경제학/경영학 분야

캐시 오닐의 《대량살상 수학무기(Weapons of Math Destruction)》

작성자
이영환
작성일
2017-11-13 00:08
조회
636

 

20171112_150552_5a086350bd637.jpg 

 

저자: 캐시 오닐(Cathy O’Neil)

역자: 김정혜

출판사: 흐름출판(2017)

 

목차

1장 대량살상 수학무기의 탄생

2장 셸 쇼크

3장 군비 경쟁

4장 선동 도구

5장 무고한 희생자들

6장 디지털 골상학

7장 일정의 노예

8장 부수적 피해

9장 안전지대는 없다

10장 표적이 된 시민들

결론: 수학 모형의 여행을 마치며

 

<북 리뷰: 빅데이터 분석 알고리즘의 부정적 측면에 대한 상세한 논의>

저자 소개 및 책의 특징

저자 캐시 오닐은 정수론(整數論)을 전공한 수학자다. 정수론의 수의 성질을 연구하는 수학의 주요 분야로서 얼마 전 우리나라에서도 상영된 영화 무한대를 본 남자(The Man Who Knew Infinity)의 주인공 스리니바사 라마누잔도 정수론을 전공한 천재 수학자였다. 오닐은 1999년 하버드 대학교에서 대수적 정수론으로 수학박사 학위를 받은 후 컬럼비아 대학교와 공동으로 학위를 수여하는 버나드 칼리지의 수학교 종신교수로 재직하다가 수학을 현실 세계에 응용한다는 아이디어에 매료되어 헤지펀드로 자리를 옮겨 퀀트(quant)로 일하기도 했다. 그러다가 2008년 금융위기를 겪으면서 금융에 환멸을 느껴 월스트리트를 떠나 IT업계의 여러 기업과 스타트업에서 데이터 과학자로 근무했다. 이런 과정에는 오닐은 빅데이터(Big Data)의 부정적인 측면을 경험하고 이를 대중에게 알린다는 사명감에서 이 책을 쓰게 되었다고 말한다. 위키피디아에 의하면 현재 그녀는 자신의 블로그 mathbabe.org를 운영하면서 빅데이터의 문제점을 대중에게 알리는 데 많은 노력을 기울이고 있다.

 

인터넷이 등장한 것은 불과 20여 년밖에 되지 않았지만 우리의 삶을 완전히 변화시켰다. 이와 함께 막대한 데이터가 생성되기 시작했으며 컴퓨터의 성능 향상과 IT기술의 발달로 이런 엄청난 양의 데이터를 신속하게 처리, 저장 및 분석이 가능하게 되었다. 과거에는 기술적으로 불가능해 무시되었을 데이터들이 이제는 황금을 낳는 거위로 거듭나고 있다. 특히 사물인터넷(IoT)이 활성화되고 인공지능 알고리즘이 발달함에 따라 빅데이터를 분석해 필요한 정보를 얻을 수 있는 가능성이 점점 증가하고 있다. 어느 기업, 어느 조직, 나아가 어느 정부도 빅데이터를 무시하고는 존립이 어려울 지경에 이르게 되었다. 바야흐로 지금은 빅데이터의 시대라 해도 과언이 아니다.

 

최근 빅데이터에 관한 책들이 많이 출간되었는데 대부분 빅데이터를 이용해 얻을 수 있는 여러 가지 이점에 초점을 맞추고 있다. 또한 거기에는 빅데이터를 무시하는 조직은 효율적인 결과를 달성할 수 없는 것은 물론이고 종국에는 몰락할 수밖에 없다는 경고가 담겨있다. 빅데이터가 마치 유토피아를 가져다 줄 것으로 일반대중에게 어필하는 상황에서 오닐은 이와 정반대 관점에서 빅데이터의 어두운 면을 조명하였다. 오닐의 입장은 이 책의 표지에 실려 있는 한 문장 어떻게 빅데이터는 불평등을 확산하고 민주주의를 위협하는가?”로 요약될 수 있다.

 

물론 이것은 빅데이터와 관련된 다분히 극단적인 결과를 염두에 두고 한 표현이라는 인상을 준다. 또한 빅데이터가 이런 결과를 초래하게 만드는 유일한 원인도 아닌 것도 사실이다. 그럼에도 불구하고 모든 사람들이 한 목소리로 찬양하는 빅데이터의 이면에 감춰진 어두운 면을 살펴보는 것은 의미 있는 일이다. 세상만사는 음과 양, 빛과 어두움을 함께 가지고 있는데 빅데이터도 예외는 아니다. , 오해의 소지를 없애기 위해 첨언하자면 여기서 문제로 삼는 것은 빅데이터 자체가 아니라 이것을 처리하고 분석한 후 결과를 해석하는 과정에 관여하는 통계적, 수학적 방법론에 기반을 둔 인공지능 알고리즘과 이를 적용하는 전문가의 태도이다.

 

빅데이터의 대극적 측면: 빛과 그림자

빅데이터는 많은 양의 데이터를 의미한다. 그런데 빅데이터는 단순히 많은 양의 데이터라는 차원을 넘어서 기존에 데이터로 취급되었던 정형 데이터(structured data)뿐만 아니라 과거에는 데이터로 취급되지 않았던 비정형 데이터(unstructured data)와 반정형 데이터(semi-structured data)를 모두 망라한 개념으로 이해하는 것이 적절하다. 숫자로 되어 있어 연산가능하면 정형 데이터이며, 형태가 있으나 연산가능하지 않으면 반정형 데이터에 속한다. 비정형 데이터는 형태도 없고, 연산 가능하지도 않은 것으로 보통 텍스트, 영상, 음성 등의 형태로 나타난다. 이런 의미에서 데이터의 다양성 또한 빅데이터의 본질에 해당한다고 할 수 있다. 그렇기에 혹자는 빅데이터 대신 스마트 데이터라는 용어를 사용해야 한다고 말한다. 일리 있는 주장이다. 단순히 양적으로 크다는 것이 핵심이 아니기 때문이다.

 

빅데이터는 양날의 검이다. 잘 활용하면 사회 전반의 발전에 기여할 수 있지만 악용된다면 사회의 기초를 위협할 수도 있기 때문이다. 그런데 지금까지 빅데이터에 대한 논의가 대체로 전자에 초점이 맞춰져 왔다는 인상을 지우기 어렵다. 인간은 대체로 부정적인 면을 외면하는 경향이 있다. 그런데 정작 우리가 관심을 가져야 할 것은 빅데이터의 그림자, 즉 어두운 측면이다. 왜냐하면 빅데이터는 인공지능 알고리즘과 결합해 사실상 4차 산업혁명을 주도하고 있는데 오직 효율성이라는 의 측면에만 초점이 맞춰져 있기 때문이다. 이미 글로벌 차원의 불평등 심화를 통해 명백히 드러났듯이 효율성 이외에 공정성이나 평등과 같은 가치 또한 사회적 통합과 발전을 위해 불가피하다. 그런데 빅데이터 분석은 거의 대부분 효율성에만 초점을 맞추고 있는 실정이다. 이로 인해 불공정성과 불평등이 확대될 수 있다는 그림자의 측면을 더 이상 간과해서는 안 될 것이다.

 

이와 관련해 먼저 필자가 최근에 읽었던 극단적으로 대비되는 두 권의 책을 비교하는 것으로 논의를 시작하고자 한다. 하나는 버나드 마(Benard Marr)빅데이터: 4차 산업혁명의 언어이고 다른 하나는 여기서 소개하고 있는 캐시 오닐(Cathy O’Neil)대량살상 수학무기이다. 버나드 마는 세계적으로 알려진 빅데이터 전문가이자 베스트셀러 작가로서 저서에서 45개의 다양한 기업과 비영리조직의 사례를 분석했다. 그는 크고 작은 여러 기업들이 빅데이터를 활용해 어떻게 비용을 절감하고 고객의 요구에 부응함으로써 시장을 확대하고 수익을 늘릴 수 있었는지 간단명료하게 설명했다. 경제학에서 말하는 소비자잉여와 생산자잉여를 늘림으로써 사회잉여를 증가시킨다는 원리에 비추어 볼 때 빅데이터가 사회 전반에서 효율성을 높이는 데 기여한다는 점은 부인하기 어렵다. 사회잉여가 증가한다는 것은 곧 효율성이 향상된다는 객관적인 지표이기 때문이다. 그리고 이런 논리는 페이스북, 구글 및 우버나 에어비앤비 같은 인터넷 기반의 IT기업뿐만 아니라 월마트나 제너럴 일렉트릭과 같은 전통적인 대기업, 나아가 정육점이나 레스토랑 체인과 같은 소기업에도 적용된다. 뿐만 아니라 영국의 BBC와 같은 공영방송, 미국의 시저스와 같은 카지노호텔 및 미국 연방정부 등 크고 작은 다양한 조직들이 빅데이터를 이용해 최대한 효율을 달성하고 있다는 점을 지적했다. 한 마디로 버나드 마는 효율성의 관점에서 빅데이터의 에 초점을 맞추었다.

 

한편 캐시 오닐은 학문적 배경과 다양한 실무 경험을 바탕으로 빅데이터 분석을 위한 수학적 알고리즘이 인공지능과 결합해 어떻게 여러 분야에서 파괴적인 영향력을 행사하고 있는지 여러 가지 사례를 통해 구체적으로 다루었다. 그렇기에 오닐은 대량살상무기를 패러디해 책 제목을 대량살상 수학무기(Weapon of Math Destruction; WMD)’로 정한 것이다. WMD는 빅데이터 분석에 이용되는 수학적 알고리즘을 지칭한다. 이런 알고리즘이 없다면 빅데이터는 단지 잡다한 데이터의 뭉치에 불과하므로 빅데이터 분석의 핵심은 수학적 알고리즘이다. 이와 관련해 오닐은 다음과 같이 말한다. 수학, 데이터, IT기술의 결합으로 만들어진 알고리즘은 지금 이 순간에도 곳곳에서 보이지 않는 손이 되어 무소불위의 권한을 휘두르고 있습니다. 특히 인간의 편견과 무지, 오만을 코드화한 프로그램들은 차별을 정당화화고, 민주주의를 위협합니다.”(6) 그래서 이런 알고리즘들이 대량살상무기만큼 위험하다고 생각해 대량살상 수학무기라고 패러디한 것이다.

 

오닐이 특히 강조한 점은 수학적 알고리즘이 대부분의 경우 공정하지 않다는 것이다. 이것은 빅데이터를 분석하는 알고리즘을 개발하는 과정에서 주관적인 가치 판단을 완전히 배제할 수 없기 때문에 발생한다. 이와 관련해 오닐은 다음과 같이 말한다. 빅데이터 경제의 원동력인 수학 모형 프로그램은 실수가 있을 수밖에 없는 인간의 선택에 기반을 둔다. 분명 이런 선택 중 일부는 선한 의도를 가지고 있다. 그러나 대다수 수학 모형은 인간의 편견, 오해, 편향성을 코드화했다.”(16) 그러면서 수학 모형, 즉 알고리즘은 블랙박스와 같아서 수학자와 컴퓨터 과학자 같이 개발에 참여한 일부를 제외하고는 내부에서 어떤 방식으로 작동하는지 알 수 없다고 지적한다. 그래서 현실과 모델의 차이가 있을 수밖에 없으므로 피드백을 통해 모델, 즉 알고리즘을 수정해야 하는데 이런 일이 거의 이루어지지 않는다는 것이다. 그 결과 오닐은 부정적인 피드백 루프(feedback loop)가 형성되어 알고리즘의 위력을 편향된 방향으로 더욱 강화한다고 주장한다. 이런 이유로 빅데이터는 공정한 결과를 달성하기는커녕 불평등을 더욱 조장하게 된다는 것이다. 그래서 오닐은 빅데이터에 대해 대량살상 수학무기라는 극단적인 표현을 사용한 것이다.

 

왜 대량살상 수학무기(WMD)인가?

그렇다면 저자는 빅데이터 분석을 항상 부정적으로 평가하는가? 그렇지는 않다. 예컨대 야구와 같은 운동은 빅데이터 분석에 적절한 데이터의 보고(寶庫). 논픽션 작가 마이클 루이스가 2003년에 발표한 베스트셀러 머니볼을 통해 우리에게도 소개되었듯이 야구는 빅데이터 분석을 통해 효율적으로 문제를 해결할 수 있는 분야다. 아마 많은 사람들이 배우 브랫 피트가 주인공으로 열연한 동명의 영화를 통해 어떻게 만년 하위팀이었던 <오클랜드 애슬레틱스>20연승이라는 대기록을 세우고 플레이오프에 까지 진출하게 되었는지 알았을 것이다. 모든 공로가 빅데이터를 활용해 전략을 수립했기 때문이었다. 저자도 이런 경우에는 빅데이터가 긍정적인 결과를 가져온다는 점을 인정한다. 그렇다면 이런 논리를 기업의 경우에도 그대로 적용할 수 있지 않나 생각할 수 있다.

 

그런데 이에 대한 저자의 견해는 단호하게 아니다쪽으로 기운다. 그러면서 그 이유는 빅데이터 분석의 알고리즘이 갖고 있는 본질적인 세 가지 특성 때문이라고 주장한다. 불투명성, 확장성, 피해가 그것이다. 불투명성은 알고리즘 자체가 블랙박스와 같아 어떤 과정을 거쳐 결론을 내놓는지 정확하게 알 수 없다는 것을 말한다. 이것은 모든 인공지능 알고리즘의 공통된 문제이기도 하다. 확장성은 모형이 기하급수적으로 성장해 특정 분야를 넘어 거의 모든 분야에 확대 적용되는 성질을 말하는데 이 과정에서 예기치 못했던 여러 문제들이 발생한다는 것이다. 이와 관련해 저자는 다음과 같이 말한다. 확장성은 WMD들을 지엽적인 골칫거리에서 막대한 피해를 초래하는 지진 해일로, 즉 우리의 삶을 정의하고 한계를 부여하는 거대한 힘으로 변화시키는 요소다. 노동, 건강, 금융 분야에서 사용되는 WMD들은 우리에게 법률에 버금가는 힘을 발휘하는 광범위한 규범을 신속하게 구축하고 있다.”(59) 한 마디로 확장성은 WMD가 우리 삶의 거의 모든 분야에서 사실상 법과 같은 구속력을 행사하고 있다는 것이다. 그것도 알고리즘을 개발한 사람이나 조직에 유리하도록 일방적으로 말이다.

 

세 번째 특성인 피해라는 것은 WMD가 모든 사람에게 이익을 가져다주는 경우는 없고 반드시 누군가는 피해를 볼 수밖에 없다는 것을 말한다. 예컨대 미국의 경우 대학입학평가 모형이나 신용평가 모형의 경우처럼 누군가 이익을 보는 사람도 있지만 다른 누군가는 반드시 피해를 입도록 설계되었다는 것이다. 이와 관련해 저자는 다음과 같이 말한다. 핵심은 WMD 모형으로 혜택을 얻는 사람들이 있다는 것이 아니다. 일부 예외를 제외하면 고통 받는 사람이 너무 많다는 것이 문제다. 알고리즘에 의해 작동되는 모형은 수백만 명의 면전에서 기회의 문을 닫아버리고 이의를 제기할 가능성조차 허용하지 않는다.”(61) 무시할 수 없는 지적이다.

 

그러면서 저자는 야구의 사례처럼 거의 모든 데이터가 숫자로 된 정형 데이터인 경우에는 WMD의 부작용이 발생할 가능성이 거의 없다는 점은 인정한다. 그런데 이런 경우는 사실상 거의 찾아보기 어렵다는 것이 문제다. 앞에서도 언급했듯이 빅데이터는 정형, 비정형 및 반정형 데이터로 구성되기 때문에 이를 분석하는 알고리즘을 개발하는 과정에서 개발자의 주관적인 가치판단이 불가피하다. 공정한 모델을 개발하려해도 개발자의 의도와 이념이 반영될 수밖에 없다. 이런 이유로 세 가지 특징이 나타나게 된다는 것이다. 그러므로 어떤 수학적 논리나 과학적 논리에 근거해 인공지능 알고리즘을 개발하더라도 WMD로 진화할 가능성은 항상 남아 있는 것이다. 즉 초기에는 좋은 의도를 갖고 시작된 빅데이터 분석이라도 나중에는 사회적으로 바람직하지 않은 방향으로 악용될 소지가 있다. 이것은 오늘날 빅데이터 분석을 기반으로 각종 서비스를 제공하는 구글, 아마존, 페이스북 등 초국적기업들에게도 그대로 적용된다. 또한 미국 국가안보국(NSA) 직원이었던 에드워드 스노든(Edward Snowden)의 폭로로 세상에 알려진 것과 같이 정부가 빅데이터 분석을 통해 얻은 정보를 바탕으로 개인의 프라이버시를 심각하게 침해할 가능성도 배제할 수 없다.

 

그러면서 저자는 이 책에서 왜 빅데이터 분석이 대량살상 수학무기로 둔갑할 수 있는지 구체적인 사례들을 통해 소상하게 설명하고 있다. 이런 면에서 빅데이터의 긍정적인 면을 강조한, 앞에서 소개했던 버나드 마의 책과 함께 읽으면 빅데이터에 대한 균형감각을 유지할 수 있다고 본다. 저자는 범죄예방을 위한 재범위험성 모형’, 금융공학에 기초한 포트폴리오 모형’, 온라인에서의 약탈적 광고 모형’, 불공정을 조장하는 인성적성검사 모형’, 종업원을 혹사시키는 일정관리 모형’, 가난한 사람들을 더욱 궁지로 내모는 신용평가점수 모형등 실로 우리의 생활 전반에서 오로지 효율성만을 추구하는 각종 수학적 알고리즘들이 어떻게 대량살상 수학무기, WMD로 둔갑해 사회적 약자들을 궁지로 내몰고 있는지 상세하게 다루었다. 물론 저자의 주장 가운데는 액면 그대로 받아들이기 어려운 부분도 있다. 그렇더라도 공정성이나 평등 같은 가치를 전제로 빅데이터 분석을 위한 알고리즘이 개발되지 않는 것만은 분명하다. 어떤 기업도 이런 가치를 전제로 빅데이터를 활용하지 않기 때문이다. 이런 의미에서 빅데이터의 그림자에 대해 제대로 알려주고 있는 오닐의 저서에 관심을 가질 필요가 있다.

 

대량살상 수학무기의 대표적 사례: <대학 순위 모형>

저자는 헤지펀드 디이쇼(D.E.Shaw)의 퀀트로 일하다가 2008년 금융위기를 경험하면서 금융계에 환멸을 느껴 월스트리트를 떠났다. 그렇기에 저자는 각종 파생금융상품의 거래를 주도했던 수학적 알고리즘이 대표적인 대량살상 수학무기라는 점을 누구보다 잘 알고 있다. 이 점은 이미 전설적인 투자가 워렌 버핏이 파생상품을 대량살상무기로 명명한데서도 확인된다. 그런데 저자는 누구나 잘 알고 있는 금융시장의 사례에 초점을 맞추기 보다는 다분히 잘 알려지지 않은 의외의 사례들을 통해 대량살상 수학무기의 폐해를 지적한다. 버바가 다룬 여러 사례들 중에 가장 두드러진 것이 <대학 순위 모형>이다. 이 문제는 우리나라에서도 그대로 재현되고 있기에 여기서 특별히 언급할 필요가 있다. 이것은 확장성이라는 WMD의 특성으로 인해 더욱 상황이 악화된 사례에 해당된다.

 

미국의 유에스 뉴스 & 월드 리포트(U.S. News & World Report)라는 시사 잡지는 그저 그런 이류에 불과했다. 그런데 이 시사 잡지는 1980년 중반 야심찬 프로젝트를 추진했다. 이른바 미국 대학들을 한 줄로 서열을 매기기 시작한 것이다. 이것은 저자가 우려하는, 정량적인 데이터를 구하는 데 한계가 있기에 대리 데이터(proxy data)를 사용할 수밖에 없는 대표적인 사례에 해당한다. 따라서 대학평가 알고리즘은 대량살상 수학무기로 둔갑할 수 있었고 실제로 그랬다는 것이 저자의 주장이다. 이와 관련해 다음과 같이 말한다. 그러나 순위가 전국적인 표준으로 확장됨에 따라 부정적인 피드백 루프가 활성화되기 시작했다. 문제는 대학 순위가 자기 강화적인 특징을 갖는다는 점이었다. 가령 유에스 뉴스에서 낮은 순위를 받으면 대학의 평판이 손상되고 전반적인 여건이 악화되었다. 우수한 학생들과 훌륭한 교수들이 해당 대학을 기피하고, 동문들은 노골적으로 불만을 드러내면서 기부금을 줄였다. 그러다보면 다음해 해당 대학의 순위는 더욱더 떨어졌다.”(98)

 

저자가 어찌 보면 별 문제가 되지 않을 것 같은 <대학 순위 모형>WMD의 사례로 든 데에는 충분한 이유가 있다. 이로 인해 미국의 교육 시스템 전체로 피해가 확산되었기 때문이다, 이런 의미에서 확장성을 문제점을 가장 잘 드러낸 사례라 할 수 있다. 이와 관련해 저자는 다음과 같이 말한다. 유에스 뉴스의 대학 순위는 거대한 공룡으로 성장했고, 얼마 지나지 않아 전국적인 표준으로 자리매김했다. 유에스 뉴스의 대학 순위는 미국 교육 시스템을 곤경에 빠뜨렸고, 대학 행정관들은 대학 순위 모형의 기준을 충족시키라는 어려운 과제를 떠안게 되었다. 또한 대학 순위 모형은 대규모인데다 광범위한 피해를 유발하고, 사실상 끝없이 순환하는 파괴적인 피드백 루프를 생성시켰다.”(99) 이와 같이 <대학 순위 모형>WMD의 모든 특징을 보여주는 사례에 해당된다.

 

여기서 굳이 이 사례를 언급한 이유는 우리나라 모 일간지가 바로 유에스 뉴스의 전철을 그대로 답습해 우리나라 대학들을 서열화함으로써 사실상 대학의 본질과 학문의 다양성을 파괴하는 엄청난 부작용을 초래했기 때문이다. 저자도 인정하듯이 양적인 데이터만 가지고도 상황을 정확하게 파악하고 대안을 마련할 수 있다면 빅데이터의 부작용은 사실상 최소화할 수 있을 것이다. 그런데 이런 경우는 지극히 예외적이고 대부분의 경우 사람의 주관적인 측면이나 사물의 질적인 측면을 고려하지 않을 수 없다. 이런 경우 어쩔 수 없이 데이터과학자들은 대리변수를 사용하는 데 여기에는 많은 문제가 따르며 이로 인해 WMD로 둔갑할 수 있다는 것이다.

 

저자에 의하면 이 점을 극명하게 보여준 사례가 바로 유에스 뉴스<대학 순위 모형>인 것이다. 미국이든 우리나라든 이런 프로젝트를 추진한 조직은 고등교육의 질을 높인다는 대의명분을 위해 자기들이 개발한 알고리즘을 사용한 것이 아니라 오로지 조직의 평판을 끌어올려 더 큰 영향력을 행사하고 더 많은 이익을 얻기 위한 것이었다. 물론 이런 이기적인 동기가 공적인 이익으로 연결되면 바람직한 일로서, 이것이 바로 애덤 스미스가 말했던 보이지 않는 손의 의미다. 그러나 이런 이상적인 일은 일어나지 않았고 대학 교육은 파행적인 상태로 치닫게 되었다. 이것이 <대학 순위 모형>의 진실이요 빅데이터 분석의 한계다.

 

대량살상 수학무기(WMD)와 데이터이즘(Dataism)

우리는 지금 4차 산업혁명이 시작된 초입에 와 있다. 이 용어가 처음 공식적으로 사용되기 시작한 것이 20161월에 열린 <세계지식포럼>에서였으니 불과 2년도 지나지 않았다. 그럼에도 우리는 엄청난 변화를 체험하고 있다. 이런 변화의 핵심에는 사물인터넷(IoT), 빅데이터 그리고 인공지능이 있다. 사실 이들은 분리해서 생각할 수 있는 것들이 아니라 하나로 통합해서 이해되어야 한다. 사물인터넷의 활성화로 방대한 양의 정형, 비정형 데이터가 축적되고 있으며 이를 처리할 수 있는 연산 능력을 가진 컴퓨터가 개발되고 원하는 목적에 맞춰 신속하게 빅데이터를 분석해 패턴과 규칙을 발견할 수 있는 고도의 인공지능이 등장했다. 앞으로 이런 발전 속도는 더욱 가속화될 것이다. 발명가이자 인공지능 전문가인 레이 커즈와일(Ray Kurzweil)이 주장한 수확가속법칙(law of accelerating returns)은 기술적으로 충분히 가능해 보인다.

 

이미 여러 사람이 경고했듯이 빅데이터와 인공지능 알고리즘의 결합은 파괴적 기술(disruptive technology)로 사회 전반에 큰 영향을 미칠 것이다. 빅데이터와 인공지능 알고리즘은 과거에는 불가능했던 방대한 데이터를 신속하게 처리해 우리 자신이 원하는 것과 우리를 둘러싼 자연환경에 대해 정확한 정보를 제공할 수 있을 것이다. 예컨대 우리는 오감(五感)을 가장 효과적으로 만족시키기 위해서는 무엇을 소비해야 할지 더 정확하게 판단할 수 있게 될 것이다. 또한 기후변화가 진행됨에 따라 해수면이 언제, 어느 정도 높아질 것이며 지구의 평균 온도가 얼마나 올라갈지 그리고 이로 인한 충격은 어떻게 전개될지 등 우리가 알아야 하는 여러 환경 문제에 대해 더 정확한 정보를 얻을 수 있을 것이다. 이처럼 빅데이터 분석을 통해 우리가 얻을 수 있는 긍정적인 요소들 또한 적지 않다. 그리고 이 모든 긍정적인 측면을 아우르는 표현은 효율성이다. 빅데이터는 많은 경우 효율성의 증진에 획기적으로 기여할 것이다. 이에 대해서는 이론의 여지가 없다.

 

그런데 사회를 유지·발전시키는 데는 효율성만으로는 부족하다. 이미 확인되었듯이 불평등의 증가는 사회의 존립 기반을 뒤흔드는 현상이다. 그래서 효율성과 불평등은 상호 배타적이라는 과거 인식이 이제는 상호 보완적이라는 인식으로 바뀌고 있다. 지나친 불평등은 오히려 효율성을 잠식할 것이라는 데 대체로 사회적 합의가 이루어지고 있는 실정이다. 빅데이터의 문제도 이런 관점에서 접근해야 할 것이다. 이것은 저자 케시 오닐이 이 책에서 견지하고 있는 입장이기도 하다. 빅데이터를 사용하려는 사람들의 의도에 따라 사회발전을 위한 도구가 될 수도 있고 불평등을 악화시키고 민주주의를 위협하는 무기가 될 수도 있다는 것이다.

 

그러면서도 저자는 빅데이터 분석 알고리즘, WMD와 관련해 근본적으로 부정적인 입장을 숨기지 않는다. 아마 이것은 빅데이터의 장점을 몰라서가 아니라 이를 이용하려는 인간의 편견이나 무지를 우려하기 때문인 것으로 보인다. 이 점과 관련해 저자는 다음과 같이 강한 논조로 말한다. “WMD는 앞에서 하는 행동과 뒤에서 하는 행동이 철저히 다르다. 앞에서는 효율성과 공정성을 약속하지만 뒤에서는 고등교육을 왜곡하거나 부채를 증가시키고 대량 투옥을 촉발한다. 또한 인생의 모든 중요한 분기점에 가난한 사람들을 곤경에 빠뜨리며, 민주주의를 손상시킨다. 따라서 WMD를 하나씩 무장해제시키는 것은 논리적으로 타당한 해결책이다.”(329) 이는 다분히 극단적인 표현이지만 저자의 순순한 의도를 읽을 수 있다. WMD가 적용되어서는 안 되는 분야가 있다는 것이다. 그것은 대체로 교육, 노동, 범죄, 취업 등 개개인의 인성이나 주관적인 자질 등이 결정적으로 중요하지만 어떤 데이터로도 제대로 파악할 수 없는 분야들이다. 이런 분야에서는 특권층이나 부유층은 빅데이터와는 무관하게 살아갈 수 있기에 거의 영향을 받지 않는 반면 나머지 계층에게는 빅데이터 분석이 그대로 적용되어 이들을 더욱 열악한 상황으로 몰아넣는 악순환의 고리가 형성된다는 것이다.

 

저자는 이 책에서 여러 사례들을 통해 빅데이터 분석이 더 이상 사회적 약자를 더욱 더 어려운 궁지로 내모는 방식으로 적용되어서는 안 된다는 점을 강조한다. 많은 기업들이 효율성을 위해 빅데이터를 활용하고 있지만 이제는 더 이상 이대로 방치해서는 안 된다는 것이다. 페이스북이나 아마존이 이런 대의명분을 전제로 인공지능 알고리즘을 개발하지 않았다는 점은 자명하다. 이들 기업뿐만 아니라 모든 기업과 조직들은 자신의 이해관계에 따라 빅데이터 분석 알고리즘을 개발했다. 개별 조직의 차원에서는 당연한 행동이지만 이로 인해 사회 전반에 불공정과 불평등이 더욱 악화된다면 이는 결코 간과할 수 없는 문제다. 빅데이터는 단순히 효율성 차원의 문제가 아니라 사회 전반의 문제임을 인식해야 할 것이다.

 

한편 캐시 오닐이 공정성이라는 관점에서 빅데이터의 부정적인 측면을 부각시켰다면 사피엔스로 우리에게 널리 알려진 유발 하라리(Yuval Harari)는 인간 존재의 정체성이라는 차원에서 빅데이터의 부정적인 측면을 강조했다. 그는 이것을 데이터주의(Dataism)이라는 용어로 압축했다. 하라리가 이 용어를 처음 만들었는지는 불분명하지만 널리 알리는 데 결정적으로 기여한 것은 분명하다. 하라리는 데이터를 신()처럼 받드는 한편 인간 스스로 자유의지를 부정하고 빅데이터의 분석 결과를 맹종하게 되는 상황을 우려해 데이터주의를 언급했다. 예컨대 아마존이나 페이스북과 같이 우리의 일거수일투족에 대한 방대한 데이터를 축적한 기업들이 우리가 누구이고 무엇을 필요로 하는지 우리 자신보다 더 많이 알고 있다면 우리는 자유의지를 포기하고 이들 기업의 지시에 따르게 될 가능성이 농후하다. 지금도 이런 현상이 벌어지고 있으며 앞으로 더 많은 데이터가 축적될 것이기에 이런 추세는 더욱 강화될 것이다.

 

이와 같이 인간이 내면에서 일어나는 욕망과 경험에 바탕을 두고 세상을 이해해온 인본주의 전통을 포기해야 한다면 도대체 인간은 어디서 의미를 찾을 것인가? 이에 대한 유일한 대안으로 등장한 것이 바로 정보이며 이를 처리하는 데이터주의, 즉 데이터 종교라는 것이 하라리의 주장이다. 인간은 또 다시 자유로부터 도피하려는 것이다. 그래서 인간은 데이터를 숭배하기 시작했다면서 호모 데우스에서 다음과 같이 지적했다. 데이터주의에 의하면 우주는 데이터의 흐름으로 구성되어 있으며 어떤 현상이나 실체의 가치는 데이터 처리에 기여하는 바에 의해 결정된다는 것이다.”(Dataism says that the universe consists of data flows, and the value of any phenomenon or entity is determined by its contribution to data processing. 367) 이 말은 곧 데이터 처리라는 관점에서 인간보다 인공지능이 뛰어나다면 인간은 더 이상 가치가 없다는 것을 함축할 뿐만 아니라 무엇이든 데이터 축적에 기여할수록 더욱 가치가 있다는 의미를 담고 있다. 바야흐로 데이터 자체가 목적이 되고 이에 기여하지 못하는 인간은 쓸모없는 존재로 전락할 수 있다.

 

사물인터넷과 빅데이터, 그리고 이를 처리하는 인공지능의 발달은 데이터주의를 더욱 강화시킬 것이다. 그러면 이런 상황에서 인간의 역할은 무엇인가? 데이터주의를 신봉하는 사람들은 사물인터넷과 인공지능을 계속 발달시켜 더욱 효율적으로 데이터를 처리하는 것이 목적이라고 주장할 것이다. 이런 상황에서 인간은 더 이상 자유로운 주체가 아니다. 마치 부족국가 시대에 외부에 존재하는 초월적인 절대자를 숭배했듯이 하라리가 말하는 기술적 인본주의 시대에 인간은 데이터를 숭배하는 상황에 처하게 될 것이다. 그리고 이럴 가능성은 점점 더 증가하고 있다. 이것이 자기 강화하는 시스템의 본질이다.

 

이와 같이 데이터주의는 인간을 기본적으로 하나의 알고리즘으로 해석하면서 기능적인 관점에서 이해한다. 데이터의 흐름에 기여하는 한 인간은 가치를 갖는다는 의미다. 인간의 모든 감정과 경험은 오로지 데이터 패턴으로 인식될 뿐이다. 따라서 데이터 처리라는 관점에서 인간보다 훨씬 더 우월한 능력을 갖는 인공지능을 숭배하게 되는 것은 자연스러운 수순이며 이런 상황에서 데이터 종교의 출현은 당연하다. 사실 자신보다 자신을 더 많이 아는 인공지능에 모든 판단을 맡기는 날이 멀지 않았다는 인식이 점점 널리 확산되고 있다. 지금도 구글, 페이스북 그리고 아마존은 우리가 무엇을 좋아하고 누구와 관계를 맺고 있고 과거 무엇을 했는지 등에 대해 더 많은 정보를 갖고 있다. 앞으로 이런 상황이 더욱 보편적으로 될 것이 명약관화하다. 그리고 이런 발전은 일정한 단계를 넘어서면 인간의 의지와는 무관하게 스스로의 논리에 의해 더욱 가속화될 것이다.

 

우리는 빅데이터의 빛과 그림자라는 두 대극적인 측면을 균형 감각을 갖고 이해해야 한다. 빛에 현혹되어 오로지 효율성을 금과옥조로 삼아 일로매진한다면 개별 기업 차원에서는 상당한 성과를 올릴 수 있을 것이나 사회 전반의 차원에서는 정보의 독과점에 따른 부작용을 피하기 어렵다. 이런 이유로 공정한 조정자로서 정부의 역할이 더욱 중요한 시점이다. 그런데 에드워드 스노든의 폭로를 통해 확인되었듯이 정부도 빅브라더(Big Brother)가 되어 국민들의 사생활을 감시하고 통제하고자 하는 충동을 억제하기 어려운 것 또한 사실이다. 빅데이터를 활용하면 정치, 경제, 사회적인 모든 측면에서 일반대중을 효과적으로 통제할 수 있기 때문이다. 이와 같이 정부를 비롯한 공공기관 나아가 기업들이 오로지 빅데이터와 인공지능을 결합해 경쟁우위를 점하는 데만 역량을 집중한다면 결국 빅데이터의 긍정적인 측면마저 퇴색될 수밖에 없다.

 

그렇다면 우리는 빅데이터가 지배하는 시대에 어떻게 대처해야 할 것인가? 사물인터넷과 빅데이터 그리고 인공지능은 세 개의 중심축을 이루면서 향후 글로벌 경제를 지배할 것으로 예상된다. 이런 과정에서 IT기술에 기반을 둔 초국적기업들, 예컨대 애플, 구글, 마이크로소프트, 페이스북, 아마존 등은 빅데이터를 활용해 시장지배력을 더욱 강화하고자 할 것이다. 현재 이런 추세를 막을 수 있는 대항세력은 존재하지 않는다. 현재로서는 어떤 정부도, 어떤 시민단체도 이것을 저지하기에는 역부족이다. 그럼에도 이에 대한 유일한 대항세력으로 시민운동을 활성화시키는 것을 들지 않을 수 없다. 물론 이것은 다분히 추상적이고 막연한 이야기라 할 수 있다. 각자 개인적인 이해관계만을 고려한다면 빅데이터가 제공하는 달콤한 꿀을 외면하기 어렵다. 따라서 이것을 부정하고 외면하라는 것이 아니라 우리 모두 여기에 함몰되는 경우에는 결국 개인의 정체성에 위기가 올 수 있으며 나아가 사회 전체가 붕괴될 수도 있다는 위기감을 느껴야 한다는 것이다. 그래야만 우리는 보다 더 균형 잡힌 사고를 할 수 있고 빅데이터의 시대에도 공존할 수 있기 때문이다. 이를 위해서는 빅데이터로 인해 발생하는 여러 가지 부작용에 대해 제대로 알아야 한다. 이런 의미에서 여기 소개한 캐시 오닐의 책과 유발 하라리의 호모 데우스에 관심을 가질 필요가 있다.

 

 

 

전체 0