-
-
알고리즘이 지배한다는 착각 - 수학으로 밝혀낸 빅데이터의 진실
데이비드 섬프터 지음, 전대호 옮김 / 해나무 / 2022년 2월
평점 :
몇 년 전, 해나무 출판사로부터 출판된,
EBS 다큐를 책으로 집필한 <빛의 물리학>이라는 책은 내가 정말 좋아하는 책 중 하나이다.
양자 물리학을 이해하기 쉽게 설명했고,
다큐를 책으로 출판해서 그런지 시각적 자료도 많아 이해하는 데에 도움을 주기 때문이다.

이번에는 4차 산업 혁명 시대에 맞게
해나무 출판사로부터 빅데이터와 알고리즘에 대한 좋은 책이 출판되었다.
이번 책 <알고리즘이 지배한다는 착각>은
수학을 기반으로 다양한 상황에서 빅데이터가 어떻게 작용되고
어떻게 알고리즘이 생성되는지를 다양한 사례를 통해 밝힌다.
이 책의 저자 데이비드 섬프터는 수학으로 박사학위를 취득한 응용수학과 교수로,
최고의 수학 논문 저자에게 수여되는 캐서린 리처즈상의 수상자이기도 하다.
그는 정부, 금융 등 다양한 주제를 수학적으로 연구했으며,
축구팀의 패스 네트워크를 분석하고 축구 우승 결과를 예측하는 모델을 개발함으로써
큰 관심을 받았다.

빅데이터, 인공지능, 알고리즘... 4차 산업 혁명에서 중심이 되는 요소들이다.
많은 양의 데이터가 모여 빅데이터가 되고,
통계학이라는 학문을 통해 인공지능에 학습시켜 다양한 알고리즘을 생성한다.
우리가 SNS를 하다가 평소에 필요했던 물건의 광고가 딱 나오는 이유도,
이렇게 학습된 알고리즘에 의한 대표적인 예라고 할 수 있다.
이러한 알고리즘의 결과가 단순히 쇼핑 목록에 추가되는 것이라면 괜찮지만,
선거 기간이나 정치 등 민감한 영역에 활용하게 되면 생각보다 큰 변화가 생길 수도 있다.
예를 들면, 인종, 직업 등에 따라 적절한 공약을 광고로 띄움으로써 지지를 호소하는 경우이다.
하지만 다량의 데이터와 통계학을 기반으로 생성된 알고리즘을 통해 나온 결과가
매번 잘 들어맞거나 긍정적으로 작용하지는 않는다.
인종에 따른 문제도 있고, 성별에 따른 문제도 생기기 마련이다.
애초에 똑같은 개수의 데이터가 수집되지 않을뿐더러,
어떠한 이유로 데이터의 개수를 맞추지 않고 분석을 진행할 수도 있기 때문이다.

또한, 빅데이터 기반의 알고리즘...으로 시작된 통계라고 하면
뭔가 신뢰성이 확보되었다는 느낌이 없지 않아 있어서 더 믿게 되는 경향도 있다.
그만큼 예측이 틀린 경우에 부작용은 굉장히 크기 때문에
많은 데이터를 기반으로 한 것이라고 할지라도 은근히 민감한 것처럼 보이기도 하다.
이 책을 읽음으로써 빅데이터 기반의 알고리즘을 무작정 신뢰하기보다는,
그동안 다수의 알고리즘이 틀린 예측을 했던 사례도 알게 되고,
알고리즘을 평가하는 요소로 '가짜 양성', '가짜 음성' 등의 보다 더 전문적인 것들도 알 수 있게 된다.
인공지능에 대해서는 의견이 분분하다.
대표적으로 인공지능을 견제하자는 테슬라 CEO 일론 머스크와
인공지능을 더 진화시켜서 좋은 방향으로 활용할 수 있다는 페이스북 CEO 마크 저커버그이다.
이런 것처럼 같은 데이터와 알고리즘을 통해 학습한 인공지능이 있더라도
이를 어떻게 해석하고 활용하는지는 인간의 몫이라고 할 수 있다.
알고리즘 분석을 통한 빅데이터의 진실을 통해
보다 4차 산업 혁명 시대에 보다 더 넓은 시야를 가져야 한다는 생각이 든다.
SNS를 하면서 한 번쯤은 광고에 놀랐다면 이 책을 읽어보길 추천한다.
출판사로부터 책을 제공받아 작성한 서평입니다.