데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
장바구니담기


업무상 통계처리 할 일이 종종 있다. 설문조사 결과를 처리하거나 난잡한 정량 data를 정리하거나... 주로 보고싶은 유형이나 계층 별로 data가 어떠한 이야기를 하는지 관찰한다.

이 책은 이러한 나에게 흥미진진한 사건들과 인물들의 이야기를 들려주었다. 통계처리를 위해 선택했던 다양한 조건들이 사실 유명한 학자, 개발자들이었고 그러한 분석처리가 어떠한 이유로 생겨났는지 이해할 수 있어서 매우 흥미롭고 도움이 되었다.

'데이터의 탄생' - '진화하는 데이터' 챕터를 통해 역사적 순으로 데이터, 분석들의 탄생비화와 의미가 서술되어있고 마지막 챕터인 '데이터, 권력이 되다'는 데이터를 둘러싼 다양한 윤리적 이슈를 제기하고 있다. 특별히 재미있게 읽은 부분은 서두부분인데 아무래도 통계적 분석을 종종 하는 이유로 시간이 가는 줄 모르고 읽었던 것 같다. 몇 가지 소개하자면, <chapter 5 무엇을 위한 데이터인가? > 에서 유의성 검정, 가설검정이 기네스(맥주회사)의 필요를 시작으로 꽃피워진 부분인데 매번 통계적으로 유의하다/유의하지 않다의 판단을 했던 피어슨값 0.05의 의미*의 역사적 성장배경과 과정을 알게 되어 재미있었다.

*(p.119) "피어슨에게 지식이란 언제나 잠정적이었다. 그의 설명에 의하면 "지식의 부속물로서 믿음을 살펴보아야 한다. 믿음이 결정이 필요한 행동의 안내자 역할을 해야하지만 그 확률은 지식만큼 압도적이지 않다"

통계처리 후 p value를 확인하고 채택/기각에만 집착했던 나에게 피어슨의 말은 다시한 번 왜 data를 해석하며 어떻게 받아들여야 하는지 생각하게 했다.

또한, 최근의 data 이슈인 빅데이터와 인공지능에 대한 부분도 흥미로웠다. 군을 위해 사용되었던 기술이 보다 다양한데 사용되길 원했던 IBM 영업담당자와 데이터 관리에 어려움을 겪었던 항공사 대표가 우연히 만나 이야기를 나누다 찾은 솔루션이 빅데이터 성장 배경에 있다니(p.178), 해당 시스템 설명서에 제시되어있다는 '데이터 수집과 비행기 좌석채우기'의 부제를 읽으며 빅데이터는 활용성에 목적을 두고 수집되고 분석/관리되어야 한다는 기본을 다시 한 번 확인했다.

이렇듯, 이 책은 데이터 분석/기술/활용의 발전과정을 다양한 인물과 사건들을 통해 흥미진진하게 제시함으로서 해당 분석/솔루션/기술이 어떠한 방향을 갖고 사용되어야 올바른가에 대하여 재 확인시켜준다. 데이터/통계 분석 경험이나 지식이 없을경우 일부 문장은 다소 이해하기 어렵게 번역된 건 아닌가? 하는 부분도 있었지만 구성이 연대기적, 혹은 중요 현안별 로 되어있어 비교적 쉽게 읽히는 편이다. 일부 문장이 난해했지만 대채적으로 사건/상황 중심으로 설명/전개되는 형식이라 어렵지 않게 유추하며 이해할 수 있다.

책이 두꺼운 편이었지만 앉은 자리에서 비교적 시간가는 줄 모르고 흥미롭게 읽었다. 통계적 경험이 있거나 전공자는 즐겁게 읽을 수 있을 것이고, 사회/과학적 분석, 데이터 분야에 관심이 있는 사람이 있다면 권할만한 책이다.

*이 책은 출판사가 제공하는 도서를 읽고 쓴 서평입니다*



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo