빅데이터가 만드는 제4차 산업혁명 - 개인과 기업은 어떻게 대응할 것인가?
김진호 지음 / 북카라반 / 2016년 12월
평점 :
장바구니담기


"앞선 세 차례의 산업 혁명보다, 기업 경영의 패러다임을 (더) 완전히 바꿔 놓을 것이다." 거의 모든 경영학자들이나 4차 산업혁명 전도사들이 주장하는 바이며, 이 책 저자 김진호 박사님의 입장도 크게 다르지 않습니다 헌데 4차 산업혁명의 내용 함의가 무엇인지 그 각론에 대해서는 또 학자들, 기업들 사이에 입장이 크게 다르기에, 뭘 급하게 하긴 해야겠는데 뭘 해야할지 모르겠다는 혼란은 여전히 대중들, 또 공부하는 학생들 사이에서 가시지를 않습니다.

4차 산업혁명의 파괴력은 아마도 2016년 상반기에 열린 알파고 對 이세돌 9단의 대결 덕분에 더 대중적으로 인식이 확산된 듯합니다. 한국은 유독 장노년층에서 바둑 애호층이 두텁고, 지난 세기 말에 체스는 이른바 IBM의 딥 블루 개발로 인간 플레이어의 수월성 신화가 깨어졌으나 바둑은 또다른 차원이라는 믿음이 이어졌기에 이 충격이 더 큰지도 모르겠습니다. 허나 사실 따지고 보면 바둑 역시 언젠가는 소프트웨어의 능력 범위, 주특기 등으로 포섭되리라는 전망이, 그 반대 입장보다는 훨씬 우세했죠. 구글이 개발한 알파고도, 엄청난 전력 소모 문제를 극복하지 않는 이상 완전한 승리를 선언하기엔 다소 무리가 따릅니다. 구글도 이게 신경 쓰이는지 대외 발표 자료에서 계속 이 문제를 언급은 합니다(얼마씩이나 개선이 이뤄졌다면서).

"숫자가 정보다" 사실 데이터란, 그 자체로는 어떤 효용도 인간 생활에 가져다 주지 못하는, 마치 사막에서 갓 캐어낸 원유와도 같습니다. 수백 년 전 사람들은 그저 "한번 불이 붙었다 하면 좀처럼 꺼지지 않는, 더럽고 성가신 검은 기름" 이상으로 여겨지 않았습니다. 데이터 역시 마찬가지라서, 가공과 해석이라는 단계를 못 거치면 아무 의미 없는 공해 같은 부호의 더미에 불과합니다.

통계 쪽에 종사하는 이들이 궁극적으로 넘어야 할 산은, 공식 하나만 알면 획일적 처리가 가능한 표준화라든가 최소자승법 같은 게 아니고, 이름만 거창하게 어려운 회귀분석도 아니며, 확률, 그 중에서도 베이지언(한국에서는 조건부 확률, 혹은 주관적 확률이라 부르죠) 케이스를 어떻게 능수능란히 다루느냐에 있습니다. 많은 이들은 그저 곱사건인 경우와, 특정 사건을 전제로 한 후 이와 연관된(혹은 무관한) 다른 사건이 연이어 터질 확률 개념 사이를 벌써 헷갈려합니다. 저자는 이를 가리켜 "문맹보다도 더 심각한 수맹"이라고 지적합니다.

빅데이터 처리 과정에서 가장 시급한 과제 중 하나는 바로 "시각화"입니다. 그래프의 함정에 빠지지 말라는 것도 저자의 요긴한 충고 중 하나인데, 그림 도표의 왜곡과 과장에 쉽게 오도되는 것도, 차트라고만 하면 뭔가 그 안에 특별한 비밀이라도 숨은 양 착각하는 대중의 미신 때문이죠. 뭘 모르는 사람 기 죽일 때 "차트나 읽을 줄 알고 하는 소리냐?" 같은 손쉬운 수법이 횡행하는 것도 이 때문입니다.

주식 투자자들 사이에서는 잘 알려진 사례입니다만, 책에는 유유제약의 리포지셔닝 전략이 소개되어 있습니다. 뭔 소린고 하니, 처음에는 영업사원들이 약국마다 돌아다니며 "베노플러스 겔"을 홍보했다고 합니다. 맨소레담이나 안티푸라민(상표명 그대로 쓰겠습니다)하고 같은 과라는 데에 홍보의 주안점이 놓였는데, 사람들 생각은 그럴 것같으면 이름 외우기도 힘든 후발주자를 구태여 약국에서 찾겠냐는 거죠.

그래서 이 회사는, 빅데이터를 분석해서 "멍을 빼는 데에 일반인, 특히 다리를 드러내는 옷을 입기 쉬운 젊은 직장 여성들이 어떤 방법을 사용하는지"를 찾아 보았습니다. 계란으로 문지른다 등등 그야말로 효과가 의심스러운 민간 요법이 대다수! 베노플러스 겔은 소염 효과 외에, 직관적으로 "멍 빼는 약"으로 얼마든지 활용 가능했죠. 동일 상품을 포지션만 새로 정했을 뿐인데 매출은 급상승했고, 어느새 (전에는 없던 카테고리, 틈새 시장) 최강자로 자리매김했습니다. 빅데이터 분석 위력을 잘 증명한 사례이지요.

벤포드 법칙이란, 어떤 자료라 해도 숫자의 첫자리 수는 대개 동일 밀도로 분포되며, 예컨대 5 등 특정 숫자가 자주 나오거나 1, 2, 3, ... 등의 빈도가 큰 차이를 보이면 그 자료는 조작되었을 가능성이 크다는 것입니다. 물론 영리한 조작자는 이런 사정까지를 다 감안하고 더 구체적인 지침 하에 조작을 시도하겠고, 그렇지도 못한 멍청한 범죄자라면 허점과 의도가 뻔히 드러나는 헛수고를 하면서도 혼자만의 환상에 취해 눈가리고 아웅을 하겠지요. 여튼 4차 산업혁명 시대에, 진실을 발견하고 남다른 가치를 찾아내는 능력은, 바로 숫자의 세계 그 비밀과 법칙을 온전히 이해하는 사람에게 주어진다는 책의 결론은 두고두고 곱씹을 만합니다.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo