-
-
AI 시대의 데이터 패러독스 - 데이터 홍수 속에서 가치를 끌어 올리는 13가지 원칙
니틴 세스 지음, 옥경석 옮김 / 에이콘출판 / 2026년 2월
평점 :
이 서평은 네이버카페 #리뷰어스클럽 의 소개로
출판사로부터 서적을 제공받아 주관적으로 작성하였습니다.

처음에 이 책을 접했을 때 느꼈던 것은 패러독스와 데이터라는 단어가 주는 이질감이었습니다. 정확히는 책 아래쪽에 데이터는 홍수인데, 인사이트는 가뭄이다라는 뭔가 모순에 가까운 문장이 눈길을 끌었기에, 조금은 학구적(?) 그리고 AI시대에 대한 걱정 등이 결합되어 책을 읽고자 하는 의지가 생겼네요. 그래서 서평단을 신청했더니 운 좋게 당첨이 되었습니다. #리뷰어스클럽 이라는 네이버카페입니다.
패러독스의 사전적 의미는 "누구나 당연하다고 믿는 상식을 빗나가거나 겉으로는 모순되어 보이지만 그 이면을 치열하게 파고들면 전혀 변하지 않는 진실을 품고 있는 상황을 뜻함"이라고 되어 있는데, 실제로 데이터가 어떤 패러독스를 갖고 있는지 상당히 궁금했습니다. 데이터가 워낙 많이 쏟아져 나오는 상황에서 데이터가 많아질수록 우리의 통찰력도 함께 깊어지고 발전할 것이라 생각하는 가운데-인간에 대한 과대평가?일까요?- 수많은 회사들이 거대한 데이터 센터를 짓고 인공지능을 도입했습니다. 하지만 정작 가장 중요한 결정을 내려야 할 순간에는 넘쳐나는 정보 때문에 오히려 갈팡질팡하는 것 같습니다.

저자 니틴 세스는 굉장한 경력을 가지고 있습니다. 글로벌 최고 기업들에서 오랜 기간 핵심적인 리더십을 발휘한 탁월한 데이터 전문가로 보입니다. 30년의 리더십은 신뢰도 면에서는 많은 점수를 주고 싶네요. 뜬구름 잡는 이론만 펼치는 것이 아닌 치열한 비즈니스 현장에서 수없이 실패하고 부딪히며 깨달은 그의 생생한 실무 경험이 책 전반에 느껴집니다. 힌디어와 중국어로 번역한다는 말은 세계 인구의 1/3 이상이 접할 기회를 얻는다는 말이겠지요?
그만큼 책에 대한 수요도 크다는 말이라고 생각합니다.

목차에서부터 차근차근 독자에게 데이터의 발전사를 이해시키고자 하는 저자의 의도가 보입니다. 데이터가 폭발적으로 많아진 과정에 대해서 이야기를 시작해서, 물리적인 세계에서 디지털 세계로 전환되며 마침내 인공지능 시대로 진입하는 거대한 기술의 흐름을 하나의 그림으로 그려냅니다. 그림에 나와 있는 다양한 회사나 용어들은 다 들어보셨을 것이라고 생각합니다. 하지만 어떤 연관성이 있는지, 구별을 하는 방법에 대해서는 잘 모를 수 있는데, 저자가 정말 잘 정리해두었습니다. 결국 인공지능은 양자컴퓨터와 블록체인과는 뗄래야 뗄 수 없는 걸까요?

이와 같이 기술은 이토록 눈부시게 발전했지만 결국 인간이 직접 해결해야 할 문제를 올바르게 정의하지 못하면 그 거대한 데이터는 그저 컴퓨터 서버 공간만 차지하는 쓸모없는 숫자의 나열로 전락하고 만다는 사실을 이야기하고 있는 것 같습니다.

데이터 품질은 맥락 최우선 접근이 필요하다라고 말하는 이 부분에서 전체적인 저자의 의도를 알 수 있었습니다. 워낙 데이터가 많다보니 절대적인 기준은 이미 중요하지 않고, 질적인 부분과 필요에 따라 중요도가 갈린다는 것 같습니다. 아무리 오류 없이 깨끗하게 정제된 데이터라고 할지라도 그것을 사용하려는 구체적인 목적과 주변 환경이라는 맥락에 맞지 않으면 철저히 무용지물이 된다는 뜻이라고 생각합니다. 흔히 데이터를 일단 긁어모으는 컴퓨터의 물리적인 성능에 집착할 수 있게 되는데, 그것 보다는 논리적으로 엮어내고 맥락을 부여하는 인간의 구조적인 사고방식이 중요한 것임을 이야기하려고 하는 것으로 보입니다.

데이터를 생태계로 표현하는 점도 재미있습니다. 호수가 아니고 바다인 이유는 무엇일까요? 고립되고 닫힌 호수처럼 데이터를 한 부서나 한곳에 가둬두는 것이 아니라 끝없이 흘러드는 물, 데이터로 확장되는 바다처럼 다양성을 적극적으로 포용해야만 데이터가 강력한 존재로 거듭날 수 있음을 말하는 것입니다. 이렇게 말하면 너무 추상적으로 데이터를 이야기하고 있는 것만 같은데, 과연 그런걸까요?

현대 데이터 스택의 주요 기술 전환을 표로 깔끔하게 비교해 둔 페이지를 보면 과거의 낡은 온프레미스나 배치 처리 방식에서 벗어나서 클라우드와 마이크로서비스 그리고 인공지능 최우선으로 나아가는 기술의 실질적인 진보가 일어 나고 있는 것을 잘 분석하고 있습니다. 또한 고도화된 기술의 화려함 이면에 반드시 존재해야 하는 윤리적 책임과 인간의 자리를 절대 놓치지 않는다는 점을 저자는 강조합니다. 데이터 공유와 프라이버시를 진지하게 다루는 챕터에서 에드워드 스노든이 이용당하는 것은 데이터가 아니라 사람이다라는 말을 합니다. 우리도 느끼는 바가 있습니다. 개인정보의 유출에 대해 생각만 해봐도 간단합니다. 방대한 데이터를 다루는 과정에서 기술이 지닌 맹목적인 발전 속도만큼이나 인간을 먼저 생각하고 보호하려는 윤리적 균형 감각이 얼마나 절실한지 언급해 주는 부분도 있습니다.

사실 책 내용에 신빙성을 더해주는 것은 이처럼 수십 건 이상의 참고문헌입니다. 실제로 얼마나 많은 연구와 분석을 통해 데이터 패러독스 책을 펴냈는지 알 수 있는 부분입니다. 그렇다고 해서 책이 아주 두꺼운데 필요 없는 부분이 있는 것도 아니고, 책 전체 내용이 매우 충실하게 구성되어 있습니다.

데이터는 폭발적으로 늘었는데 왜 성과는 늘 제자리일까? 하고 데이터 사용에 대한 반성에 대한 질문을 받으면, 어떻게 대답해야 될지 몰랐었습니다. 하지만 책에서 구체적으로 제시하는 13가지 핵심 원칙을 정독한다면 이런 데이터 홍수의 시대에서 인간의 통찰력만큼 중요한 것이 없다는 결론에 이를 수 있게 됩니다. 단 하나의 진실이라는 허황된 목표를 향해 달리다가 길을 잃는 경우가 많을 수 있는 이런 인공지능 시대에 대한 대답을 해주는 책이라고 생각합니다.
겉으로 드러난 화려한 기술의 이면에 숨겨진 데이터의 본질을 꿰뚫어 보고, 현재 진행형인 데이터 홍수의 시대에 매몰되지 않고 통찰력을 키우고자 하는 분들이라면 이 책을 읽고 성찰해보시면 좋겠습니다.
