데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
장바구니담기


* 출판사에서 보내준 책을 읽고 서평을 썼습니다.

몇 년 전부터 빅데이터라는 단어가 널리 쓰이고 있습니다. 국가나 기업 등에서는 많은 데이터를 가지고 있는데 그동안은 이를 분석할 수 있는 하드웨어나 소프트웨어에 한계가 있었습니다. 최근 기술이 발전하면서 대용량의 데이터를 빠르게 처리할 수 있게 되면서 데이터를 분석해 의미있는 인사이트를 도출하고 있네요. IoT 기기들도 널리 쓰이면서 하루에 생산되는 데이터의 양은 폭발적으로 증가하고 있는데 앞으로 데이터의 중요성은 커질 것입니다.

이러한 데이터는 우리 삶에 어떤 영향을 미치고 있을까요. '데이터의 역사' 에서는 데이터 종류와 이를 어떻게 분석 및 활용하고 있는지 인류의 역사를 통해 살펴보고 있습니다.

국내 총생산, 국가 행복 지수, 세계 대학 순위 등 분야별로 대표값들이 많이 있습니다. 우리는 다양한 경제 활동을 하는데 각각이 얼마의 가치를 창출하는지 계산한 다음 모두 더해 국내 총생산을 산출하고, 이를 달러로 환산해서 전세계 국가들이 서로 얼마나 우위에 있는지 비교하네요. 국가 뿐만 아니라 개인 차원에서도 대표값이 정의될 수 있는데 세대별 평균 자산이나 평균 대출 금액, 평균 월 지출 등이 있습니다. 국가나 개인을 분석하려고 하면 막막할 수 있지만 이렇게 데이터를 통계에 활용함으로써 대략적인 파악이 가능해졌네요.

AI 시대에 들어와서는 데이터의 중요성이 더욱 커지고 있습니다. AI 는 비교적 최근에 등장한 기술인것 같지만 컴퓨터도 없던 1950년대에 여러 교수와 연구원들이 미국 다트머스 대학에 모여 기본 개념을 정립하였습니다. 이후 두 번의 AI 혹한기를 보내면서 침체기를 겪기도 하였지만 대량의 데이터와 이를 학습한 모델을 만들면서 널리 쓰이기 시작했습니다. AI 는 사람이 하는 말을 알아듣고 답을 내는데 답도 단순히 텍스트에 그치는 것이 아니라 이미지, 음성, 영상 다양하네요. 결과물을 보면 정말 내가 한 말을 이해한 것처럼 보이는데 수많은 데이터를 학습해 그 데이터에 기반해 비슷한 답을 생성해 낸다고 합니다. 대용량의 데이터 처리가 가능했기에 AI 가 등장할 수 있었네요.

이러한 학습에는 우리가 온라인에서 활동하면서 만든 모든 데이터들이 그대로 들어가기도 합니다. 글을 쓰거나 다른 사람이 하는 말에 댓글을 쓰면서 만들어진 언어 데어터는 AI 가 사람처럼 말하도록 하는데 유용하네요. 하지만 이러한 데이터를 무단으로 수집하면서 문제가 되고 있습니다. 얼마전 한 AI 기업에서 만든 모델의 답변에서 특정인에 대한 상세한 개인 정보나 메신저 대화가 나와 사회적으로 큰 이슈가 되었습니다. 온라인에서 상품을 검색하고 구입하면 웹사이트에 그 상품과 관련된 광고가 뜨는 것을 볼 수 있는데 온라인을 통해 편리하게 서비스를 이용할 수 있지만 반대로 개인 정보가 노출되는 위험성이 있네요. 유럽에서는 GDPR 을 만들어 대응하고 있는데 우리나라도 해킹 사고가 빈번히 발생하고 있어 개인 정보 보호를 위한 대책이 필요해 보입니다.

앞으로 데이터의 중요성은 더 커질 것입니다. 데이터를 분석하거나 활용할 수 있는 기술도 발전하면서 우리 삶에 더 큰 영향을 미칠텐데 데이터에 대해 읽어볼 수 있어서 도움이 되었습니다.






댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo