빅 데이터가 뭐예요? 미래를 여는 키워드 7
반병현 지음, 김민준 그림 / 풀빛 / 2026년 2월
평점 :
장바구니담기


이 글은 출판사로부터 책을 제공 받고 작성한 리뷰입니다


빅 데이터가 뭐예요?

반병현 김민준
풀빛출판사

대체로 동의하듯이 생각보다 ai의 발전 속도가 눈부시게 지나왔고 이제는 새로운 뉴스기사거리 외에는 더 쓸어담을 정보가 없다고 할 정도로 거대한 빅 데이터를 소유하게 된 것이 지금의 ai이다. 문제는 뉴욕타임즈와 같은 메이저 언론사가 챗gpt 등을 상대로 데이터를 무단으로 가져가 학습시킨 건에 대해 소송 중에 있다고 한다. 챗gpt 외에도 다른 생성형ai들도 인터넷을 통해 모든 분야의 고유 정보들을 무단으로 학습하여 가지고 있으며 이를 바탕으로 사람들이 ai에게 프롬프트라는 작은 창을 통해 필요한 정보를 물어보면 빅데이터를 가진 ai는 순순히 체계적으로 대답을 해주기는 하지만 그 전에 ai가 정보를 무단으로 가져간다는 부분은 누구나 동의하기 쉽지 않은 사실이다.
저자분이 언급했듯이 참 적절한 비유인데, 요리재료는 세상에 존재하는 빅데이터이고 요리는 ai 자체이며 요리사는 인간이기 때문에 인간이 올바른 사고를 가지고 ai를 운용하지 않으면 부정적이고 매우 우려될만한 결과를 양산해낼 것이기 때문에 요리사의 윤리가 가장 최우선되는 부분이라고 했다.

빅데이터는 처음부터 빅데이터가 아니었다. 수십년 동안 인터넷 발족이후에 쌓이고 누적된 정보들이 스몰한 크기에서 빅사이즈로 변형된 것이다. 이를 처리할 컴퓨터의 성능도 처음에는 적은 데이터를 감당하기도 어려웠지만 눈부시게 발전하여 슈퍼컴퓨터부터는 웬만한 연산과 처리도 단시간에 끝낼 수 있게 된다. 예컨대, 한 사람이 전문가가 되기까지 의무교육부터 선택교육인 박사과정까지를 볼 때 230권 분량의 책을 보게 되며 더 심도 있게 책을 섭렵한다면 2000권 정도를 독서한다고 하는데, 이를 글자 용량으로 따지면 600메가바이트정도 된다고 한다. 한 사람이 이천권의 책을 대략 60년 사이에 읽는다고 할 때 슈퍼컴퓨터는 이 용량을 1초정도에 처리할 수 있다고 한다. 지금은 더군다나 슈퍼컴퓨터가 계산하는 것도 버거운 복잡한 우주공학계산을 감당하기 위해 양자컴퓨팅을 개발하려고 시도 중에 있다는 것을 들었다.

이런 발전 속에서 ai를 평면에서 접하는 것에서 나아가 현재는 입체적인 삼차원상의ai인 휴머노이드를 양산하고 있는 중이다. 즉 로봇이다. 유수의 거대 기업들은 피지컬을 갖춘ai 즉 휴머노이드의 자연스러운 움직임을 발전시키는 동시에 공급가격을 줄이는 노력도 가하고 있다. 하여 기업이나 공공기관에 공급되는 것에서 더 나아가 가정용으로도 충분히 공급되도록 하는 목표를 가지고 있다. 현재 시점으로 가격대가 상당히 낮아져 억대가 아닌 수천만원 대로도 로봇이 구입가능하다고 들었다. 이렇게까지 가능해진 것도 빅데이터를 축적하여 활용한 덕분일 터이다.
책에서 빅데이터의 개념과 역사, 활용에 대해서 그림을 통해 알기 쉽게 설명해주고 있다. 물론 아직 생성형ai가 아무리 세상의 모든 정보를 가지고 있어도 사람에게 전달하는 정보의 사실유무 등의 신뢰도는 여전히 양산되는 문제점 중의 하나이다. 하여 오류를 줄이기 위한 대책과 개발도 이뤄지고 있을터이다. 한번에 뚝딱하고 이뤄지는 것은 없다. 어느 정도 궤도에 오르기까지 개발과 수정을 번갈아가면서 가야하는 지난한 여정이다. 모든 사람들에게 밝은 미래와 건투를 빌어본다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo