-
-
한눈에 보이는 데이터 과학과 AI 그림책 ㅣ 한눈에 보이는 그림책
한선관.박소영 지음 / 성안당 / 2023년 3월
평점 :
OpenAI에서 개발한 자연어 처리 인공지능 모델인 챗GPT가 연일 화제의 중심에 있습니다. GPT 모델은 대규모의 텍스트 데이터를 기반으로 사전 훈련된 다양한 모델들을 제공하여, 적은 데이터로도 높은 성능을 보이는 인공지능 언어모델을 구현할 수 있게 되었습니다.
혹자는 이를 두고, '인공지능의 아이폰 혁명'이라 하더군요. 2008, 9년 애플에서 아이폰이 출시되면서 스마트폰이라는 새로운 디지털 트렌드와 함께 모바일 혁명을 이끌었던 것처럼 기존 멀게만 느껴졌던 서툴기 짝이 없던 인공지능과는 달리 사람들이 직접 몸으로 체험할 수 있고, 생산성 향상을 직접 확인할 수 있다는 의미에서 챗GPT는 곧 인공지능 혁명이라 불러도 좋을 겁니다.
이처럼 텍스트 뿐 아니라 대규모의 다양한 데이터(숫자, 영상, 소리, 이미지 등)를 수집하고, 가공하고, 분석하여 거대한 데이터의 홍수 속에서 의미있는 패턴을 발견하고, 그 패턴에서 인류에게 가치있는 지식과 정보를 추출하기 위한 '인공지능 알고리즘'의 발전은 필연적일 수 밖에 없습니다.
이러한 인공지능의 기반이 되는 '데이터 과학에 대한 이해'는 곧 인공지능에 대한 지식과 기술 이해로 나아감을 의미합니다.

오늘 소개해 드리는 <한눈에 보이는 데이터 과학과 AI 그림책>에서는 데이터 과학의 개요와 더불어 핵심이 되는 데이터 처리 절차를 순차적으로 제시하고, 인공지능과의 접목을 통해 최근 관심이 높은 인공지능 기술과 함께 윤리적 이슈까지 짚어내고 있습니다.
특히 이론적 접근 만으로는 이해가 쉽지 않기에 데이터 과학의 실제적인 활용 사례와 구체적인 실습 문제를 따라하도록 코딩과 앱 활용 분석 예제를 제시하고 있어 이해의 폭을 넓히고 있습니다.
아이크림(eye cream)을 구입하기 위한 첫 단계로 나이, 피부 타입 등에 따른 리뷰를 나누고 이를 나와 비슷한 사람들 리뷰만 골라 보기로 정의한 후, 웹 크롤링 기법으로 데이터를 수집하고, 필요없는 내용 삭제 및 결측치를 엑셀로 처리하고, 평균 및 주요 단어를 엑셀과 오렌지3로 추출해내 데이터를 분석하는 예제를 따라해 봅니다.
그 후 워드 클라우드 혹은 그래프 형태로 데이터를 시각화함으로써 처음 목표했던 피부 타입에 따른 리뷰를 선택해서 분석하고, 내 피부 타입 및 나이가 비슷한 사람들의 리뷰를 선택적으로 확인할 수 있음을 체험할 수 있습니다. 말 그대로 실제 데이터 분석과 관련한 전 과정을 아주 쉽고, 간단히 느껴볼 수 있다는 뜻입니다.
또한 실생활에서 데이터 과학을 활용한 대표적인 사례 중 심야 버스의 운행을 위해 다양한 데이터를 분석하여 노선을 확정한 '서울시 심야버스', 운전시간대, 주요 운전경로, 운전습관 및 패턴 데이터를 통해 보험료 책정에 활용하는 '인슈어테크(insuretech)' 그리고 구매내역, 검색기록, 장바구니 물품, 리뷰 및 평점, 재고 등의 데이터를 바탕으로 고객의 선호 물품과 취향을 미리 분석하여 '예측 배송 시스템' 을 구현해낸 사례 등을 자세히 안내하고 있어 현실 생활과 밀접한 관련있는 데이터 수집과 분석의 효용을 잘 보여주고 있습니다.

책의 말미에는 데이터 분석과 관련해 민감한 문제인 데이터 윤리 문제를 다루고 있어 눈길이 갑니다. 민감한 개인 데이터를 다룸에 있어 '개인 정보 보호의 문제'와 해킹과 데이터 탈취관련의 '데이터 보안 문제'를 다루고 있습니다.
특히 데이터를 통해 스스로 학습하는 인공지능의 문제점으로 지적되는 '데이터의 편향성'과 데이터에 접근하고, 이를 확보하는 데 있어서의 '불평등과 격차의 문제'를 예시를 통해 잘 설명하고 있어 인공지능 기술의 진보와 더불어 제기되는 윤리적 문제 이해에 도움이 되리라 생각합니다.
직관적으로 이해되는 풍부한 그림과 도해 그리고 저자들의 친절한 설명으로 데이터 과학과 인공지능의 개념과 원리 그리고 제기되는 다양한 문제들을 일목요연하게 확인할 수 있는 책으로 평가합니다.
인공지능 기술의 기초가 되는 데이터 과학에 대해 쉽게 접근하여 개념과 원리를 이해하고자 하는 분들의 일독을 권합니다.