데이터과학자의 사고법 - 더 나은 선택을 위한 통계학적 통찰의 힘
김용대 지음 / 김영사 / 2021년 2월
평점 :
장바구니담기


데이터과학자의 사고법 - 더 나은 선택을 위한 통계학적 통찰의 힘

_김용대 / 김영사

 


감정에 치우치지 않는 데이터

 

‘4차 산업혁명’, ‘빅데이터’, ‘인공지능과 더불어 빼놓을 수 없는 것이 데이터과학이다. 데이터과학은 빅데이터보다 전문성이 요구되는 분야이다. 이 책의 저자인 통계학 박사이자 데이터사이언스학과 김용대 교수는 현 시대에 데이터과학은 우리 주위에 공기처럼 존재한다고 언급한다.

 

데이터과학에 대한 오해 두 가지를 확인해볼 필요가 있다. 첫 번째는 과학을 위한 데이터이다. 데이터 중심 연구가 다양한 과학 분야에서 각광받고 있다. 의학 분야에선 정밀의료’, 생물학 분야에선 생물정보학’, 기상학에선 엘니뇨 예측’, 인지과학분야에선 뇌 네트워크 분석’, 언어학 분야에선 텍스트 마이닝등이 과학을 위한 데이터이다. 이러한 연구들은 데이터과학을 활용한 것이지 데이터과학 그 자체가 아니라는 것이다. 통계학에 가깝다고 봐야 할 것이다. 데이터 과학에 대한 두 번째 오해는 데이터를 위한 기술이라는 것이다. 응용분야의 지식과 데이터 기술은 데이터과학에서 매우 중요한 부분이지만 데이터과학의 전부가 아니라는 것이다. 데이터과학의 핵심에는 데이터로부터 유용하고 새로운 정보를 찾기 위한 합리적 사고방법이 자리 잡고 있다.

 

저자는 이 책을 통해 데이터과학에서 다루는 복잡하고 어려운 방법을 설명하지 않는다. 다만 데이터를 통한 합리적 의사결정이 왜 어려운지 일상 속 여러 사례를 통해서 소개하고, 다양한 분야에서 데이터과학의 활약상을 살펴보고 있다. 데이터를 통한 합리적 의사결정은 응용분야 전문가뿐만 아니라 우리의 일상생활에서도 매우 중요하다는 것에 역점을 둔다.

 

실생활에서 만나는 흥미로운 소재들도 많다. ‘2년차 징크스는 왜 생길까?’_평균으로의 회귀, ‘왜 내 차선만 막히나요?’_데이터 편이, ‘술 취한 사람 이해하기’_임의보행, ‘로또에 당첨되는 법’_다중비교 그리고 데이터의 활약상 챕터에선 인구조사에서 빅데이터 시대까지, 질병과의 전쟁, 유권자의 마음을 읽어라, 당신도 모르는 당신의 마음 등과 데이터과학이 새로운 도전과제로 삼는 인공지능으로 이어진다.

 

미래 예측하기챕터를 정리해본다. ‘차원의 저주와 과적합 문제라는 아리송한 부제가 붙어있다. 미래를 알고 싶어 하는 인간의 욕망은 무한질주이다. 저자는 미래를 아는 것과 미래를 예측하는 것은 다르다고 한다. 누구나 미래를 정확히 알 수 없다. 단지 예측할 뿐이다. 데이터로 미래를 예측하는 어떤 방법이 있을까? 한 예를 들면, 내 수명이 얼마나 남아있을까? 즉 앞으로 얼마나 더 살다 갈 수 있는가? 저자는 한 가지 방법을 제안한다. 나와 가장 비슷한 사람을 국민건강보험공단에서 갖고 있는 사망자 데이터를 통해 예측해볼 수 있다고 한다. 문제는 비슷한 사람을 찾는 것이 관건이다. 설령 (, 몸무게 등 신체조건, 출생지, 학력, 직업 등등)비슷한 사람을 찾았다고 할지라도 과적합 문제에 봉착하게 된다는 것이다., 조건을 너무 많이 적용할수록 결과는 안 좋다. 이럴 경우엔 조건을 줄여서 적당히 비슷한 사람 여러 명을 찾은 뒤 그들의 평균수명으로 의뢰자의 수명을 예측하는 것이 훨씬 정확하다는 이야기다.

 

인공지능이 인간을 넘어설지에 대하여 많은 논의가 진행되고 있습니다. 인공지능은 데이터를 바탕으로 지식을 추출하고 미래를 예측합니다. 따라서 경험해보지 않은 상황에서는 예측을 할 수 없습니다. 반면에 인간은 창의적인 사고로 인류가 경험하지 못한 상황에서도 적절한 판단이 가능할 것입니다. 이러한 면에서 인공지능은 인간을 넘어서기 어려워 보입니다. , 데이터는 감정이 없습니다. 모든 상황에서 객관적인 평가를 할 수 있습니다. 이와 반대로 인간은 감정에 치우치며 종종 일을 그르치곤 합니다. 인공지능과 공존하기 위해서 인간에게 필요한 것이 무엇인지 생각하게 됩니다.” (p.143)

 

 

"출판사에서 도서를 지원 받아 작성한 리뷰"

 





댓글(0) 먼댓글(0) 좋아요(19)
좋아요
북마크하기찜하기 thankstoThanksTo