데이터 과학 레벨 업 with 로드맵 - 캐글 그랜드마스터가 알려주는 문제 해결의 기술
콘라트 바나헤비치.루카 마사론 지음, 김형민 옮김 / 한빛미디어 / 2023년 4월
평점 :
장바구니담기


얼마전 챗-GPT를 개발한 OpenAI의 CEO인 샘 알트멍의 인터뷰 기사를 읽었다.
내용인 즉슨 오픈API 합류 후 머신러닝을 대하고 그것읗 학습한 과정과 챗-GPT 등 서비스를 개발한 과정에 대한 이야기였다.
그가 머신러닝, 딥러닝을 익히기 위해 얼마나 노력했는지에 대한 내용과 그가 AI 서비스를 개발하면서 어떤 과정을 거쳐 왔는지를 진솔하게 이야기하고 있었다.
그리고 느낀 점은 저렇게 난 사람도 어려워하는데, 이 바닥에서 살아남으려면 나같은 범인은 어떻게 하여야 하는가 하는 것이었다.

<데이터 과학 레벨업 with 로드맵>은 나처럼 머신러닝, 딥러닝 결국인 데이터 과학에 치중하게 되는 인공지능 기술을 어떻게 익히고 경험을 최소한이나마 쌓을 수 있는지를 알려주는 책이다.

이를 위하여 캐글(https://www.kaggle.com)이라는 사이트를 이용한다. 따라서 책의 시작은 캐글에 대한 시작으로부터 시작하고 있다. 캐글을 이용하여 데이터 과학, 더 나아가 AI 관련 기술을 익혀서 성공한 사례와 캐글 사이트의 서비스를 이용하는 방법(데이터셋, 캐글 노트북 사용법 등)을 소개하고 있다.

그 이후에 캐글에서 제공하는 데이터셋을 이용하여 모델링 및 최적화 등을 하는 방법을 알려주고 있고(이 책에서는 이것을 ‘대회를 위한 테크닉’이라는 파트로 다루고 있다), 끝으로 데이터 과학자가 되기 위한 경력관리 방법 즉 포트폴리오 준비하는 방법과 캐글에서의 새로운 기회를 찾는 방법을 알려주고 있다.

케글에서 데이터셋을 발굴하고 모델링한 후 그것을 최적화하여 답을 제시하는 것은 다른 책에도 많이 나와 있는 듯하지만, 캐글을 이용한 경력관리 방법에 관한 내용은 나로서는 이 책에서 처음 접하는 듯하여 매우 신선하게 다가왔다.

특히 캐글을 넘어 온라인에 존재감 드러내기는 블로그나 깃허브를 이용하여 자신이 작성한 코드를 공개하고 외부에 알릴 수 있다는 것을 소개하고 있으며, 또한 자신을 적극적으로 알리기 위하여 캐글에 새롭게 등록되는 대회에 적극적인 참여가 필요함과 이러한 최신 소식을 지속적으로 모니터링이 필요하다고 적고 있다.

덧붙이자면 블로그를 통해 자신을 알리는 것은 기술적인 글쓰기 방법을 익혀야 함을 의미한다.
결국은 이 세계에서 살아남기 위해서는 지속적인 학습과 끊임없는 노력이 필요하다는 것이 아마 이 책의 결론이 아닐까 싶다.





댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo