파이썬 머신러닝 실무 테크닉 100 제이펍의 인공지능 시리즈 (I♥A.I.) 35
시모야마 테루마사.미키 다카유키.이토 준지 지음, 김모세 옮김 / 제이펍 / 2021년 12월
평점 :
장바구니담기


데이터 분석과 관련된 작은 스킬들을 블록식으로 조립하여 MVP 방식에 적합한 소규모 머신러닝 시스템을 구축하는 과정을 담은 책으로 PC 한 대만으로도 소개한 시스템의 구축이 가능하다.

책은 크게 2개의 파트로 나뉜다. 먼저 1부에서는 데이터 분석 시스템을 완성한 후, 2부에서는 1부의 구조화된 시스템에 모델을 결합하여 머신러닝 시스템으로 업그레이드 하는 과정을 거친다.

대규모의 투자를 감행하여 사내에 AI 시스템을 구축하는 것은 사업이 실패할 경우 감당해야 하는 리스크가 크다. 머신러닝 시스템의 성패는 데이터 수집, 전처리, 모델링, 평가, 문제해결에 이르는 일련의 과정을 얼마나 자주 반복하며 개선할 수 있느냐에 달려있다.

바로 이런 측면에서 이 책이 장점을 십분 활용할 수 있는데 처음부터 목적없이 대규모의 시스템을 들이기에 앞서 MVP 규모의 소규모 시스템으로 스스로의 가설을 검증해보고 숨은 인사이트를 발견하는 과정을 반복할 수 있도록 자동화함으로써 목적에 충실한 시스템을 먼저 구현해 볼 수 있다. 이 과정을 반복해나가며 필요할 경우 대규모 시스템으로 진화할 것을 권장하고 있다.

책의 제목과 구성을 볼 때 각각의 스킬이 평행식으로 열거된 100가지 테크닉이 소개되는 것이라고 착각할 수 있으나 100가지 테크닉은 평행적인 나열이 아닌 입체적인 구성과 상호 유기적인 관계를 갖고 있다.

예를 들면 1장의 앞서 소개된 9가지 스킬은 10번째 스킬로 구조화되며 통합되는 방식이다. 또한 2장의 시각화를 위한 각 스킬들은 3장의 대시보드 시스템에 통합 활용되며 구조화된다.

여기에 엑셀 보고서를 통한 의사소통 문제를 해소하는 4장의 내용이 더해지면 5장의 데이터 분석 시스템이 완성된다. 즉, 1 ~ 4장의 내용이 5장으로 통합 구조화되는 모양이라고 볼 수 있다.

여기에 이르기까지 Pandas에서 자주 활용하는 기본적인 기능과 Python의 기초 지식을 익힐 수 있음은 물론 ipywidgets 패키지를 활용하여 주피터 노트북을 인터랙티브하게 활용할 수 있는 등 여러 단독 스킬들을 배워나갈 수 있다.

파트1의 과정은 파트2에서 대부분 복습할 수 있다. 때문에 파트1에서 잘 이해가지 않는 부분이 있더라도 걱정말고 일단 구조화를 향한 큰 그림에 집중하며 실습해도 큰 문제가 없을 듯하다.

그렇다면 파트2는 파트1 대비 어떤 차이점이 있을까? 제목에서 알 수 있듯 파트2에서는 머신러닝 시스템을 향한 구조화 과정이라 말할 수 있다.

6장에서는 1장과 매우 유사하나 머신러닝에서 활용할 목적, 설명, 상관관계 등의 변수를 생성한다던가 범주화 처리 같은 머신러닝 모델이 보다 잘 이해할 수 있는 몇가지 과정이 추가된다는 차이가 있다.

7장은 모델링에 집중한다. 가설을 수립하고 설명, 목적 변수를 선정하며, 알고리즘 선정에서 평가에 이르는 일련의 과정이 포함되어 있다.

8장은 앞에서 배운 6 ~ 7장의 내용을 통합 구조화하며 입력 데이터에 지속적인 변경이 가해지더라도 성능을 자동으로 갱신할 수 있는 시스템을 만든다.

9장에서는 이 모든 내용을 통합하며 10장에서 대시보드로 완성한다. 일련의 예측 및 분석 과정도 결국은 내부를 모르는 또 다른 의사결정자와 소통이 필수적이기에 10장에서는 그런 의사 전달 체계를 위한 과정이 포함되어 있다.

조금 더 나아간다면 해석 가능한 인공지능 기법인 XAI의 기술들이 활용될 수 있겠으나 여기에서는 Feature Importance 정도의 기법만 소개되고 있다.

결과적으로 10장까지 다루는 일련의 과정을 통해 최소 규모의 머신러닝 시스템을 갖출 수 있게 된다. 각 과정에서 군더더기는 최소화되어 제거된 듯 하고 구조화를 향한 목적에 초점을 맞추기 위해 각 기능도 최소로 활용된 느낌이 든다.완성

이 책을 통해 하나의 잘 구조화된 설계 흐름을 익히고 난다면 그 위에 살을 붙여 나가는 과정은 또 다른 좋은 레퍼런스로 충분히 가능할 것이라고 생각하기에 책의 내용을 컴팩트하게 압축하여 핵심에만 집중할 수 있게 구성한 점이 마음에 든다.

그렇기에 머신러닝 입문서에서 배운 기초 과정들이 서로 유기적으로 어느 타이밍에 활용할 수 있을지 입체적으로 이해할 수 있게 된다. 예를 들면 테크닉 20의 경우 차원 소멸의 대표적인 알고리즘 t-SNE를 적용한다.t-SNE

일반적인 입문서로만 학습을 했다면 t-SNE를 배워도 어떤 기초 개념인지는 이해할 수 있어도 이를 어느 타이밍에 어떤 이벤트에 활용해야 할지 바로 떠오르기 어렵게 된다. 하지만 이 책을 통해 일련의 과정을 입체적으로 배우고 나면 그런 기초 요소들을 어느 시점에 적용해야 할지 쉽게 판단이 되는 것이다.

책의 난이도는 데이터 분석을 처음으로 접하는 사람이 도전해도 충분할 것 같다는 생각이 들지만 그래도 Python 프로그래밍 기초 수준은 필요할 듯 하다.

또 본 도서의 과정은 모델의 알고리즘이나 수학적 기초에 집중하는 책이 아니다. 최대한 라이브러리를 이용하고 이론 지식을 소개하지 않는다. 다만 알려진 알고리즘을 어떻게 언제 활용해야 하는지 실무에만 집중하는 책이기에 어느 정도의 모델이나 입문 지식 정도는 알고 실습에 임하면 더욱 도움이 될 것이다.

이 책은 특히 예산이 충분하지 않은 소규모 스타트업의 초기 모델 구축에 도움이 될 것 같다. 그 외에도 개인적으로 소규모 시스템을 구축하고 싶은 독자에게도 추천하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
애즈 어 서비스다! - 비트 경제의 게임체인저
김경훈 외 지음 / 페이퍼로드 / 2021년 12월
평점 :
장바구니담기


서비스로의 변환하는(As a Service) 산업의 제조, 물류, 라이프, 교육, 데이터, AI, XR 등 분야별 현재와 미래를 살펴보고 거대한 트렌드에 대응하기 위한 방법을 조언한 책이다.

본 도서에서 말하는 “As a Service”의 정의는 다소 복잡하나 책의 20p에서 가장 잘 정의하고 있다.

애즈 어 서비스 : 자본주의의 모든 산업에서 기존 구조를 파괴하며 모든 수요자에게 자동화된 디지털 플랫폼을 기반으로 구현한 비소유적 메타 서비스를 제공하는 비즈니스 패러다임.

다소 딱딱하고 추상적인 설명이기에 이 책의 장별 초두에 설명하고 있는 분야별 2030년의 모습을 요약 언급해 보겠다.

  • 제조
    서핑마니아 K씨는 서핑을 즐기다 급류의 물보라 아래로 묻히는 위기를 겪은 후 서버들의 체력을 서포트하는 보조 장비를 기획하여 제작을 의뢰한 후 크라우드 펀딩 모금을 통해 사업을 시작했다.

  • 물류
    풀필먼트 센터장을 맡고 있는 L차장은 파킹로봇과 이동로봇 덕분에 거의 사람없이 배송 업무를 처리한다. 물량이 폭주하면 몇 대 더 갖다 놓으면 되고 24시간 쉬지 않는다. 인수인계나 교육도 필요없고 일의 속도는 점점 더 빨라진다.

  • 라이프
    AI집사 찰스가 아침 식사를 물어본다. “아무거나.”라는 대답에 “어제는 현미식이었으니 샐러드식은 어떨까요?”라는 답이 들려온다. 수락하자 로봇쉐프에게 식사를 주문한다. 구독도시락 서비스의 실시간 버전이다. 외출 시 장소에 맞는 가방과 의상이 자동 주문되고, 당뇨병 전용 맞춤형 케어푸드가 주문되기도 하며, 심부름은 찰스가 대전까지 다녀오는 것은 물론 결제도 알아서 처리한다.

  • 교육
    K교사는 가상교실의 A군을 클릭하자 한달 간 연습량 및 어느 부분에서 주로 실수하는지 파악 가능하다. 일주일에 한 번 열리는 오프라인 수업은 타 대학의 시설을 공유 사용한다.

  • 데이터
    스마트 베게가 수면 상태를 수집하고 미세 진동으로 나를 기분좋게 깨운다. 몸의 바이탈 사인 분석으로 생활 습관 잔소리가 끊이질 않는다. 오히여 불편한 누군가를 통해서 듣는 조언보다 마음이 편하다. 내가 작성한 글 분석을 통해 우울하다는 정황이 파악되어 비슷한 고민의 친구 찾기를 통해 3명의 친구가 연결된다. 퇴근 후 맞춤형 선곡 음악이 흐르고 휴가 추천 여행지 및 행사 등이 TV에 나온다.

  • AI
    로봇 셔틀은 탑승 무게 등을 고려하여 흔들림을 거의 느낄 수 없다. 가드 봇이 정류장에 대기하며 무거운 짐도 옮겨주고 보디가드 역할도 담당한다. 집에 들어서니 홈로봇이 몸 상태를 셰프 봇에 전달하며 잠들기 전 온도 조절과 공기 청정을 열심히 해 숙면을 취하게 해준다.

  • XR
    P군은 바빠 피아노학원을 갈 수 없다. 대신 XR기기를 착용하고 피아노 앞에 앉으면 세계적인 가상 선생님이 레슨을 진행한다. K군은 XR기기로 전 세계의 친구들을 원격에서 불러 프리미어 리그를 시청한다. L군은 증강현실 메타버스 테스트 룸에서 통합 테스트 업무를 진행하고, M군은 전 세계 친구들과 생일 파티를 여는데 촉각, 후각, 미각까지 공유가 가능하다. 기억저장소에 접속하면 만나고 싶었던 조상님들과 대화도 가능하다.

위 예시만큼 이 책을 알기 쉽게 잘 설명해주는 글이 없어 다소 시간을 내어 정리해보았다. 각 장별 내용은 위 예시의 처음과 끝이라 할 수 있다.

즉, 위 상상이 가능하기 위해 분야별로 오늘날의 기술이 어느 수준에 이르렀으며 한계점이 무엇인지 실태를 파악하고 미래로 나아가기 위한 방법을 알아보는 내용이 담겨있다.

생각보다 진척이 빨라 놀라운 산업 분야가 보이는가 하면 의외로 쉬울 것 같은데 난항을 겪는 기술도 있는데 우리가 미래에 살며 직접 겪을 라이프 변화 측면은 물론 관련 비즈니스에 종사하며 내 직무에 직접적으로 영향을 미치거나 투자 등 선제적인 입장을 취할 수 있다는 점이 이 책이 갖는 가장 큰 장점이라 할 수 있다.

부록편에는 As a Service를 실현중인 대표적인 국내외 회사들이 소개되어 있다. 해당 회사로의 이직, 협업, 투자, 벤치마킹 등 다양한 방법으로의 활용이 가능할 것 같다.

더불어 성공적인 As a Service를 위한 체크리스트도 제공된다. 사업을 꿈꾸고 있는 이에게는 매우 중요한 자료가 될 거라 생각하며 현재 근무 중인 사내에서 As a Service를 기획하는 이에게도 많은 도움이 될 것 같다.

요약하자면 As a Service라는 트렌드를 중심으로 현 시점 관련 비즈니스를 분석하는 책이자 세계 시장의 트렌드를 분석한 책이다. As a Service라는 새로운 출발을 기획하거나 창업을 꿈꾸는 독자에게 일독을 권하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
오노레 드 발자크 - 세기의 창조자
송기정 지음 / 페이퍼로드 / 2021년 11월
평점 :
장바구니담기


90여 편에 이르는 소설 “인간극”을 비롯 하루 16시간 이상 글을 쓴 프랑스 작가 발자크의 생각과 작품 속에 녹아있는 프랑스 문화를 30년 간의 연구 끝에 한 권의 책으로 압축한 명작이다.

200년 전 한 천재의 생각을 읽는다는 것은 흥미로운 일이다. 나는 발자크의 생애의 족적을 따라가며 우리나라의 정약용 선생이 떠오르기도 했다.

공간의 차이만 있을 뿐 비슷한 시기를 살았던 인물이자 왕성한 저작 활동 그리고 천재성은 물론 정치, 사상, 철학, 과학, 경제, 법 등 사회 전반을 아우르는 해박함까지 유사한 점이 많았다.

국학에 숨겨진 선조들의 지혜를 얻고 당대 천재들의 생각과 인사이트를 배운다는 점 외에도 200년 전 혹은 그 이전 사람들의 사상과 생각을 읽는다는 것은 설레는 일이다.

경세유표, 목민심서, 여유당전서 등 기회가 닿는대로 다산 선생의 작품을 읽어 온 것은 그 때문이다. 덕분에 세계에서 가장 빠른 근대화를 이룬 국가 중 하나인 프랑스의 낯선 공간을 빗대어 이해하는데 도움이 되었다.

내가 이 책을 읽으며 느끼는 가치는 200년 전 한 사람의 생각을 옆에서 대화하듯 오롯이 알 수 있다는 것, 그럴 수 있을 정도로 그가 다방면에서 많은 작품을 남겼다는 것, 마지막으로 30년 간 발자크를 연구한 저자의 노력이다.

특히 총 등장 인물이 2천 5백명에 달하는 인간극 총서에 가장 관심이 간다. 등장 인물의 수는 그렇다 치고 그 안에 거미줄 처럼 얽힌 유기적 관계를 모두 파악하고 글로 남긴 발자크의 천재성이 놀라울 따름이다.인간극

이 책의 말미에도 인간극의 작품별 주요 인물이 일부 소개되고 있는데 일부의 인물들 간 관계를 정리하는 것만으로도 쉬운 일이 아니다. 하지만 그 오묘한 관계를 파악하고 있노라면 저자의 창의성, 당대 프랑스를 살았던 사람들의 마음 등이 엿보여 즐거움이 샘솟기도 한다.

책의 첫장의 시작은 매우 인상적이었다. 발자크가 당시 활동했던 지역이나 그의 작품에서 등장 인물들이 활동했던 장소를 지도로 확인한 후 그의 작품에 대한 설명이 이어진다.파리지도

프랑스의 지리나 문화를 잘 이해하고 있는 사람에게는 말할 것도 없고 나 같이 프랑스를 잘 모르는 사람도 이 지도를 먼저 익히고 출발하는 것은 나침반 있는 항해와 없는 항해에 견줄만큼 이해에 도움을 준다.

생제르망, 당탱, 마레 지구가 어떤 차이가 있는지 모르는 채 문학 작품을 이해한다는 것은 반쯤 눈을 가리고 출발하는 일이다. 물론 이 퍼즐을 맞춰나가는 과정이 문학작품을 감상하고 즐기는 하나의 묘미이겠지만 그래도 발자크와 같은 대 문호를 이해하는데 진입장벽이 너무 높아진다.

30년 간 발자크를 연구한 저자 분 덕에 200년 전 프랑스의 지리와 문화와 사람들을 쉽게 이해할 수 있어 다행이라는 생각이 들었다. 이런 지도를 펴놓고 그의 소설과 같이 엮어보며 파리에 존재했던 공간의 법칙을 이해할 수 있는 것이다. 공간의 법칙을 어긴 인물은 댓가를 치른다 - 심지어는 목숨일지라도 - 는 당시의 생리를 쉽게 이해할 수 있다.

이어지는 2장 프랑스 대혁명과 7장 철학 연구의 초기 소설들 편은 발자크의 사상과 철학을 느낄 수 있는 장이자 우리 사는 세상 진리가 모두 담겨있는 소재로 이루어져 있어 이해하는데 많은 시간이 걸린다. 독자에게 등불을 밝혀주는 저자의 노력이 없었다면 가히 형체조차 인식하기 어려웠을듯한 느낌이었다.

다른 장은 발자크와 정치관, 과학, 경제, 법 등을 다루고 있는데 한 작가의 작품이 이렇게 다양한 학문과 연결되어 있다는 것이 놀라울 뿐이다. 그렇기에 그의 작품에는 19세기의 프랑스가 그대로 녹아있다 표현할 수 있는 것이리라.

책의 말미에는 이를 증명하는 그의 연보가 나온다. 작가이자 사업가, 사상가이자 정치가로써 그의 왕성한 활동에 놀라지 않을 수 없다. 한 사람이 한 평생을 살며 이렇게 많은 활동이 가능한 것인지는 모르겠지만 그가 남긴 방대한 유작은 독자에게 행복과 즐거움을 선사한다.연보

당시의 정치, 과학 수준, 금융 시스템이나 결혼 제도를 이해하는 재미는 물론 한 정치가가 자유주의자에서 절대왕정파로 이동하기까지의 상황과 심리를 엿보는 것은 신비하고도 즐거운 일이다.

사업가로서 연이은 실패로 빚더미에 시달리고 아이러니하게도 그것이 그를 16시간 이상 글을 쓰게 하여 독자들에게 의미있는 가치를 남기는 일련의 과정속에 삶의 오묘한 이치가 느껴지기도 한다.

근대화로 접어들며 산업 초기 신용 거래 및 경제 구조를 이해하는 것은 꽤 흥미로운 일이었다. 사회주의 진영의 싹이 트는 과정이나 대혁명 이후 부의 분배 문제에서부터 고질적인 자본주의의 행태가 오늘날까지 이어지는 연결고리를 얻을 수 있었다.

문학적으로는 인간의 이중성에 집중하는 것이 매력적이다. 스스로 사업가로 돈에 미치는가 하면 경멸하기도 하고 작품의 주인공들은 배신과 변절이 난무하며 어떤 구절엔 그간의 노력이 부질없다는 듯 허위의식을 풍자하는데 그러다보면 지금 사는 삶이나 그의 작품 세계나 차이가 있긴 한지 궁금해지기도 한다.

바야흐로 오늘날은 컨텐츠 시대이다. 오징어 게임과 웹툰 산업 등 한류의 열풍의 중심에 컨텐츠가 있다. 인간극 총서의 등장 인물과 그들 간의 관계는 오늘날의 컨텐츠를 심오하게 업그레이드 시키는 것에 큰 도움을 줄 것이다.

또 AI가 세상을 변화시키고는 있지만 아직까지는 축적된 데이터가 있어야 그럴듯한 성능을 낸다. 그런 측면에서 존재하지 않는 데이터로서의 발자크의 인간극 총서의 값어치는 상상을 초월하며 그의 행적이 AI 시대 사람이 나아가야할 방향이 아닌가 하는 생각도 들었다.

아무튼 이 도서는 리뷰를 작성하기 너무 어려운 책이다. 내용의 방대함은 물론 하나의 사상이나 생각에 빠져들면 단 몇 장의 분량으로 그 이상의 리뷰를 써야할 지경에 이른다.

말이 발자크의 세계관에 관한 연구이지 한 시대의 모든 것을 한 권의 책으로 녹여 낸 저자의 역량에 감탄할 뿐이다. 이 책으로 문학의 장르가 가질 수 있는 파괴력과 드 넓은 세계를 처음으로 느꼈다.

30년 내공이란 이런 것인가 보다. 다시 한 번 소중한 책을 출간해 주신 저자께 감사드리며 세상을 살아가는 모든 분들께 일독을 권하고 싶다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 과학자 되는 법 - 취업, 이직부터 탄탄한 커리어를 쌓는 방법까지
재클린 놀리스.에밀리 로빈슨 지음, 이창화 옮김 / 한빛미디어 / 2021년 11월
평점 :
장바구니담기


데이터 과학자가 되기 위한 준비, 구직 단계를 거쳐 실무에 적응하고 커리어를 성장시키는 일련의 과정을 잘 정리한 체크리스트형 가이드이다.

데이터 과학자의 커리어를 다룬 책은 흔치 않은데 이 책이 나왔다는 소식을 들었을 때 얼마나 반가웠는지 모른다. 데이터 과학자는 개인적으로 가장 관심이 많은 직종인데다가 저자 뿐만 아니라 다른 실무 전문가들의 인터뷰도 같이 수록되어 있었기 때문이다.

종합적인 평을 먼저 내리자면 절반은 예상대로 기대했던 내용을 담고 있었고 나머지 절반은 다소 아쉬웠다는 평을 내리고 싶다.

만족스러워던 부분을 먼저 언급하자면 데이터 과학자가 되기 위한 일련의 과정을 거의 누락없이 모두 채우고 있다는 것이다. 학위 준비과정만 봐도 학위를 취득할 때 고려해야 할 라이프 스타일, 학비 등 수많은 고려요소들을 모두 수록한 것은 감동이었다.

또, 포트폴리오를 소개한 챕터에서는 실제 포트폴리오를 잘 구성하여 합격한 이들의 예시가 등장하고 있어 많은 도움이 되었다.

좋은 이력서의 예시가 등장함은 물론 이력서를 구성하는 경력이나 학위 등 하나하나의 작은 부분들을 채워나갈 때 마다 가이드를 제시하고 주의 사항을 명시하고 있어 혹여나 내가 준비 과정에서 중요한 요소를 놓치지 않게끔 도와준다.

부트캠프나 커뮤니티 활동에 있어서 어떤 과정이 있는지 구체적으로 명시하고 있으며 각 단원마다 관련 경험이 있는 실무자를 섭외하여 인터뷰를 수록한 것은 가장 큰 장점 중에 하나이다.

실제 인터뷰를 통해 저자들의 편향에서 벗어나 객관성을 확보하고 있고 각 장의 말미마다 참고 문헌이 공개되어 있어 자칫 편향에 빠지지 않도록 주의를 기울인 정성이 눈에 띄였다.

가장 주목할 만한 부분은 10장 분석 파트로 실제 현업에서 이뤄지는 일련의 분석 과정을 대부분 수록하고 있고 그 안의 의사소통 과정에서 벌어질 수 있는 실무 문제들에 대처할 수 있게 잘 쓰여져 있다.

반면 내 기대치가 너무 높아서일까? 책에 등장하는 실무자들이 구체적으로 어떤 일을 하고 있는지 자신들의 일이 공개되지 않는 점이 아쉬웠다.

너무 추상적이어서 실제 데이터 과학자들이 하는 일을 구체적으로 알기 어려운 편이다. 인터뷰를 수록한 이들은 한정된 지면 떄문에 어쩔 수 없을지라도 적어도 두 저자의 경험만큼은 구체적으로 언급되었다면 실제 데이터 과학이 무엇인지 독자들이 감을 잡기 쉽지 않았을까 하는 아쉬움이 생긴다.

물론 이 책은 데이터 과학자들의 일을 다뤘다기 보다는 커리어에 대한 가이드이기에 이 점을 충족시키지 못한 것이 결함이 되지 않는다는 것은 알지만 파트 3, 4에서 취업에 성공한 데이터 과학자들이 헤쳐 나가야 할 길을 안내하고 있기에 실무가 구체적으로 소개되었으면 좋겠다는 아쉬움은 어쩔 수 없다.

또, 전반적으로 너무 교과서적으로 쓰여진 느낌이 있다. 실제 구체적인 예시 보다는 전체를 아우르는 이론서 같은 느낌이 들어 머리속에서 구체적인 이미지로 형상화되기 어렵다. 가끔 번역체 같이 이해하는데 어려운 어순의 번역도 조금 더 쉬운 이해를 방해하는 요소이다.

내심 자신이 구체적으로 어떤 일을 하는지 구체적인 프로젝트 진행 과정은 무엇인지 공개하는 책을 기다리는 마음이 커서 어쩌면 책을 객관적으로 평하지 못했을지도 모르겠다.

사실 이것은 내 욕심이다. 데이터 과학자에 대한 정의도 명확하게 내리기 어려운 시점에 스스로의 방법을 자신있게 공개할 수 있는 사람은 많지 않을 뿐더러 책을 쓸 시간이 없을 정도로 바쁠 수도 있다. 나아가 기업의 기밀을 담고 있을 가능성도 있어 여러 이유로 구체적인 실무 과정을 공개하기는 쉽지 않을 것이다.

아무튼 개인적인 바램은 뒤로하고 객관적으로 이 책은 훌륭한 책이 맞다. 이 책을 그대로 따라하기만 해도 데이터 과학자로써 취업하고 커리어를 발전시키는데 훌륭한 나침반이 될 것임은 의심의 여지가 없다. 내가 평한 구체적인 실무는 주위 동료들과 경험이 메꿔줄 수 있을 것이다.

또한 데이터 과학자의 커리어를 다루는 거의 유일한 책이기에 이 책이 가지는 희소성 가치는 높다 할 것이다. 데이터 과학자를 준비하는 사람이라면 미래를 설계하는 매 순간순간 마다 이 책이 많은 도움을 줄 것이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
빅데이터 커리어 가이드북 - 빅데이터는 무엇이고, 빅데이터 전문가는 어떤 일을 할까?
조성준 외 지음 / 길벗 / 2021년 11월
평점 :
장바구니담기


AI, 빅데이터 분야를 목표로 하는 독자를 위한 책으로 빅데이터 산업 분야 및 전망, 현업 실무자들의 인터뷰, 국내외 지원 절차, 갖춰야 할 역량까지 종합적으로 안내하는 커리어 가이드이다.

신생 산업 분야의 커리어를 이렇게 잘 정리한 책은 처음 본다. 그동안 찾고 있던 유형의 책인데 내용도 기대 이상이었다. 결론부터 말하자면 AI 분야의 커리어에 관심이 있는 분이라면 반드시 읽어야 할 필독서라 평하고 싶다.

저자를 먼저 소개하자면 서울대학교 데이터마이닝 센터장과 같은 연구실 출신의 연구원들이 공동 집필했다. 구성원들의 지식만으로도 이미 충분히 가치 있는 책이 나올 수 있었을텐데 거기에 집필진의 인맥이 가미된 것 같다.

네이버, 삼성 등 국내 AI를 선도하는 인력들의 인터뷰도 실려있는데다 갖춰야 할 지식을 다룬 3장의 경우 입문서에 가까운 정도의 대부분의 필요한 지식의 엑기스가 잘 정리되어 있다. 게다가 길벗이라는 IT 전문서 출판사의 친절한 구성까지 합쳐져 개인적으로는 간만에 참 완벽한 책을 만났다는 생각을 했다.

책은 순서대로 읽어도 좋지만 4장 취업 파트부터 읽은 후 2장 직무를 파악하는 순서로 읽을 것을 권하고 싶다. 아무래도 커리어 서적인 만큼 당장 급한 내용은 4장에 포함되어 있고 2장을 권유하는 이유는 데이터 분야의 직종이 어느정도 정립되어 가는 지금 시기에 적합한 형태로 직무가 잘 정리된데다 현업 실무자의 인터뷰가 실려있기에 구체적으로 본인이 어떤 일을 하게 될지 예측이 가능해지기 때문이다.

그 다음으로는 취업을 위해 갖춰야 할 지식을 파악하기 위해 3장 지식 파트를 읽은 후 1장으로 산업 동향을 파악하고 전체를 정리해보는 것이 어떨까 싶다.

이 순서에 입각하여 소개하자면 먼저 4장에서는 구체적으로 취업을 위한 프로세스를 다룬다. 먼저 본인의 강점을 파악하여 직무를 정하고 업무 도메인을 정한 후 적합한 회사를 찾는 순서로 진행할 것을 가이드 하는데 단계별로 꼼꼼하게 주의사항을 정리하고 있어 잘 아는 선배가 옆에서 인도하듯 도움되는 느낌이다.

특히 2절에는 어느 분야보다 경력직을 선호하는 AI분야에서 신입도 취업에 성공할 수 있을 만한 자격을 마련하는 방법을 다루고 있다. 인턴십, 연구실 인턴, 공모전, 개인 프로젝트, 인사이트 도출 훈련, 링크드인과 깃허브의 관리, 헤드헌터 활용 등의 가이드가 제시된다.

그 중에서도 개인 프로젝트의 예시로 한 지원자가 글래스도어 해외 구직 사이트를 NLP 등으로 분석했던 개인프로젝트 덕에 취업에 성공한 사례가 제시된다. 인사이트 도출 훈련도 생각지 못한 방법이라 신선했다.

결국 이런 개인 프로젝트는 전문가에게서 고도의 스킬을 쌓는 방법은 아닐지라도 스스로 얼마만큼의 열정이 있는지 그리고 스스로 문제 해결 능력을 갖췄다는 점에서 면접관이 보기에 흥미를 끌만한 요소라는 생각이 든다.

이 책은 주위에 알려진 뻔한 방법은 물론이거니와 나 같이 적극적으로 취업 및 시장의 동향을 파악하는 독자조차 생각지 못했던 팁을 주기에 매우 훌륭한 커리어 도서라는 확신을 할 수 있었다. 아래 그림과 같이 연구실 인턴십 지원을 위한 콜드 메일의 예시까지 등장할 줄은 상상도 못했으니 말이다.콜드메일

다음으로 읽으면 좋을 2장에는 앞서 언급한 바와 같이 현업 실무자의 인터뷰가 상당히 도움된다. 먼저 직종을 매우 잘 정리한 도표가 있으니 이를 통해 데이터 분야의 직종 구분을 어느 정도 분류해볼 수 있다.직종

데이터 분야에서 가장 활동이 왕성한 페이스북 커뮤니티인 텐서플로우코리아에 올라오는 구인글이나 구직자의 분류를 참조할 때 거의 유사한 형태의 직종으로 잘 정리된 것 같다는 생각이 든다.

이 중 가장 유명한 직종인 데이터 사이언티스트 직종에 대해 책에서 어떻게 다루고 있는지 예시를 들어 보겠다. 먼저 독자에게 친절한 길벗 서적 답게 북맵이라는 가이드가 제시된다. 아래 그림과 같이 해당 직종은 다른 직종 대비 어느 정도의 관련성이 있는지 친절하게 안내하고 있어 전체 직종대비 읽고 있는 직종의 위치가 대략 가늠된다.직종

이어 포뮬레이션과 같은 이 직종에서 하는 일들이 소개되고 어떤 적성의 지원자에게 적합한지 안내되고 있다. 일반적인 설명이지만 꽤 구체적이고 재미있게 구어체 식으로 설명되고 있으며 이 조차 이해 되지 않을 경우를 대비해 후반부에 현업 실무자의 인터뷰가 등장한다.

네이버 데이터사이언티스트 전영환 님의 인터뷰에서는 스마트어라운드 서비스를 기반으로 한 오늘의 PICK! 서비스를 만드는 데 저자의 업무가 어떤 형태로 이뤄지는지 엿볼 수 있다. 추천시스템과 협업 필터링의 개념을 추가로 알 수 있는데 이런 용어가 어렵다면 추후 소개할 3장에서 대략의 지식을 파악해보면 되니 걱정하지 않아도 된다.

단순히 일의 소개에 그치는 것이 아니라 인터뷰이가 현 시점 생각하는 인재상과 취업에 대한 조언도 언급되니 놓치지 말고 읽어야 한다. 예를 들면 모델링, 코딩 외에도 관련 분야에 대한 인사이트가 중요하다는 점을 강조하고 있으며 팔방미인에서 세분화 된 능력을 갖추는 것이 중요한 시점이 되었다는 트렌드도 읽을 수 있다.

회사를 선정하는 방법에 있어서도 데이터가 주가 되는 회사인지, 배울 점이 많은 회사인지가 가장 중요하다는 친절한 조언을 들을 수 있다. 그 외에도 위 도표에 제시한 다른 직종도 비슷한 상세함과 친절함으로 설명되고 있으니 스스로의 적성과 흥미가 어느 직무에 가장 어울릴지 보다 세부적으로 검증해 볼 수 있다.

다음으로 3장에서는 직무를 수행하기 위해 갖춰야 할 능력을 소개한다. 수학 및 통계학, 머신러닝, 프로그래밍, 시각화는 물론 파이프라인에 이르기까지 필수 지식을 한 번에 정리하고 있는데 이 모든 것을 완벽하게 아는 사람이 있을 수 없는 만큼 이 파트의 가치는 필요한 지식의 엑기스를 체계화 했다는 것에 있다고 할 수 있다.

특히, 8절 머신러닝의 경우 입문서에 가까운 수준의 내용을 담고 있다. 입문서 한 권을 매우 잘 요약하여 엑기스만 뽑아내 매우 쉽게 학습할 수 있는 느낌이다.

적어도 이 책의 1,2,4장을 이해하는데 필요한 교양 수준의 지식을 담고 있으며 교양에서 전공 사이의 경계선 수준에 해당하는 지식들이 담겨있어 이 분야의 진로를 꿈꾸는 학생들에게는 향후 훌륭한 나침반이 될 만한 지식을 담고 있다고 볼 수 있다.

이에 그치지 않고 이번 장 또한 아래 그림과 같이 심화학습을 위한 학습 가이드도 온라인, 서적 분야로 잘 정리하고 있어 감동을 받았다. 개인적으로 데이터 관련 서적을 200권 이상 읽고 집에 약 500권 정도 책을 쌓아놓고 틈나는대로 보기에 적어도 어떤 책이 좋은 책인지 정도는 알고 있다.가이드

장담하는데 이 책에서 추천하는 도서나 온라인 강의는 정말로 대내외적으로 검증된 좋은 레퍼런스들이다. 혹시나 길벗 출판사에서 발간된 책이라고 길벗 책만 추천하진 않을까 눈여겨 봤는데 그런 편향없이 훌륭한 책들이 잘 소개되어 있다.

마지막으로 1장은 대부분 2 ~ 4장의 요약본이라고 보면 되며 추가로 산업 동향, 케이스 스터디의 정보가 담겨있다고 보면 된다.

특히 케이스 스터디의 가치가 높다고 생각하는데 팀구성, 시각화 도구 도입, 개발 환경 구축, 이탈 예측모델로 이어지는 회사에서 수행되는 프로젝트의 요약본을 매우 상세하게 엿볼 수 있는 기회이니 이 부분을 정독할 것을 권하고 싶다.

프로그래밍 언어론이 있는가 하면 이를 프로젝트화하는 SW개발방법론이 있듯 빅데이터의 어떤 직무도 결국은 이 개발방법론을 거친 서비스 혹은 제품으로 귀결되기 마련이다. 이 과정에서 회사에서 각 구성원들이 어떤 방향으로 움직이는지를 잘 엿볼 수 있는 귀한 내용이 담겨 있다.

이외에도 주변에서 흔히 듣기 힘들었던 들도 자세히 소개되어 있다. 구직 정보는 그동안 사기업 사이트만 알고 있었지 공공 중심의 알리오라는 서비스가 있다는 것도 이 책을 통해 처음 알았고 마이더스 아이티 회사에 AI 역량검사가 있다는 사실도 그동안 듣기만 했지 이번에 구체적으로 알 수 있었다. 또, 해외 이력서를 작성하는데 있어 Overleaf와 같은 사이트가 있다는 것도 처음 알았다.

빅데이터 분야의 커리어 서적은 처음이라 관심이 많았지만 막상 뚜껑을 열어보니 상상 이상으로 알차게 구성되어 있어 너무 놀랐다. 커리어 서적은 난이도의 문제가 아니라 정보 유무의 문제이다. 정보 유무의 문제는 모르면 매우 힘든 길을 빙빙 돌아가게 되고 시간과 노동력의 낭비가 크다.

심도있는 이해와 노력 없이도 그런 정보가 있다는 것을 알면 끝날 문제를 빙빙 돌아갈 필요는 없다고 보기에 만약 이 분야의 커리어를 목표로 두고 있는 독자라면 반드시 본 도서를 먼저 접한 후 추가적인 정보를 조사할 것을 권하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo