XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 - 캐글 고수에게 배우는 실전 파이썬 머신러닝, 코랩에서 실습 가능
코리 웨이드 저자, 박해선 역자 / 한빛미디어 / 2022년 4월
평점 :
장바구니담기


이번 달에 리뷰하게 된 책은 <XGBoost와 사이킷런을 활용한 그레이디언트 부스팅>이다. 다른 사람 책상 위에 이 책이 있는 걸 보고 "무슨 내용이지?" 하고 궁금했던 차라 반가웠다. 그리고 생계형 번역가꾼이라고 자칭하는 박해선 님이 번역한 책. 초판 1쇄. ^^


서문에 "데이터 과학 전문가, 데이터 분석가, 빅 데이터를 빠르고 정확하게 처리하는 머신러닝 모델을 구축하려는 개발자를 대상으로 합니다. 파이썬에 익숙하고 선형 대수학의 기초를 알고 있으면 이 책을 읽는 데 도움이 될 것입니다." 라고 써있다. 즉, 왕초보를 위한 책은 아니라는 얘기다.


먼저 밑바닥부터 그래이디언트 부스팅 모델을 만들어 보고 나서 빠르고 효율적이라고 하는 XGBoost 라이브러리의 속도감을 실감할 수 있게 해준다. 

Part 1은 선형회귀, 로지스틱회귀, 결정트리(Decision Tree), 배깅, 랜덤 포레스트, 그레이디언트 부스팅을 다루고 있고, 

Part 2에서  XGBoost를 소개한다. 모델을 만들고 튜닝하는 과정이 있다. 

Part 3에서는 XGBoost에 있는 다양한 기본 학습기의 차이점에 대해서 알아보고 적용도 해본다. 선형 기본학습기인 gblinear, 결정트리의 변종으로 드롭아웃 기법을 사용하는 DART(Dropouts meet Multiple Additive Regression Trees), XGBoost 랜덤 포레스트를 소개하고 있다. 성능을 높이는 것은 어떤 경우든 지난한 튜닝의 과정이 필요하네. 기계가 학습을 하는 건지 내가 학습을 하는 건지 모를....(둘 다 학습을 하겠지) 

마지막으로는 XGBoost를 사용해 캐글 대회에서 우승한 캐글 마스터들로 부터 배울 수 있는 노하우를 소개하고 있다. 역시나 새로운 특성을 만들어서 최적의 모델에 적용하는, (시간도 엄청 많이 걸리는데) 그냥 단순히 시간만으로는 해결되지 않는 과정이 있구나. 머신러닝 파이프라인을 구성하는 것까지 해서 책이 마무리된다.


​이전에 보았던 다른 책들 보다 한 단계 더 깊이 들어간 내용을 다루고 있나보다 생각했었지만, 읽다보니 Pandas로 데이터프레임을 처리하는 것이나 원핫인코딩과 같은 기초적인 개념들도 같이 다루고 있었다. 파이썬을 아는 정도라면 머신러닝 입문자도 읽을 수 있을 것 같다.


​이런 부분은 다른 책에서는 보지 못한 부분이라 재미있다.


보면서 살짝 아쉬웠던 건 종이가 너무 얇다는 거... 형광펜이라도 그으면 뒷면에 비칠 것 같아서 그냥 연필만 쓰게 된다.  그래서 전체적으로 책이 얇고 가벼워졌다는 장점도 있겠지만... 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
fastai와 파이토치가 만나 꽃피운 딥러닝 - 박사 학위 없이 AI를 폼나게 구현하는 법
제러미 하워드.실뱅 거거 지음, 박찬성.김지은 옮김 / 한빛미디어 / 2021년 8월
평점 :
장바구니담기


720쪽이나 되는 굉장히 두꺼운 책이라서 끝까지 다 보지는 못했지만..

"높은 수준의 수학 교육이나 수년 간의 교육이 필요하진 않다, 약간의 상식과 끈기만 있으면 끝까지 읽을 수 있는 책이다." 라는 글에 힘입어 끝까지 나가보기로. 즉, 고등학교 수학 정도 마쳤다면 누구나 공부할 수 있다고 한다.

고등학교 수준의 수학 실력으로 고가의 장비 없이(Colab활용!) 50개 미만의 데이터로도 의미있는 결과를 도출해 내는 것. 딥러닝을 막 시작한 사람들에게 필요한 것 아닐까.


내용 면에서는 이미지, 자연어 처리, 범주형/연속형 데이터 처리부터 밑바닥 부터 딥러닝을 구현하고 성능을 향상시키는 방법, 실무에서 중요한 최신 딥러닝 기술 소개, 딥러닝 연구 논문을 읽는 방법, 윤리적인 측면에 대한 고민까지 광범위하게 다루고 있다. 처음에는 넓은 관점에서 큰 그림을 보고, 서서히 세부적인 것으로 들어갈 수 있도록 구성했다. 사전 학습된 모델을 사용해 가능하면 빨리 자신의 문제에 활용할 수 있도록 유도하는 방향으로 끌고 가므로 질리지 않고 재미있게 공부할 수 있을 것 같다. 앞부분에서 너무 이론이 길어진다든가, 너무 깊이 들어가면 뒷부분까지 끌고 나가기가 어려운데...


실습은 Colab을 이용하면 되니 큰 부담이 없고,

https://course.fast.ai/start_colab#Opening-a-chapter-of-the-book

이 사이트에 접속하면 Colab 사용법 부터 각 챕터마다 담겨 있는 소스코드들을 Colab에서 활용할 수 있는 링크를 볼 수 있다.


이 책을 보고 싶었던 제일 큰 이유는 파이토치로 되어 있기 때문이라는 것인데, 그동안 텐서플로에만 익숙해져 있었는데, 이번에 자연어처리를 공부하면서 파이토치에도 익숙해져야 할 필요가 생겨서이다. 기본 개념을 알고 있으면 몇 가지 문법적인 차이만 배우면 되지 않을까 하는 가벼운 마음으로 접근해 보려고 한다.(그러다 큰 코 다치려나?)



각각의 명령어 라인에 대해서는 책에서 상세하기 설명을 하고 있기 때문에 그대로 따라가다 보면 감을 잡을 수 있겠다. 실제로 학생들을 가르치면서 느끼는 것은 코드를 작성하고 실행하는 것 보다는 "무엇을 위한 코드를 작성할 것인가"를 생각하고 결정하는 것이 훨씬 더 중요하다는 것이다. 내가 해결하고 싶은 문제가 무엇인가가 먼저이고, 그것을 어떻게 해결할까는 그 다음. 해결책에 대한 안내는 여기저기 참 많다. 이 책도 좋은 안내서가 될 것 같다. 또한 이 책에서는 '원동력 접근법'이라는 것을 소개하고 있는데, 실제로 모델을 유용하게 사용하기 위해 먼저 모델의 사용 방식을 고려해 보자는 것이다. 먼저 목표를 고려하고, 목표에 변화를 주는 '레버'를 생각한 다음, 각 레버를 목표로 연결하는 유용한 데이터가 무엇인지 고민하고, 모델을 구축하는 것이다. '원동력 접근법'이라는 것은 2012년에 나왔다는데(10년!) 용어 자체는 처음 들어보고, 내용 면에서는 내가 생각했던 것과 통하는 점이 있어서 흥미로웠다.


책의 구성이나 배치도 읽기 편하게 되어 있고, 각 장마다 있는 결론, 질문지, 추가연구 부분이 생각할 거리를 줘서 나에게는 참 유익했다.




본 글은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
AI로 일하는 기술 - 인공지능은 어떻게 일이 되는가: 메타버스, NFT, 자율주행 결국 이 모든 것은 인공지능이다
장동인 지음 / 한빛미디어 / 2021년 12월
평점 :
장바구니담기




나처럼 AI 기술에 관심을 가진 사람을 위한 책이라기 보다는, AI에 대한 전반적인 사항들, 다양한 관점을 접하고 싶은 사람들을 위한 책인 것 같다. 하지만 그렇다고 해서 가벼운 책은 아니다. 사실 이 책에 대해서는 모임의 다른 분이 '임원들이 읽어봐야 할 책'이라며 소개해줘서 처음 알게 되었다. 아마 다음과 같은 내용들 때문이었던 것 같다. 다음 페이지에서는 임원들이 코딩을 배워야 한다고 주장한다.^^ 기업이 인공지능 기술을 도입하는 데 실패해서 잃는 기회 비용과 인공지능 전문가를 영입했지만 부서 간 협업이 안 되어 잃어버린 시간 비용 등을 계산해 보면 임원들이 코딩을 배우는 비용이 훨씬 저렴하기 때문이라고 한다. 단지 "코딩을 배워라" 라는 문구 때문이 아니라 책을 읽다 보면 인공지능이 막연한 대상에서 점점 구체화 된다.



실제로 AI에 관해 궁금해할만한 내용들을 조근조근 쉽고 재미있게 풀어나간다. 질문은 크게 다음 47가지로 되어 있다.

01 인공지능이 뭔가요?

02 인공지능 역사에도 겨울이 있었나요?

03 인공지능의 문제점은 없나요?

04 인공지능도 인간의 뇌를 닮아 인간처럼 학습하나요?

05 인공지능은 어떻게 학습하나요?

06 인공지능이 데이터를 학습할 때 문제점은 없나요?

07 머신러닝과 딥러닝은 어떻게 다른가요?

08 알파고가 이세돌을 이긴 후 바둑계는 어떻게 되었나요?

09 알파고는 어떻게 되었나요?

10 인공일반지능이 뭔가요?

11 특이점이 뭔가요? 언제 올까요? 온다면 어떻게 될까요?

12 인간과 구별이 안 되는 인공지능이 가능한가요?

13 인공지능은 어디까지 발전할까요?

14 기계가 인간보다 나은 시대가 올까요?

15 인공지능이 사람을 지배하는 세상이 올까요?

16 인공지능은 어떤 분야가 있나요?

17 인공지능을 하려면 꼭 수학을 알아야 하나요?

18 인공지능을 공부하려면 어떻게 해야 하나요?

19 인공지능이 보는 면접은 어떻게 준비해야 할까요?

20 미래에는 어떤 직업을 가져야 할까요?

21 인공지능의 발달로 직장을 잃게 된다는 게 사실인가요?

22 사람이 인공지능보다 더 잘할 수 있는 분야가 있을까요?

23 인공지능이 글을 쓴다고요?

24 인공지능이 노래를 한다고요?

25 인공지능이 작곡도 할 수 있나요?

26 인공지능이 박세리보다 골프를 잘 친다고요?

27 인공지능 스피커는 왜 사람의 말을 못 알아들을까요?

28 챗봇은 언제쯤 제대로 사용할 수 있을까요?

29 인공지능이 그림을 그린다고요?

30 인공지능 배우가 생겼다고 하는데 앞으로 어떻게 될까요?

31 요즘 뜨는 메타버스와 NFT는 인공지능과 어떻게 관련있을까요?

32 한국의 인공지능 수준은 어느 정도인가요?

33 인공지능이 선생님이 될 수 있을까요?

34 인공지능으로 신약 개발을 한다고요?

35 완전 자율주행차는 언제쯤 나올까요?

36 인공지능 주식 트레이더를 믿어도 될까요?

37 게임에서 인공지능은 어떻게 쓰이나요?

38 군대에서 인공지능을 어떻게 활용할까요?

39 기업에서 인공지능을 어떻게 활용할까요?

40 기업이 인공지능을 어떻게 도입하면 좋을까요?

41 기업에서는 인공지능을 어떻게 구현하나요?

42 우리는 인공지능을 어떻게 바라봐야 할까요?

43 인공지능을 윤리적으로 어떻게 바라봐야 할까요?

44 인공지능을 철학적으로 어떻게 바라봐야 할까요?

45 인공지능을 법률적으로 어떻게 바라봐야 할까요?

46 인공지능을 교육적으로 어떻게 바라봐야 할까요?

47 앞으로 나올 인공지능 신기술은 무엇이 있을까요?

인공지능이 잘할 수 있는 것(인식, 예측, 자동화/최적화, 생성, 의사소통 기능)과 할 수 없는 것, 앞으로 가능하게 될 것들에 대해서도 명쾌하게 이야기하고 있다. 얼마 전에 참여했던 캠프에서 한 팀이 지난 주가 데이터를 가지고 미래 주가를 예측하는 주식 트레이딩 프로그램을 만들었는데, 모의투자에서 1억 투자해서 4원을 벌었다고 했다. 절대로 실제 투자는 하지 말라고만 말해줬다. 인공지능이 마치 만병통치약의 이름처럼 보이지만, 단순한 기술만으로 실현하기 힘든 것들도 많이 있다. 주식 투자처럼. 도메인 지식 뿐만 아니라 어떻게 변화할지 모르는 국제 정세, 급작스런 이슈들....이런 것들을 다 담아낸다고 하는 것은 쉬운 일이 아니므로... 그런데 역시나...ㅎㅎㅎㅎㅎㅎ



나같은 경우에는 평소에 인공지능을 윤리적으로, 철학적으로, 법률적으로, 교육적으로 어떻게 바라봐야 할까 하는 문제에 가장 관심이 많았다. 그것이 정립되고 나서야 내가 어떻게 처신해야 할 것인가에 대한 기준을 세우고 방향을 정할 수가 있기 때문이다.



저자는 서로 다른 분야의 전문가들과 제대로 된 대화를 시작할 수 있으려면 우선 인공지능과 일반인공지능을 구분할 수 있어야 한다고 말한다.

1. 인공지능은 행위의 주체가 아니다.

2. 인간의 뇌와 인공지능은 근본적으로 같지가 않다.

3. 인공지능은 자의식이 없다.

4. 인공지능은 자유의지를 가질 수 없다.

5. 인공지능은 감정을 가질 수 없다.

6. 인공지능을 사람과 같은 객체로 인정할 수 없다.

7. 인공지능에게 법적 지위를 부여할 수 없다.(또한 책임과 권한도 없다)

이렇게 가정하고 인공지능을 바라보면 많은 모습이 다르게 보인다. 그리고 인공지능을 만들거나 사용하는 내의 책임이 더 무겁게 느껴진다.

나는 사실 과학기술의 발전이 이제 그만 멈췄으면 하고 바라는 사람 중에 하나이다^^ 아날로그에 대한 향수가 많다. 그리고 눈 뜨면 새로운 것이 생겨나는 세상이 조금 버겁다. 기술 발전의 속도가 예전보다 너무나 빨라져서 자라나는 학생들은 좋기도 하겠다가 힘들기도 하겠다가....ㅎㅎㅎ 하지만 어쩌랴. 아무리 거부해도 인공지능 속에서, 아니면 인공지능과 같이 살아가야 할 운명인 것을.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
맛있는 디자인 프리미어 프로 CC 2021 - 쉽게 배워 제대로 써먹는 유튜브 영상 편집 맛있는 디자인 시리즈
정지원 외 지음 / 한빛미디어 / 2021년 3월
평점 :
구판절판


대충 익혀서 대충 사용해 왔던 <프리미어 프로>를 제대로 사용해 보려고 스터디 모임에 참여해서 끝까지 모든 예제들을 다 해봤다. 어떤 것이든 본인만의 영상으로 연습을 충분히 하는 것만큼 실력이 느는 건 없겠지. 이 책에도 다양한 예제와 설명들이 실려있지만, 결국에는 영상을 많이 만들어 보는 것이 답인 것 같다.


이 책에서는 학습에 사용될 영상과 프로젝트 파일도 공유를 해주고 있다. 즉, 재료는 다 준비해 주었고 책에는 자세한 레시피가 써있으니 맛있게 요리만 하면 된다. 그런데 사실 내가 만든 요리는 그냥 인스턴트 음식 같다. 빨리 내 재료를 준비해서 맛난 음식 만들어야지. 레시피는 이미 책에 다 있으니...




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
인공지능 딥러닝 직접 코딩하기 with 라즈베리파이 피코 - 인공지능 딥러닝 알고리즘 구현과 활용
서민우 지음 / 앤써북 / 2021년 11월
평점 :
장바구니담기


라즈베리파이로는 가볍게 많은 것을 할 수 있지만 그래도 여전히 학생들한테는 부담스러워 선뜻 사용할 수가 없었는데, 피코가 나왔다. 4딸라~

피코를 즉시 활용할 수 있는 책도 나왔다고 하니 안 볼 수가 없지.

엔써북에서 나온 <인공지능 딥러닝 직접 코딩하기 with 라즈베리파이 피코>


책은 결코 가볍지 않다. 1장. 인공 지능 딥러닝의 이해 모두 이해하려고 하면 머리가 아플 수 있기 때문에 "아, 이런 게 있구나. 이렇게 동작하는 구나"하는 감만 잡은 다음에 우리 모두가 좋아하는 피지컬 활동으로 넘어가도 좋겠다.


2장 파이썬 인공지능 키트 시작하기에서 LED, 부저, 푸시버튼, 빛 센서, 온도 센서, RGB LED, RGB LCD를 가지고 이런 저런 동작을 하다가 얘를 좀 더 똑똑하게 만들어 보고 싶다는 욕구가 솟아 오를 때 3장 인공 지능의 딥러닝 알고리즘 동작 원리 이해와 구현을 통해서 인공지능에 대한 이해를 넓혀갈 수 있다. 


4장에서는 Numpy에 대한 얘기가 나온다. Numpy DNN 여기에서부턴 쉽지 않다. 하지만 끝이 보이니 조금 더 힘을 내보자.

4딸라~(라고 말하지만 실제로 사려면 체감은 그보다 더 하지만)짜리 라즈베리파이 피코는 초등학생, 중학생도 사용할 수 있지 않을까? 하고 생각하고 있었기에 이 책도 아이들을 가르치는데 참고해야지 했는데 내용은 쉽지 않다. 우선은 파이썬의 기본 문법은 알고 있어야 시작할 수 있다. 고등학생, 성인들이 공부를 시작할 때 참고하기 좋은 책인 것 같다. 그런데 책의 내용에 비해 가격이 너무 착한 거 아닌가...? ^^

장점:

1. 인공지능(딥러닝)의 개요부터 설명해 준다.

2. 라즈베리파이 피코 자체만으로도 코딩이 가능하고 LED나 센서 등을 다뤄볼 수 있어서 이론공부가 머리아플 때 간단한 토이프로젝트를 해볼 수도 있다.

3. 그림설명이 잘 되어 있다.

단점:

1. 내 눈이 어두워졌나 왠지 글씨가 좀 흐리게 보인다.ㅜㅜ


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo