기계의 반칙 - 위대한 AI 석학이 해설하는 인공지능에 대한 오해와 진실
넬로 크리스티아니니 지음, 김정민 옮김 / 한빛미디어 / 2023년 11월
평점 :
장바구니담기


인공지능 분야의 석학이 20년 이상 AI를 연구하는 과정에서 겪어 온 철학적, 기술적 고찰의 기록

첫장을 열면서부터 시기적으로 이르게 깜짝 놀랐다. 세간에 알려진 AI에 대한 생각 또는 접근방식과는 달리 저자만의 독특한 시각과 깊이 있는 인사이트를 느낄 수 있었기 때문이다.

오랫동안 과학, 좁게는 AI의 영역에 있어 칼 세이건이나 엘런 튜링과 같은 저명한 과학자의 위상은 범접할 수 없는 신과 같은 존재였다. 튜링테스트는 말할 것도 없고 외계 지능체 탐사를 위해 공헌한 칼세이건의 노력에 흠집을 내려는 시도는 저명한 이들조차 엄두를 내지 못하는 영역이었다.

그럼에도 저자는 그들에게 선전포고하는 것으로 본 도서의 시작을 열었다.

칼 세이건의 주장에 따르면 외계 지능체는 3차원의 31^3 비트 시퀀스이자 포름알데히드 분자를 형상화한 이미지를 표현한 무선 신호만으로도 우리의 존재를 인식할 수 있음을 주장했다.

이러한 가설은 외계 생명체 역시 우리와 같은 우주에서 진화했고 같은 물리법칙의 지배를 받았을 것이기에 이러한 개념을 이해할 수 있다는 점에 기인한다.

가설을 테스트 하는 과정에 있어 물리학 박사 과정의 학생 네 명이 부분적으로나마 메시지를 해독할 수 있었다는 점은 긍정적이었지만 저자의 테스트에서 칼 세이건의 가설은 통과하지 못한다.

저자의 고양이들에게 금속판과 무선 시퀀스를 활용하여 테스트를 진행했지만 고양이로 부터 어떤 답장도 받을 수 없었기 때문이다.

인간 판정단이 대화 중 상대방이 인간이라고 생각할 수 있는지의 여부를 테스트하는 튜링 테스트 또한 마찬가지이다. 인간인지 아닌지 판단한다는 기준 자체가 지극히 인간 중심적이다.

이를 통해 저자가 주장하는 바는 코페르니쿠스적 전환의 강조이다. 지구가 세상의 중심이 아니듯, 지능이라는 것을 정의 내리는 것에 있어 그 중심에 인간이 있어서는 안된다는 것이다.코페르니쿠스적 전환

무언가를 정의라는 내린다는 것은 어찌보면 단순한 행위일지도 모른다. 하지만 이 정의 하나에 외계 생명체를 발견하는 방식 및 가능성이 뒤집힐 수 있고 뒷 장에 이어질 기계 및 AI를 이해하는 정도와 방식이 뒤집힐 수 있음을 책을 읽는 내내 지속하여 경계할 수 밖에 없었다.

이어지는 장은 저자가 AI를 연구해오며 등장했던 굵직한 사건들의 기록들이 담겨있다. 한국인이라면 모르기 힘든 이세돌과 알파고의 접전에서부터 데이터에 조그만 관심이라도 가진 이라면 들어봄직한 추천 시스템을 통해 어느 아빠가 어린나이에 딸이 임신한 사실을 알게 된 일화 등이 대표적이다.레시피

AI의 태생에 결정적 기여를 한 접근방식을 치트키라 표현하며 소개하는가 하면 기계 학습의 패턴 속에서 질서를 찾아내는 고찰 그리고 부분적으로 인간의 지능을 뛰어넘는 기계 지능에 대한 저자의 견해는 소개된 주제 하나하나에도 책 한권 분량의 리뷰를 작성할 수 있을 정도로 거대한 철학의 향연이다.

책의 후반부로 진입할수록 기계와의 공생 방법에 대한 고찰로 이어진다. 로봇을 금지가 아닌 규제하는 방식으로 우리 삶에 받아들이는 방법이라든가 의도를 벗어난 행동 즉, 윤리적인 측면의 고민 그리고 소셜 머신과 같이 우리 사회에 이들이 영향을 미치는 정도와 우리 삶에 침투하는 방식 등에 저자의 인사이트를 엿볼 수 있다.

AI의 역사는 짧지만 사건의 분량은 적지 않다. 하루에도 수없이 쏟아져 나오는 AI의 논문 홍수 속에서 새로운 기술이나 인사이트를 쫓는데도 급급한 요즘이다.

상황이 이러할 진데 한가롭게 AI의 본질과 윤리 혹은 인류의 미래에 공생할 수 있는 방법을 찾는데 기울일 수 있는 시간은 얼마나 될까?

하지만 이런 신기한 기술의 일부를 쫓는데 급급하여 정작 중요한 본질적인 부분, 즉, 우리의 미래 그리고 기계와의 공생에 대한 인문학적인 고찰은 기술의 발전 속도를 어느정도 따라가고 있는지에 대한 고민이 끊임없이 이어졌다.

책을 읽으며 가장 강렬히 느낀 것은 지금이 매우 중요한 시점인 것 같다는 생각이다. AI 연구자 혹은 업계 종사자라면 더 중요한 본질을 놓치고 있지는 않은지 각성이 필요해보인다.

AI에 직접적인 관련이 없는 독자들 또한 마찬가지다. 이것이 우리 삶에 침투하여 어떤 미래를 선사할 것인지 그 안에서 나의 역할은 무엇일지 고찰할 시간이 필요하다. 이러한 이유에 기인하여 이 책의 존재 가치는 더욱 빛난다고 말할 수 있을 것 이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
윤피티의 프레젠테이션 디자인 실무 강의 with 파워포인트 - 마이크로소프트 MVP & 프레젠테이션 디자이너에게 1:1로 배우는
윤상림 지음 / 한빛미디어 / 2023년 11월
평점 :
장바구니담기


PPT 프레젠테이션 디자인 실무 기법을 전달하는 책.

효율적으로 PPT 도구를 다루는 방법과 시각적으로 매력적인 다자인을 구성하는 방법을 쉽게 알려주는 책이다. 개인적으로 컬러를 선택하는 노하우, 이미지를 PPT에 녹이는 방법, 파워포인트 기능의 숙달, 저자의 경험에 기반한 인사이트 등 크게 네가지 측면에서 많은 도움을 받았기에 각각 하나씩 소개해보고자 한다.

첫번째로 소개하고 싶은 장점은 컬러를 선택하는 노하우를 얻을 수 있었다는 점이다. 디자인 문외한인 나로써는 색상을 고르는게 정말 쉽지 않았다. 색상의 가지수가 몇가지인지는 모르겠으나 내게 너무 많은 선택권을 주는 것이 불안했다. 긴 시간을 들여 고른 색상은 너무 원색적이거나 촌스러웠으니 색상을 고르는 데 들이는 시간도 아까웠다.

그 때문인지 그동안 PPT의 색상을 중요하게 생각하지 않았다. 인터넷에서 돌아다니는 예쁘고 세련되어 보이는 PPT를 몇개 구한 후 그 중 눈에 띄는 색상을 선택하는게 보통이었는데 이 책 덕분에 PPT 내부 컬러도 각각 메인, 서브, 베이스 컬러로 세분화 된다는 사실을 알 수 있었다.

어쩐지 인터넷에 돌아다니는 예쁜 색상 몇가지를 선택하다보면 PPT 한페이지 자체는 나름 봐줄만한 것 같기도 하였으나 결과적으로 전체 PPT 작업이 끝나고 나면 통일성이 깨지는 느낌을 받곤 했다.

정신없이 산만해 보인다거나 너무 다양한 색상 조합으로 정신없고 집중력이 떨어져 가독성을 해치곤 하였는데 메인 컬러를 선택하고 저자의 경험과 조언에 따라 서브 색상 및 베이스 컬러를 선택하는 순서로 진행하니 전체적으로 PPT에 어떤 색상을 녹여야 할지, 혹은 색상 부분에 있어 내가 현 시점 어떤 색상을 선택해야 할지에 대한 나름의 기준이 세워졌다.컬러

두번째로 마음에 들었던 것은 이미지를 PPT에 녹이거나 편집하는 기술이다. 이미지와 PPT는 완전 별개라고 생각해왔는데 이미지를 PPT에 들여와 숨을 쉬게 해주는 과정이 생각보다 다양하다는 것을 깨달을 수 있었다.

예를 들어 아래 예제처럼 카카오 프로필의 둥근 사진은 무조건 포토샵에서 가공해서 들여와야 하는 줄 알았는데 PPT에서도 불러온 이미지를 타원형으로 잘라주는 스킬이 있다는 것을 이 책을 통해 처음으로 알게 되었다.이미지편집

더욱이 품질 좋은 이미지를 얻는 방법도 궁금했는데 저자가 소개하는 다양한 레퍼런스 사이트들 덕분에 이미지를 구하는 데 많은 도움을 얻을 수 있었다.이미지레퍼런스

세번쨰로 인상적이었던 부분은 PPT의 다양한 기능을 일목요연하게 정리해준다는 점에 있다. 개인적으로 프로그래머이기에 단축키를 즐겨 활용하는 편이었는데 유독 PPT를 다룰 때면 단축키를 몰라 마우스의 사용 비중이 월등히 늘어났다. 신기하게도 평소 행태랑 다른 걸 몸이 아는지 단축키를 쓰지 않다보면 이내 머리가 재미없어 한다. 왠지 자신감도 떨어진다.

때문에 언젠가 PPT 단축키를 한 번 일목요연하게 정리하여 익혀야 겠다 생각했는데 그 생각만 벌써 15년째 가지고 있고 막상 실행으로 옮기진 못했다. 이 책은 PPT를 단축키를 활용하여 더욱 풍부하게 활용하고 빠르고 효율적으로 이용할 수 있도록 도와주고 있어 이런 부분은 독자로써 상당히 고마운 부분이었다.단축키와 기능

그동안 서식만 복사하는 기능을 몰라 마우스 우클릭으로 어렵게 경로를 찾아가며 기억력을 탓하고 시간을 낭비하곤 했었는데 ctrl + shift + c키로 서식복사하고 ctrl + shift + v 키로 붙여넣기를 하며 ‘역시 이 맛이지!’를 여러번 외쳤다.

비단 단축키 외에도 PPT에 숨겨진 유용한 기능들은 PPT를 나름 구상하고 기획하는 데 있어 많은 자신감을 주었다.

마지막으로 저자의 경험과 노하우가 풍부하게 수록되어있다는 점을 강조하고 싶다. 특히 책의 후반부에 해당하는 파트2 부분에서 저자의 인사이트를 많이 얻을 수 있었다.

이런 경험적인 측면은 독자에게 전달하기 쉽지 않다는 것을 잘 알고 있다. 추상적으로 전달하면 체계를 확보하며 배울 수 있다는 점이 장점이나 구체적으로 실전에서 당장 적용하기 어렵다.유형별

반면 너무 구체적으로 전달하면 따라하기는 쉽고 무엇인지 확실히 이해는 할 수 있으나 체계가 잡히지 않아 유사한 케이스를 마주했을 때 즉각적으로 배웠던 기술이 떠오르지 않아 또 한참을 해맨다.

파트2에서는 제안서, 포트폴리오, 브리핑, 강의자료 등 템플릿 유형별로 실습을 진행한다. 각각의 목적에 따라 전달방식은 달라진다. 강조하고자 하는 부분부터 목적이 달라지는데 늘 동일한 유형의 템플릿을 사용했던 내가 우수한 품질의 PPT를 만들 수 없음이 당연하게 느껴졌다.템플릿

한편 다소 아쉬운 부분도 있다. 저자의 스킬을 전달하는 방식이 보다 타임라인에 기반하였으면 어땠을까 싶다. 대부분 PPT에 관심을 가지는 사람은 시간이 많지 않은 사람들이다.

파트2의 유형별로 실습을 진행하며 작업자에게 필요한 선택의 순간마다 어떤 기준으로 해당 색상 혹은 디자인 구성을 선택했는지 선택하는 과정에서 저자의 경험에 기반한 인사이트가 녹아있었다면 더욱 명작이 되지 않았을까 싶다.

어쨌든 이 책은 PPT 문외한인 나에게 큰 도움이 되었다. 분량도 많지않고 실습을 따라하는데 많은 시간이 걸리지 않고 저자의 경험에 기반한 다양한 스킬을 익힐 수 있는 책이기에 PPT를 작성하는 데 고민이 많은 독자분들께 일독을 권하는 바이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
핸즈온 머신러닝 - 전2권 - 사이킷런, 케라스, 텐서플로 2로 완벽 이해하는 머신러닝, 딥러닝 이론 & 실무, 3판
오렐리앙 제롱 지음, 박해선 옮김 / 한빛미디어 / 2023년 9월
평점 :
장바구니담기


AI 분야에서 단 한 권의 책만 읽을 수 있다면 주저없이 꼽고 싶은 명작. 드디어 3판 개정판이 발간되었다.

이 책은 참 묘한 책이다. 전체적으로 난이도가 높은 편임에도 부분 부분 읽다보면 의외로 읽기가 편하고 이해가 잘 되는 편이다.

엄밀한 수학적 정의를 다룬다든가 대부분의 논문 이해에 무리가 없을 수준의 깊이가 담겨있는 것은 아니지만 AI 진영에 두루 쓰이는 기술이 체계적으로 망라되어있다. 이 분야를 과학과 공학으로 나눈다면 과학보다는 공학 중심적인 내용을 담고 있다.

과학도 상당 부분 담겨있지만 과정의 도출보다는 결론을 깔끔하게 정리하는 식으로 기술되어있으며 이를 구현해 내는 것과 응용하는 데 보다 많은 도움을 주는 책이다.

따라서 이 분야의 기술을 숲을 보는 시각으로 두루 섭렵한다든가 프로그래밍 능력이 뛰어난 개발자가 AI 진영의 기술을 담은 서비스를 구현하는 데 많은 도움을 받을 수 있다. 물론 연구 진영에서도 AI분야의 비교적 최신 이론을 빠르게 정리하고 연구의 방향성을 잡는 데에도 큰 도움이 될 것이다.

이 책에는 1000페이지가 넘는 방대한 분량이 수록되어있음에도 어느 정도의 통계학적 혹은 데이터 관련 지식 - 예를 들면 그림으로 배우는 StatQuest 머신러닝 강의 책에 담긴 내용을 잘 숙지하는 정도-을 습득하고 있고, Python 중급 이상의 프로그래밍 실력을 갖춘 독자라면 긴 AI의 여정을 이 책으로 시작할 것을 권하고 싶다.

무언가를 골똘히 연구할 때나 고민하거나 혹은 문제해결을 위해 고심하고 있을 때 우리는 보통 마인드 맵과 같은 도구를 통해 생각을 정리하고 방향성을 잡는다.

이 책은 그런 마인드 맵에서 첫 출발 지점 동그라미의 위치로 적합한 책이다. 책 한 권으로 AI 진영의 폭넓은 지식을 한 눈에 파악하기에는 이 책보다 뛰어난 책이 없다고 생각한다. 방대한 내용을 담아내고 있음에도 하나하나의 주제는 매우 친절하고 자세하게 수록되어있고 직관적인 시각화를 통해 개념을 깊이있게 이해할 수 있도록 도와준다.

우선 머신러닝 서비스의 전반을 이해하는데에는 이 책의 1~2장 만으로도 충분하다. 2장의 실습을 진행하며 예측을 위한 머신러닝 모델을 어떤식으로 만들어나가는지 감을 잡는다면 뒤에 이어질 내용을 익혀 특정 데이터, 도메인, 기술, 아이디어, 문제에 심화 적용하기만 하면 되는 셈이다.주택가격예측

실리콘 밸리의 주택 가격을 예측하는 모델 하나를 만들어보는 과정으로 AI 진영에서 활용되는 기술 전반을 이해하기에 부족함이 없다. 더욱이 더 깊이있는 수준의 지식을 습득하는데 상당한 지적 호기심을 제공하여 향후 학습의 강력한 동기부여로 작용하기도 한다. 단 두개 챕터에 수록된 내용이지만 능히 한 권의 책을 낼 수 있을 정도의 분량이기도 하다.

이 책은 출판사의 배려로 3판부터는 2권의 책으로 나뉜다. 1권은 주로 머신러닝 내용을 다루고 있으며 케라스를 활용하여 간단한 딥러닝을 맛볼 수 있다. 머신러닝 대부분의 지식과 기술은 딥러닝에도 요긴하게 활용되므로 2권을 읽기 전에 충분히 개념을 학습해 두면 좋다.

이번 개정판에는 사이킷런에 추가된 새로운 기능들과 최신 라이브러리가 수록되었지만 1권에 해당하는 머신러닝 진영의 기술은 딥러닝에 비해 훨씬 오랜 기간 연구되었고 변화가 딥러닝 분야에 비해 적기 때문에 2판에 비해 크게 달라진 사항은 없다.

하지만 기술 측면에서 불필요하고 중요하지 않은 내용들이 많이 삭제되어 보다 집중력있게 핵심을 이해하는 데 도움을 주는 방향으로 편집된 것 같고 의외로 실무적으로 중요한 요긴한 팁들이 생략된 경우가 더러 있었는 데 그런 부분들이 알차게 보완된 느낌이다.

2판에서 계속 이어지는 기조 중에 정말 마음에 드는 것은 개인적으로 쉬운 내용 기술과 더불어 애매한 개념을 눈으로 보이게 하는 시각적 자료의 활용이 인상적이다.

예를 들면 3장에서 다루는 오차 행렬의 시각화는 볼 때마다 놀랍다. 2차원적인 동적 기억을 필요로하는 개념이라 보는 순간에는 이해가 되어도 기억이 휘발되고 나면 다시 깊이있는 통찰로 로딩하는데 제법 시간이 걸리는 이상한 지식 구조이다. (마치 법률 분야의 if에 따른 리걸 마인드 기억 구조와도 유사하다.)

어떤 책은 예측과 실제의 축을 거꾸로 명시해 많은 혼동을 주는가 하면 오차 행렬 혹은 혼동 행렬이라는 용어 답게 저자들도 혼동된 것인지 오류로 기술된 책들도 은근 많다. 반면 본 도서에는 이 오차 행렬표 내부에 숫자 그림이 들어가 있어 예시를 활용한 명쾌한 이해 및 개념을 잡는 데 도움을 주고 있어 저자의 전달력과 깊이 있는 인사이트에 여러번 감탄했다.오차행렬

이런 장치는 책을 읽는 내내 여러번 경험할 수 있다. 아래 그림은 경사하강법의 여러 방식을 적용하며 실제 파라미터 공간에 표시된 경로를 시각화 한 것인데 예제를 실습하며 직접 구현해보려고 노력하다보면 말로는 전달하는 데 한계가 있는 경사하강법의 움직임을 눈으로 확인하고 직관적으로 이해하는 데 많은 도움을 받을 수 있다.경사하강법
규제

소프트맥스 회귀나 결정트리 등 알고리즘 설명 파트도 마찬가지이다. 대충 그렇다는 말 보다는 확실히 그림으로 경계선을 확인하고 파라미터 변수의 조정으로 달라지는 경계선을 눈으로 확인하는 것이 이 알고리즘을 확실하게 이해하는데 큰 도움이 된다.소프트맥스
결정트리
k-mean

하다 못해 통계의 가장 기초적인 성절인 대수의 법칙(큰수의 법칙)이나 차원의 저주도 눈으로 보여준다. 방대한 분량의 쉽지 않은 책을 때로는 매우 쉽게 만들어주는 묘한 장치들이다.큰수의법칙
차원의저주

책에 수록된 코드를 실습하기 쉽게 안배하고 있는 점도 이 책의 뛰어난 장점 중 하나이다. 말로 설명하는 것 이상으로 실제 구현하고 눈으로 확인할 수 있게 도와주는 방식이 매력적이다. 이 책의 역자는 저자의 배려를 한층 업그레이드 하여 더욱 편리하게 실습할 수 있도록 도와주고 있어 인상적이었다. 역자의 깃허브로 들어가 Open in Colab 버튼만 누르면 되니 어지간히 게으른 독자도 실습 핑계를 대긴 어려운 구조이다.깃허브
텐서보드

2권부터는 딥러닝의 여정을 떠난다. 보다 저수준의 텐서플로 API를 활용하는 예제들이 등장한다.텐서플로

특히 CNN, RNN, LSTM의 기본 3모델에서 더욱 확장된 ResNeXt, CSPNet과 같은 다양한 신형 모델들이 등장한다. 이는 이 책의 또 하나의 매력이기도 하다. 개정판이 나올 때마다 비교적 최신의 선풍적인 인기를 끌었던 새로운 모델들과 기술들이 소개되고 있어 개인적으로 매우 유익했다.

가진 레거시 환경의 변화 대비 AI 진영의 SOTA 지식들은 차고 넘쳐 이젠 따라갈 수 없는 지경에 이르렀다. 가진 역량의 한계로 소소한 변화는 더이상 추적할 수 없게 되었고 집중하는 분야의 SOTA를 파악하고 시스템에 반영하는 것도 무리수였는데 이 책 덕분에 그간 잃어버린 고리, 미씽 링크를 연결할 수 있어 저자에게 많은 감사를 느낀다.

그러면서도 내용은 더욱 풍부해졌다. RNN 모델을 다룰때도 전통적인 통계 진영의 시계열 모델링도 다루고 있어 비교 대조하면서 관련 지식의 깊이를 풍부하게 만드는 데 도움이 되었다.

ARIMA 모델은 전통적으로 오랜 기간 동안 그리고 지금까지도 잘 쓰이는 모델인데 딥러닝 도서 대부분에는 이 부분이 생략되어있어 양 진영의 시너지를 활용하기 부족함이 많았는데 이번 개정판에는 그런 부분도 신경쓰고 있어 더욱 알차게 구성되었다는 느낌을 받을 수 있었다.ARIMA

한편 이번 개정 3판의 백미는 역시 딥러닝 파트의 커다란 변화인데 허깅페이스의 트랜스포머스 라이브러리나 잡음 제거 확산 확률 모델 DDPM 등 2020년 이후 굵직한 변화를 추적하기에 좋다.트랜스포머스
DDPM

3판이나 개정되면서 1권 영역은 성숙도가 높아졌으니 다음번에는 딥러닝 위주의 2권에 대한 개정판만 나와도 좋겠다는 생각도 든다.

방대한 내용을 한정된 리뷰로 모두 담아내는 것은 보통 무리가 아니었다. 처음엔 챕터별로 다른 책에서 익히기 힘든 내용들을 본 도서는 어떻게 기술하는지에 중점을 두고 리뷰를 작성했다가 폭발하는 분량이 감당이 안되어서 다시 줄여 썼는데 이러니 또 책이 가진 모든 장점을 잘 보여주지 못해서 안타깝다.

개인적으로 2판의 베타리딩에 참여하였기에 더욱 정이 가는 책이고, 이번 3판 역시 참여의 기회가 있었으나 개인적인 좋지 못한 사정으로 인해 참여하지 못해 많이 아쉬웠던 책이기도 하다. 그만큼 더 알찬 리뷰를 정리하고 싶었는데 방대한 규모와 책의 수준이 뛰어나 수준에 걸맞는 리뷰 작성에는 한계가 있다.

하지만 분명한 사실은 AI 분야의 관련 기술을 한 권의 책으로 이 보다 폭넓게 파악하고 가진 레거시에 적용하는데 있어 이보다 도움되는 책은 없을거라 확신한다. 관련 분야의 도서를 벌써 300권은 넘게 읽은 것 같은데 이 만한 책을 찾지 못했기에 더욱 확신한다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
크리에이티브 프로그래머 - 프로그래밍에 창의성을 더하는 7가지 사고력
바우테르 흐루네벨트 지음, 차건회 옮김 / 한빛미디어 / 2023년 8월
평점 :
장바구니담기


창의성을 다룬 책 답게 창의성의 정의를 창의적이지 않은 방법으로 기술하지 않아 간만에 창의적으로 창의성을 생각해 볼 수 있어 뜻 깊은 시간이었다.

프로그래머가 창의성을 키우는 방법과 창의성을 기술에 적용하는 방법을 다룬 책이다. 창의성 주제를 다룬 책 답게 이 책의 가장 마지막 페이지에는 저자가 본 도서를 요약한 마인드 맵이 수록되어있는데 이 책을 한 눈에 바라볼 수 있는 방법이기도 하다.마인드맵

마인드 맵이라는 것이 사람의 신경망의 구조와 닮은 부분이 많아 이해하기 쉽다. 그림에서 보듯 이 책에는 창의적 프로그래머에게 필요한 7가지의 큰 그림이 있다.

시계 방향으로 바라보면 크게 기술 지식, 제약 조건, 비판적 사고, 호기심, 창의적 마인드셋, 커뮤니케이션, 창의적 기법 등의 7가지 주제로 이뤄져있다는 것을 예상할 수 있다.

개인적으로는 이 책을 읽기 전에 이 마인드 맵을 먼저 읽기를 권하고 싶다. 최대한 저자가 어떤 주제를 이야기 하려는 것인지, 7가지 주제에 세부적으로 그려져 있는 메시지들은 무엇을 말하고자 하는 것인지 독자 스스로 그간의 경험을 바탕으로 최대한 유추해보고 시간을 들여 고민도 해 본 후 책을 읽어나간다면 더 재미있게 읽을 수 있을 뿐만 아니라 저자가 던지는 메시지의 본질을 더 잘 캐치해 낼 수 있을거라 생각한다.

그리고 난 후 스스로의 경험과 융합하여 7가지의 동그라미를 파괴도 해보고 재구성도 해보고 연결고리를 바꾸는 작업도 유의미할 것 같다. 그간 유사한 도서를 많이 읽고 개인적인 경험으로 정리해 본 바 인간의 뇌는 한 방향으로 깊이있게 뻗어나가는데는 특화되어있지만 첫 출발점이 되는 7가지 동그라미를 즉각적으로 떠올리는 데에는 다소 취약한 것 같다.

하지만 그 취약한 부분은 인간 누구에게나 갖고 있는 맹점이 되기 때문에 이를 어떻게 재구성하는지에 따라 그동안 보지 못한 독창적인 솔루션이 될 수도 있고 그런 부분에서 또 한가닥의 창의성을 얻을 수 있지 않을까?

말미에는 내가 이 책을 읽고 재구성한 나름의 첫번째 동그라미도 소개하겠지만 리뷰 취지에 맞게 간단하게나마 이 책을 소개해볼까 한다. 앞서 소개한 7가지 주제는 사실 서로 연관되어 있는 듯 하다.

책의 구성이라는 제약에 맞게 유사한 주제를 헤쳐모여 한것이기에 굳이 순서대로 읽을 필요도 없고 눈에 띄거나 읽고 싶은 부분을 먼저 읽어도 저자가 전달하고자 하는 메시지를 이해하기에는 영향이 없어 보인다.

그렇기에 스스로 생각하는 이 책은 크게 프로그래밍과 관련된 부분과 관련되지 않은 부분 즉, 일반적인 창의성에 관련된 주제로 나눌 수 있을 것 같다.

전자에 해당되는 주제 중 하나는 커뮤니티 스멜과 같은 주제이다. 클린 코드나 실용주의 프로그래머 등 프로그래머들이 고전처럼 취급하는 명저들에 언급되었던 코드 스멜과 유사하지만 그동안 주목을 받지 못했던 주제이기도 하다.

창의성도 결국은 사람들의 모임에 종속될 수 밖에 없기에 커뮤니티를 망하게 만드는 냄새 또한 중요하다. 아래 그림에 잘 정리되어 있지만 성공적인 팀을 빌딩하고 운영해 나가는 데 꽤 중요한 부분이다.커뮤니티스멜

또한 본 도서의 메인 주제는 아니지만 프로세싱 언어에서 파생되어 나온 P5도 눈여겨 읽은 부분이다. 프로세싱은 주류 언어는 아니지만 마치 프로그램 언어와 비 프로그래밍 도구 어느 중간에 위치한 표현력 좋은 도구이다.P5

이 언어나 도구를 사용하는 각기 다른 나름의 목적이 존재하겠지만 나의 경우는 창의성을 키우는데 많은 도움을 받았던 도구인데 이 책에도 소개되어있어 사실 조금 놀랐다.

생각을 시각화 하다보면 스스로의 생각에 갇힌 틀과 실제로 구현된 세계간에 생각보다 큰 갭이 존재한다는 것을 깨달으며 놀라곤 했기 때문이다. Nature of Code라는 책에서 프로세싱 언어를 처음 접하고 심심할 때마다 즐기곤 했는데 이 책에도 같은 생각이 담겨있어 꽤 반가웠다.

이 책은 창의성 주제를 다룬 책 답게 창의성을 정의하는데 집중하거나 다른 창의성들을 모아놓은 창의적이지 않은 방법으로 창의성을 기술하지 않는다는 점이 가장 마음에 드는 부분이다.

읽다보면 다소 두서나 체계가 없다는 느낌을 자주 받을 수 있는데 정말 다양한 각도에서 창의성의 본질을 설명하고자 노력한 것 같아 만족스러웠다. 잠시 책을 접어두고 저자가 언급한 주제를 정리하고 생각하다보면 내가 지금 어떤 주제에 소속되어있는지 감을 잡기 힘들 정도로 나를 이쪽 세계에 빠드렸다가 저 쪽 세계에 빠뜨리곤 한다.

창의성과 대우 문제 문제도 흥미롭다. 창의성이 좋으면 한번에 혹은 쉽게 눈에 들어오지 않는 업계의 본질도 드러나기 마련이다. 아래 그림에 보상받지 못하는 지식이 특히 그런 부분이다. 내가 남보다 대단하다고 생각함에도 왜 인정받지 못하는지에 대한 질문에 이 그림보다 완벽한 설명이 있을까?과잉자격

그런가 하면 창의성이 주제인만큼 프로그래밍과는 크게 관련없어 보이는 창의성 본연의 성질에 대한 고찰도 다양하게 담겨있다. 스스로의 지식을 어떻게 표현하고 정리할 수 있을지 그 체계를 담아내기 위한 고찰도 그런 분이다.지식체계

인간의 뇌의 기가막힌 기능 중 하나도 망각이기에 결국 망각을 저장하고 다시 불러오는 부분에 대한 고찰도 중요하다. 개인적으로도 그 IO 과정에서 지식의 표현 형태는 변경되기에 그 사이에 손실이나 잡음 증폭이 존재할거라 생각해왔는데 그 부분에 대한 학계의 깊은 연구가 쉽게 요약정리 되어있어 매우 만족스럽게 읽은 부분이기도 하다.

가끔 머리를 식혀주는 퀴즈들이 등장하는 것도 재미있는 부분이다. 읽다보면 다른 프로그래밍 도서는 내가 읽고 있는 현재의 위치를 파악하는 것이 중요할 때가 많은 데 이 책은 다른 프로그래밍 도서와는 달리 지금 내가 어디에 위치하고 있는지 파악하기 어렵다. 대신 정신없는 만큼 재미는 있다.퀴즈

아무튼 책 소개를 위해 프로그래밍에 관련된 주제와 그렇지 않은 주제로 나눠 인상적이었던 주제를 몇가지 소개했지만 결론은 창의성이라는 주제에 대해 오오트 구름처럼 불투명해 보일지라도 감으로나마 정리는 해두면 좋겠다는 생각이다.

개인적으로 고찰해 온 것들과 경험에서 비롯된 것들 그리고 이 책을 읽으며 떠올렸던 내용들을 종합하여 창의성에 도움이 되는 몇가지 방법을 간략히 정리해보며 리뷰를 마친다.

  • Min-Max 어떤 일이든 어떤 사고든 미래에 대한 예측이든 그 바운더리 즉, Min - Max가 어디인지 그 끝을 쫓아보는 것이 좋다. 이 책에 등장하는 제약이라는 주제도 비슷한 맥락이다.

  • 절대 위치와 상대위치 객체의 위치를 파악하려고만 하지 말고 주체 혹은 관찰자의 위치를 바꿔보는 것이 문제나 현상의 본질을 이해하는 데 큰 도움이 된다. 폴 세잔의 사과처럼 다양한 시각에서 대상을 바라보고자 노력한다면 남들이 보지 못하는 본질을 얻을 수 있다.

  • 추상과 구체 어떤 현상이나 물체의 본질을 알고 싶다면 매우 추상적인 관점에서 바라볼 필요도 있고 혹은 반대로 매우 미시적인 관점에서 바라볼 필요도 있다. 멀리서 본 전깃줄은 1차원이지만 가까이서 본 전깃줄은 3차원이다. 우주의 세계와 양자의 세계는 닮았다. 비슷한 법칙이 작용하면서 동시에 상반된 법칙이 공존한다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
모두의 한국어 텍스트 분석 with 파이썬 - 기초부터 챗GPT까지, 누구나 쉽게 시작하는 자연어 처리 모두의 시리즈
박조은.송영숙 지음 / 길벗 / 2023년 5월
평점 :
장바구니담기


한국어 텍스트 분석 방법을 종합한 책으로 KoNLPy에서 딥러닝까지 적은 분량에 대부분의 실전 기법을 알차게 담아낸 점이 인상적이다.

한국어 텍스트 분석을 처음 접하거나 다른 책이 어려워 새롭게 입문하고 싶다면 이 책으로 시작해 볼 것을 권하고 싶은 도서이다.

대략 300페이지 정도의 많지 않은 분량임에도 한국어 텍스트 분석에 필요한 기본 사항들을 놓치지 않고 잘 전달하고 있는 것 같다. 그동안 유사 도서들을 여러권 봤는데 이 정도 분량에 이만큼의 내용을 전달하는 경우는 흔치 않았던 것으로 보인다.

책은 크게 두 부분으로 구성된다. 1장에서 4장은 데이터 분석 및 파이썬을 다루는데 필요한 기초 지식을 소개한다. 코랩 환경을 구성하여 실습하는 것에서부터 문자열 연산 위주의 Python 기본 문법이 소개되어 있다.

특히 데이터 분석 시 가장 많이 활용되는 세가지 라이브러리 Numpy, Pandas, sklearn이 매우 짧게 소개되고 있는데 생각해보면 여기 소개된 것만 알아도 데이터 분석의 큰 흐름엔 지장이 없는 것 같다.

예전에 당장 사용하지 않을 불필요한 기능을 어렵게 익혀 쉽게 잊혀졌던 허탈감과 비교해보면 일단 이 정도만 챙기고 출발한 후 후반부에 이어질 실습 등을 통해 살을 붙여 나간다면 기억에도 오래남고 더 재미있고 효율적인 학습에 도움이 될 것 같다는 생각이 들었다.

4장부터 본격적으로 텍스트 분석이 시작되는데 후반부에 이어질 가장 기초적인 지식인 BOW나 TF-IDF의 기본 지식 및 실습이 소개된다. 쉽게 말하자면 전자는 단어의 빈도수를 체크하는 개념이고, 후자는 여러 문서에 공통적으로 등장하는 단어보다는 특정 문서에 자주 등장하는 단어의 중요도를 높게 평가하는 개념이라 생각하면 된다.

5~9장은 후반부에 해당한다. 주로 특정 주제를 가진 실습문제를 풀어나가는 과정으로 이어지는데 이 부분들이 이 책의 백미라고 할 수 있다. 뉴스 타이틀을 분류하는 것에서 인프런 댓글 분석에 이르기까지 각각의 데이터 특성과 분석 목적에 따라 새로운 기법들이 등장한다.

뉴스 타이틀 분류 예제의 경우 가장 기본적이고 쉬운 분류 모델을 활용한다. 특히 KoNLPy 라이브러리를 활용한 전처리 방법에서 배울 것이 많다.

KoNLPy

불용어 등을 제거하는 전처리 과정이나 형태소 분석기를 사용한다는 점이 흥미롭다. 다른 언어와 달리 한국어의 특징에 맞게 전처리를 돕는 라이브러리이므로 한국어 분석에 있어서는 반드시 알아둬야 할 지식들이기도 하다.

국민청원 데이터 파트에서는 다양한 시각화 방법을 마음껏 즐길 수 있다. 그동안 꽤 시각화를 해왔다고 생각해왔지만 이 부분에서 몰랐던 새로운 기법을 익힐 수도 있었다.시각화

또한 이 장에서는 구글 드라이브를 활용하여 데이터를 입출력한다는 점이 독특한 부분이며 머신러닝 분야에서 비교적 최신 기법이면서 성능이 좋은 LightGBM 모델을 활용하여 앙상블 기법을 맛볼 수 있다.

120다산콜재단 토픽 모델링 예제에서는 본격적으로 확룰이나 딥러닝과 관련된 전문적인 기법들이 활용된다. 잠재 디리클레 할당이나 RNN, LSTM 모델도 등장한다. 딥러닝 실습을 통해 NLP 분야에서 딥러닝의 위력이 얼마나 뛰어난지 체감할 수 있는 예제이기도 하다.딥러닝

물론 딥러닝의 모델 하나하나도 처음 접하면 배우고 알아둬야 할 것이 너무 많기에 이 책의 예제만으로는 부족한 것이 사실이지만 일단 딥러닝으로 무엇을 해낼 수 있는지와 더불어 프로그래밍의 디자인 패턴 처럼 대략 이런 패턴으로 딥러닝을 설계, 개발한다는 정도의 블루 프린트를 익힌다고 생각하면 좋을 듯 하다. 차후 본격적으로 딥러닝 개발에 좋은 설계도 역할을 할 수 있는 예제라 생각했다. 또한 pyLDAvis 라이브러리를 이용한 시각화가 소개되어 있어 이 책은 확실히 시각화 파트로 배울 점이 많은 책이라는 생각이 들었다.

인프런 이벤트 댓글 분석 예제에서는 군집화와 같은 비지도 학습이 소개된다. 더불어 그동안 배운 것들을 실제 업무에 적용해 볼만한 주제를 찾는다거나 당장 도움이 될만한 분석 기법을 만드는데 도움이 되는 장이라 생각했다.

마지막으로는 ChatGPT나 뤼튼을 활용하는 방법도 간략히 소개되어있다. 뤼튼은 잘 알지 못했는데 한국어 생성 LLM 서비스인듯 하다. 덕분에 한번 이용해봐야겠다.

이 책은 특히 저자 분의 실력이 검증된 분이기에 더욱 추천하고 싶은 책이기도 하다. 예전에 박조은 님의 인프런 강의를 들은 적이 있었는데 시원시원하게 유창한 설명과 더불어 전광석화와 같은 속도로 코딩 타이핑을 따라가며 저자분의 생각을 읽어나간적이 있다.

강의 전달력이 너무 좋으시고 데이터 분석 분야로 아는 것이 많으신데다 그간 고민한 것을 전달하는 능력이 일품인 전문가라는 생각이 들었는데 그 실력과 경험이 이 책에 녹아있어서인지 책의 내용과 전달력 또한 역시 기대한 바와 같았다.

한국어를 처음으로 분석하는 분은 이 책을 일독할 것을 권하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo