AI 딥 다이브 - 오차역전파부터 확산모델까지, 미래를 만드는 73가지 기술 이야기
오카노하라 다이스케 지음, 정원창 옮김 / 한빛미디어 / 2024년 7월
평점 :
장바구니담기


무한한 AI 지식나무들 속에서 길을 잃지 않고 숲을 볼 수 있게 도와주는 가이드.

방대한 AI 지식의 세계속의 굵직한 획을 그었던 기술들의 핵심만 모아 엮은 책이다. AI에 관심을 두고 있거나 이를 업으로 삼고 있는 이들이라면 이 책을 펴는 순간 펼쳐지는 재미덕분에 한동안 눈을 떼지 못할 것이다.

하나하나 쉽지 않은 주제인지라 그동안 경험하고 학습했던 머릿속의 AI지식들과 비교하고 리마인드해가며 읽느라 꽤 오랜 시간이 걸리는 것도 사실이지만 처음 책을 펴는 순간 3장을 다 읽을 때까지 꽤 오랜시간동안 재미있게 몰입할 수 있었다.

읽으며 가장 놀랐던 것은 이 방대한 AI의 역사 중 어떻게 이렇게 중요한 우선순위를 추려 책을 낼 수 있었을지에 대한 의문이었다. 한 주제 한 주제가 한 시대를 풍미했던 굵직한 기술들이고 학회에서 긴 시간동안 활발한 연구대상이었던 주제도 있었다.

어떻게 한 사람이 인공지능의 원리, 뇌과학, 모델, 로보틱스와 인프라에 이르기까지 전 영역을 다 알 수 있단 말인가? 한 분야에 쏟아져 나오는 논문만해도 Abstract 하나 소화하기 버거운 현실에 어떻게 이게 가능한 것인가? 절대 한 사람이 소화할 수 있는 분량이 아님에도 AI의 세분화된 각 분야의 굵직한 기술들을 소개하고 있어 놀라움을 금치 못했다.

나중에 알게 되었지만 이 책은 저자가 2015년 7월부터 논문 및 뉴스 등에서 중요하다고 생각한 주제를 선택하여 기고한 것이라 한다. 그렇기 때문인지 책의 구성 또한 잡지를 읽는 기분이다. 마치 과거 마소지를 읽는 느낌이랄까? 덕분에 무거운 주제여도 가벼운 느낌으로 읽을 수 있어 산뜻했다.

이 책을 읽다보면 AI에 대한 공포가 더욱 심해진다. 또 한편으로 이 무한한 가능성에 심장이 두근거리기도 한다. 저자가 언급한대로 AI의 속도, 무경계, 창의성이라는 주제에 더욱 깊은 생각을 하게 된다.

이 중 특히 속도는 앞에서도 언급했지만 두말할 나위없이 두려운 부분이다. 나 역시 2016년 알파고 등장 이후 AI 분야에 대한 학습을 부단히 노력해왔었다. 처음에는 오차역전파법을 배우며 수학적으로 그리 어렵지 않은 미분연쇄라는 아이디어를 놓고 한국 교육과정에 심각한 문제가 있음을 느꼈던 기억이 난다.

또 한편으로는 그 안에 미분 불가능이라는 주제에 대한 호기심을 갖기도 했으며 순간 괜찮은 아이디어가 떠올랐음에도 AI의 망망대해에서 쫓아가야 할 지식들이 부지기수인지라 고찰보다는 습득에 중점을 뒀던 기억이 난다.

그러나 내 배움의 속도는 AI세계에서 유수한 연구자들이 쏟아내는 지식을 쫒는 것도 버거울 지경이었다. 기본적인 CNN, LSTM, VAE, GAN 등의 모델에 자신이 좀 생기자 관련 분야의 논문은 일주일이라는 짧은 시간내에 파악하기도 어려울 정도로 쏟아졌다.

이내 논문의 흐름에 좀 적응할만하자 Attention, BERT 등이 등장하였고 그것들을 익히자 LLM과 생성모델들이 쏟아지기 시작했다. 어느 순간부터는 남들이 자랑하듯 내놓는 아이디어의 노예가 된 느낌이었다. 하물며 이젠 다 내려놓고 LLM을 어떻게 기똥차게 써볼까라는 생각에 집중하고 있는 지경이라니…

AI의 최전선까지는 아니라도 그래도 나름 그 바닷속에서 헤엄치고 있는 수준은 된다는 위치가 이 급류에 적응하지 못해 허우적거리고 있으니 도대체 AI에 대해 지식이 전무한 사람은 얼마나 갑갑한 생각이 들까? 아니 아예 아무것도 모르면 오히려 안심이 되려는지 오만가지 생각이 드는 요즘이다.

이 책은 이런 AI속도의 위대함에 답답함을 느끼는 내게 잠시 휴식을 준 고마운 책이다. 다소 느린감은 있지만 예전에 잠시 떠올렸던 오차역전파의 문제점인 미분불가능에 대해 다시금 생각할 여유를 줬다.오차역전파한계

잠시 모델에서 벗어나 관련 기반 인프라의 발전에 관한 부분도 흥미롭게 둘러봤다. 올해 초 AI가 불러올 전력대란이 일으킬 다양한 문제점 그리고 사회의 변화 방향에 대해 다시금 생각할 수 있는 기회가 주어졌다.오차역전파한계

또, 언제 실용화할만한 기술로 발전할지 늘 궁금한 주제인 양자 역학과 AI와의 만남에 대해서도 어느정도 갈증을 풀 수 있었다. 원자 수준 시뮬레이션이라니 잠시 머릿속에서 공상과학 소설을 쓰고 있노라면 다가올 미래가 어렴풋이 보이기도 한다.양자역학

급할수록 돌아가라 했던가? 그간 꼭두각시 인형처럼 세상의 천재들이 내놓는 엄청난 기술들의 코어는 커녕 겉모습만 쫓기에도 뱁새가 황새 쫒는 격이었다. 배우는 순간에는 신박한 아이디어의 향연에 빠져 즐겁기도 했지만 어느새 방향을 잃은 느낌에 점점 들어가는 나이덕에 체력은 떨어져갔다.

이렇게 열심히 공부하는데 뭔가 중요한 것을 놓치고 있는 허탈감이 무엇인지 잠시 생각할 수 있는 기회를 줬다.

이 책 하나하나의 주제는 관련된 논문이 부지기수일 정도로 대단한 주제이다. 그렇다고 일반 AI 교양서처럼 난이도가 쉬운 책도 아니다. 논문에 핵심이 되는 굵직한 수식들도 종종 등장하고, 논문의 핵심 아이디어들이 쉴새 없이 등장한다.

AI분야에서 이름 꽤나 떨치는 분들도 결코 이 책의 모든 주제들을 쉽게 이해하진 못할 것이다. 그럼에도 이 책이 만족스러운 것은 기술적인 핵심을 빠르게 파악할 수 있도록 도와준다는 점이다. 리뷰 논문을 읽는 것 이상으로 각 분야의 획을 그은 기술들을 빠르게 섭렵할 수 있게 도와준다.

가급적 적은 분량의 수식과 핵심기술을 핵심만 빠르게 전달하는 저자 특유의 전달력이 놀랍다. 어려운 이론을 적절한 예시와 비유를 들어 쉽게 전달하는 능력은 더욱 놀랍다.

AI업계에 종사하는 이는 물론, AI세계에 관심이 생긴 입문자에게도 매우 좋은 책이라 생각한다.

AI라는 거대한 숲에서 길을 잃어 가까운 데 머물고 있는 해결책을 놓치고 있진 않은지? 혹은 AI의 속도에 짓눌려 스스로 가야할 방향을 잃고 있진 않은지? 본인이 몸담은 AI 특정 카테고리에 묶여있어 유관 카테고리의 변화에 두려움을 느끼진 않는지? 이런 질문에 해당하는 독자라면 이 책이 많은 해결책을 제시할거라 생각한다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
인간이 된다는 건 참으로 힘든 일입니다 - 흔들리는 삶을 위한 괴테의 문장들
임재성 지음 / 한빛비즈 / 2024년 7월
평점 :
장바구니담기


저자, 니체, 쇼펜하우어가 바라본 괴테의 여정. 괴테는 우리 인생 그 자체.

요한 볼프강 폰 괴테 그리고 파우스트. 정확히 누군지는 몰라도 정확히 어떤 작품인지는 몰라도 이 두 단어를 들어보지 못함 사람은 찾기 힘들 것이다. 파우스트라는 대 역작을 어떻게 완성했는지는 감히 상상도 못하겠거니와 그나마 완전히 음미하여 읽어 본 이는 얼마나 될런지..

나 역시 존경하는 아인슈타인의 극찬 그리고 역사상 최고의 천재로 불리는 괴테가 20대에 쓰기 시작해서 생을 마감하기 1년 전에 완성한 대 역작을 그냥 지나칠 수는 없었다.

감히 이 책을 만분의 일이라도 이해했다고 말할 수 있을지는 모르겠지만 그리고 지금은 제대로 기억하지 못하지만 희곡에 등장하는 수많은 등장인물들 덕분에 인간의 본성을 다각도에서 보다 객관적으로 이해할 수 있었다는 것과 메피스토펠레스라는 악마의 유혹에 넘어간 파우스트는 선명히 기억난다.

다양한 등장인물들이 인간의 본성과 인생을 하나하나 퍼즐 조각 맞추듯 완성해 나간 것 처럼 나 역시 청소년기의 나와 사회초년생이 된 나 그리고 현재 중년의 내가 다양한 각도로 인생을 바라보며 퍼즐을 맞춰 나가고 있다.

그렇기에 이 책은 볼 때마다 달리 보인다. 예전의 생각은 허물어지고 다시 재구성된 관념은 또 한 번 무너지고 다 무너진 줄 알았던 관념은 불씨가 살아나 또 다른 관념을 불태운다.

괴테에게 감사한 것은 늘 인생에 최선을 다했다는 것 - 저자는 이를 향상심이라 표현했다 - 그리고 가장 감사한 것은 이를 기록으로 남겼다는 것이다.

다시 본 리뷰 도서로 넘어와 이 책을 읽고 행복할 수 있었던 것은 역시 앞서 언급한 다양한 관점의 존재이다. 저자 역시 괴테의 향상심을 본받아 괴테와 파우스트 그리고 인생에 대한 이해에 최선을 다한듯 하다.

본인의 시각만으로는 부족하다 판단했는지 직선의 글이라 표현한 니체와 쇼펜하우어의 견해도 차용한다.

위대한 괴테를 위대한 진리를 그리고 인생을 혼자 밝혀나가는 것은 극도로 외로운 일이고 괴로운 일이다. 부족한 내게 같이 푸념이라도 늘어놓을 수 있는 저자, 니체, 쇼펜하우어, 그리고 각종 명저와 명언들이 등장하니 생각보다 제법 걸을만 했고 인생 중년의 시점에 외롭지 않고 따뜻했고 예전보다는 괴테의 말이 조금씩 들리기 시작했다.

"사랑했노라. 괴로워했노라. 그리고 배웠노라."

괴테가 말년에 자신의 삶을 축약한 문장이라고 한다. 아직 말년은 아니지만 내 인생 역시 돌이켜보면 이 정도로 축약이 가능할 것 같다. 또한 앞으로의 인생도 그럴 것이다.

우리는 어떻게 태어나는가사랑

사랑의 위대함은 연인, 종교, 부모님, 자식 등 다양한 관계에서 살며 깨닫는 영역이고 다양한 책 심지어 노랫말들이 끊임없이 저마다의 정의를 내리고 있지만 괴테가 슈타인부인에게 보낸 편지에 수록된 이 글만큼 훌륭히 정의 내린 글을 본 적이 없다.

배웠노라.

인생은 끊임없는 배움의 연속이다. 괴테의 향상심은 아마 파우스트의 욕망과 다르지 않을 것이다. 괴테의 배움 행보를 추적하는데 저자가 좋은 이해의 틀을 제공한다. 바로 트리비움 구조이다.트리비움 구조

문법은 남의 것이다. 이를 진정한 내것으로 만들어 내는 단계가 논리학이다. 또 이를 표현할 줄 알아야 하는데 이 영역이 수사학이다. 표현할 줄 모른다면 사실 제대로 알고 있는 것이 아닌 것이다.

요약하지면 이 책은 저자가 바라본 괴테의 여정을 담고 있다. 저자는 이를 6개 장으로 재구성해 기록했다. 조졸하지만 배움에 한 껏 미쳐있는 나에게는 특히 와닿는 장이 3장이다.

“진실은 신과도 같아서 직접 우리 눈앞에 나타나지 않는다. 우리는 드러난 징후들을 통해 그것을 알아내야먄 한다.”

괴테는 참된 것은 후세에도 사라지지 않는다 했다. 위대한 인물들의 본질 그리고 진실에 대한 생각도 유사하다.본질

우리 대부분의 일반인들이 살면서 누구보다 치열해 본 적이 얼마나 될까? 괴테보다 치열하긴 더욱 힘들 것 같다. 하지만 운명의 이끌림에 혹은 무언가의 갈증에 어떤 영역과 사건에 있어서만큼은 적어도 평균보다는 치열하게 살아본 적이 분명 있을 것이다.

나는 잘은 모르겠지만 거대하고 어려운 괴테에 빠져드는 유일한 길이 이 각자의 치열함이 아닐까 싶다. 그리고 이 과정에 도움을 주는 괴테에 오르는 계단중에 이 책이 있다고 생각한다.

누구보다도 힘들었고 치열했던 삶의 한 순간을 간직한 사람에게는 분명 이 책 그리고 나아가 괴테의 글이 와 닿을거라 생각한다. 그리고 200년 남짓 세상에서 가장 치열하게 살다 간 선배의 흔적이 그 무엇보다 큰 위로가 될 것임을 확신한다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
주택청약의 모든 것 - 한국부동산원 청약홈이 선보이는 대한민국 주택청약 바이블, 2024~2025년 전면 개정판
한국부동산원 지음 / 한빛비즈 / 2024년 7월
평점 :
구판절판


청약홈을 운영하는 한국부동산원의 출간서이다. 청약과 관련된 거의 모든 제도가 최신버전으로 담겨있다는 점이 장점이며, 청약홈을 운영하며 많은 민원을 커버한 경험 덕분인지 청약 지원자 입장에서 늘 궁금했던 부분에 대한 설명이 탄탄하다.

로또 청약이라는 말이 심심찮게 들려오는 요즘이다. 이 책을 읽는 시점 가장 최신 로또 청약은 동탄 롯데캐슬이었다. 무순위로 줍줍을 성공하면 시세차익 10억을 얻을 수 있는 대기회가 주어졌다. 쉽지 않은 기회가 찾아온만큼 경쟁률도 300만 대 1에 육박했다.

올해 내가 도전한 로또 청약만 3개는 넘는 것 같다. 경쟁률도 나날이 높아져가는데 아마 대부분의 성인이라면 이젠 청약홈이라는 사이트를 알 것이다. 아파트 청약을 신청하는 사이트인데 바로 이 홈페이지를 운영하는 기관이 한국부동산원이다.

서점 부동산 코너에 가면 청약과 관련된 책이 부지기수이다. 그렇게 많은 서적 중에 유독 이 책만이 가지는 차별점이 몇가지 있는데 바로 청약홈을 운영하는 한국부동산원에서 출간한 책이라는 점이다.

한국부동산원이 출간한 책의 장점은 여러가지가 있다. 청약홈을 운영하는 기관이기에 개정된 법이나 제도에 대해 전문적으로 파악하고 전달하는 공신력이 있다는 점, 청약홈을 운영하며 잦은 민원들을 상대할테니 청약 신청자의 궁금점과 그에 대한 답변 데이터가 축적되어 있다는 점이다.

출생률의 급감은 우리나라의 최대 위기라 할 수 있는데 이에 대한 대응책이 청약 제도에도 미치고 있다. 아이를 낳고 더 나아가 다자녀를 둘 수록 내집마련의 기회를 높여주는 것이다. 그에 따라 올해 개정된 사항도 상당한데 다자녀 특별공급 등의 상세한 법 개정내역이나 당첨되는 방법, 그리고 일련의 절차가 알차게 소개되어있어 만족스러웠다.

그 뿐만 아니라 노부모 부양 특별공급과 같이 노인이 많아지는 나라에서 또 한번 도전해 봄직한 방법들도 소개되어있다. 이런 내용들은 특히 3장이나 4장에 거의 모든 전략들이 자세히 수록되어있기에 각자 요건에 해당되는 내용을 찾아 숙독해놓는다면 분명 남들보다 유리한 고지에서 더 쉽게 내집마련을 이룰 수 있을 것이다.노부모특공

또 하나의 강점은 청약 신청자 입장에서의 궁금점을 속시원히 해소시켜 준다는 점에 있다.

예를들어 “무주택“의 정의는 생각보다 까다롭다. 청약은 물론 양도세, 취득세 등 세금 문제에서도 조금씩 의미하는 바가 달라진다. 중요한 것은 이를 명확히 아는 것이다. 실제 주변에 무주택의 정의를 잘못아는 바람에 취득세를 2배 넘게 내 1억에 가까운 손해를 입은 사람도 있다.

마찬가지로 청약에 있어서도 상속 등의 이슈로 원치않게 시골의 작은 집을 하나 물려받았는데 본인을 1주택자라고 생각하는 바람에 무주택자만 지원할 수 있는 기회들을 날리면 얼마나 안타까운 일인가? 복잡하다고 물러설게 아니라 꼼꼼히 확실하게 알아둬야 하는데 이 책이 그런 평소 궁금했던 부분을 속시원히 해소시켜 주고 있어 만족스러웠다.무주택

뿐만 아니라 처음 청약에 도전하던 시절 입주자 모집 공고문의 복잡하고 깨알같은 글씨에 기겁한 기억도 난다. 가뜩이나 딱딱하고 해석 안되는 용어들이 즐비한데 내용도 한 바가지인지라 읽다보면 까먹거나 중요한 부분은 지쳐서 대충 흘려넘기기 일수다.

청약 지원자 입장에서 그런 어려운 부분들을 매우 잘 파악하고 있는 것이 이 책의 장점이다. 입주자 공고문도 아래 체크리스트를 따라가면서 체크하다보면 입체적으로 보이기 시작하고 중요한 부분을 놓치지 않을 수 있어 유익하다.공고문

이 책은 거꾸로 5장부터 읽기를 권하고 싶다. 5장은 실전으로 청약홈에서 직접 청약에 도전해보는 장인데 1 ~ 4장의 내용을 모르면 잘 이해가지 않는 부분도 있겠지만 모르는 부분은 무시하고 일단 진행하다보면 청약의 큰 숲이 보이고 청약에 성공할 수 있다는 자신감도 얻는다.

내집마련을 투기 목적으로 하는 이는 드물겠지만 계산기를 두들겨 보는 것 또한 피할 수 없다. 청약홈에서 신청 후 계약 및 각종 세금 문제까지 고려해야 할 사항들을 폭넓게 다루고 있어 개인적으로 매우 만족스러웠다.실전

이 책은 한 번도 청약에 도전해보지 못한 사회 초년생들에게 가장 추천하고 싶은 도서이다. 더불어 청약 경험이 있어도 정확한 세법이나 제도를 알지 못해 부분적으로만 숙지하고 있던 중장년층에게도 추천하고 싶다. 생각보다 다양한 전략이 숨어있다는 것 그리고 내게 해당되는 청약 제도가 생각보다 다양하게 존재하고 있다는 점을 알고 놀라게 될 것이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
보고 혁명 : 현직 팀장들이 검증하는 실무 보고서 작성법
이성윤 지음 / 한빛미디어 / 2024년 6월
평점 :
장바구니담기


유명 기업의 팀장들의 설문 결과를 통해 보고서 작성의 어려움 및 문제점을 분석하고, B2WHEN라는 통일된 공식을 도출하여 다양한 유형의 보고서에 적용할 만한 방법론을 제시하는 것이 인상적이다.

보고를 잘하거나 보고서를 잘 작성하는 방법을 다룬 책들은 이미 시중에 다양하게 출간되어 있기에 이 책만이 가지고 있는 차별화된 장점 두가지를 소개해 볼까 한다.

하나는 여러 기업의 일잘러 팀장의 설문 결과를 토대로 보고서 작성이 실패하는 이유를 분석한 점이고, 다른 하나는 B2WHEN 공식으로 압축되는 어떤 보고서에도 적용할만한 통일된 공식을 도출한 점이다.

삼성, 구글 등에 실제 종사하는 팀장 20명에게 얻은 설문 결과는 평소 보고서를 자주 작성하는 실무자라면 설문 답변만 읽어보고 자신의 룰과 비교해보는 행위만으로도 많은 인사이트를 얻을 수 있다.

총 14가지의 문항에 대한 답변 전부를 소개하기는 어렵지만 핵심은 마지막 질문과 답변에 함축되어 있다.

Q14. “지시 사항과 다른 보고서가 보고되는 경우, 가장 큰 원인이 무엇이라고 생각하십니까? 또 그 원인을 줄이기 위한 방법은 무엇이라고 생각하십니까?(자유롭게 서술)

이 질문에 대한 답변은 아래 그림으로 저자가 핵심을 잘 요약하고 있다.피드백

팀장은 보고서 작성을 의뢰한 목적, 이유, 배경을 잘 가이드해야 하고, 팀원은 의도를 명확히 파악하고 방향에 맞게 작성 중인지 주기적인 피드백을 체크하는 것이 문제의 핵심이다.

저자는 이런 문제점을 해결하기 위한 구체적인 방법으로 B2WHEN공식을 제안한다. 이는 책에 수록된 보고 프로세스 로드맵을 통해 구체적으로 살펴볼 수 있는데 이 책의 핵심 요약사항이라 할 수 있다.로드맵

B2WHEN을 간략히 설명하면, “B’는 백그라운드와 원인을 분석하여 목적을 찾는 과정이다. 이를 통해 “WHE”애 해당하는 제안사항을 도출하고 “N”에 해당하는 기타사항(필요,요청 및 첨부사항)을 추가한다.

위 로드맵만으로는 너무 추상적이기에 아래 “주요 매장 매출 하락 대응 방안” 보고서 예시를 참조하면 구체적으로 이해할 수 있을 것이다.예시

B2WHEN이 상당히 유용하다고 생각하는 이유로는 어떤 보고서 유형에도 접목해 볼 수 있는 통일된 솔루션이라는 점에 있다. 이를 입증하기 위해 4장에서는 문제파악, 검토, 제안, 요청, 계획, 완료보고, 회의요약 등 다양한 유형의 보고서의 개요를 잡는데 있어 본 공식을 적용해본다.

위 유형별 예시는 저자의 주장을 입증할 좋은 근거가 됨은 물론 향후 실무에 있어서 참고하기에 매우 좋은 가이드라 생각한다. 개인적으로는 이 부분이 가장 유용한 내용이라 생각한다.

다양한 유형의 보고서는 결국 보고서, 제안서, 기획서 유형으로 분류할 수 있을텐데 유형에 따라 본 공식을 적용하는 것에 큰 무리가 없다는 점을 아래 그림이 잘 나타내고 있다.유형별

앞서 소개한 로드맵 하단부의 “단계별 추가 생각 포인트” 부분도 꽤 용이하다. B2WHEN이 보고서의 큰 흐름을 가이드 한다면 하단부의 체크리스트는 큰 흐름의 각 부분의 주장을 강화하거나 설득력을 높이고 감동을 원동력으로하는 설득 및 추진의 연료가 된다.

그 외에도 책에는 SWOT분석이나 책 말미의 전달 전 체크리스트와 같이 보고서 작성의 화룡정점에 해당되는 다양한 장치도 소개되어있어 유익하다.

책이 통일성있게 논리적으로 저자의 주장을 잘 담고 있어 한 편의 잘 작성된 보고서와 같다는 생각을 했고, 이는 저자가 보고서 작성에 있어 전문가임을 입증하는 근거라 생각한다. 특히, 다양한 유형의 보고서를 작성하는데 일관된 방향성을 찾지 못해 해메는 독자에게 추천하고 싶은 도서이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
머신러닝 리스크 관리 with 파이썬 - 안정성과 신뢰성 높은 견고한 모델을 구축하는 방법
패트릭 홀 외 지음, 윤덕상 외 옮김 / 한빛미디어 / 2024년 5월
평점 :
장바구니담기


XAI, 모델 디버깅, 편향, 보안 등의 주제를 중심으로 머신러닝 리스크의 대처법을 다룬 책이다. 인공지능 위험관리 프레임워크, Python 예제, 사례연구를 통해 추상적인 내용을 구체적으로 이해시켜 준다는 점이 이 책의 백미이다.

머신러닝 시스템의 리스크에는 어떤 것들이 있을까?

머신러닝이 흔히 활용되는 분야인 의료나 자율주행 분야는 인명사고로 이어질 수 있는 분야이고 금융거래는 재산피해로 이어진다. 인종차별 편향의 경우 윤리적인 문제로 이어지며 그 외 머신러닝 시스템 자체의 보안 및 프라이버시 유출과 관련된 부분도 머신러닝 리스크로 볼 수 있다.

이 책에서 다루는 주제가 머신러닝 리스크이다. 이 유형들에 대한 정의에서 출발하여 실제 케이스를 분석해보고 실습을 통해 리스크를 최소화 할 수 있는 다양한 방법을 학습하도록 구성되어있다.

문제는 이러한 내용들이 너무 추상적인 내용이라 이해가 쉽지 않다는 점에서 출발한다. 이 책은 이 문제를 해결하고자 최대한 구체적으로 개념들을 열거하기 위한 몇가지 장치를 사용한다. 사례, 구체화 된 프레임워크의 활용, Python 실습이 해결책으로 등장하는데 이 책의 가장 큰 장점이기도 하다.

각 장 말미에는 해당 주제에 대한 구체적인 사례를 소개한다. 해당하는 하나의 구체적인 사례이기에 머신러닝 지식이 없는 사람도 흥미롭게 읽을 수 있는 부분이며 이런 구체적인 실제 생활의 사례는 추상적인 개념을 이해하는데 큰 도움이 된다.

예를 들면 1장의 “질로우 아이바잉“을 소개할 수 있다. 3년 전 즈음 미국 주식에 투자하면서 각광받던 부동산 프롭테크의 강자인 질로우의 주가가 하루사이에 급락하여 관련 주식을 검색한 기억이 있다. 부동산 종목에 큰 관심을 두지 않던 때라 자세히 알아보지는 않았지만 머신러닝 시스템의 결함때문에 회사가 큰 손실을 보았다는 기사는 꽤 흥미로운 부분이었다.

당시의 기억 덕분에 1장의 사례연구는 꽤 재미있게 읽을 수 있었다. 요약하자면 질로우 주가 급락의 원인은 아이바잉 사업때문이었다. 이는 주택을 매입 후 되팔아 시세차익으로 수익을 창출하는 사업인데 문제는 이 사업의 판단을 머신러닝 시스템에 맡겼다는 것이고 머신러닝 시스템의 부정확성 때문에 회사에 큰 빚이 생기게 된다. 손실액만큼 감가상각을 진행했고 그 액수만큼 주가에 반영되어 하락으로 이어진 것이다. 이는 머신러닝 리스크의 대표적인 사례라 할 수 있다.

두번째로 소개한 프레임워크는 NIST에서 제작한 “인공지능 위험관리 프레임워크(NIST AI RMF)”이다.NIST AI RMF

위험관리 분야 및 절차를 정의하고 설계하는 데 있어 몇 안되는 저자만의 경험만 활용한다는 것은 다소 위험한 부분이다. 보다 구체적으로 다양한 사람들의 피드백이 수렴하는 권위있는 가이드를 중심으로 저자들이 중요하다고 생각하는 문제를 서술하고 있어 믿고 볼 만한 책으로 보인다.

2024년 3월 유럽연합 의회가 인공지능법(AI Act)을 통과시킨 것을 시작으로 앞으로 전 세계적에 인공지능에 대한 규정, 규제, 규칙 등이 제정이 가속화 될 것 같다. 다양한 지침을 만족시키기 위한 측면에서도 이 책은 높은 가치를 지녔다고 생각하며 더욱이 이런 분야를 중심으로 저술된 책은 그동안 찾아보지 못했기에 그 희소성이 더욱 귀중한 책이라 하겠다.

세번째로 소개할 Python 실습 부분은 이 책의 백미라고 할 수 있다. 1부에 이론적인 내용들이 서술되어 있긴 하지만 쉽게 이해되지 않는 부분들이 많다.

추상적인 내용이 자주 등장하며 행적적인 측면의 가이드 제시의 비중이 커 구체적으로 이해하기 어려움이 있는데 2부의 실습들이 1부가 말하고자 하는 부분들을 구체적으로 소개한다. 실습을 통해 추상적인 개념들을 명확히 이해할 수 있으며 이 책에서 가장 마음에 드는 부분이기도 하다.

이 책에서 다루는 내용을 간단히 요약한 부분이 1장이다. 리스크 관리에 대한 전반적인 방안을 제시한 후 구체적인 대응책은 2장에서 부터 시작된다. 요약하자면 XAI, 모델 디버깅, 편향, 보안 측면으로 나눌 수 있다.

먼저 XAI파트는 이론은 2장에 상세하게 설명하고 실습은 6장, 7장에서 진행한다. XAI란 인공지능의 내부에 감춰진 블랙박스를 열어보려는 기법이다. XAI를 통해 인공지능을 해석해보는 과정은 모델 디버깅, 보안 등을 위한 필수적인 사전 과정이다.

LIME, SHAP, 특성의 부분종속도, 개별조건부기대 등을 소개하고 있으며 아래 그림은 각각 XGBoost 기반의 정형 데이터 분석 과정 및 비정형 이미지 데이터의 XAI 분석을 다룬 그림이다.정형XAI비정형XAI

이어서 디버깅 파트를 소개한다. 이론은 3장에서 소개하고 실습은 마찬가지로 정형 데이터는 5장, 비정형 데이터는 9장에서 소개한다.정형 디버깅비정형 디버깅

비정형데이터 디버깅에 있어 대립예제를 활용하는 것이 흥미롭다. 이 기법은 5장 보안파트에서 공격 수단 중 하나로 소개되는 기법이기도 하다.대립예제공격

디버깅 이후에는 편향 테스트에 대하여 학습한다. 이론은 4장, 실습은 10장에서 진행된다.대립영향비 변화

마지막으로 보안에 관련된 주제는 이론은 5장에서 소개하고 있고, 실습은 거의 모든장에 포함되어있다고 보면 되는데 그 중에서도 10장에서 레드팀을 구성하는 방법은 꽤 흥미로운 부분이다. 단조제약조건 위반을 통해 백도어 유무를 판별하는 방법이 신선하다.백도어파악

각각의 기법을 상세하게 설명하기에는 지루한 리뷰가 될 것 같아서 내용을 구성하는 큰 그림만 간략히 소개해보았다. 원하는 기술이나 방법을 찾아보는데 도움이 될 것이다.

이처럼 이 책의 3가지 큰 장점을 살펴보았다. 무엇보다 리스크 주제를 통합적으로 다룬 책이 희귀한만큼 머신러닝 시스템 운영자 입장에서는 필독서가 아닐까 싶다. 참고로 부록에는 컬러 이미지가 수록되어 있어 색상 정보 없이 직관적으로 파악하기 힘든 일부 그림들을 가독성있게 파악하는데 도움이 될 것이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo