-
-
인공지능 구조 원리 교과서 - 개발자와 프로젝트 매니저를 위한 AI 수업, 머신러닝·딥러닝·CNN·RNN·LLM 메커니즘 해설 ㅣ 지적생활자를 위한 교과서 시리즈
송경빈 지음 / 보누스 / 2024년 3월
평점 :
인공지능은 단순한 기술이 아닌, 우리 삶의 모든 측면에 영향을 미치는 핵심 기술입니다. 의료, 금융, 제조, 교육, 엔터테인먼트 등 다양한 산업 영역에서 활요되고 있으며, 점점 더 그 영향력이 더욱 커질 것으로 기대됩니다.
이러한 인공지능 기술을 이해한다는 것은 이를 효과적으로 활용하고, 문제를 해결하기 위한 필요조건이기도 합니다. 또한 원리와 구조를 이해함으로써 인공지능으로 인해 벌어질 윤리적 문제와 보안 문제에 효과적으로 대응하고, 예상치 못한 결과와 오작동을 예방하고 대응하는데 도움이 됩니다.
그러나 이런 인공지능 기술은 다른 기술들에 비해 다소 난해한 것이 사실입니다. 수학, 확률, 통계, 컴퓨터 공학 등 선행 지식이 필요하고, 상당히 복잡한 이론과 공부해야할 분량이 매우 많기 때문에 일반인들 뿐 아니라 관련 엔지니어들 또한 매우 부담을 느끼고 있는 것이 사실입니다.
대략 컴퓨터 공학 학부를 졸업하고, 대학원에서 최소 4학기 정도의 학습량이 필요하다는 전문가들의 지적이 있습니다만, 기술의 발전 속도와 대중화 속도가 워낙 빠른 반면, 필요 인력이 많이 부족하다 보니 최근에는 속성으로 인공지능 개발 학원이나 강좌가 우후죽순으로 생겨나고 있습니다.
오늘 소개해 드리는 <인공지능 구조 원리 교과서>는 '개발자와 프로젝트 매니저를 위한 AI 수업'이라는 부제가 달려있습니다만, 전공자 뿐 아니라 비전공자들 또한 인공지능 관련 업계로의 진출하기 위해 인공지능의 구조와 원리를 학습하기 위해 적절한 출발점이 아닌가 생각합니다.
'데이터 분석'에 대한 설명으로 부터 시작해 어떻게 이것이 '머신러닝'으로 이어지며, 다시 '딥러닝'과 '대규모 언어모델'로 발전해왔는지를 다루면서 그 기술적 흐름을 중심으로 구성되어 있어, 흐름을 놓치지 않고 따라가다 보면 자연스럽게 현재 인공지능의 대부분의 핵심 기술들을 이해할 수 있게끔 구성되어 있습니다.
앞부분에서는 간략히 인공지능 관련 용어와 역사 그리고 가뭄예측과 보행자의 이행상동 탐지 등의 활용사례를 소개하고, 서로 겹치면서도 성격이 다른 분야인 '데이터 분석'과 '머신러닝'에 대한 설명이 이어집니다.
변수와 가중치로 예측값을 얻는 기존의 '데이터 분석 모델'로 부터 이러한 기존의 통계 분석 모델의 수식을 빅데이터 학습을 통해 자동으로 완성하는 '머신러닝'과 머신러닝 모델을 여러층으로 쌓아 고도화한 '딥러닝' 기술의 다양한 사례를 통해 결국 데이터 분석, 머신러닝, 딥러닝이 데이터를 분석하고 활용하는 방식의 문제임을 지적합니다.
특히 인공지능 학습의 출발점인 '경사하강법'을 설명하기 위해, H(x)=wx+b 라는 간단한 '일차함수'와 수식으로 표현되는 세상을 위한 '가설식', 최적의 가중치 조합을 찾기 위한 '다양한 인공지능 기술들(선형회귀, 이진분류, 다중 분류)과 수식'에 이어 현재 가설식이 얼마나 정확한지 확인하기 위한 '손실비용 산출'에 이르기 까지의 전 과정을 도식과 그림을 통해 쉽게 보여주고 있습니다.
물론 '기초적인 머신러닝 기법을 사용해 이미지를 인식하는 예제'와 같이 중간 중간 실습예제를 QR코드 혹은 URL로 제시하고 있어 이론적인 부분을 실습을 통해 좀 더 구체적으로 이해할 수 있는 방법을 제공하고 있어 특히 초심자들에게 큰 도움이 되리라 생각합니다.
이와 같이 전반부의 기초적인 데이터 분석과 머신러닝 기술에 대한 학습은 후반부에 나오는 '딥러닝'과 '대규모 언어모델'로의 확장을 위한 기초 공사와 같은 성격을 지닙니다.
'다층 퍼셉트론'을 통해 기존 불가해의 XOR 논리연산 문제를 공간 확장이라는 솔루션으로 해결함으로써 결국 가중치들을 세분화하여 가설의 유연성과 확장성을 높이고 이를 통해 정확도 높은 '딥러닝(DNN)'이라는 예측 모델의 탄생을 예비하게 되었음을 기억할 필요가 있습니다.
이는 곧 기존 논리적 접근에서 실험적 접근으로의 개발 패러다임의 변화를 의미합니다.
책에서는 이미지 인식의 대표모델인 'CNN'과 연속성이 있는 데이터에 특화된 모델인 'RNN'의 구조와 작동 원리를 자세히 밝힘으로서 현대 인공지능의 컴퓨터 비전 기술과 번역, 챗봇, 작곡 등 생성형 인공지능의 힌트가 되는 기술을 잘 설명하고 있습니다.
마지막으로 최근 챗GPT와 같은 대규모 언어모델의 구조와 원리는 이전 설명보다 좀 더 학습량이 많고, 어렵게 느껴지는 것이 사실입니다. 이해가 잘 안된다면 천천히 읽거나 한 두번 다시 읽어보라는 저자의 제안처럼 한 번에 이해하기는 쉽지 않으리라 생각됩니다.
그러나 대규모 언어모델 이해를 위한 기본 개념인 자연어처리, 워드 임베딩, 전이학습, 인코딩과 디코딩, 컨텍스트 벡터, 트랜스포머 개념, 어텐션에 대해서는 빠짐없이 설명하고 있어, 본서에서 개념을 잡고, 예제를 포함한 좀 더 깊은 학습을 병행하기를 추천드립니다.
앞서 말씀드린 대로 개발자와 프로젝트 매니저의 인공지능 기술 이해를 위해 쓰여진 책이긴 하지만 본 기술에 대해 관심을 가진 누구라도 처음부터 차례대로 읽어 나가다 보면 현대 인공지능의 전체 그림을 그려볼 수 있는 교과서와 같은 책이 아닌가 생각합니다.
인공지능의 구조와 작동원리를 알고자 하는 모든 분들의 일독을 권합니다.