인공지능 구조 원리 교과서 - 개발자와 프로젝트 매니저를 위한 AI 수업, 머신러닝·딥러닝·CNN·RNN·LLM 메커니즘 해설 지적생활자를 위한 교과서 시리즈
송경빈 지음 / 보누스 / 2024년 3월
평점 :
장바구니담기


인공지능을 쉽게 알아보자




책을 선택한 이유


인공지능은 SF소설 속 상상의 존재였지만

놀라운 컴퓨터 공학의 발전으로 인간의 존재를 위협한다.


인공지능에 대해 알아보기 위해

"인공지능 구조 원리 교과서"를 선택한다.




"인공지능 구조 원리 교과서"는


1장 인공지능의 부상

2장 데이터와 인공지능

3장 머신러닝

4장 딥러닝

5장 비지도학습

6장 강화학습

7장 대규모 언어 모델

8장 고성능 기계, 그리고 사람


으로 구성되었다.





1장 인공지능의 부상 에서는


인공지능은 사진을 보고 설명할 수 있지만,

사진 속 사람이 쓴 터번을 인식하지 못한다.


CNN 매커니즘은 사전에 학습한 내용만 인식하므로,

학습하지 않은 터번을 인식하지 못하는 한계가 있다.


머신러닝 기술은 지능이 아니라 뇌의 작동 방식을 모방한 것이나,

빠른 기술 발전으로 인공지능의 의미로 쓰인다.


인공지능 기술의 역사, 이용 상황을 알아본다.





2장 데이터와 인공지능 에서는


AI의 본질은 데이터를 분석하고 활용하는 것이다.


데이터는 정형 데이터, 비정형 데이터,

반정형 데이터로 구분된다.


데이터를 분석하고 활용하기 위해서는

데이터를 활용하는 목적을 분명히 해야 한다.

수집된 데이터는 정제, 가공 단계를 거쳐야 한다.


빅데이터는 데이터를 자원으로 인식해

의사결정의 도구로 사용하는 패러다임이다.


빅데이터의 핵심은 분석이며, 모델링이다.

데이터 분석, 활용의 주요 사례를 소개한다.





3장 머신러닝 에서는


머신러닝은 학습을 통해 성능을 향상시키는

기계 시스템을 구현하는 것이다.


머신러닝은 현상을 수식으로 표현하고 학습한다.

변수에 가중치를 부여하면서 정답에 가까운

결과를 얻기 위한 최적의 조합을 찾는다.


선형회귀는 기본 가설식과 학습 데이터를 통해

정답을 스스로 찾아낸다.


오류를 확인하는 손실 비용 산출,

머신러닝의 핵심 경사하강법,


다양한 변수를 반영한 다항 선형회귀,

이진분류, 다중분류, MNIST와 이미지 인식을 설명한다.



4장 딥러닝 에서는


인공신경망, 뉴런의 기본 작동 메카니즘은

각각 가중치를 갖는 여러 자극값들을 합해

일정치 이상이 되면 출력을 활성화하고

그렇지 못하면 비활성화 하는 수식이다.


퍼셉트론은 뉴럴넷, 인공신경망을 구성하는 단위 모듈이며,

단위출력값이 일정값 이상이면 다음셀로 전달하고,

그렇지 않으면 출력을 소멸한다.


퍼셉트론은 AND, OR, XOR 연산을 수행한다.


다층 퍼셉트론은 데이터의 차원과 자유도를 늘리며,

복잡한 문제를 풀어낼 가능성을 열어준다.

DNN은 퍼셉트론을 입력층, 은닉층, 출력층으로 구성한

딥러닝의 기본형 모델이다.


딥러닝 모델은 치밀하고 정교한 설계가 아니라,

실험을 통해 결과를 확인하고 모델을 적용한다.



CNN은 그림이나 사진을 판독하는 인공지능이다.

이미지로부터 의미 있는 정보를 추출한다.


이미지 데이터를 압축하고 필터의 가중치를 수정하면서,

이미지 데이터 상하좌우의 특성, 관계를 파악한다.



RNN은 데이터 사이의 시간적, 공간적 연관성 있는

데이터세트에 적합한 모델이다.


앞 데이터를 입력받았을 때 만들어진 상태값을

현 시점의 모델에 전달해서,

데이터 사이의 연관 정보를 활용할 수 있는 머신러닝 모델이다




5장 비지도학습 에서는


머신러닝 학습 기법들은 지도학습, 비지도 학습,

강화학습으로 구분된다.


지도학습은 데이터를 사용해 답을 계속 확인하면서,

예측 모델의 가중치를 수정하는 방식이다.

선형회귀, 이진분류, 다중분류, CNN, RNN 등이 있다.


자기 지도학습은 레이블을 자동으로 확인하고,

다음 글자나 단어 등을 예측한다.



비지도학습은 사람의 학습 방식을 모방해,

주변 환경과 상호작용하면서 스스로 학습한다.


데이터 레이블 작업 없이, 데이터로부터 특성을 파악하고

분석하거나 필요한 정보를 얻는 방법으로 학습시킨다.


K-means는 주어진 데이터를 분석해 특성이 유사한

데이터들을 자동으로 그룹화하는 비지도학습 알고리즘이다.


GAN은 진짜와 유사한 가짜 데이터를 생성하는 생성자,

진짜와 가짜를 판별하는 감별자가 경쟁하면서 학습한다.

GAN은 진짜에 대한 식별 정보를 제공하므로,

반지도학습으로 분류하기도 한다.



6장 강화학습 에서는


강화학습은 경험과 시행 착오에 따른 보상 체계를

기반으로 막무가내로 학습한다.


게임과 같이 제한된 조건과 단순한 작동 규칙이 작용되는

NPC, 로봇 개발, 자율주행 자동차 등에서

강화학습은 막강한 성능을 보여준다.


강화학습 모델에게 완벽한 시나리오를 주려면,

모든 상황을 파악하는 방대한 데이터가 요구된다.




7장 대규모 언어 모델 에서는


ChatGPT는 질문자의 요구를 정확하게 인지하고,

풍부한 지식으로 자세하고 명쾌하게 답변한다.


대화형 시스템은 자연어 처리 기술이 사용된다.


GPT는 자연스러운 문장 생성을 목적으로,

대규모 컴퓨팅 자원과 방대한 양의 데이터를

투입해 만든 자연어 처리 소프트웨어, LLM이다.


자연어 처리는 사람 말을 정제하고, 숫자로 변환해,

컴퓨터가 내용 요약, 분류, 번역, 문장 생성,

질의응답 등을 수행할 수 있도록 한다.


토큰은 사람 말의 기본 단위며,

인덱싱은 토큰에 일련번호를 매기며,

어휘 목록은 토큰의 집합이다.


언어 모델, LM은 주어진 토큰의 다음 토큰으로

어떤 것이 가장 적합한지를 예측하면서 문장을 생성한다.



워드 임베딩은 단어를 숫자 체계로 표현하거나,

숫자로 만들어진 단어 표현값이다.


워드 임베딩은 특성을 공간으로 표현하며,

임베딩 차원이 클수록 단어의 특성을 나눠서

세부적으로 표현할 수 있다.



전이학습은 학습이 완료된 머신러닝 모델이

새로운 모델에게 가중치 설정값을 전수하는 것이다.


파인튜닝 은 추가 학습을 통해 가중치를 미세 조정하면서,

원하는 용도로 모델을 특화하는 과정이다.


대규모 언어 모델의 문장을 감성 분석 모듈로 분석하면,

긍정, 부정, 중립으로 분류하고 판단할 수 있다.


대규모 언어 모델은 문장을 가상 공간 좌표로 표현하면서,

문장 특성을 섬세하게 파악하는 자연어 처리 분야의 범용 모델이다.


RNN 기반 언어 모델은 문장 데이터를 활용해,

어떤 단어가 나왔는지 확인하면서 가중치를 조정한다.


대규모 언어 모델은 학습을 대규모로 진행한 언어 모델이다.

경사하강법 알고리즘으로 가중치, bias를 갱신하면서 학습한다.


인코더-디코더 모델은 데이터 열을 입력받고,

대응되는 데이터열을 출력하는 모델이다.


문장을 임베딩한 좌푯값의 컨텍스트 벡터를 이용해

번역할 대상 언어의 문장을 생산한다.


RNN 기반의 인코더-디코더 모델의 임베딩은

언어 모델의 정체성을 정의하는 근간이 된다.



RNN 기반의 인코더-디코더 모델은 입력 시점이

오래된 데이터의 영향력이 낮아지는 왜곡이 발생한다.



어텐션 메커니즘은 의미 있고 연관성이 있는 단어의

중요도를 파악하는 매커니즘이다.



트랜스포머의 핵심은 어텐션이다.


인코더 셀프 어텐션, 디코더 셀프 어텐션,

인코더-디코더 간 어텐션으로 나뉜다.


트랜스포머 어탠션은 문장 내 단어들의 관계성을 보며,

문장 내 모든 단어들에 대해 상호 유사성을 계산한다.


디코더 셀프 어텐션은 인코더 셀프 어텐션 처럼

생성된 단어 열 안에서 각 단어 사이의 관계 정보를

파악하면서 적절한 다음 단어를 예측하며,


인코더-디코더 어텐션은 디코더가 단어를 생성할 때마다,

인코더의 모든 단어를 어텐션한다.


트랜스포머는 어텐션을 학습 모듈로 사용하면서,

입력 단어들을 동시 처리하면서 학습 시간을 단축한다.



BERT는 트랜스포머에서 인코더를,

GPT는 트랜스포머에서 디코더를 사용한 모델이다.


BERT는 문장의 특성을 이해하고,

GPT는 문장을 매끄럽게 생성하는데 방점을 둔다.


BERT는 주어진 문장을 단어 단위 임베딩으로 인코딩하며,

GPT는 입력된 단어의 다음 단어를 예측하는 방식으로 작동한다.


대규모 언어 모델의 놀라운 성과는

트랜스포머의 셀프 어텐션, 빅데이터,

대규모 컴퓨팅 자원에 기인한다.



머신러닝 모델은 정확성 검증 기능이 없으며,

확률적으로 높은 대답을 하는 한계가 있다.


대규모 언어모델 출현이 가져올 변화,

대규모 언어모델의 기본 원리를 이야기 한다.



8장 고성능 기계, 그리고 사람 에서는


학습 모델 가중치 설정은 추정이고,

AI 예측에 대한 근거가 불분명하며,

학습 데이터의 왜곡이 발생하는 등

AI 기술은 취약하다.


머신러닝은 컴퓨터의 활용성을 극한으로 끌어올리며,

퍼셉트론의 가중치를 수정하면서, 인공지능을 모델링한다.


인공지능 모델 개발을 위한 학습 데이터의 중요성,

학습용 데이터 구축을 위한 데이터 정제와 레이블링,


대규모 언어 모델의 데이터 확보 용이성,

인공지능과 기계학습의 개념 차이,


강인공지능과 약인공지능, 범용 인공지능,

행동 모델과 휴머노이드,


인공지능 소프트웨어와 일반 소프트웨어 개발의 차이점,

AI 엔지니어가 하는 일, 인공지능 기술의 활용을 말한다.



"인공지능 구조 원리 교과서"는

인공지능의 개념과 역사, 데이터 활용,

머신러닝, 딥러닝, 비지도학습,

강화학습, 대규모 언어 모델,

인공지능의 주요 이슈를 다룬다.


머신러닝 기술은 뇌의 작동 방식을 모방하면서,

인공지능의 의미로 쓰인다.


AI의 본질은 데이터를 분석하고 활용하는 것이다.



빅데이터의 핵심은 분석이며, 모델링이다.

빅데이터는 데이터를 의사결정의 도구로 사용하는 패러다임이다.



머신러닝은 현상을 수식으로 표현하고 학습하면서,

변수에 가중치를 부여하고 최적의 조합을 찾는 시스템이다.


선형회귀는 기본 가설식과 학습 데이터를 통해

정답을 스스로 찾아낸다.


인공신경망, 뉴런의 기본 작동 메카니즘은

자극값들의 합계가 일정치 이상이 되면

출력을 활성화하고 그렇지 못하면 비활성화 한다.


퍼셉트론은 뉴럴넷, 인공신경망을 구성하는 단위 모듈이다.


퍼셉트론은 AND, OR, XOR 연산을 수행하며,

다층 퍼셉트론은 데이터의 차원과 자유도를 늘리며,

복잡한 문제를 풀어낸다.


DNN은 딥러닝의 기본형 모델이며,

실험을 통해 결과를 확인하고 모델을 적용한다.


CNN은 그림이나 사진을 판독하는 인공지능이며,

이미지로부터 의미 있는 정보를 추출한다.


RNN은 데이터 사이의 시간적, 공간적 연관성 있는

데이터세트에 적합한 모델이다.



머신러닝 학습 기법들은 지도학습, 비지도 학습,

강화학습으로 구분된다.


지도학습은 데이터를 사용해 답을 계속 확인하면서,

예측 모델의 가중치를 수정하는 방식이다.


비지도학습은 사람의 학습 방식을 모방해,

주변 환경과 상호작용하면서 스스로 학습한다.


강화학습은 경험과 시행 착오에 따른 보상 체계를

기반으로 막무가내로 학습한다.


제한된 조건과 단순한 작동 규칙이 작용되는 상황에서

강화학습은 막강한 성능을 보여준다.



대화형 시스템은 자연어 처리 기술이 사용된다.


자연어 처리는 사람 말을 정제하고, 숫자로 변환해,

컴퓨터가 내용 요약, 분류, 번역, 문장 생성,

질의응답 등을 수행할 수 있도록 한다.


워드 임베딩은 단어를 숫자 체계로 표현하거나,

숫자로 만들어진 단어 표현값으로,

단어의 특성을 세부적으로 표현할 수 있다.


대규모 언어 모델은 문장을 가상 공간 좌표로 표현하면서,

문장 특성을 섬세하게 파악하는 자연어 처리 분야의 범용 모델이다.


대규모 언어 모델은 학습을 대규모로 진행한 언어 모델이다.

경사하강법 알고리즘으로 가중치, bias를 갱신하면서 학습한다.


인코더-디코더 모델은 데이터 열을 입력받고,

대응되는 데이터열을 출력하는 모델이다.


트랜스포머의 핵심은 어텐션이다.


어텐션 메커니즘은 의미 있고 연관성이 있는 단어의

중요도를 파악하는 매커니즘이다.


트랜스포머는 어텐션을 학습 모듈로 사용하면서,

입력 단어들을 동시 처리하면서 학습 시간을 단축한다.


머신러닝 모델은 정확성 검증 기능이 없으며,

확률적으로 높은 대답을 한다.



머신러닝은 컴퓨터의 활용성을 극한으로 끌어올리며,

퍼셉트론의 가중치를 수정하면서, 인공지능을 모델링한다.


학습 데이터의 중요성, 학습용 데이터 구축,

데이터 확보, 인공지능의 분류, 행동 모델과 휴머노이드,

인공지능 소프트웨어와 일반 소프트웨어 개발의 차이점,

AI 엔지니어, 인공지능 기술의 활용을 설명한다.



인공지능에 대해 관심은 많지만

인공지능을 제대로 아는 사람은 드물다.



영화 터미네이터의 스카이넷,

매트릭스의 매트릭스 같은 두려운 존재로 인식되기도 한다.


인공지능은 오랜 침체기를 겪었지만 딥러닝 기술과

컴퓨터 기술의 발전에 힘입어 최근 엄청난 속도로 발전한다.



인공지능이 가져올 미래를 대비하기 위해서는

막연한 두려움이나, 공포에서 벗어나,

인공지능을 제대로 이해하는 것이 중요하다.



"인공지능 구조 원리 교과서"는 인공지능의 주요 개념을

원리와 구조를 중심으로 쉽게 설명한다.


인공지능에 대한 개념과 특성을 이해하고,

인공지능의 기술적 흐름을 살펴보면서,


인공지능을 파악하고, 인공지능을 어떻게 활용할 수 있을지 이해할 수 있다.


우리가 원하든 원치 않든 인공지능은 미래를 좌우할 것이다.


인공지능에 대해 바로 아는 것은

미래를 대비하는 첫 걸음이다.


"인공지능 구조 원리 교과서"는 인공지능의

기초원리와 응용까지 파악하면서,

인공지능 시대를 준비할 수 있도록 돕는다.


보누스 에서 "인공지능 구조 원리 교과서"를 증정해주셨다.

감사드린다.


#인공지능구조원리교과서 #인공지능 #보누스 @bonusbook_publishing

#송경빈


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo