-
-
파이썬과 엑셀로 시작하는 딥러닝 - 딥러닝의 알고리즘 원리부터 파악하기
홍재권.윤동현.이승준 지음 / 정보문화사 / 2023년 7월
평점 :
안녕하세요.
이번에 읽은 책은 딥러닝의 핵심 알고리즘을 엑셀과 파이썬으로 구현하는
『파이썬과 엑셀로 시작하는 딥러닝』 입니다.
딥러닝의 알고리즘 원리부터 파악하자!, 『파이썬과 엑셀로 시작하는 딥러닝』
(홍재권·윤동현·이승준, 『파이썬과 엑셀로 시작하는 딥러닝』, 정보문화사, 2023)
『파이썬과 엑셀로 시작하는 딥러닝』는 딥러능의 기초 원리부터 응용까지 배울 수 있는 책입니다. 엑셀과 파이썬으로 선형 회귀부터 CNN, RNN까지 구현해볼 수 있어 유용했습니다.
『파이썬과 엑셀로 시작하는 딥러닝』의 저자는 홍재권·윤동현·이승준 이렇게 총 3명으로, 저자 홍재권은 기계정보공학을 전공하고 현재 산업 차량 무인화 기술 파트에서 일하고 있습니다. 다음으로 저자 윤동현은 인공지능에 대한 기술 구현에 관심이 많고 컴퓨터 비전 분야를 연구하고 있고, 현재 소프트웨어 개발 법인을 운영하고 있습니다. 마지막으로 저자 이승준은 데이터 기반 고장 예측 진단 분야에 흥미를 느껴 딥러닝에 입문하였고, 현재 산업용 엔진 제품 검증팀에서 근무하고 있습니다.
책의 구성은 총 7장으로 구성되어 있습니다.
1장에서는 파이썬의 라이브러리인 '넘파이(Numpy)'를 학습합니다. 딥러닝은 데이터를 행렬로 구성하여 연산처리하기 때문에, 앞으로 배울 딥러닝을 이해하기 위해서는 넘파이를 배우는 것은 필수입니다.
2장에서는 딥러닝의 기초에 대해서 학습합니다. 전반적인 머신러닝과 딥러닝의 내용을 배우며, 엑셀로 간단한 회귀 예측을 해봅니다.
3장에서는 파이썬 라이브러리인 사이킷런(Scikit-Learn)을 이용해 숫자를 예측하는 회귀에 대해 학습합니다.
4장에서는 분류에 대해서 학습하며, 소프트맥스 등 활성화 함수에 대해서도 살펴봅니다.
5장에서는 4장에서 배운 내용을 토대로 분류 문제를 실습해봅니다. 사용하는 데이터는 붓꽃 데이터와 손글씨 데이터이며, 원핫인코딩에 대해서도 학습합니다.
6장에서는 CNN(Convolutional Neural Network-합성곱 신경망)에 대해 학습하고, 이미지 데이터에 특화된 딥러닝 모델을 실습합니다.
7장에서는 RNN(Recurrent Neural Network-순환 신경망)에 대해 학습하고, 시간적 순서가 있는 시계열 분석을 직접 실습을 통해 이해를 합니다.
책의 자료인 소스코드는 정보문화사(출판사) 홈페이지에 제공되어 있습니다.
http://www.infopub.co.kr/new/include/detail.asp?sku=06000248
엑셀로 딥러닝을 배우는 이유는 무엇일까?
파이썬에는 'wlwings'라는 라이브러리 패키지가 있는데, 이를 이용하면 파이썬으로 엑셀 시트를 작성하고 시각화가 가능합니다. 이를 통해 파이썬의 다양한 라이브러리를 활용하는 강력한 분석 기능과 엑셀의 편리한 시각화 및 편집기능을 모두 이용할 수 있어 효율적인 데이터 분석이 가능합니다.
딥러닝이란 무엇일까?
컴퓨터가 스스로 규칙을 찾고 학습을 하는 것을 머신러닝이라 하고, 이런 머신러닝의 방법 중 사람의 뇌(뉴런)를 모하여 학습하게 만든 방법이 딥러닝입니다.
CNN vs RNN
CNN(Convolutional Neural Network)은 이미지 처리에 특화되어 있으며, 이미지의 특징을 잘 추출하는 데에 주로 사용되는 신경망 구조입니다. 합성곱 계층(이미지의 특징을 감지하는 역할)과 풀링 계층(공간 크기를 줄여서 계산 효율성을 높이고, 불필요한 정보를 제거하는 역할)으로 구성되어 있으며, 이러한 계층들을 반복적으로 쌓아올린 구조로 이루어집니다.
RNN은 순서가 있는 데이터, 시계열 데이터, 자연어 처리 등에 주로 사용되는 신경망 구조입니다. RNN(Recurrent Neural Network)은 이름 그대로 순환적인 구조를 가지며, 이전 단계의 출력이 현재 단계의 입력으로 사용되는 특징을 가지고 있습니다.
책을 읽으면서 느꼈던 장점으로 첫번째, 쉬운 개발환경 및 실습환경입니다. 엑셀(Excel)과 주피터(Jupyter)를 활용하기 때문에, 고사양의 실습환경이 필요하지 않고 책에 나오는대로 관련된 라이브러리 패키지를 설치하고 사용 방법을 익히기 때문에 수월한 학습이 가능했습니다.
두번째, 딥러닝의 기초 알고리즘을 실습하면서 기초를 익힐 수 있었습니다. 알고리즘의 내부 동작 방식과 그 원리를 이해하고, 당뇨병 예측, 체력 검사, 붓꽃, 손글씨 등 실전에 맞춘 데이터로 이해가 쉬웠습니다. 그리고 실습를 통해 모델을 구현하고 검증함으로써 딥러닝의 개념(미분값, 역전파, 순전파)을 확실히 잡는데 도움이 되었습니다.
세번째, 풀컬러로 책의 자료를 제공합니다. 특히 딥러닝에서 중요한 순전파와 역전파 등을 엑셀을 통해 시각화
넷번째, 구글 스프레드시트와 텐서플로(Tensorflow)에 대한 사용법도 책에 제공됩니다. 라이선스 구매가 필요한 엑셀과 달리 무료로 사용이 가능한 구글 코랩과 구글 스프레드시트를 연동하여 사용하는 방법까지 안내함으로써 다양한 독자의 요구를 충족시킬 것 같습니다.
책의 아쉬운 점은 질문과 답변을 제공하지 않는 점입니다. 딥러닝이라는 어려운 분야를 다루는 만큼 누군가에게는 어려울 수 있습니다. 어려운 내용을 이해하는 데에는 독자와 질문과 저자의 답변이 동반되어야 하지만 제공되지 않아 아쉬웠습니다.
책의 난이도는 딥러닝의 알고리즘과 모델 구현, 실습을 다루는 만큼 쉽지는 않습니다. 다만 인공지능에 대한 수학을 쉽게 접할 수 있는 『인공지능을 위한 수학』(이시카와 아키히코 지음, 신상재·이진희 옮김, 프리랙, 2019)와 같은 도서과 읽는다면 학습 효과가 더 좋을 것 같습니다.
추천하는 책은 『파이썬 딥러닝 머신러닝 입문』(오승환, 정보문화사, 2021)입니다. 이 책에서 다루지 않는 머신러닝도 중점적으로 다루며, 데이터를 편하게 다룰 수 있는 판다스(Pandas)와 같은 라이브러리도 학습하므로 유용할 것입니다.
추천 독자로는 딥러닝의 실습에 앞서 개념부터 먼저 공부하고 싶은 사람, 딥러닝의 원리와 구현을 직접 배우고 싶은 사람, 직접 모델을 만들어보면서 원리를 알고 싶은 사람에게 추천합니다.
각기 다른 경험을 가진 저자들이 딥러닝을 어떻게 하면 쉽게 이해할 수 있을까에 대한 고민과 조언이 이 책에 녹아 있습니다. 이를 모두 학습하여 끊임없이 발전하고 있는 딥러닝 분야에서 자신만의 새로운 방법과 기술을 개발하는 데 활용하면 도움이 될 것입니다.
본 서평은 리뷰어스클럽 서평단으로서 출판사로부터 도서를 제공받아 작성하였습니다.