-
-
모두의 한국어 텍스트 분석 with 파이썬 - 기초부터 챗GPT까지, 누구나 쉽게 시작하는 자연어 처리 ㅣ 모두의 시리즈
박조은.송영숙 지음 / 길벗 / 2023년 5월
평점 :
ChatGPT를 통해서 생성형 인공지능에 대한 관심이 매우 높아졌습니다. 질문에 대한 대답을 척척하게 해주는 ChatGPT를 보면서 사람들은 매우 신기해했고 매우 많이 사용하고 있습니다. 이 기술에는 텍스트를 분석하여 학습하고 질문에 대한 답을 알려주는 것입니다. 이책은 이러한 인공지능 텍스트 분석을 위한 가장 기본적인 내용을 알려주고 있습니다.
초보자가 어떻게 인공지능이 텍스틑 분석하는 지를 알기 전에 기본적으로 알아야하는 기본적인 지식을 알려줍니다.
파이썬 에서 텍스트를 다루기 위해서는 문자열을 다뤄야하는데, 문자열에 필요한 함수 및 다양한 기능을 알려주고 있습니다. 그리고 파이썬에서 가장 많이 사용하는 라이브러리인 판다스와 넘파이를 간단하게 알려주고 있습니다.
이를 바탕으로 단어 가방 모형과 TD-IDF에 대한 내용을 서술하고 이와 관련된 예제 코드를 자세히 알려주어 하나씩 따라 할 수있게 구성되어 있습니다.
그리고 실제 연습을 위해서 연합뉴스 타이틀 텍스트 데이터를 가지고 주제를 분류하는 실습을 해볼 수 있습니다 .이 실습을 통해서 데이터 전처리, 문자 전처리, 단어 벡터화, 학습과 예측하는 전 과정에 대한 해석과 코드를 설명해주고 있습니다. 사이킷런의 팩키지를 사용합니다.
또한 이책의 장점은 실제 데이터를 활용하여 텍스트 분석을 한다는 것입니다. 위에서 기본적인 데이터로 텍스트 분석을 해본 후 국민청원 데이터와 120다산콜재단 토픽모델링, 인프런 이벤트 댓글등 실제 프로젝트에 사용할 수 있는 데이터로 분석을 하는 과정을 자세히 알려주고 있습니다.
이러한 과정을 따라하면서 실전에서 어떻게 사용할 수 있는지 그 내용을 배울 수 있어서 매우 좋았다고 생각합니다. 특히 텍스트 분석을 처음 접하시는 분들도 상세히 쉽게 접근할 수 있게 코드를 제시하고 이를 자세히 설명해주고 있습니다.
이책은 텍스트 분석이 어떤 방식으로 되고 어떤 모델을 사용해서 할 수있는지 실전 예를 들어서 자세히 코드 및 그림으로 설명을 해주고 있습니다. 텍스트 분석을 처음 접하는 개발자들에게 꼭 필요한 책으로 적극 추천합니다.