연금 부자 습관 - 100세까지 부자로! 은퇴중산층이 되는 법 좋은 습관 시리즈 18
강성민 지음 / 좋은습관연구소 / 2022년 3월
평점 :
장바구니담기



나는 세모람레터라는 곳을 구독하고 있어서 매주마다 메일을 받고 있다. 메일을 받았는데 메일 내용에 '습관'을 주제로 양질의 책을 출간하고 있는 '좋은습관연구소'와 함께 여름방학/휴가를 맞이하여 '도서 증정 이벤트'를 진행하고 있다는 내용이 적혀 있었다. 여러 습관과 관련된 책들이 있었는데 나는 그중에서 <연금부자습관>이라는 책이 가장 눈길이 갔다. 왜냐하면 나는 은퇴와 노후 준비에 대한 관심이 크고 걱정이 많아서 이 책을 읽어보고 싶은 마음이 컸다. 그래서 이 책으로 이벤트를 신청했다. 얼마 지나고 당첨되었다는 소식을 안내받고 책을 수령 받았다. 감사합니다.^^ 세모람레터님, 좋은습관연구소님.^^



책의 저자-김성민PD

KBS 라디오 PD 겸 공인회계사

1994년 클래식 음악 PD로 KBS에 입사했다. 20대 때부터 시작한 재테크 경험으로 경제에 일찍 눈 뜨면서 30대 중반부터 클래식과 함께 경제, 시사 프로그램도 담당했다. 이때 자신의 부족한 지식을 메우고자 공인회계사(CPA) 자격증을 취득한다. 그리고 연금 생활을 하시던 아버지를 보면서 건강한 노후를 위해서는 돈(연금)과 관계(정서연금) 건강(근육연금)을 잘 갖추는 것이 필요하다는 것을 깨닫는다. 남들보다 조금 빠르게 은퇴와 연금에 대해 관심을 갖게 된다.

2019년 팟캐스트는 <강PD의 똘똘한 은퇴설계>를 기획하고 직접 진행했다. 연금, 투자, 보험, 건강 등 각 분야의 전문가들로부터 인생 후반전을 행복하게 살 수 있는 지혜를 배웠다. 이때 따로 시간을 내어 은퇴설계전문가(ARPS)과정도 함께 공부한다. 이렇게 습득한 내용은 작가의 경험과 결부되어 은퇴설계 칼럼으로 사내 게시판에 연재하는 밑바탕이 된다. 작가는 KBS 직원들만 보던 내용을 다른 사람들과 공유하고 싶어 이책을 썼다.

연세대학교에서 화학과를 졸업하고, 같은 대학에서 음악이론으로 석박사를 수료했다. 라디오 <노래의 날개위에> <뉴스와이드>, <경제투데이> 등 여러 프로그램을 제작했고, 방송통신심의위원회의 <이달의좋은프로그램상>, 한국PD연합회의 <한국PD대상> 등 다수의 방송상을 수상했다. 현재는 KBS 1라디오에서 <라디오매거진 위크앤드>와 를 제작하고 있다.

책의 목차

1부. 재무적 연금 습관

1. 연금을 주기적으로 점검하는 습관

- 우리가 쌓아야 할 5층 연금탑을 확인하고, 나는 지금 몇 층까지 준비되었는지 확인한다.

2. 적립식 투자로 연금을 키우는 습관

- 내가 갖고 있는 연금 종류를 확인하고 투자 상품으로 연금 수익률을 관리한다.

3. 보험계약 내용을 확인하는 습관

- 보험계약은 자세히 알면 알수록 돈이 된다. 약관 보장 내용을 한 번 더 확인하고, 향후 연금수령액도 확인한다.

4. 우아하게 가난해지는 습관

- 지출 수준을 어떻게 조금씩 낮출 수 있는지 알아보고, 그동안의 생활 패턴도 점검한다.

5. 제2의 직업을 준비하는 습관

- 평생 일하는 게 행복이다. 제2의 인생을 풍요롭게 해줄 다음 일을 생각해본다.

6. 새로운 소득원을 개발하는 습관

- 파이프라인은 다다익선! 파이프라인 하나 더 만들기, 지금부터도 늦지 않았다.

7. 세금에 대해 공부하는 습관

- 종합소득세를 알아보고, 퇴직 소득과 양도 소득의 절세법을 확인한다.

8. 상속 디자인을 하는 습관

- 상속과 증여의 시기를 파악하고, 부모님을 대신해 유언 제도도 알아둔다.

9. 복지 제도를 알아보는 습관

- 매년 바뀌는 복지 정보 놓치지 않도록 실시간 업데이트 받는 방법을 알아본다.

10. 주거에 대해 생각해보는 습관

- 배우자도 함께 만족할 수 있는 미래 주거지를 미리 알아보고 준비한다.

2부. 비재무적 연금 습관

11. 건강하게 아침을 맞는 습관

- 건강한 아침을 위한 생활 습관 팁과 근육 연금을 키우는 루틴을 확인한다.

12. 소식을 잘하는 습관

- 식습관을 개선하는 건강노트 쓰는 법을 알아본다.

13. 내 몸을 아끼는 습관

- 아직 젊다고 막 쓰면 안 되는 내 몸 관리법을 알아본다.

14. 주기적으로 치아 검진을 받는 습관

- 은퇴 남녀 1,000명에게 물었더니 가장 후회되는 일은 치아 관리였다.

15. 취미를 만드는 습관

- 은퇴 후 내가 쓸 수 있는 시간은 대략 8만 시간, 평생 가져갈 취미를 고민해 본다.

16. 정서연금을 쌓는 습관

- 선택과 집중을 통한 관계 정리를 한다. 그동안의 관계는 사회적 지위가 만들어 준 것임을 깨닫는다.

17. 쓰지 않는 물건을 잘 버리는 습관

- 물건의 순환, 단사리(斷捨離) 정리의 기술을 배운다.

18. 뇌를 쓰고 독학하는 습관

- 매너리즘에 빠지지 않는 뇌 만들기 방법을 익힌다. 인생 후반전 공부는 독학인 만큼 독학 요령을 확인한다.

19. 삶에서 의미를 찾는 습관

- 의미도 있고 즐거움도 있는 삶을 사는 행복 6계명을 확인한다.

20. 죽음에 대해 생각해 보는 습관

- 죽음을 받아들이는 5단계를 확인한다.

더 읽기

- 퇴직금과 퇴직연금

- 연금저축 vs. 개인형 퇴직연금(개인형 IRP)

- 비과세 연금보험 vs. 연금저축

- 3종 3색, 비과세 연금보험

- 종신형 vs. 확정형, 내게 맞는 연금수령 방법은?

- 개인연금저축 vs. 구(舊)연금저축 vs. 신(新)연금저축



책의 특징

이 책의 저자는 연금의 개념을 재무적인 것뿐만 아니라 다른 영역으로까지도 확대하고 있다. 이 책에서는 관계 속에서 행복을 모색하는 정서 지능을 강조하고 있다. 또 건강에 관한 항목도 담겨져 있다. 저자는 건강에서 가장 기본이 되는 '근육 연금'을 강조한다. 저자는 관계를 잘 만드는 것, 근육을 잘 만드는 것이 연금을 쌓는 것과 그 원리가 비슷하다고 강조한다. 저자는 소액을 오랜 시간 적립해서 적립액을 키우고 그것을 다시 죽을 때까지 나누어 받는 연금, 오랜 기간 운동을 해야 키울 수 있는 근육, 시간을 두고 사람들에게 공을 들여야 만들어질 수 있는 좋은 관계는 하루아침에 만들어지지 않기 때문에 시간이 필요하다고 이야기한다.

책의 장점

이 책은 작고 가벼워 휴대하기 쉬워 언제 어디에서나 읽기가 편하다. 또 책이 어렵지 않고 술술 잘 읽힌다. 저자는 자신의 개인사나 지인들의 이야기를 하나씩 가지고 와서 연금 설명을 하는데 누구나 고민하고 경험하는 우리의 일상사가 자주 등장해 저자의 체험이 독자의 체험과 맞닿아 있어 쉽게 공감이 된다. 이 책은 이제 연금을 준비하려는 사람들에게 연금 교과서라고 불릴 수 있을 만큼 연금에 대한 전체적인 그림을 그릴 수 있도록 도와준다. 연금 전반에 걸쳐 객관적이고 실증적인 기준점을 제공하고 있어 내가 연금 분야에 있어 놓치고 있는 부분이 무엇인지 그리고 내가 앞으로 무엇을 해야 하는지 방향을 안내해 주는 나침반 역할을 해준다.

책의 후기

이 책을 통해서 우리나라에 존재하는 다양한 연금제도들을 알 수 있었다. 공적연금(국민연금, 공무원연금, 군인연금, 사학연금), 퇴직연금(기업연금), 개인연금(사적연금), 주택연금의 특징과 차이점들을 알 수 있었으며 공적연금이 물가상승률을 감안해 연금을 지급 보장해 준다는 것과 추납을 할 수 있으며 군 복무자는 군 복무 기간 동안 추납을 할 수 있다는 것도 알게 되었다. 책의 저자분의 아버지는 공무원으로 처음에 전매청에서 일하셨다고 한다. 그런데 전매청이 KT&G(한국담배인삼공사)로 바뀌면서 공기업 직원이 되셨다고 한다. 그래서 저자의 아버지는 국민연금과 공무원연금을 동시에 수령하셨다고 한다. 그래서 저자의 아버지는 자산이 많지 않았음에도 자식에게 의존하지 않고 누구보다 여유로운 은퇴 생활을 즐기셨다고 한다. 그래서 이 책을 읽고 자산이 많은 것도 중요하지만 꾸준히 나오는 연금과 같은 현금흐름이 중요하다는 것을 깨닫게 되었다. 퇴직연금과 개인연금은 한 달에 조금씩 돈을 입금해서 ETF 투자로 연 8~10% 수익을 낸다면 은퇴 시에는 몇십억의 자산이 생겨서 여유로운 노후를 보낼 수 있다는 것도 배우게 되었다. 퇴직연금과 개인연금을 잘 굴려봐야겠다. 그리고 이 책은 물질적인, 재무적인 연금만 따지는 게 아니라 비재무적인 습관들도 알려주어서 건강 연금과 정서 연금을 축적하는 습관들을 알려준다. 오늘부터 이 책에서 나오는 습관들을 꾸준히 실천해서 재무 연금, 정서 연금, 건강 연금을 잘 쌓는 사람이 되어야겠다!







#연금부자습관 #김성민 #김성민PD #좋은습관연구소 #좋은습관연구소출판사 #현금흐름 #세모람 #세모람레터 #은퇴 #연금 #노후 #노후준비 #노후대비 #은퇴준비 #은퇴대비 #공적연금 #기업연금 #주택연금 #개인연금 #사적연금 #퇴직연금 #국민연금 #공무원연금 #군인연금 #사학연금 #연금저축 #연금저축펀드 #연금저축보험 #IRP #개인형퇴직연금 #투자 #저축 #추납 #추납제도 #건강 #정서 #재무 #습관 #좋은습관



댓글(2) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
dltkddnjs150 2023-09-07 00:39   좋아요 0 | 댓글달기 | URL
연금부자습관,김성민,김성민PD,좋은습관연구소,좋은습관연구소출판사,현금흐름,세모람,세모람레터,은퇴,연금,노후,노후준비,노후대비,은퇴준비,은퇴대비,공적연금,기업연금,주택연금,개인연금,사적연금,퇴직연금,국민연금,공무원연금,군인연금,사학연금,연금저축,연금저축펀드,연금저축보험,IRP,개인형퇴직연금,투자,저축,추납,추납제도,건강,정서,재무,습관,좋은습관

dltkddnjs150 2023-09-07 00:39   좋아요 0 | 댓글달기 | URL
연금부자습관,김성민,김성민PD,좋은습관연구소,좋은습관연구소출판사,현금흐름,세모람,세모람레터,은퇴,연금,노후,노후준비,노후대비,은퇴준비,은퇴대비,공적연금,기업연금,주택연금,개인연금,사적연금,퇴직연금,국민연금,공무원연금,군인연금,사학연금,연금저축,연금저축펀드,연금저축보험,IRP,개인형퇴직연금,투자,저축,추납,추납제도,건강,정서,재무,습관,좋은습관
 
고객이 찾아오는 브랜드는 무엇이 다른가 - 실리콘밸리 전략가가 알려주는 4단계 브랜딩 법칙
테레사 M. 리나 지음, 박세연 옮김 / 현대지성 / 2023년 8월
평점 :
장바구니담기


인스타그램 게시물을 보다가 현대지성계정에서 <고객이 찾아오는 브랜드는 무엇이 다른가?>라는 책의 서평 이벤트를 하고 있었다. 창업을 해서 회사를 사람들이 많이 찾는 브랜드로 만들고 싶은 마음이 있고, 주식투자에 관심이 많아서 이 책을 읽으면 고객이 찾아오는 브랜드 회사를 만드는 방법과 고객이 찾아오는 브랜드 회사를 찾아내는 방법을 배워서 고객이 찾아오는 브랜드를 가진 회사를 찾는 데 도움을 주고 그런 회사들을 투자하는 데 도움을 줄 수도 있을 것 같아서 책에 관심이 생겼다. 그래서 이 책의 서평 이벤트를 신청하고 당첨되어서 책을 받게 되었다.



책의 저자-테레사 M. 리나

실리콘밸리에서 20년 넘게 브랜드 경영 전략가로 활동하고 있다. NASA 본부가 위치한 지역에서 나고 자란 저자는 미국의 유인 달 탐사 계획을 성공적으로 완수한 ‘아폴로 프로그램’ 방식과 기업의 시장 접근 방식이 대단히 유사하다는 사실을 발견했다. 이를 바탕으로 십수 년 동안 독창적인 브랜드 전략 모델을 연구·개발했고, 이를 현장에 적용하면서 탁월한 효용성을 입증했다. 이 책은 그 성과를 집대성한 결과물이다.

세계 최대의 경영 컨설팅 회사 액센츄어(Accenture)에서 커리어를 시작했는데, 당사에서 커뮤니케이션 산업 그룹인 CIG를 설립해 수십억 달러의 규모로 성장시켰다. 여러 IT 스타트업에서 최고 전략책임자(CSO) 및 최고마케팅책임자(CMO)로 일했으며, 애플, 아마존, 구글, 나이키, 디즈니, 시스코 등 수백 곳의 경영진을 대상으로 컨설팅을 제공하기도 했다. 지금은 시장 지배 전략을 연구하는 리나 그룹(Lina Group, Inc)의 CEO를 맡고 있다. 2006년부터는 스탠퍼드 경영대학원과 협업해 학생들에게 리더십과 경영 전략, 기업 혁신에 관한 강의를 진행하고 있다.

역:박세연

고려대 철학과를 졸업하고 글로벌 IT 기업에서 마케터와 브랜드 매니저로 일했다. 현재 파주출판단지 번역가 모임, ‘번역인’의 공동대표를 맡고 있다. 『MOT 진실의 순간 15초』, 『실리콘밸리의 팀장들』, 『아이디어가 팔리는 순간』, 『팀 하포트의 경제학 팟캐스트』, 『지금 당장 이 불황을 끝내라!』 등 인문학과 비즈니스가 만나는 곳에서 지금까지 60여 종의 책을 우리말로 옮겼다.

책의 목차

추천의 글

프롤로그

들어가며

1부 왜

1장 범용화는 최고의 적이다

2부 무엇을

2장 시장 문제 해결사가 되자

3장 고객이 찾아오는 브랜드는 무엇을 다르게 하는가

3부 어떻게

4장 시장 지배를 위한 아폴로 접근 방식

5장 발사 모드: 책임감을 가지고 시장 문제 해결하기

6장 점화 모드: 문제와 솔루션을 중심으로 시장 흐름 주도하기

7장 항해 모드: 고객을 문제 해결의 여정으로 안내하기

8장 가속 모드: 시장 변화와 경쟁에 앞서기

9장 1페이지 비행 계획서

저자 노트

감사의 글

참고 문헌



책의 특징

책의 저자는 NASA 본부 건물이 있던 지역에서 자라면서 기업의 접근 방식과 인간을 달에 보내는 프로젝트의 접근 방식 사이에 유사성을 발견했다고 한다. 책의 저자는 아폴로 스페이스 프로그램이 쓸모 있는 이유는 많은 기업이 직면하는 상황과 상당히 유사하기 때문이라고 한다. 저자는 이 책을 통해 아폴로 스페이스 프로그램을 이끈 리더들이 어떻게 핵심 인재를 끌어모았는지, 어떻게 프로젝트와 비즈니스를 관리했는지, 어떻게 수많은 조직을 세우고 동기를 부여하고 파트너를 끌어들였는지, 그 과정에서 어떻게 획기적인 성공을 이루고 지속적인 지원을 위해 대중과 의회를 설득했는지에 관한 이야기를 접하게 된다. 저자는 무수한 우여곡절이 있었고 엄청난 비극도 있었다고 한다. 결코 쉬운 여정이 아니었지만, 놀라운 성과와 더불어 새로운 역사를 써나갔다고 한다. 저자는 마찬가지로 비즈니스 세계에서도 이루지 못할 목표는 없다고 주장한다. 저자는 한 가지 당부를 한다. 사례 연구가 늘 그러하듯 기업이나 스타트업, 개인이 직면하는 상황과 아폴로 스페이스 프로그램이 직면했던 상황이 100퍼센트 정확하게 일치하지는 않는다고 한다. 하지만 차이점에만 주목한다면 자신의 상황에 소중한 교훈을 적용할 기회를 놓치고 만다고 한다. 저자는 이 책의 목적이 독자가 앞으로 밟아나가야 할 전반적인 경로를 머릿속에 쉽게 떠올릴 수 있도록 도움을 주고 현실적인 기준을 제시하는 것이라고 한다. 저자는 아폴로 스페이스 프로그램은 실로 놀라운 영감을 제공하는 이야기이자, 기업이 시장 지배를 추구하는 과정에서 따라야 할 유용한 롤 모델이라고 한다.

저자는 비행기 안에서 업무 계획표를 그려봤을 때, 이것을 '시장 지배를 위한 아폴로 접근 방식'이라는 이름으로 불러야겠다는 생각이 들었다고 한다.

책의 장점

이 책은 아폴로 스페이스 프로그램의 교훈을 넘어서 성공적인 기업이 실행했던 방식으로, 선거 후보자가 정치 캠페인을 통해 인지도와 지지를 얻는 방식으로, 스타가 팬을 만드는 방식으로 자신의 관점과 솔루션을 통해 시장에서 관성을 이끌어내는 방법을 배울 수 있다. 디즈니, 구글, 페이스북, 아마존, 테슬라, 레이 등 많은 기업이 비교적 협소한 시장에서 어떻게 고-투 기업이 되었는지, 어떻게 확장해 나갔는지에 관한 통찰력 넘치는 이야기를 만날 수 있다. 그리고 저자의 경험을 포함해서 주목할 만한 실패와 교훈을 발견할 수 있다. 이 책은 표와 그래프, 그림이 많아서 책의 이해를 도와주며 책의 파트마다 마지막 장에 핵심 정리가 있어서 파트의 핵심 내용을 다시 복습할 수 있으며 파트마다 실천 과제 파트가 있어서 책의 내용을 실습해 볼 수 있다는 장점이 있다. 또 몇몇 파트에는 업무 계획표 파트가 있어서 업무 계획표를 세워 볼 수도 있다.









#고객이찾아오는브랜드는무엇이다른가 #테라사M리나 #현대지성 #현대지성출판사 #인스타그램 #서평 #서평이벤트 #서평단 #브랜드 #브랜딩 #고객 #테슬라 #메타 #디즈니 #아마존 #애플 #구글 #박세연 #마케팅 #홍보 #비즈니스 #경영 #경영전략 #전략 #경영학



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 라벨링으로 돈 잘 버는 N잡러 되기 - 입문에서 고수입까지, 데이터 라벨링 한 권으로 끝내기
심정우.박민영 지음 / 라디오북(Radio book) / 2023년 8월
평점 :
장바구니담기


나는 데이터분석/통계에 관심이 많아서 데이터분석/통계와 관련된 책들을 읽고 있다. 그런데 데이터분석을 하기 전에 데이터를 전처리하는 라벨링도 매우 중요한데 시중에 데이터분석/통계 책은 많이 출판되어 있지만 라벨링 관련 책은 찾아보기가 힘들었다. 그러다가 yes24 리뷰어클럽에서 <데이터 라벨링으로 돈 잘 버는 N잡러 되기>라는 책의 서평 이벤트를 하고 있는 것을 목격했다. 책의 내용을 보니 책은 데이터 라벨링에 관련된 책이었다. 그래서 라벨링을 배울 수 있는 이 책이 큰 기대가 되고 읽고 싶은 마음이 커서 서평단 신청을 하게 되었다. 신청 후 결과를 기다렸는데 다행히 선발되어서 저 저번 주에 책을 수령 받게 되었다. 감사합니다. YES24님, 라디오북출판사님.^^



책의 저자-심정우

현재 4년 차 전업 데이터 라벨러로, 2020년 입문 이후 백만 건 이상의 데이터를 가공했다. 1400여 명 규모의 카카오톡 오픈채팅방 ‘라벨러 쉼터’ 운영자로, 여러 기업에서 데이터 가공 의뢰를 받으며 활발히 활동 중이다.

책의 저자-박민영

인문대 박사과정 수료와 더불어 코로나19가 유행하면서 재택 일을 찾다 부업으로 데이터 라벨링을 시작했다. 현재 3년 차 데이터 라벨러로, 문과 전공을 살려서 텍스트 데이터 가공에 주력하고 있다. 카카오톡 오픈채팅방 ‘라벨러 쉼터’ 부운영자로도 활동하고 있다.

목차

작가의 말 - 성공하는 데이터 라벨러의 길을 열어드립니다

1장 데이터 라벨링 : 인공지능 시대, 누구나 쉽게 시작할 수 있는 N잡

1. 새로운 온라인 유망 일자리 ‘데이터 라벨링’

1) 성장하는 인공지능 산업의 기초, 데이터 라벨링

2) 디지털 노매드가 되는 가장 빠른 지름길, 데이터 라벨러

2. 무한한 가능성을 보유한 데이터 라벨링 산업

3. 데이터 라벨러는 얼마를 벌까?

2장 시행착오 없이 데이터 라벨러 입문하기

1. 한눈에 보는 데이터 라벨링 필수 용어

2. 입문자가 알아야 할 데이터 라벨링 작업 방식

1) 인공지능에 눈을 부여하는 작업 : 컴퓨터 비전(Computer Vision)

2) 사람 목소리를 이해시키기 위한 작업 : 음성 분야

3) 글에 대한 독해력과 이해력을 불어넣는 작업 : 자연어 처리(NLP)

3. 데이터 라벨링 생태계 이해의 핵심, 정부와 민간사업

1) 대규모 예산이 투입되는 ‘기회의 땅’ 정부 사업

2) 꾸준한 작업 기회가 주어지는 민간사업

3장 데이터 라벨링 수입 활동을 위한 기초 쌓기

1. 데이터 라벨러로 수입 내기 워밍업

1) 데이터 라벨링의 시작점, 크라우드소싱 플랫폼

2) 더 많은 프로젝트를 찾기 위한 여정, 채용공고 검색

3) 정보의 메카, 데이터 라벨링 커뮤니티 탐색

4) 두려움은 돈 벌 기회만 날린다, 채용공고 지원하기

5) 레벨업을 위한 데이터 라벨링 전문 교육 학습

2. 데이터 라벨링을 위한 필수 작업 도구 세팅하기

1) 원활한 작업을 위한 최소한의 컴퓨터 세팅

2) 작업 효율 극대화하는 모니터 선택

3) 능력 있는 데이터 라벨러의 ‘유능한 손’ 마우스

3. 성공 정착을 위한 데이터 라벨러 마인드셋

1) 바람직한 데이터 라벨러의 기본 소양, 직업윤리

2) 올바른 생태계 조성을 위한 노력, 다른 데이터 라벨러 배려하기

3) 기업이 선호하는 라벨러 되기, 데이터 라벨링 기업과의 관계 구축법

4. 데이터 라벨링 주요 협업툴 이해하고 활용하기

1) 익숙하지만 헷갈리는 카카오톡 사용법

2) 데이터 라벨링 주요 협업툴 ‘슬랙’ 한 번에 이해하기

5. 데이터 라벨링 주요 플랫폼 따라잡기

1) 크라우드웍스 : 데이터 라벨러를 양성하는 국내 1위 데이터 플랫폼

2) 에이모 라벨러스 : 우수한 저작도구를 보유한 데이터 가공 플랫폼

3) 레이블러 : 원활한 소통으로 다양한 기회를 제공하는 플랫폼

4) 라벨온 : 많은 라벨러에게 작업 기회를 주는 플랫폼

5) 테스트웍스 : 사회적 가치를 실천하는 플랫폼(aiworks)

6) AI-Studio : 프로젝트별 트레이닝을 제공하는 플랫폼

4장 데이터 라벨링으로 고수입 창출하기 -이론 편-

1. 꾸준함이 최고, 고수입을 위한 마음 관리

1) 고수입 달성을 위해 필요한 마음가짐

2) 고수입을 만드는 지름길, 명확한 목표 세우는 방법

3) 높은 수입을 위한 최적의 작업 환경 만들기

2. 고수입 달성 핵심 포인트, 시급과 작업기록

1) 돈 되는 프로젝트 선별을 위해 반드시 알아야 할 시급 계산법’

2) 체계적인 프로젝트 관리로 고수입 만드는 작업기록 노하우

3. 본격적인 고수입 만들기, 프로젝트 선택과 진입

1) 수입 높은 프로젝트를 선택하는 기준 잡기

2) 고수입 필수 조건! 여러 프로젝트에 동시 참여하는 법

4. 프로젝트에 완료 후 놓치지 말아야 할 노하우들

1) 시급 높이고 작업 속도 올려주는 가이드 분석법

2) 작업 효율을 극대화하는 전략적인 질문 방식

3) 고수입 가르는 결정적 디테일, 작업 효율 높이는 법

5장 데이터 라벨링으로 고수입 창출하기 -실전 편-

1. 고수입을 위해 꼭 써야 하는 필수 프로그램들

1) 작업 속도를 높이는 가장 손쉬운 방법, 한 손 키보드

2) 폴리곤의 친구 Numpad 클릭

3) 아는 만큼 작업 시야가 넓어지는 브라우저 확장 프로그램

4) 바운딩 박스 정확도 높이는 십자선 프로그램

5) 다양한 프로젝트에서 활용 가능한 효과 만점 확대 프로그램

2. 고수입 라벨러의 기법별 실전 노하우

1) 바운딩 박스(Bounding Box) 빠르게 작업하는 비결

2) 폴리곤(Polygon)으로 탄탄하게 기초 다지기

3) 세그멘테이션(Segmentation) 난이도를 낮추는 작업 순서

4) 확장 프로그램으로 키포인트(Key Point) 작업 쉽게 하기

5) 점군 데이터(Point Cloud) 작업을 위한 점군 눈에 익히기

3. 작업 시간 줄여주는 저작도구 사용법

1) 기본 기능에 충실한 크라우드웍스 저작도구

2) 작업 효율이 뛰어난 에이모 라벨러스 저작도구

3) 직관적 인터페이스를 가진 레이블러 저작도구

4) 초보자도 쉽게 사용 가능한 라벨온 저작도구

5) 다양한 기능으로 활용도 높은 테스트웍스 저작도구(blackolive)

6) 오토 세그멘테이션 기능을 지원하는 AI-STUDIO 저작도구

7) 간편한 라벨링 연습 OK! 접근성 높은 Labelme 저작도구

8) 다양한 기능 체험이 가능한 온라인 기반 CVAT 저작도구

6장 저자 노하우 대공개, 저자 2인의 데이터 라벨링 Talk

1. 데이터 라벨링 전업으로 대기업 연봉 받는 저자 심정우

2. 학업과 병행하며 시급 3만 원 부업 하는 저자 박민영

7장 각자의 방법으로 성공한 현직 데이터 라벨러 4인의 노하우 Talk

1. 데이터 라벨링으로 연 소득 7,000만 원, 절정 고수 주부 김안나 님

2. 아이 돌보며 데이터 라벨링 부업 하는 주부 정재윤 님

3. 은퇴 후 데이터 라벨러로 성공 정착한 60대 박수길 님

4. 데이터 라벨링으로 본업만큼 버는 회사원 김원제 님

8장 기업 관계자 Talk : 데이터 라벨링 산업 전망과 기업이 선호하는 데이터 라벨러

1. 크라우드웍스 TA/PI팀 김예원 님

2. 에이모 교육 매니저 정진수 님

3. 레이블러 HI팀 운영 매니저 일레븐 님

4. 라벨온 AI 플랫폼 사업부 카리나 님



책의 특징

책의 저자는 데이터 라벨러로 활동하면서 많은 사람들이 각자의 생활에서, 없는 시간을 쪼개, 데이터 라벨링이라는 생소한 분야에 도전하는 사람들이 갈피를 못 잡고, 이리저리 흔들리다가 포기하는 사례를 많이 보게 되었다고 한다. 책의 저자는 많은 고비를 넘기며 데이터 라벨링 시장에 진입했지만 앞으로 나아갈 방법을 찾지 못해 업계를 떠나는 사람들을 보면서 안타까움을 느꼈다고 한다. 그래서 저자는 데이터 라벨링에 관심 있는 사람들의 진입 과정에서 어려움을 덜어주고, 남들보다 나은 수입을 가져가길 바라는 마음에서 이 책을 쓰게 됐다고 한다. 이 책은 데이터 라벨러로 입문하는 분들에게 명확한 방향을 제시한다. 정보의 홍수 속에서 올바른 방향을 잡지 못한 사람들의 시행착오를 줄여줄 수 있게 도와준다.

책의 장점

이 책에서는 대표적인 크라우드소싱 플랫폼들의 특징을 최대한 자세하게 다뤘다. 데이터 라벨링 산업의 특성상 라벨러는 플랫폼 의존도가 높은 편인데 저자는 정확한 정보 전달을 위해 대표적인 플랫폼 기업들의 자문을 받으며 특징 및 참여 방법을 자세히 설명했다. 데이터 라벨러로 활동 중이지만 만족스러운 수입을 얻지 못한 사람들을 위한 실전 노하우를 비중 있게 담았다. 저자가 4년간 실제로 작업하며 사용했던 방식과 노하우를 책에 심도 있게 풀어 났다. 또 다양한 플랫폼의 저작도구 활용 노하우를 이 책에 담아놓았다. 또 데이터 라벨링 기법별로 작업 속도를 올릴 수 있는 팁들과 함께 작업에 활용할 수 있는 저자의 모든 노하우가 담겨져있다.

책의 후기

시중에 <수학의 정석>이라는 전 국민이 들어보고 풀어봤을 만한 유명한 시리즈의 책이 있다. 나는 이 책을 <데이터 라벨링의 정석>이라고 부르고 싶다. 왜냐하면 이 책은 데이터 라벨링의 정의, 필요성, 산업전망, 급여, 필수 용어, 작업 방식, 생태계(정부와 민간사업), 수입 내는 방법, 커뮤니티, 교육 학습 방법, 필수 작업 도구 세팅 방법, 마인드 셋, 주요 협업툴, 주요 플랫폼, 고수입을 위한 마인드 셋, 시급과 작업기록, 프로젝트 선택과 진입, 놓치지 말아야 할 노하우들, 필수 프로그램들, 기법별 실전 노하우, 저작도구 사용법을 알려주고 데이터 라벨링 기업과의 관계 구축법, 저자 2인의 노하우, 각자의 방법으로 성공한 현직 데이터 라벨러 4인의 노하우, 기업관계자(현업 종사자)와 인터뷰를 기록해 놓아서 기업이 선호하는 데이터 라벨러에 대한 정보도 알 수 있다. 사실상 <데이터 라벨링>이라는 분야에 대한 모든 정보가 담겨져 있고 <데이터 라벨링>에 대해 가질 수 있는 궁금한 점이나 질문에 대해서도 책에 전부 답변을 해놓았다는 생각을 들게 만드는 책이었다. 그래서 나는 이 책을 <데이터 라벨링의 정석>이라고 부르고 싶었다. 책을 읽고 나서 프로그래밍(코딩)만큼 중요한 게 데이터 라벨링이라는 것을 알게 되었고 라벨링이 잘 된 좋은 데이터가 있어야 좋은 인공지능을 만들 수 있다는 것을 확실하게 배울 수 있었다. <데이터 라벨링>의 중요성을 깨닫게 해주는 책이었다.







#데이터라벨링으로돈잘버는N잡러되기 #심정우 #박민영 #라디오북 #라디오북출판사 #RADIOBOOK #yes24 #yes24리뷰어클럽 #서평 #서평이벤트 #서평단 #리뷰 #리뷰단 #데이터 #데이터라벨링 #라벨링 #전처리 #데이터전처리 #인증 #책인증



댓글(1) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
dltkddnjs150 2023-09-03 00:19   좋아요 0 | 댓글달기 | URL
* YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.
 
어둠 속의 추적자들 - 다크웹의 비트코인 범죄자 사냥 - 암호화폐 익명성의 신화를 깨다 에이콘 해킹과 보안 시리즈
앤디 그린버그 지음, 김상현 옮김 / 에이콘출판 / 2023년 7월
평점 :
장바구니담기


여느 날과 다를 거 없이 페이스북 게시물을 보고 있었다. 그러다가 에이콘 출판사에서 업로드한 게시물을 보게 되었는데 게시물의 내용이 에이콘 출판사에서 새로 출간한 <어둠 속의 추적자들> 책의 서평 이벤트를 한다는 게시물이였다. 이 책은 비트코인과 블록체인을 분석하고 추적해 범죄자들을 잡은 내용을 설명한 책이였다. 많은 사람들이 비트코인이 범죄에 쓰인다고 크게 우려하고 있는데, 많은 사람들의 생각과 달리 비트코인은 장부에 거래 기록이 남고 모두가 장부를 볼 수 있어서 범죄에 쓰기에 적합하지 않다고 한다. 블록체인 분석을 통해 익명성 뒤에 숨은 범죄자들을 잡아낸 방법이 궁금하고, 나는 비트코인을 투자하고 있어서 비트코인에 대해서 공부하고 있는데 이 책을 읽으면 비트코인에 대해서 내가 모르는 지식을 배우고 비트코인을 더 깊게 이해할 수 있다는 생각이 들어 이 책이 큰 기대가 되고 꼭 읽어보고 싶어서 서평 이벤트를 신청했고 당첨되어서 책을 받게 되었다.

감사합니다.^^ 에이콘출판사님.^^



책의 저자-앤디 그린버그((Andy Greenberg)

디지털 기술과 문화, 사건과 사고를 심층적으로 다루는 월간지 「와이어드(Wired)」의 선임 작가이다. 『내부 고발자들, 위험한 폭로: 위키리크스와 사이퍼펑크, 해킹과 암호화 기술로 세상의 정보를 가로챈 이들』(에이콘, 2015), 『샌드웜: 사이버 세계를 벗어난 러시아 해커들』(에이콘, 2021)을 집필했다. 특히 『샌드웜』과 그 발췌본은 제럴드 로브 국제보도상(Gerald Loeb Award for International Reporting), 전문언론인협회(Society of Professional Journalists)의 시그마 델타 카이 상(Sigma Delta Chi Award), 뉴욕전문언론인협회(New York Society of Professional Journalists)의 데드라인 클럽 상(Deadline Club Award), 그리고 해외언론클럽(Overseas Press Club)이 주는 코닐리어스 라이언 최우수 표창장(Cornelius Ryan Citation for Excellence)을 수상했다. 그는 아내이자 다큐멘터리 영화 제작자인 말리카 주할리-워럴(Malika Zouhali-Worrall)와 함께 브루클린에 살고 있다.

책의 목차

프롤로그. 개념 증명

1부. 이름 없는 남자들

1장 엘라디오 구즈만 푸엔테스

2장 노브

3장 감사관

4장 크립토아나키(Cryptoanarchy)

5장 실크로드

6장 드레드 파이어럿

7장 퍼즐

8장 익명의 인물들

9장 사이버 나크(Cyber Narc)

10장 글렌 파크

11장 이중 첩자

12장 영수증

13장 프렌치메이드, 데스프롬어바브

14장 재판

2부. 청부 추적자

15장 몰락

16장 더러운 돈

17장 소음

18장 두 번째 요원

19장 금고 속의 구멍

20장 BTC-e

21장 WME

22장 비니크(Vinnik)

23장 아차상

3부. 알파베이(Alphabay)

24장 알파02(Alpha02)

25장 제보

26장 카제스(Cazes)

27장 태국

28장 튜나피시(Tunafish)

29장 로미오(Rawmeo)

30장 한사(Hansa)

31장 장악

32장 고등 분석

33장 아테네 호텔(The Athenee)

34장 급습

35장 억류

36장 부검

37장 덫

38장 여파

39장 수완나품 공항(Suvarnabhumi Airport)

4부. 웰컴투비디오

40장 다섯 개의 부호

41장 “서라치 비디오(Serach Videos)”

42장 낙지

43장 시험 케이스들

44장 서울

45장 넷(The Net)

46장 파급 효과

5부. 다음 라운드

47장 사냥철

48장 한계

49장 회색 지대

50장 럼커(Rumker)

에필로그

취재 노트



책의 특징

이 책은 사이버 공간을 무대로 온갖 음험하고 부도덕한 범죄 행각을 저지르는 악당들의 거래 및 축제 수단에 주목한다. 비트코인과 암호화폐들. 책의 저자인 그린버그는 몇 년에 걸친 심층 취재를 바탕으로 사이버 공간을 넘어 현실 세계까지 큰 파장과 물의, 공분을 불러일으켰던 대표적 범죄 행위들을 소개한다. 온라인 최대 규모의 마약 밀매 사이트로 악명을 떨친 실크로드를 비롯해 그보다 더 큰 규모로 이른바 '다크웹' 시장을 주도했던 알파 베이(Alpha Bay)부터 몇백만 달러 상당의 비트코인을 잃어버리면서 돌연 파산한 수수께끼의 암호화폐 거래소 마운트곡스(Mt.Gox), 범죄자들의 비트코인 현금화를 주도한 또 다른 거래소 BTC-e, 네덜란드 경찰이 다크웹 사이트 운용자로 가장해 함정 수사를 펼친 한사(Hansa), 악명 높은 아동 성 학대 물 매매 사이트인 웰컴투비디오(Welcome to Video)에 이르기까지 그린버그는 암호화폐를 이용한 끔찍한 범죄 행각과 그를 수사해 철퇴를 내린 담당 수사관들의 활약상을 꼼꼼하게 생생하게 그려낸다. 이 책은 암호화폐, 토르(Tor) 같은 신기술의 은폐 기능을 범죄에 악용하는 악당들과 그럼에도 불구하고 놀라운 창의력과 끈질긴 추적으로 사법적 정의를 구현하려는 수사관들의 쫓고 쫓기는 '고양이와 쥐'의 형세를 잘 보여준다. 그런가 하면 수사관들이 누구나 정의로운 것은 아니며 수사 과정에서 얻은 기밀 정보로 변절해 막대한 이익을 취하는 일도 발생한다는 사실을 드러낸다. 이 책의 3부 '알파 베이' 4부 '웰컴투비디오'. 5부 '다음 라운드'에는 자살과 자해와 관련한 부분이 있다. 또한 4부 '웰컴투비디오'에는 아주 생생하게 묘사하지는 않았지만 아동 학대를 지칭하는 내용이 있다.

책의 장점

이 책은 실제 있었던 사건을 다루는 책이지만 뉴스 기사처럼 사실만을 딱딱하게 서술해서 전달하지 않고 소설처럼 구성해서 작성했다. 그래서 읽기가 쉽고 편하며 재미있고 흥미롭다. 마치 추리소설이나 범죄소설을 읽는 듯한 느낌이 난다. 뉴스 기사처럼 사실만을 딱딱하게 서술해서 전달했었다면 책을 읽는데 재미가 없고 어려워서 읽다가 덮었을 수도 있지만 이 책은 그렇지 않아서 책장을 계속 넘길 수 있었다. 뉴스나 신문에 나와서 한 번쯤 들어봤던 실크로드 사건, 마운트곡스(Mt.Gox), 웰컴투비디오(Welcome to Video) 사건들을 자세히 설명해 주어서 자세한 내막과 과정을 알 수 있게 도와준다. 그리고 잘 들어보지 못했던 알파 베이(Alpha Bay), 한사(Hansa) 사건들의 내막과 과정을 알려준다.

책의 후기

많은 사람들이 비트코인으로 통칭하는 암호화폐 또는 가상화폐는 사용자의 익명성을 보장해 그것을 거래의 지불 수단으로 삼는 한 거래 당사자의 신원이 공개되거나 범행의 꼬리가 잡힐 염려가 없다는 생각을 한다. 그러나 이 책은 그러한 잘못된 생각을 바꾸게 만들어준다. 비트코인 같은 암호화폐는 추적되지 않는 통화이기에 완전한 익명성이 보장된다는 믿음은 그릇된 것이라는 것을 알려준다. 나는 이 책을 읽고 비트코인과 암호화폐가 투명하고 신뢰할 수 있다는 생각을 하게 되었고 투자해도 괜찮을 것이라는 믿음이 강해졌다. 많은 사람들은 비트코인과 암호화폐는 범죄에 쓰이기 때문에 투자하면 안 된다고 이야기하지만, 이 책을 읽는다면 그러한 생각은 바뀔 수 있다고 생각한다. 비트코인 같은 암호화폐들은 장부가 투명해서 거래기록을 누구나 조회할 수 있기 때문에 범죄 추적에 용이해서 많은 범죄들과 범죄자들을 잡아낼 수 있기 때문이다. 비트코인과 같은 암호화폐들이 널리 사용된다면 마약, 인신매매, 사기, 횡령, 비리와 같은 흉악범죄들을 줄일 수도 있을 것이다.







#어둠속의추적자들 #TRACERSINTHEDARK #앤디그린버그 #AndyGreenBug #김상현 #에이콘 #에이콘출판사 #서평 #서평이벤트 #리뷰 #리뷰이벤트 #리뷰어 #비트코인 #암호화폐 #BitCoin #CryptoCurrency #블록체인 #BlockChain #다크웹 #DarkWeb #알파베이 #마운트곡스 #BTC-e #한사 #웰컴투비디오 #AlphaBay #Mt.Gox #Hansa #WelcomeToVideo #범죄 #마약 #수사 #수사관 #추적 #사건 #비디오 #Video



댓글(1) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
dltkddnjs150 2023-08-31 23:33   좋아요 0 | 댓글달기 | URL
어둠속의추적자들,TRACERSINTHEDARK,앤디그린버그,AndyGreenBug,김상현,에이콘,에이콘출판사,서평,서평이벤트,리뷰,리뷰이벤트,리뷰어,비트코인,암호화폐,BitCoin,CryptoCurrency,블록체인,BlockChain,다크웹,DarkWeb,알파베이,마운트곡스,BTC-e,한사,웰컴투비디오,AlphaBay,Mt.Gox,Hansa,WelcomeToVideo,범죄,마약,수사,수사관,추적,사건,비디오,Video
 
모두의 한국어 텍스트 분석 with 파이썬 - 기초부터 챗GPT까지, 누구나 쉽게 시작하는 자연어 처리 모두의 시리즈
박조은.송영숙 지음 / 길벗 / 2023년 5월
평점 :
장바구니담기


페이스북 게시물을 보다가 길벗출판사에서 <21차 개발자 리뷰어> 이벤트를 하고 있는 것을 발견했다. 길벗출판사에서 이번 2023년 상반기에 출판된 책들 중 한 권을 선택해서 책을 선물로 받고 리뷰하는 이벤트인데 나는 책들을 구경하다가 내 맘에 드는 <모두의 한국어 텍스트 분석 with 파이썬>이라는 책을 발견했다. 이 책이 맘에 들었던 이유는 텍스트 데이터 분석에 관심이 많은데 시중에 나와 있는 많은 책들, 인터넷 자료들은 텍스트 분석 대부분이 한국어가 아닌 영어로 맞춰져 있었기 때문에 한국어 텍스트 데이터 분석에 관심이 많은 나에게는 책과 공부자료를 찾는 것이 어려웠다. 그런데 이 책은 한국어 텍스트 분석을 다루고 있었기 때문에 나에게 딱 맞는 공부자료라는 생각이 들어 책의 서평 이벤트를 신청했고 당첨되어서 책을 받게 되었다! 감사합니다.^^ 길벗출판사님.^^



책의 저자-박조은

새로운 것을 배우고 탐구하는 것을 좋아한다. 주로 게임과 광고회사에서 백엔드 개발자로 근무해 왔다. 알파고가 등장했을 즈음에 초등학교에 입학하는 첫 아이의 육아를 위해 회사를 그만두고 오늘코드 유튜브 채널을 개설하여 데이터사이언스 분야를 탐구하기 시작했다. 여러 기회가 연결되어 다양한 도메인의 기업, 교육기관, 학교와 일하고 있다. 파이토치 한국 사용자 모임(pytorch.kr)의 운영진으로 활동하고 있으며, Microsoft MVP로 커뮤니티와 함께 나누고 성장하는 것에도 관심이 많다.

책의 저자-송영숙

송영숙은 경희대학교 국어국문학과에서 공부하고 있다. 국어학을 전공했고 전산언어학과 언어 유형론에 관심이 많다. 사람의 언어와 기계의 언어에 장벽을 조금이라고 줄여서 벽을 허물고 길을 내는 사람이 되려고 노력하고 있다.

책의 목차

1장 코랩 시작하기

LESSON OT 들어가며

LESSON 01 코랩 실행하기

____1 주석

____2 단축키

LESSON 02 코랩에서 실습 코드 열기

____1 코랩 테마

2장 파이썬에서 문자열 다루기

LESSON OT 들어가며

LESSON 01 문자열 실습 전에

LESSON 02 문자열 실습

____1 문자열 표현

____2 오류 처리

____3 표현 방법 + 오류 처리

LESSON O3 문자열을 다루는 여러 방법

____1 변수

____2 인덱싱

____3 슬라이싱

____4 문자열의 길이, 단어 수

____5 문자열 함수

____6 반복

____7 함수

____8 문자열 내장 메서드 목록

3장 라이브러리 다루기

LESSON OT 들어가며

LESSON 01 판다스

____1 데이터 프레임과 시리즈 이해하기

____2 str 접근자로 문자열 다루기

LESSON 02 넘파이

____1 넘파이 배열 이해하기

____2 맷플롯립으로 넘파이 배열 시각화하기

4장 단어 가방 모형과 TF-IDF

LESSON OT 들어가며

LESSON 01 단어 가방 모형

____1 단어 가방 모형을 만드는 방법

____2 단어 가방 모형 만들기

____3 n-gram: 앞뒤 단어 묶어서 사용

____4 min_df와 max_df: 빈도수 설정

____5 max_features: 학습 단어 개수 제한

____6 stop_words: 불용어 제거

____7 analyzer: 문자, 단어 단위 설정

LESSON 02 TF-IDF

____1 TF-IDF 가중치를 적용하는 방법

5장 연합뉴스 타이틀 주제 분류

LESSON OT 들어가며

LESSON 01 데이터 선택하기

LESSON 02 분류 과정

LESSON 03 분류를 위한 기본 설정

____1 라이브러리 불러오기

____2 시각화를 위한 폰트 설정

LESSON 04 데이터 불러오기

LESSON 05 데이터 전처리하기

____1 데이터 전처리를 위한 데이터 병합

____2 정답값 빈도수 확인

____3 문자 길이 확인

____4 맷플롯립과 시본을 이용해 히스토그램으로 시각화

____5 주제별 글자와 단어의 빈도 확인

LESSON 06 문자 전처리하기

____1 숫자 제거

____2 영문자는 모두 소문자로 변경

____3 형태소 분석기로 조사, 어미, 구두점 제거

____4 불용어 제거

LESSON 07 학습, 시험 데이터 세트 분리하기

LESSON 08 단어 벡터화하기

LESSON 09 학습과 예측하기

____1 랜덤 포레스트 분류기

____2 교차 검증

____3 학습

LESSON 10 답안지 불러오기

6장 국민청원 데이터 시각화와 분류

LESSON OT 들어가며

LESSON 01 분석 과정

LESSON 02 분석을 위한 기본 설정

____1 라이브러리 불러오기

LESSON 03 판다스로 데이터 불러오기

____1 구글 드라이브에 파일 다운로드

____2 다운로드한 데이터 살펴보기

____3 결측치가 있는지 확인하기

LESSON 04 판다스 데이터 분석과 시각화

____1 답변 대상 청원 열 추가

____2 청원 기간별 분석

____3 청원 기간과 분야별 분석

____4 시각화

LESSON 05 soynlp로 워드클라우드 그리기

____1 라이브러리와 데이터

____2 토큰화

____3 텍스트 데이터 전처리

____4 워드클라우드 그리기

____5 명사만 추출해 시각화

LESSON 06 머신러닝으로 국민청원 데이터 이진 분류하기

____1 지도학습과 데이터 세트 분리

____2 이진 분류 대상 정하기

____3 평균을 기준으로 투표수 예측하기

____4 전처리하기

____5 학습 세트와 시험 세트 만들기

____6 단어 벡터화하기

____7 TF-IDF 가중치 적용하기

____8 LightGBM으로 학습시키기

____9 평가하기

____10 예측하기

____11 예측 결과의 정확도 평가하기

7장 ‘120다산콜재단’ 토픽 모델링과 RNN, LSTM

LESSON OT 들어가며

LESSON 01 분석 과정

LESSON 02 잠재 디리클레 할당으로 토픽 분류하기

____1 라이브러리 설치 및 데이터 불러오기

____2 단어 벡터화하기

____3 잠재 디리클레 할당 적용하기

____4 pyLDAvis를 통한 시각화하기

____5 유사도 분석하기

LESSON 03 순환 신경망으로 텍스트 분류하기

____1 라이브러리와 데이터 불러오기

____2 학습/시험 데이터 세트 분리하기

____3 레이블값을 행렬 형태로 만들기

____4 벡터화하기

____5 패딩하기

LESSON 04 모델 만들기

____1 Bidirectional LSTM

____2 모델 컴파일하기

____3 학습하기

____4 예측하기

____5 평가하기

8장 인프런 이벤트 댓글 분석

LESSON OT 들어가며

LESSON 01 분석 과정

LESSON 02 분석을 위한 기본 설정

____1 라이브러리 불러오기

____2 데이터 불러오기

LESSON 03 데이터 전처리

____1 중복된 글 제거하기

____2 소문자로 변환하기

LESSON 04 문자열 분리로 ‘관심강의’ 분리하기

LESSON 05 벡터화하기

LESSON 06 TF-IDF로 가중치를 주어 벡터화하기

LESSON 07 군집화하기

____1 KMeans

____2 MiniBatchKMeans

____3 클러스터 예측 평가하기

____4 실루엣 계수 분석하기

9장 ChatGPT를 사용한 문장 생성 자동화

LESSON OT 들어가며

LESSON 01 생성 모델의 개념

LESSON 02 생성 모델의 파라미터 크기와 종류

LESSON 03 ChatGPT 사용하기

LESSON 04 한국어 생성 서비스: 뤼튼



책의 특징

이 책의 목표는 텍스트를 분석하는 데 바탕이 되는 데이터의 기초를 이해하고, 코퍼스 또는 텍스트 데이터를 파이썬으로 분석하는 방법을 익히는 2가지 목표가 있다고 한다. 이를 위해서 1~3장에서는 파이썬 실습에 필요한 프로그래밍 기초에 대해 먼저 학습한다.

1장에서는 본문에서 사용할 구글 코랩(Google Colaboratory Colab)에 대해서 알아본다.

이어지는 2, 3장에서는 파이썬의 기초를 다룬다.

2장에서는 텍스트(문자열)를 다루는 데 필요한 파이썬의 기초를 배운다.

3장에서는 파이썬으로 텍스트를 다룰 때 쓸 수 있는 유용한 라이브러리에 대해서 배운다. 데이터 분석과 머신러닝에 광범위하게 쓰이는 판다스와 넘파이 라이브러리 핵심을 알아본다. 두 라이브러리 외에 많이 사용하는 사이킷런 라이브러리도 소개한다.

파이썬의 기초와 라이브러리 사용법을 배운 뒤, 이것들을 적용하고 응용해서 이후부터는 다양한 한국어 데이터에 파이썬을 적용해 본다.

4장에서는 텍스트 분석에 널리 쓰이는 분석 방법인 단어 가방(Bag of Words, BOW) 모형과 TF-IDF(Term Frequency-Inverse Document Frequency) 방법을 살펴본다.

5장에서는 뉴스 데이터라는 텍스트를 분류해 본다. 이 장에서는 연합뉴스 타이틀을 주제별로 분류해 본다. 제목을 놓고 그 범주를 맞춰본다. 단어 가방 모형을 사용해 텍스트를 학습시키고 분류한 결과가 정답과 일치하는지 확인해 본다. 이를 위해서 간단한 텍스트 분류를 통해 머신러닝 알고리즘이 학습할 수 있도록 단어를 수치화하는 방법, 머신러닝 모델을 통해 학습 및 예측하는 방법을 알아본다.

6장에서는 국민청원 데이터를 시각화해 데이터를 탐색해 본다. 국민청원 데이터를 판다스를 통해 데이터를 샬펴보고 KoNLPy와 soynlp로 특정 형태소를 추출하거나 제거해 본다. 그리고 머신러닝으로 텍스트 데이터를 이진 분류해 본다. 이를 진행하면서 텍스트 데이터 분석에 입문하고 간단한 머신러닝까지 활용해 본다.

7장에서는 120다산콜재단이라는 365일 24시간 상담 서비스를 제공하는 2007년 다산콜센터로 시작한, 서울시의 행정 상담 민원 서비스의 질문과 답변 데이터를 사용한다. 이 장은 두 가지 부분으로 구성되어 있다. (1.' 120다산콜재단' 데이터를 토픽별로 분석 시각화, 2.RNN, LSTM을 통한 모델링) 먼저 잠재 디리클레 할당을 통한 토픽 모델링으로 분석하고, 토픽 모델링을 시각화해 주는 pyLDAvis를 이용해 시각화해 본다. 그리고 학습, 시험 데이터를 분리해 RNN으로 모델을 만들어 학습시켜 본다.

책의 장점

이 책은 프로그래밍의 기초가 없는 사람에게 텍스트 분석을 위한 키워드를 제공해 줘서 텍스트 분석을 배우고 싶은 초보자들에게 유용하고 프로그래밍 자체를 너무 깊이 있게 다루지는 않아서 프로그래밍 초보자들도 배우기 유용한 책이다. 이 책은 구글 코랩(Google Colaboratory)을 이용해서 프로그래밍을 하는데 그로 인해 파이썬과 파이썬 라이브러리를 이미 설치해 제공하므로 사용하기가 편리하다. 또한 코드뿐만 아니라 설명, 이미지, 영상도 추가할 수 있다. 그리고 다른 사람에게 내 코드를 공유할 수 있으며, 내 계정과 다른 사람의 계정 구글 드라이브와도 호환할 수 있다. 돈을 낼 필요 없이 이 모든 것을 무료로 사용할 수 있는 장점도 있다. 코랩은 구글 계정과 크롬(Chrome)이라는 2가지만 있으면 사용이 가능하다는 편리한 점이 있다. 구글 코랩을 사용해서 컴퓨터에 따로 프로그래밍 환경을 설치할 필요도 없고 코드를 하나하나 입력할 필요도 없어서 쉽고 편리하게 실습할 수 있는 환경을 제공해 준다. 필요한 경우 코드 윗줄에 코드에 대한 설명을 주석으로 넣어 주어서 코드를 학습할 때 참고하기 좋다. 시중에 나와 있는 많은 프로그래밍 책들은 흑백으로 되어있는 경우가 많은데 이 책은 알록달록한 컬러로 되어있어서 눈이 편하고 눈을 즐겁게 만들어 준다. 시중에 많은 텍스트 분석 책과 인터넷 자료에는 영어 언어를 분석하는 책과 자료들이 많아서 한국어 텍스트 분석은 공부하기가 어려운 편인데 이 책은 한국어에 중점을 맞춰서 한국어 텍스트 분석을 공부 할 수 있는 기회를 제공해 준다. 만약에 이 책에서 어려운 자연과학, 사회과학, 응용과학(공학), 의학 저술, 논문과 같은 전문적이고 학술적인 텍스트 데이터 분석을 했다면 어렵고 흥미를 느끼기 어려웠을 것 같다. 그러나 이 책에서 제공하는 텍스트 데이터가 연합뉴스. 국민청원 데이터, '120다산콜센터 재단' 인프런 이벤트 댓글 분석과 같이 우리 일상에 흔히 접할 수 있는 데이터라서 쉽고 재미있게 분석할 수 있다. 예제로 제공한 텍스트 데이터 분석을 해서 실력을 기르고 이것을 기반으로 응용해서 나만의 새로운 텍스트 데이터 분석을 할 수 있게 도와준다.

책의 후기

나는 이 책에서 구글 코랩(Google Colaboratory Colab)을 처음으로 알게 되었다. 구글 코랩으로 구글 계정과 크롬 브라우저만 있다면 굳이 파이썬 홈페이지에 들어가서 파이썬을 설치하지 않고 파이썬으로 라이브러리를 다운받지 않아도 파이썬 프로그래밍을 할 수 있다는 것이 신기하고 놀라웠다. 실습을 빠르게 할 수 있어서 좋았다. 앞으로는 구글 코랩을 애용해 봐야겠다. 숫자가 아닌 텍스트 데이터에도 머신러닝을 사용할 수 있다는 것이 신기하기도 했고 텍스트 데이터를 수치 형태의 데이터로 변환하는 작업이 흥미로웠다. 또 유튜브에 저자의 무료 텍스트 분석 강의가 있어서 보면서 따라 할 수 있었다. 실습을 하면서 어려운 점도 있었고 이해가 잘 안되는 점, 막히는 점도 있었지만, 이것저것 찾아보고 다시 해보면서 조금씩 천천히 하다 보니 문제를 해결할 수 있었다. 열심히 해서 원하는 결과가 잘 나오면 기쁘고 뿌듯하기도 했다. 이 책에서 해본 텍스트 분석을 다른 사이트에 가서 다른 사이트의 텍스트를 모아서 해봐야겠다.









댓글(1) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
dltkddnjs150 2023-08-30 23:41   좋아요 0 | 댓글달기 | URL
#개발자리뷰어 #개발자 #도서증정이벤트 #모두의한국어텍스트분석WITH파이썬 #박조은 #한국어텍스트 #데이터 #데이터분석 #텍스트 #텍스트데이터 #파이썬 #텍스트분석 #텍스트데이터분석 #파이썬 #길벗 #길벗출판사 #길벗IT #서평 #서평이벤트 #리뷰 #리뷰어 #송영숙#송영숙