데이터 라벨링으로 돈 잘 버는 N잡러 되기 - 입문에서 고수입까지, 데이터 라벨링 한 권으로 끝내기
심정우.박민영 지음 / 라디오북(Radio book) / 2023년 8월
평점 :
장바구니담기


나는 데이터분석/통계에 관심이 많아서 데이터분석/통계와 관련된 책들을 읽고 있다. 그런데 데이터분석을 하기 전에 데이터를 전처리하는 라벨링도 매우 중요한데 시중에 데이터분석/통계 책은 많이 출판되어 있지만 라벨링 관련 책은 찾아보기가 힘들었다. 그러다가 yes24 리뷰어클럽에서 <데이터 라벨링으로 돈 잘 버는 N잡러 되기>라는 책의 서평 이벤트를 하고 있는 것을 목격했다. 책의 내용을 보니 책은 데이터 라벨링에 관련된 책이었다. 그래서 라벨링을 배울 수 있는 이 책이 큰 기대가 되고 읽고 싶은 마음이 커서 서평단 신청을 하게 되었다. 신청 후 결과를 기다렸는데 다행히 선발되어서 저 저번 주에 책을 수령 받게 되었다. 감사합니다. YES24님, 라디오북출판사님.^^



책의 저자-심정우

현재 4년 차 전업 데이터 라벨러로, 2020년 입문 이후 백만 건 이상의 데이터를 가공했다. 1400여 명 규모의 카카오톡 오픈채팅방 ‘라벨러 쉼터’ 운영자로, 여러 기업에서 데이터 가공 의뢰를 받으며 활발히 활동 중이다.

책의 저자-박민영

인문대 박사과정 수료와 더불어 코로나19가 유행하면서 재택 일을 찾다 부업으로 데이터 라벨링을 시작했다. 현재 3년 차 데이터 라벨러로, 문과 전공을 살려서 텍스트 데이터 가공에 주력하고 있다. 카카오톡 오픈채팅방 ‘라벨러 쉼터’ 부운영자로도 활동하고 있다.

목차

작가의 말 - 성공하는 데이터 라벨러의 길을 열어드립니다

1장 데이터 라벨링 : 인공지능 시대, 누구나 쉽게 시작할 수 있는 N잡

1. 새로운 온라인 유망 일자리 ‘데이터 라벨링’

1) 성장하는 인공지능 산업의 기초, 데이터 라벨링

2) 디지털 노매드가 되는 가장 빠른 지름길, 데이터 라벨러

2. 무한한 가능성을 보유한 데이터 라벨링 산업

3. 데이터 라벨러는 얼마를 벌까?

2장 시행착오 없이 데이터 라벨러 입문하기

1. 한눈에 보는 데이터 라벨링 필수 용어

2. 입문자가 알아야 할 데이터 라벨링 작업 방식

1) 인공지능에 눈을 부여하는 작업 : 컴퓨터 비전(Computer Vision)

2) 사람 목소리를 이해시키기 위한 작업 : 음성 분야

3) 글에 대한 독해력과 이해력을 불어넣는 작업 : 자연어 처리(NLP)

3. 데이터 라벨링 생태계 이해의 핵심, 정부와 민간사업

1) 대규모 예산이 투입되는 ‘기회의 땅’ 정부 사업

2) 꾸준한 작업 기회가 주어지는 민간사업

3장 데이터 라벨링 수입 활동을 위한 기초 쌓기

1. 데이터 라벨러로 수입 내기 워밍업

1) 데이터 라벨링의 시작점, 크라우드소싱 플랫폼

2) 더 많은 프로젝트를 찾기 위한 여정, 채용공고 검색

3) 정보의 메카, 데이터 라벨링 커뮤니티 탐색

4) 두려움은 돈 벌 기회만 날린다, 채용공고 지원하기

5) 레벨업을 위한 데이터 라벨링 전문 교육 학습

2. 데이터 라벨링을 위한 필수 작업 도구 세팅하기

1) 원활한 작업을 위한 최소한의 컴퓨터 세팅

2) 작업 효율 극대화하는 모니터 선택

3) 능력 있는 데이터 라벨러의 ‘유능한 손’ 마우스

3. 성공 정착을 위한 데이터 라벨러 마인드셋

1) 바람직한 데이터 라벨러의 기본 소양, 직업윤리

2) 올바른 생태계 조성을 위한 노력, 다른 데이터 라벨러 배려하기

3) 기업이 선호하는 라벨러 되기, 데이터 라벨링 기업과의 관계 구축법

4. 데이터 라벨링 주요 협업툴 이해하고 활용하기

1) 익숙하지만 헷갈리는 카카오톡 사용법

2) 데이터 라벨링 주요 협업툴 ‘슬랙’ 한 번에 이해하기

5. 데이터 라벨링 주요 플랫폼 따라잡기

1) 크라우드웍스 : 데이터 라벨러를 양성하는 국내 1위 데이터 플랫폼

2) 에이모 라벨러스 : 우수한 저작도구를 보유한 데이터 가공 플랫폼

3) 레이블러 : 원활한 소통으로 다양한 기회를 제공하는 플랫폼

4) 라벨온 : 많은 라벨러에게 작업 기회를 주는 플랫폼

5) 테스트웍스 : 사회적 가치를 실천하는 플랫폼(aiworks)

6) AI-Studio : 프로젝트별 트레이닝을 제공하는 플랫폼

4장 데이터 라벨링으로 고수입 창출하기 -이론 편-

1. 꾸준함이 최고, 고수입을 위한 마음 관리

1) 고수입 달성을 위해 필요한 마음가짐

2) 고수입을 만드는 지름길, 명확한 목표 세우는 방법

3) 높은 수입을 위한 최적의 작업 환경 만들기

2. 고수입 달성 핵심 포인트, 시급과 작업기록

1) 돈 되는 프로젝트 선별을 위해 반드시 알아야 할 시급 계산법’

2) 체계적인 프로젝트 관리로 고수입 만드는 작업기록 노하우

3. 본격적인 고수입 만들기, 프로젝트 선택과 진입

1) 수입 높은 프로젝트를 선택하는 기준 잡기

2) 고수입 필수 조건! 여러 프로젝트에 동시 참여하는 법

4. 프로젝트에 완료 후 놓치지 말아야 할 노하우들

1) 시급 높이고 작업 속도 올려주는 가이드 분석법

2) 작업 효율을 극대화하는 전략적인 질문 방식

3) 고수입 가르는 결정적 디테일, 작업 효율 높이는 법

5장 데이터 라벨링으로 고수입 창출하기 -실전 편-

1. 고수입을 위해 꼭 써야 하는 필수 프로그램들

1) 작업 속도를 높이는 가장 손쉬운 방법, 한 손 키보드

2) 폴리곤의 친구 Numpad 클릭

3) 아는 만큼 작업 시야가 넓어지는 브라우저 확장 프로그램

4) 바운딩 박스 정확도 높이는 십자선 프로그램

5) 다양한 프로젝트에서 활용 가능한 효과 만점 확대 프로그램

2. 고수입 라벨러의 기법별 실전 노하우

1) 바운딩 박스(Bounding Box) 빠르게 작업하는 비결

2) 폴리곤(Polygon)으로 탄탄하게 기초 다지기

3) 세그멘테이션(Segmentation) 난이도를 낮추는 작업 순서

4) 확장 프로그램으로 키포인트(Key Point) 작업 쉽게 하기

5) 점군 데이터(Point Cloud) 작업을 위한 점군 눈에 익히기

3. 작업 시간 줄여주는 저작도구 사용법

1) 기본 기능에 충실한 크라우드웍스 저작도구

2) 작업 효율이 뛰어난 에이모 라벨러스 저작도구

3) 직관적 인터페이스를 가진 레이블러 저작도구

4) 초보자도 쉽게 사용 가능한 라벨온 저작도구

5) 다양한 기능으로 활용도 높은 테스트웍스 저작도구(blackolive)

6) 오토 세그멘테이션 기능을 지원하는 AI-STUDIO 저작도구

7) 간편한 라벨링 연습 OK! 접근성 높은 Labelme 저작도구

8) 다양한 기능 체험이 가능한 온라인 기반 CVAT 저작도구

6장 저자 노하우 대공개, 저자 2인의 데이터 라벨링 Talk

1. 데이터 라벨링 전업으로 대기업 연봉 받는 저자 심정우

2. 학업과 병행하며 시급 3만 원 부업 하는 저자 박민영

7장 각자의 방법으로 성공한 현직 데이터 라벨러 4인의 노하우 Talk

1. 데이터 라벨링으로 연 소득 7,000만 원, 절정 고수 주부 김안나 님

2. 아이 돌보며 데이터 라벨링 부업 하는 주부 정재윤 님

3. 은퇴 후 데이터 라벨러로 성공 정착한 60대 박수길 님

4. 데이터 라벨링으로 본업만큼 버는 회사원 김원제 님

8장 기업 관계자 Talk : 데이터 라벨링 산업 전망과 기업이 선호하는 데이터 라벨러

1. 크라우드웍스 TA/PI팀 김예원 님

2. 에이모 교육 매니저 정진수 님

3. 레이블러 HI팀 운영 매니저 일레븐 님

4. 라벨온 AI 플랫폼 사업부 카리나 님



책의 특징

책의 저자는 데이터 라벨러로 활동하면서 많은 사람들이 각자의 생활에서, 없는 시간을 쪼개, 데이터 라벨링이라는 생소한 분야에 도전하는 사람들이 갈피를 못 잡고, 이리저리 흔들리다가 포기하는 사례를 많이 보게 되었다고 한다. 책의 저자는 많은 고비를 넘기며 데이터 라벨링 시장에 진입했지만 앞으로 나아갈 방법을 찾지 못해 업계를 떠나는 사람들을 보면서 안타까움을 느꼈다고 한다. 그래서 저자는 데이터 라벨링에 관심 있는 사람들의 진입 과정에서 어려움을 덜어주고, 남들보다 나은 수입을 가져가길 바라는 마음에서 이 책을 쓰게 됐다고 한다. 이 책은 데이터 라벨러로 입문하는 분들에게 명확한 방향을 제시한다. 정보의 홍수 속에서 올바른 방향을 잡지 못한 사람들의 시행착오를 줄여줄 수 있게 도와준다.

책의 장점

이 책에서는 대표적인 크라우드소싱 플랫폼들의 특징을 최대한 자세하게 다뤘다. 데이터 라벨링 산업의 특성상 라벨러는 플랫폼 의존도가 높은 편인데 저자는 정확한 정보 전달을 위해 대표적인 플랫폼 기업들의 자문을 받으며 특징 및 참여 방법을 자세히 설명했다. 데이터 라벨러로 활동 중이지만 만족스러운 수입을 얻지 못한 사람들을 위한 실전 노하우를 비중 있게 담았다. 저자가 4년간 실제로 작업하며 사용했던 방식과 노하우를 책에 심도 있게 풀어 났다. 또 다양한 플랫폼의 저작도구 활용 노하우를 이 책에 담아놓았다. 또 데이터 라벨링 기법별로 작업 속도를 올릴 수 있는 팁들과 함께 작업에 활용할 수 있는 저자의 모든 노하우가 담겨져있다.

책의 후기

시중에 <수학의 정석>이라는 전 국민이 들어보고 풀어봤을 만한 유명한 시리즈의 책이 있다. 나는 이 책을 <데이터 라벨링의 정석>이라고 부르고 싶다. 왜냐하면 이 책은 데이터 라벨링의 정의, 필요성, 산업전망, 급여, 필수 용어, 작업 방식, 생태계(정부와 민간사업), 수입 내는 방법, 커뮤니티, 교육 학습 방법, 필수 작업 도구 세팅 방법, 마인드 셋, 주요 협업툴, 주요 플랫폼, 고수입을 위한 마인드 셋, 시급과 작업기록, 프로젝트 선택과 진입, 놓치지 말아야 할 노하우들, 필수 프로그램들, 기법별 실전 노하우, 저작도구 사용법을 알려주고 데이터 라벨링 기업과의 관계 구축법, 저자 2인의 노하우, 각자의 방법으로 성공한 현직 데이터 라벨러 4인의 노하우, 기업관계자(현업 종사자)와 인터뷰를 기록해 놓아서 기업이 선호하는 데이터 라벨러에 대한 정보도 알 수 있다. 사실상 <데이터 라벨링>이라는 분야에 대한 모든 정보가 담겨져 있고 <데이터 라벨링>에 대해 가질 수 있는 궁금한 점이나 질문에 대해서도 책에 전부 답변을 해놓았다는 생각을 들게 만드는 책이었다. 그래서 나는 이 책을 <데이터 라벨링의 정석>이라고 부르고 싶었다. 책을 읽고 나서 프로그래밍(코딩)만큼 중요한 게 데이터 라벨링이라는 것을 알게 되었고 라벨링이 잘 된 좋은 데이터가 있어야 좋은 인공지능을 만들 수 있다는 것을 확실하게 배울 수 있었다. <데이터 라벨링>의 중요성을 깨닫게 해주는 책이었다.







#데이터라벨링으로돈잘버는N잡러되기 #심정우 #박민영 #라디오북 #라디오북출판사 #RADIOBOOK #yes24 #yes24리뷰어클럽 #서평 #서평이벤트 #서평단 #리뷰 #리뷰단 #데이터 #데이터라벨링 #라벨링 #전처리 #데이터전처리 #인증 #책인증



댓글(1) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
dltkddnjs150 2023-09-03 00:19   좋아요 0 | 댓글달기 | URL
* YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.