-
-
자바스크립트와 Node.js를 이용한 웹 크롤링 테크닉
쿠지라 히코우즈쿠에 지음, 이동규 옮김 / 제이펍 / 2016년 12월
평점 :
절판
노드를 활용한 데이터 수집 분석에 관한 보물창고 같은 책입니다
1, 2장
개발환경을 구축한후 html의 데이터를 가져오고 파싱하는 기본을 보여줍니다
각종 툴과 노드 라이브러리를 이용해서 쉽게 구현하는데 노드를 처음하더라도 이해에 어려움은 없습니다
단 자바스크립트 문법은 당연히 알고 있어야합니다
사이트를 통째로 다운로드하는 부분부터 소스가 약간 길어지지만 간단한 소스의 연속일뿐입니다
함수형 프로그램에 대한 경험이 있으면 특히 수월하게 따라갈수 있습니다
클래스를 사용하지는 않고 함수의 연속입니다
3장
로그인이 필요한 사이트의 크롤링입니다
얼핏 난이도가 있을거 같았는데 이것도 이미 잘만들어진 툴을 이용해서 간단하게 구현합니다
로그인 페이지의 html 페이지 구조만 분석하면 나머진 CasperJS의 api 사용법만 따라하면 됩니다
그리고 Electron으로 데스크탑앱 개발하는게 약간 나오는데 그저 이런것도 가능하구나 알고 넘어갔습니다
몇페이지로 다루기에는 너무 큰 주제같습니다
4장
데이터 처리와 저장에 관한 장입니다
이장은 대부분 경험있는 개발자라면 이미 익숙한 내용이고 노드와 웹크롤링에 국한된 내용은 아닙니다
그리고 커피스크립에 관한 부분은 약간 뜬금없고 너무 적은 내용이라서 별 도움은 안될거같네요
개인적으론 아마도 타입스크립트가 좀더 낫지 않을까 싶습니다
5장
한글 형태소 분석인데 짧지만 신기하고 재밌었습니다
특히 원서가 일본인데 한글로 수정 번역해주신 번역가님께 박수를 쳐드리고 싶습니다
6장
유명한 사이트에서 제공하는 open api를 통해 데이터를 가져오는 법을 보여줍니다
깊이있게 다루지는 않지만 여러 유명 sns, 웹서비스 등에서 골고루 기본을 알려줍니다
사이트에 개발자로 가입하고 api 활용해서 데이터 끌어오는건 대부분 비슷합니다
7장
머신러닝에 관한 장인데 저에겐 어려워서 많이 보지 못했습니다
하지만 채팅봇에 관한 부분은 어렵지 않고 흥미로우므로 읽을만 합니다
8장
차트 그래프를 만드는 장입니다
자바스크립트로 이런 수준의 차트가 가능하다는게 놀랍습니다
특히 D3.js 기반의 라이브러리는 한번 익혀두면 굉장한 실력자로 보일수 있을거 같습니다
결론
자바스크립트의 기본만 있으면 충분히 도전할 가치있는 책입니다
따라하기 어렵거나 복잡한 소스는 거의 없습니다
노드에 대한 깊이있는 이해도 필요하지 않습니다
완성도 높은 긴 예제가 나오진 않지만 각종 팁 모음집 같은 형태를 취하면서 개발자에게 많은 영감을 줄 수 있는 좋은 책으로 적극 추천합니다
특히 웹개발자에게 자바스크립트로 가능한 개발 영역에 대한 이해를 넓혀줄 겁니다