9가지 사례로 익히는 고급 스파크 분석 - 개정판
샌디 라이자 외 지음, 박상은.권한철.서양주 옮김 / 한빛미디어 / 2018년 3월
평점 :
절판


요즘 실리콘밸리는 "속도"죠. 빠르게 변화하는 트렌드를 쫒기 위한 목적도 있지만, 개발자나 데이터 과학자의 높은 급여를 이유로 높은 장비 운영 비용이 들더라도, 빠르게 결과를 낼 수 있는 도구를 선호합니다. Python, Golang, Scala, JavaScript, Swift, Kotlin 같은 언어들이 선호되는 이유기도 합니다.


스파크도 속도 트렌드를 충족하는 도구 입니다. 스파크 이전에 엔지니어들은 여러가지 도구 사이를 헤집고 다니며 작업 도구를 스위칭 해야 했습니다. 스파크는 도구 스위칭을 줄이고, 빠르게 데이터를 분석할 수 있도록 개발 되었습니다.

저는 자바 언어는 알지만 자바 전문 개발자가 아니라 Scala라는 언어를 모르는 상태였습니다. 스파크라는 빅데이터 분석 도구를 사용하는데 Scala가 적합한 언어라 시간이 걸리더라도 이번 기회를 핑계로 삼아 익혀야 겠다고 생각했습니다. Scala라는 새로운 언어를 배우는데 오랜 시간이 걸릴거라는 것은 기우 였습니다. 이미 Python, JavaScript에 익숙하기 때문에 Scala라 언어 레퍼런스는 몇시간만에 읽고, 스파크를 연습하는데 충분 했습니다. 물론 스파크는 Python, Java, R 언어도 지원하지만 Scala를 익힐 기회를 놓칠 수 없었기 때문입니다.

이 책은 프로그래밍 언어 레퍼런스가 아니었습니다. Scala는 익히기 쉬운 언어이므로 개발자라면 몇시간이면 언어 스펙을 읽고 코딩 할 수 있습니다. 물론 Scala로 응용 프로그램을 개발하자면 API에 익숙해져야 하죠. 하지만, 스파크를 다루는 목적이라면 Scala에 빨리 적응 할 수 있었습니다.

이 책의 초반에 이 책은 머신러닝 이론서가 아니라고 설명 하고 있었는데, 아닙니다. 머신러닝 이론과 스파크를 통한 실무 예제를 연결하여 추천 알고리즘 개발, 네트워크 이상 탐지, 의미 분석, 네트워크 분석, 교통 분석, 금융 리스크 추정, 유전체 분석, 신경 영상 분석 과업을 해결하는 과정을 다루고 있습니다. 사용된 알고리즘들은 자주 사용되는 대부분의 알고리즘을 커버 하며, 이미 머신러닝 알고리즘들은 알고 있기 때문인지, 스파크를 통한 데이터 분석 예제를 어려움 없이 수행 할 수 있었습니다.</p>

빅데이터 분석에 스파크는 훌륭한 도구이자 안내자 입니다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
9가지 사례로 익히는 고급 스파크 분석 - 개정판
샌디 라이자 외 지음, 박상은.권한철.서양주 옮김 / 한빛미디어 / 2018년 3월
평점 :
절판


빅데이터는 느립니다. 요즘 대세는 속도죠. 스파크는 빠른 빅데이터 분석을 목적으로 하며, 기존 복잡한 도구들에 비해 간편하고 빠른 분석 환경을 제공 합니다. 수많은 데이터 분석, 머신러닝 알고리즘을 통해 9가지 문제를 풀어보는 예제를 통해 스파크 머신러닝 데이터 분석을 동시에 배웁니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

유명한 O'REILLY MySQL Troubleshooting 을 한국어로 읽을 수 있는 기회를 잡았다. 300페이지 가량의 책이지만 내용은 결코 만만하지 않다. 이 책에 부제를 넣는다면 거창해 보일수도 있는 'MySQL DBA로 가는 길'이라고 하고 싶다.

애플리케이션 개발자들이 RDBMS의 적용을 쉽게 생각하고, 적용해 버리고, 결국 DBA에 대한 지식이 없어 장애를 해결하지 못하여 실패하는 사례들을 보아 왔다. RDBMS는 생명체와 같다. 애플리케이션이 RDBMS를 지원하는데서 끝나지 않는다. RDBMS는 잘 보살펴 주지 않으면 게으름을 피우거나, 엉뚱한 작업을 하거나 심하면 생명이 꺼져 버리기도 한다.

이 책은 이미 SQL에 대한 기본 지식이 있는 독자를 대상으로 한다. SQL 문법, 정규화 등은 알고 있어야 한다.

이 책에서 MySQL을 사용하는 프로젝트의 개발, 테스트, 운영 과정에서 발생하는 대부분의 지식을 담고 있다. 손상으로부터의 복구, 운영 정보 수집, 에러 추적, 장애의 해결, 성능 튜닝, 테스트, 샌드박스 사용법, 설정, 보조 서버 운영, 백업, 플러그인의 구조와 차이점, MySQL이 가진 버그를 확인하고 회피하는 방법, MySQL 운영을 돕는 도구 등에 대한 지식을 얻을 수 있었다.

무엇보다 필자가 MySQL 개발과 테스트에 참여한 자신과 동료들의 경험을 살려 MySQL 내부 동작을 설명을 하여 이해를 쉽게 도와주는 점이 큰 장점이다.

이 책의 '원서'에 따른 내용이겠지만,  'MySQL 운영을 돕는 서드파트 도구'들에 소개가 반갑긴 하지만 사용법과 예제가 없는 점이 아쉽다. 이부분은 따로 검색해서 봐야 한다.

이 책은 MySQL을 통해 응용 소프트웨어를 개발하려는 개발자, 개발 사업을 추진하는 책임자급 엔지니어, MySQL 전문가가 되고 싶은 입문자들, 특히 RDBMS를 구성, 운영을 해야 하는 IT기업 오너들에게 권한다.


3개의 상품이 있습니다.

프로그래머를 위한 베이지안 with 파이썬
캐머런 데이비슨 필론 지음, 곽승주 옮김 / 길벗 / 2017년 11월
27,000원 → 24,300원(10%할인) / 마일리지 1,350원(5% 적립)
2017년 12월 18일에 저장
절판
해커스 편입수학 공식집- 시험에 꼭 나오는 핵심 공식 총정리, 기초수학.미적분학.선형대수학.공업수학.확률과통계 (최종 암기 점검을 위한 ‘핵심 공식 TEST’ 수록)
홍창의 지음 / 해커스편입 / 2017년 9월
12,000원 → 10,800원(10%할인) / 마일리지 600원(5% 적립)
양탄자배송
밤 11시 잠들기전 배송
2017년 12월 18일에 저장

세상에서 가장 쉬운 베이즈통계학 입문
고지마 히로유키 지음, 장은정 옮김 / 지상사 / 2017년 3월
15,500원 → 13,950원(10%할인) / 마일리지 770원(5% 적립)
양탄자배송
밤 11시 잠들기전 배송
2017년 12월 18일에 저장



3개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기