마스터링 아파치 스파크
마이크 프램톤 지음, 정기훈 옮김 / 정보문화사 / 2016년 6월
평점 :
장바구니담기



얼마 전에 연구실에서 친구 일을 조금 분담해서 하던 중 알게 된 아파치 스파크.

최근 떠오르고 있는 분산 데이터 분석 시스템이다.

사실 알아보던 부분은 streaming processing 부분이었는데, 

spark는 batch 기반으로 동작하지만, streaming을 지원하는 부분도 있어 보게 되었다.


책 자체는 원서를 번역한 책이다.



리눅스, 하둡, 스파크, 스칼라에 대한 기본적 지식이 필요한 듯 하다.

마냥 초보들만을 위한 책은 아니라는 것이다.

사실 이런 빅데이터 분석 시스템에 과한 내용을 공부하려면 항상 하둡이나 리눅스는 필수적이라고 생각한다.



내가 보던 스트리밍 부분.

상세히 책의 내용을 찍어 올릴 수는 없지만, 뒤의 내용을 보면 나름대로 자세한 설명이 있다.
스트리밍 이외에도 스파크 자체에 관한 설명이라던가, 스파크의 여러가지 모듈들(SQL/머신러닝 등)에 대한 설명도 잘 나와있다.



앞서 대상 독자에 써 있던 말처럼 리눅스, 하둡, 스칼라 등에 대한 기초적 지식만 있다면 스파크에 대해 개념을 쌓고 공부하는 데 좋은 책인 듯 하다. 앞서 언급한 기초 지식들까지 있는 책을 찾으려면 아마 저만한 두께로는 안될 듯 싶다...... 리눅스, 하둡, 스칼라 등에 대한 내용들은 구글링만 잘 해봐도 레퍼런스가 꽤 많으니, 찾아가며 공부해도 나쁘지 않을 것 같다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo