빅데이터 전문가의 하둡 관리
샘 R. 알라파티 지음, 안진섭 옮김 / 성안당 / 2018년 11월
평점 :
품절


4차 산업혁명과 관련하여 최근 몇년간 가장 많이 듣게 된 용어 중 하나가 빅데이터 일 겁니다. AI, IoT 등 다른 4차 산업혁명의 키워드들도 사실 빅데이터가 기반이 되어야 하는 것들이 많죠. 그만큼 빅데이터의 중요성은 커지고 있습니다. 개인적으로 프로그래밍 관련 일을 하고 있지만 빅데이터 관련 분야는 아니라 저에게도 생소한 부분이었습니다.


빅데이터와 관련해서 이것저것 찾아보다가 하둡이 빅데이터 처리 시스템의 표준이라는 것을 알고 공부할 방법을 찾다가 이 책을 읽게 되었습니다. 

전체적으로는 1장 하둡 소개, 2장 하둡 어플리케이션 프레임워크, 3장 하둡 데이터 관리 및 보호 그리고 고가용성, 4장 데이터이동,리소스할당,잡스케줄링 그리고 보안, 마지막 5장 모니터링, 최적화, 그리고 문제해결의 다섯개 장으로 구성되어 있습니다. 

하둡은 페타바이트 또는 엑사바이트와 같이 매우 큰 데이터를 다루는 대용량 데이터 처리능력이 있습니다. 또 높은 장애 대응열과 데이터의 스트리밍액세스, 간단한 데이터 일관성 모델 등의 특징이 있습니다. 또한 하둡에도 하둡1과 하둡2가 있다는 것을 처음 알았습니다. 하둡 2와 하둡1의 가장 큰 차이점은 YARN입니다.  

그외에도 800페이지가 넘는 방대한 분량만큼 자세하게 하둡에 대해 소개하고 있습니다. 기본적으로는 하둡 관리자를 위한 책이지만 개발자 또는 분석가더라도 자신에게 도움이 되는 부분을 찾을 수 있습니다. 하둡을 처음 접하는 사람 보다는 어느정도 하둡에 대해 공부를 하신 분들이 자신의 수준을 향상시키려고 할때 도움이 될 책이라고 생각되네요. 이 책을 계기로 하둡에 대해 좀 더 공부를 해봐야겠네요. 잘 읽었습니다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo