처음 처음 | 이전 이전 | 1 | 2 |다음 다음 | 마지막 마지막
헬로 데이터 과학 - 삶과 업무를 바꾸는 생활 데이터 활용법
김진영 지음 / 한빛미디어 / 2016년 3월
평점 :
절판


[스몰 데이터부터 시작하라]


빅데이터부터 알파고까지, 몇년 전부터 데이터 과학은 저자의 말처럼 섹시한 분야가 되었다. (정작 난 이 표현 별로 안 좋아하지만....) 개인 개인이 만들어 낸 데이터 총량이 어느 순간보다도 많아진 것이다. 유튜브에 분당 업그레이드 되는 비디오는 300시간이다. 더욱 놀라운 것은 5년전 24시간에서 10배 가까이 증가된 수치라는 것이다. 정보의 홍수 속에 살고 있다고 해도 과언이 아니다. 


우리 의사결정엔 데이터가 무척 중요하다. 대학에서도, 직장에서도, 심지어 몸무게를 파악할 때에도 중요한 역할을 한다. 그런데 더 많은 양의 정보가, 항상 더 좋을 것일까? 


대부분 데이터 과학 교양서들은 "열려라 빅데이터!' 같은 느낌이었다. 물론 빅데이터는 중요하다.  빅데이터를 다루는 사람에게. 엄청난 소음속에서 아주 작은 신호를 찾는 것 부터가 "건초 더미에서 바늘 찾기" 인데 [수집비용, 복잡한 수식과 알고리즘, 고사양의 컴퓨터(여러대)] 를 만나 실생활에서 쓸일은 거의 없다. 책 읽고 직접 실습을 하려고 해도 불가능에 가깝다. 


그런 의미에서 이 책에서 얘기하는 스몰 데이터 부터 시작하라는 아주 의미가 깊다. 데이터의 본질은 크기보다, 데이터를 통해 의사결정에 어떤 도움이 되는가이다. 이러한 본질을 저자는 다양한 예시와 시각화를 통해 데이터를 올바르게 정제하는 법을 아주 친절하게 가르쳐준다.



[자신에게 정말 필요한 것으로 시작하라]


오랜 기간동안 데이터 과학을 연구했고, Bing의 검색기능을 분석하는 데이터 과학자인 저자의 이력중에서 가장 인상이 깊었던 것은 Quantified Self(정량화된 나) 라는 조금 수상쩍은 이름의(...) 집단에서 활동을 했다는 것인데, 간단하게 말하면 "나" 데이터를 셀프로 관리하는 활동이다. 


활동 이름처럼 주변에서 일어날 수 있는 생활 데이터들을 위주로 사례를 소개하고 있다. 첫장에 나오는 에어비앤비 사례 역시 아주 심플하다. 테크 기업이니까, 숙박지의 가격을 예측하기 위해, 공항으로부터의 거리를 삼각함수로 구하고, 유류할증료와 테러데이터 선형분석하여... 이런 일은 일어 나지 않는다.


전문 사진사로 숙소 사진을 찍었더니 객수가 증가하더라 라는 나도 생각했을 것 같은(..) 하지만 비즈니스에서 이러한 정량화된 수치는 무척이나 중요하다. 중요한 것은 에어비앤비 창업자들은 데이터 과학의 힘을 믿었고, 어떤 일을 실행하더라도 이 일을 데이터로 남기고 의사 결정에 활용했다는 것이다.


이들처럼 우리도 우리에게 정말 필요한 것으로 시작할 수 있다. 저자는 우리 주변에 문제들을 해결하기 위해서 직접 데이터를 수집하고 활용하라고 한다.


이 책의 어찌보면 아쉬운 점은 엑셀을 실습툴로 선택했다는 것이다. (아마 더 많은 사람들이 데이터 과학을 쉽게 접근했으면 하는 따뜻한 마음이었겠지. 마소에서 일하셔서는 아닐거야.. ) 하지만 데이터 과학을 처음으로 시작할 때 시각화가 이미 되어 있는 엑셀은 어떤 프로그램이나 언어보다도 데이터 과학에 쉽게 접근할 수 있게 해 줄 것이다. 엑셀에 저렇게 기능이 많을 줄이야 하고 놀라실지도 (역시 마소에서 일하셔서....)



[한줄 평]

오늘부터 시작하는 데이터 과학! 



아래는 저자의 페이스북 페이지과 블로그이다. 책이 출간되기 전부터 팔로우 했었는데 간간히 데이터 과학과 관련하여 읽을 거리가 올라온다. 매우 유익하다. 


https://www.facebook.com/hellodatascience/

http://www.hellodatascience.com/




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 


2개의 상품이 있습니다.

머신 러닝 인 파이썬- 파이썬을 활용한, 예측분석을 위한 기계 학습
마이클 보울즈 지음, 정동식 옮김 / 비제이퍼블릭 / 2015년 11월
27,000원 → 24,300원(10%할인) / 마일리지 1,350원(5% 적립)
2016년 05월 07일에 저장
절판

머신 러닝 워크북- 머하웃, 스프링 XD, 하둡, 스칼라, 스파크, R
제이슨 벨 지음, 곽승주 옮김 / 길벗 / 2016년 4월
35,000원 → 31,500원(10%할인) / 마일리지 1,750원(5% 적립)
2016년 05월 07일에 저장
절판



2개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기
 
 
 


1개의 상품이 있습니다.

레시피보다 중요한 100가지 요리 비결
쿠아야마 케이토 그림, 김혜선 옮김, 도요미츠 미오코 감수 / 숨쉬는책공장 / 2016년 5월
16,000원 → 14,400원(10%할인) / 마일리지 800원(5% 적립)
양탄자배송
내일 아침 7시 출근전 배송
2016년 05월 07일에 저장



1개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기
 
 
 


3개의 상품이 있습니다.

비즈니스 활용 사례로 배우는 데이터 분석:R- 실무에서 바로 적용하는 8가지 데이터 분석 사례
사카마키 류지.사토 요헤이 지음, 손정도 옮김 / 한빛미디어 / 2015년 11월
22,000원 → 19,800원(10%할인) / 마일리지 1,100원(5% 적립)
2016년 05월 07일에 저장
절판
당신은 데이터의 주인이 아니다- 빅데이터 시대의 생존과 행복을 위한 가이드
브루스 슈나이어 지음, 이현주 옮김, 김보라미 감수 / 반비 / 2016년 4월
19,000원 → 17,100원(10%할인) / 마일리지 950원(5% 적립)
2016년 05월 07일에 저장
절판

데이터가 뒤집은 공부의 진실
나카무로 마키코 지음, 유윤한 옮김 / 로그인 / 2016년 5월
13,000원 → 11,700원(10%할인) / 마일리지 650원(5% 적립)
2016년 05월 07일에 저장
품절



3개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기
 
 
 


2개의 상품이 있습니다.

진정성이라는 거짓말- 진정한 나를 찾다가 길을 잃고 헤매는 이유
앤드류 포터 지음, 노시내 옮김 / 마티 / 2016년 2월
16,000원 → 14,400원(10%할인) / 마일리지 800원(5% 적립)
2016년 05월 07일에 저장
구판절판
사피엔스 (무선본)- 유인원에서 사이보그까지, 인간 역사의 대담하고 위대한 질문
유발 하라리 지음, 조현욱 옮김, 이태수 감수 / 김영사 / 2015년 11월
22,000원 → 19,800원(10%할인) / 마일리지 1,100원(5% 적립)
2016년 05월 07일에 저장
절판



2개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기
 
 
 
처음 처음 | 이전 이전 | 1 | 2 |다음 다음 | 마지막 마지막