Head First Data Analysis 헤드 퍼스트 데이터 분석 - 하둡을 이용한 SQL 기반 빅데이터 분석 도구 Head First 시리즈
마이클 밀튼 지음, 김경태 옮김 / 한빛미디어 / 2013년 4월
평점 :
장바구니담기


데이터분석이란 단어를 보니 데이터란 뜻을 먼저 보면 하나의 정보를 데이터라고도 하고 컴퓨터에서는 데이터를 관리하고 우리의 삶에 있어서 많이 이용이 되고 있다. 국어사전에서 뜻을 찾아보니 이론을 세우는데 기초가 되는 사실, 또는 바탕이 되는 자료이다.

 

이 데이터에 대한 것을 분석하는 것 분석이란 이 데이터가 더 가치 있는 데이터를 만들기 위해 분석을 하고 필요 없는 부분은 삭제를 하는 아니면 필요는 없더라도 다른 곳에 작은 아이디어가 될 만한 것들은 따로 모아 놓는 행동이 분석을 나는 식으로 내가 살아가는데 있어서 필요한 행위라고 본다. 먼저는 데이터에 대해 말할 것인데 일상생활에서 우리가 말 할 때는 학교에서는 숙제를 하기 위해서 자료를 조사하고 여행가기 전에 자료를 조사하고 자신이 앞으로 살아가는데 있어서 자료를 조사를 한다.

 

이러한 자료들이 사람에게 중요해지고 많아지면서 자료가 상당히 많아지게 되었다. 자료들이 정보화 시대가 되면서 정보화 시대 이전에는 컴퓨터가 없고 손으로 직접 작성하기도 하고 많은 양의 정보들을 직접 종이로 갖고 있거나 머리로만 하는데는 한계가 있어서 힘든 부분이 많았을 것이다. 하지만 정보화 시대가 되면서 자료들을 무형의 공간에 보관을 할 수 가 있고 지금의 엄청난 데이터를 말하는 빅 데이터란 단어까지 나오게 되었다.

 

인터넷이란 것이 보편화가 되면서 직접 가지고 있지 않아도 컴퓨터란 가상의 공간에서 정보를 찾을 수 도 있고 자신의 업무에 사용하기도 한다. 많은 양의 데이터가 있는데 이 데이터를 분석이란 절차를 통해서 더 가치 있는 데이터를 만드는 것이 개인적인 생각의 데이터 분석이다. 어릴 때부터 숙제라는 것 또한 데이터 분석의 하나이다.

 

좁은 면의 데이터를 지금까지 말했었고 좀 더 나아가면 데이터란 것은 어떻게 해야 내가 알고 있는 것을 상대방에게 좀 더 쉽게 전달 할 수 있을 까하는 생각을 하게 되는데 표나 그래프를 만들어서 상대가 한눈에 알아 볼 수 있는 자료를 만들기도 한다. 인터넷이란 것을 통해 자신이 좋아하는 것을 취미로나 블로그를 하여서 포스트를 하기도 하는데 인터넷이란 이 도구를 활용하여서 삶에 유익한 정보를 많이 접할 수 있다.

 

살아오면서 데이터 분석하면 멀게 느껴지고 전문가가 있을 것 같아 관심을 안가지고 있는 사람들도 많겠지만 누구나 데이터 분석 전문가가 될수 있다고 생각한다. 이 책은 입문자에게 좋은 책으로 알려진 헤드퍼스트에서 나왔다. 우리가 학교교육과정을 거치면서 들었던 이론검증 하는 것이나 가설 검증등 쉬운 단어 들로 되어있는 제목들이 있고 처음 접한 단어들의 목차들도 있지만 설명이 잘되어있어 좋았다.

 

이 책은 데이터를 분석하는데 있어서 인간처럼 분석한다. 파트도 있었는데 분석에 있어서 사람이 할 수 있는 것을 하므로 생각하지 못해 일어나는 변수들을 막을 수 있고 오류를 처리하는데도 내가 처음 사용해본 사람인데 범할 오류가 무엇일지 생각도 해보고 주변 사람에게 도움을 청하면서 오류를 더 나지 않도록 예방을 할 수 있다. 예방하므로 하지 않은 것보다 나은 결정이 나오므로 읽으면서 데이터 분석에 대한 폭을 넓힐 수 있었다.

 


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo