어제에 이어서 빅데이터에 관한 책 한권을 추가로 더 읽어보기로 했다. 목차를 잠깐 살펴보니 개인적으로 이전에 읽었던 책들에서 봤던 내용들도 일부 나오지만 처음 보게 될 사례들도 만나볼 수 있을 듯하다.
분야를 막론하고 중요한 것은 반복해서 등장하기 마련인데, 핵심을 잘 짚어감과 동시에 다른 책에서는 미처 보지 못했던 새로운 것들을 만날 수 있는 시간이 되길 기대하며 시작해본다.

미래의 시민에겐 통계적 사고가 읽고 쓰는 능력만큼이나 중요하게 될 것이다. _사무엘 윌크스(미국의 저명한 통계학자).- P5
이 시대에 맞는 준비를 하고 있으면, 이 시대에 맞는 역량을 키우고 있으면 그런 역량을 발휘할 기회는 반드시 온다.- P6
숫자를 다루고 숫자로 말하는 사람이 성공하는 빅데이터 시대- P7
"미래는 이미 우리 곁에 와 있다(The future is already here)." _공상과학 소설가 & 미래학자 윌리엄 깁슨 (William Gibson)- P14
빅데이터는 데이터의 양이나 종류가 엄청나게 많아서 기존의 방법으로는 도저히 수집, 저장, 검색, 분석 등이 어려운 데이터이다.- P24
정형 데이터 : 바로 통계 분석이 가능한 형태(표)로 정리된 데이터로 열은 항목이고, 행은 저장되는 단위가 된다. 기존의 시스템에 저장된 데이터, 예를 들어 회원정보, 구매 정보 등은 모두 정형 데이터다.- P24
반정형 데이터 : 데이터 구조가 일관성이 없는 데이터로 속성을 나타내는 메타데이터를 갖는다. html, 웹 로그, 센서 데이터 등이 대표적이다.- P24
비정형 데이터 : 형태 자체가 정해지지 않은 텍스트(글), 음성, 이미지, 동영상, GPS 등과 같은 데이터로 분석하려면 정형 데이터로 변환해야 한다.- P25