상기의 구분 또는 변환을 잘하는 사람과 그렇지 못한 사람을 차이는 앞으로 데이터가 중심이 되는 이 시대에 큰 차이를 가지고 올 것이다. 처음에는 데이터로부터 정보를 뽑아내는 기술이 중요하겠지만 나중에는 철학과 사고가 더 핵심이 되는 시대가 올것이다.
즉 작금의 엔지니어시대 이후에는 다시 철학의 시대가 올 것이라는 생각이다.
(물론 내 생각이다)
이 책의 구성은 다음과 같다.
1부 데이터의 탄생_ 태초에 데이터가 있었으니
2부 정보의 지도_ 데이터가 힘이 되려면
3부 지능의 미래_ 신의 영역에 도전하기
4부 지혜의 시대_ 데이터가 지혜가 되는 순간
데이터를 잘 활용하기 위해서 이해해야 할 것들, 정의해야 할 것들에 대한 내용을 전반부에 다루고, 후반부에 가면 우리가 데이터를 다룸에 있어서 생각해야 할 것들을 균형있게 다루고 있다고 생각한다.
알고리즘에 대한 이야기, 빅인텔리전스에 대한 이야기 윤리적 이슈가 될 수 있는 미래의 이야기들도 담담하게 생각할 수 있게 해주는 것이 이 책의 또 하나의 매력이라고 생각한다. 지구의 종말 또는 인류의 종말은 전혀 다른 방향으로 올수도 있다는 생각이 들었다.(귀있는자는 들을지어다)
덧붙임.
1. 철학적인 책인데, 오히려 실무에 도움이 될만한 팁들을 많이 얻었다.
(하반기 프로젝트에 써먹을 예정이다)
2. 수많은 데이터를 어떻게 세련되게 가공할지, 가공된 데이터에서 데이터를 가공한 사람을 생각을 읽어내는 것 이것이 향후 핵심이다.
본문의 내용을 일부 인용하면,
관찰자가 가지고 있는 관찰 동기와 목적에 따라 현상이나 사건을 바라보는 관점이 달라지므로 우리가 접하는 모든 데이터는 관찰자의 마음에서 왔다고 해도 과언이 아니다. 데이터는 결코 객과적 개체가 아니며, 관찰자가 주관적으로 바라보고 싶은 세사의 단면일 가능성이 크다. 데이터가 객관적 타당성을 가질 거라고 속단한다면 당신은 데이터의 노예가 될 수 밖에 없다.
우리 스스로가 빅 데이터 시대를 주도하고 한다면 우리 주위에 수집보관되고 있는 데이터가 누가 어떠한 관점ㅁ에서 수집한 것인가를 파악해야 한다. 그래야 주도적 관찰자로서의 주관을 가질 수 있고, 그 관점에서 새로운 데이터를 발굴할 수 있으며 이를 올바른 가치관에 따라 활용할 수 있다.
결국 정보를 탐색하고자 할때, 서로 연관된 세가지를 명확히 하고 출발하는 것이 좋다. 첫째는 정보탐색의 대상을 정하고, 둘째는 정보탐색의 관점을 정하며, 셋째는 이를 결정할 주체로서의 '나'를 정의하는 것이다. 이 세가지는 서로 밀접하게 얽혀 있어, 어느 한가지도 따로 떼어낼 수 없다.
횡단적과점에서의 개관은 시간 축을 고정하고 광범위한 대상의 생김새와 모양을 파악하려는 것이다. 횡단적 개관을 통해 발견하고자 하는 것은 광범위한 영역에 내재한 어떠한 구조나 패턴, 그리고 그것을 이해하기 위한 분류 시스템등이다. (중략) 횡단적 개관은 데이터를 도출하는 것도 중요하나 방대한 데이터량 때문에 도출된 데이터를 압축적으로 잘 표현하는 것이 더욱 중요하다.
종단적관점에서의 개관은 시간 축에 따라 대상의 변화를 추적한다는 점에서 모니터링과 유사하다. 그러나 모니터링이 관찰 대상을 특정하는 집중형 추적이라면, 종단적 개관은 시간 축에 따라 광범위한 영역의 전반적 흐름을 파악하는 것이다. 따라서 종단적 개관을 통해 발견하고자 하는 것은 광범위한 영역에서 전반적으로 나타나는 추세이다. 흔히 말하는 메가트렌드의 발견이 종단적 개관의 주된 목적 중 하나다.
1993년 미국 애리조나 주 공무원인 웨인 넬슨이 주 정부의 돈 200만 달러를 횡령하려고 시도했다. 가짜 납품 업체를 만들어 놓고 주 정부가 가상의 물품대금을 그 업체에 지불토록 하는 수법을 썼다. 이런 방법으로 약 열흘에 걸쳐 그가 발행한 지급 수표는 총 23장, 수표상의 금액은 가장 작게는 1,927.48달러, 가장크게는 96,412.21달러였다. 23장의 수펴에 적힌 금액을 살펴보니, 전체 23중 21장의 수펴 첫 자리가 7,8,9였고, 나머지 두장만 첫 자리가 1과2였다. 이는 벤포드 법칙의 관점에서 보면 매우 비정상적인 것이었다. 벤포드 법칙에 따르면 23중 30퍼세트에 해당하는 일곱장은 첫자리가 1로 시작되고, 18포센트에 해당하는 네장은 첫자리가 2로 시작되어야 정상이다. 그런데 거의 대부분의 수표가 7,8,9로 시작된 것은 벤포드의 법칙에서 보면 충분히 의심을 살 만했다.