데이터 읽기의 기술 - 숫자를 돈으로 바꾸는
차현나 지음 / 청림출판 / 2019년 10월
평점 :
장바구니담기



데이터가 어느 날 갑자기 하늘에서 뚝 떨어진 건 아니다. 과거부터 항상 데이터는 있었다. 각종 데이터가 곳곳에 넘쳐났지만 이를 제대로 활용하는 방법을 몰랐다. 데이터라는 게 우리 주변에 있다는 사실을 그다지 인식하지 못했다. 데이터는 넘치지만 데이터로 바라보지 못했다. 그저 각 개인마다 갖고 있는 경험에 따른 상식과 지식이 데이터라 할 수 있었다. 더 많은 지식과 상식을 갖고 경험 많은 노인일수록 데이터가 훨씬 풍요롭게 보인 가장 큰 이유다.

시간이 지나면서 우리 주변에 있던 모든 것을 데이터로 활용할 수 있다는 걸 깨달았다. 기술의 발달로 발견한 것도 있지만 그보다는 인식의 전환과 다르게 보는 방법을 알게 된 덕분이 아닐까한다. 없던 것을 창조한 것이 아닌 있던 것을 발견하게 되었으니 말이다. 이런 점은 컴퓨터의 발달로 데이터를 모을 수 있었기 때문으로 보인다. 내가 관련 전문가는 아니고 그저 책 몇 권 읽은 정도라 함부로 말하기는 힘들지만 말이다. 데이터를 가장 필요한 곳은 역시나 기업이다.

기업은 언제나 고객에게 어던 식으로 접근할 것인지가 가장 큰 화두다. 고객이 무엇을 좋아하고, 어떤 방법으로 소비하며, 언제 주로 이용하는 지 등에 대해서 알고 싶은 욕구가 크다. 이런 걸 알기 위해서 이전까지는 현장에서 활동하는 사람들의 감에 의지한 측면이 크다. 그들이 갖고 있는 현장감이 결코 부족한 점은 아니지만 데이터의 범위와 깊이를 본다면 다소 부족한 것도 사실이다. 무엇보다 사람이 갖고 있는 편견에서 자유롭기는 힘들다는 점도 있다.

데이터가 있어도 이를 제대로 활용하지 못하면 아무런 의미도 없다. 정확하게 표현하면 제대로 읽지 못한다면 데이터는 무용지물이다. 데이터를 볼 때도 마찬가지로 편견은 들어간다. 이를 배제하고 도출된 데이터에서 제대로 된 정보를 읽어야 한다. <데이터 읽기의 기술>은 데이터를 전문적으로 다루는 저자가 어떻게 데이터를 볼 지 알려주는 책이다. 현장에서 경험한 바를 근거로 어떤 일이 있었는지도 사례로 보여준다. 책에서 제일 데이터로 중요하게 알려주는 게 있다.

그것은 바로 영수증이다. 실제로 상가투자 하는 사람들에게 영수증은 무척이나 중요한 도구 중 하나다. 영수증을 갖고 해당 상가의 매출을 파악하며 수익성을 파악한다. 책에서는 알려준다. 영수증에 모든 데이터가 전부 다 들어있다고. 영수증에는 다음과 같은 정보가 들어있다. 매장이 어디인가. 구매자는 누구인가. 제품은 무엇인가. 쿠폰은 몇 개인가. 멤버십을 갖고 있는 사람인가. 경제수단은 무엇인가. 언제 제품을 구입했는가. 구입 가격은 얼마인가.

이에 따른 매출을 파악한다. 흔히 말하는 육하원칙에서 왜를 제외한 모든 것이 담겨있다. 왜라는 부분은 영수증을 보고 직접 데이터를 해석하는 사람의 몫이다. 단순히 남성인가. 여성인가는 중요하지 않다. 연령대도 중요하지 않다. 이를 테면 A형은 전부 소심하다고 접근하면 엄청난 오판을 갖게 된다. 같은 나이라도 각자 취향은 완전히 천차만별이다. 데이터를 해석한다는 것은 이렇게 단순하지 않다. 이미 나온 정보를 이렇게 접근하면 돈만 쓸 뿐이다.

더구나 데이터를 해석했을 때 특별한 점이 나오는 것도 아니다. 우리가 익히 알고 있는 부분이 나온다. 오히려 실망하고 데이터가 필요없다고 생각할 수 있다. 그보다는 데이터에서 나온 정보를 어떻게 해석할 것인지가 중요하다. 예를 들어 아마존에서 했던 방법과 같다. 아마존에서는 연령대와 성별도 중요하겠지만 그보다는 해당 고객이 어떤 책을 구입했는지를 중요하게 여긴다. 거기에 해당 고객이 어떤 책을 주로 클릭했는지에 대한 데이터를 전부 모은다.

그 후에 해당 고객이 구입한 책과 자주 본 책의 분야를 모은 후에 비슷한 성향의 사람들에게는 같은 책을 추천한다. 이런 점은 넷플릭스가 성공한 가장 큰 요인 중 하나다. 넷플릭스에서 드라마나 영화를 보면 전현 관련성이 없어 보이는 작품을 나에게 추천하는 경우가 있다. 이것은 넷플릭스에서 수많은 데이터를 모으고 검증한 끝에 이런 작품을 보는 사람이 주로 선호하는 장르와 작품이 있다는 걸 파악한다. 그에 맞게 관련된 작품을 추천하며 데이터 알고리즘을 활용한다.

고객의 행동에 따란 패턴을 분석해서 데이터를 가공하여 제안한다. 이런 식이 가장 효율적인 데이터 사용이라 할 수 있다. 책에서는 데이터를 어떤 식으로 읽을 것인지에 대한 설명을 한다. 너무 전문적이지도 않고 다소 에세이 비슷하게 내용을 설명하는 느낌도 든다. 수많은 데이터는 중요하지 않다. 데이터는 넘치도록 많고 지금 이 순간에도 계속 쌓이고 있다. 그런 면에서 책 제목처럼 데이터를 어떻게 읽을 것인지가 제일 중요하다. 갈수록 그 부분이 오히려 핵심이 되지 않을까 한다.

증정 받아 읽었습니다.

까칠한 핑크팬더의 한 마디 : 의외로 오래 읽음

친절한 핑크팬더의 한 마디 : 데이터를 읽는 게 중요.

함께 읽을 책



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo