퀴즈! 과학상식 : 빅데이터 과학 퀴즈! 과학상식 75
도기성 지음, 이준기 감수 / 글송이 / 2018년 1월
평점 :
장바구니담기



4차 산업혁명의 계기가 되는 것이 바로 '빅데이터 big data' 라고 한다.  빅데이터를 통해 수많은 정보를 파악하고, 그것을 활용하는 것이 인공지능이며, 그로 인해 4차 산업혁명이 이루어진다는 것이다.


인공지능 '알파고'와 사람 '이세돌'은 바둑을 두었다. 한동안 시끌벅적했던 이야기, 알파고.
또 다른 인공지능 '왓슨',  왓슨을 의료용으로 업그레이드 한 '왓슨 포 온콜로지' 등의 인공지능은 의료, 음악, 미술 등 다양한 분야에 발 디디고 있다.


이 책은 그 기반이 되는 '빅데이터'에 대해 이야기한다.  어렵게 느껴지는 빅데이터를 초등학생이 이해할 수 있도록 '쉬운 예시, 쉬운 비유'를 들어서 알려준다.  빅데이터에 대해 단어만 알고 좀 더 정확히 알고 싶은 사람이라면, 이 책을 참고하는 것도 좋을 것 같다.


다만, 이 책은 '빅데이터의 장점, 좋은 점'에 대한 내용이 대다수이다. 물론 책의 뒤쪽에 아주 일부 '빅데이터 / 빅브라더'의 위험성에 대해 조금 언급하지만, 그야말로 아주아주 조금일 뿐이다. 

'빅브라더 big brother'는 '조지 오웰'의 소설 <1984>에 등장하는 것으로, '소설 속 사회를 통치하는 수수께끼의 독재자'를 일컫는다.  (긍정적인 의미로는 사회를 돌보는 보호적 감시자, 부정적 의미로는 정보를 독점하여 개인 및 사회를 통제하는 수단  (출처 : http://terms.naver.comentry.nhn?docId=300607&cid=43665&categoryId=43665   )

컴퓨터 등장을 기준으로, 그 이전을 "아날로그 시대", 컴퓨터 등장 이후를 "디지털 시대 ( 정보화 시대)"라고 한다.
기록의 방법 차이로, 아날로그 시대에는 '종이'에 기록하지만 디지털 시대에는 '인터넷 등에 사진이나 글을 등록하는 것 (sns 등)'으로 기록을 한다.


디지털 digital 이라는 단어는 라틴어 digit (디지트/ 손가락)에서 왔다고 한다.  손가락으로 숫자를 세듯이 0과 1로 숫제를 센다는 의미라니, 신기하다.


빅데이터는 "서로 연결된 정보"라고 한다. 그렇기에 "연결되지 않은" 것은 빅데이터에 포함되지 않는다는 것이다. '연결'이란 '공유'를 말하며, 내 생각에는 '비공개'가 아닌 '전체 공개'를 의미하는 것 같다.


빅데이터는 엄청나게 많은 수많은 정보를 말하며, 그 정보에는 '거짓 정보, 과장된 정보'등도 있기에 신중하게 판단해야 한다고 알려준다.
또한 '빅데이터의 가치'를 "많은 데이터를 분석하여, 새로운 사실을 알고, 미래를 예측하는 것"이라고 한다. 
빅데이터로 미래를 예측한다고?? 신기하다.   

이 책에는 빅데이터로 '미래를 예측'해서 성공한 사례들을 여러 개 알려주고 있다. 예를 들어, '기저귀'가 많이 팔리는 날에 '맥주'가 많이 팔리는 것을 알게 된 마트는 '기저귀+맥주 패키지' 상품을 내놓았다고 한다. 그리고 매출 증가를 이루었다는 것이다.
'빅데이터 -> 새로운 사실 파악 -> 미래 예측'으로 매출 신장을 이룬 것이다.


표본조사 / 전수조사의 차이에 대해 알게 되었고, 빅데이터의 의미가 '전수조사'에 있음을 알게 된다.
수많은 정보, 빅데이터가 필요한 이유를 '점잇기 그림'으로 비유하여 설명한 것은 정말 근사한 방식이었다. 무척이나 이해하기 쉬웠기 때문이다.

 

데이터는 '정형 데이터', '비정형 데이터 (다크 데이터 dak data )' 로 구분된다고 한다. 정형 데이터가 10%, 비정형 데이터가 90%이며,  10%의 정형 데이터만으로 구축한 것이 인공지능 '왓슨', '알파고'라고 하니, 깜짝 놀랐다.
만약 90%의 비정형 데이터까지 인공지능에 활용한다면, 그 인공지능은 도대체 어디까지, 무엇까지 알 수 있으며 할 수 있을 것인가???


( 정형 데이터 : 엑셀 등
비정형 데이터 : 동영상, 사진, 문자로 된 기사, 책 )

 
2010년 안드로이드 폰 등장 이후 검색이 더없이 늘어났다고 한다. 나 역시 '내 손안의 컴퓨터'를 가지게 된 후, 보다 더 쉽게 검색을 한다. 건강에 대한 정보를 찾기도 하고, 맛집에 대한 정보를 찾기도 한다.
그런 작고 작은 정보들이 '기업체에, 휴대폰 어플에, 쌓이고 쌓여서'  빅데이터가 되는 것이리라.


중국에서 '시행 중인(?)'  '빅데이터 주권'에 관한 내용은 굉장히 독특한 느낌이었다. 
이제 많은 기업, 국가에서 '빅데이터'가 '돈'이 되는 재료임을 깨닫고,  해당 데이터의 소유권이 누구에게 있는가?ㅡ에 대해 고민하고 있다고 한다.

ㅡ 중국은 개인과 기업의 빅데이터 소유권 다툼에서 한 발 더 나아가 '빅데이터 주권'을 주장하고 나섰어!
중국에서 발생한 데이터는 중국의 서버에 저장해야 하고, 해외에 데이터를 보내려면 미리 중국 정부의 허가를 받아야 한다는 내용의 법안까지 통과시켰지!   (180쪽  )

빅데이터로 유용한 점도 많겠지만, 빅브라더 등 위험성도 분명히 존재한다. 또한 지금보다 더 크고 많은 빅데이터들이 모인다면,  정말로 인간보다 뛰어난 인공지능이 등장하는 '영화에서나 보던 디스토피아적 미래'를 만날지도 모른다.  누가 '아니다!'라고 확신할 수 있겠는가?


나는 20년 전에,  '내 손안에 컴퓨터를 들고 다닌다'라는 상상을 하지 못했다. 스티브 잡스와 빌 게이츠는 20년 전에 그런 상상을 했을까?

 

이 책을 통해 '빅데이터'에 대해, '데이터 마이닝 / 밈 meme ' 등 관련 내용을 쉽게 이해할 수 있어서 좋았다.  앞으로 조금 더 어려운(?) 빅데이터 책을 보더라도 조금 더 이해하기 쉬울 것 같다.

 

 

 

사진과 함께한 서평은 블로그 참고 : http://xena03.blog.me/221184252990

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo