天長地久 追夢人

讓青春吹動了 你的長髮 讓它牽引你的夢

청춘이 흩날려버린 그대의 긴 머리는 그대의 꿈을 이끌어오고


不知不覺這城市的歷史已 記取了你的笑容

어느덧 이 도시의 역사는 이미 그대의 미소를 기억하고 있네요.


紅紅心中藍藍的天 是個生命的開始

뜨거운 마음 속 파란 하늘은 생명의 시작이죠.


春雨不眠隔夜的你 曾空獨眠的日子

봄비가 내리고 잠 못 이룬 채 밤을 지샌 그대만이 홀로 남겨졌네요.


讓青春嬌豔的花朵 綻開了深藏的紅顏

청춘의 요염한 꽃들은 깊이 감췄던 아름다운 얼굴을 피게 하네요.


飛去飛來的滿天的飛絮 是幻想你的笑臉

흩날리는 온 세상의 버들꽃솜처럼 웃는 그대의 얼굴은 환상 같죠.


秋來春去紅塵中 誰在宿命裡安排

가을이 오면 봄이 가는 속세에서 누가 숙명을 정해놓았을까요?


冰雪不語寒夜的你 那難隱藏的光彩

얼음처럼 차가운 겨울밤에도 숨기기 힘든 그대의 광채


看我看一眼吧 莫讓紅顏守空枕

한번만 나를 봐 줘요. 아름다운 얼굴로 빈 베개를 지키지 않게.(혼자이지 않게)


青春無悔不死 永遠的愛人

청춘이 후회 없이 사라지지 않게 영원히 사랑하고 싶은 그대여.


讓流浪的足跡在荒漠裡 寫下永久的回憶

방랑하는 발자국은 황량한 사막에서 영원한 추억을 남기게 하죠.


飄去飄來的筆跡是 深藏的激情你的心語

흩날리듯 썼던 필적은 감춰둔 그대의 격정적인 마음속 이야기였어요.


前塵後世輪迴中 誰在聲音裡徘徊(원가사 : 谁在宿命里徘徊)

전생과 후생이란 윤회 속에서 누구의 소리(숙명으)로 배회하고 있는건지.


癡情笑我凡俗的人 世終難解的關懷

치정이라 나를 비웃던 평범한 사람들도 끝끝내 풀 수 없는 관심사일 뿐이겠죠.


看我看一眼吧 莫讓紅顏守空枕

한번만 나를 봐 줘요. 아름다운 얼굴로 빈 베개를 지키지 않게.(독수공방 않게)


青春無悔不死 永遠的愛人

청춘이 후회 없이 사라지지 않게 영원히 사랑하고 싶은 그대여.


讓青春吹動了 你的長髮 讓它牽引你的夢

청춘이 흩날려버린 그대의 긴 머리는 그대의 꿈을 이끌어오고


不知不覺這城市的歷史已 記取了你的笑容

어느덧 이 도시의 역사는 이미 그대의 미소를 기억하고 있네요.


紅紅心中藍藍的天 是個生命的開始

뜨거운 마음 속 파란 하늘은 생명의 시작이죠.


春雨不眠隔夜的你 曾空獨眠的日子

봄비가 내리고 잠 못 이룬 채 밤을 지샌 그대만이 홀로 남겨졌네요.


春雨不眠隔夜的你 曾空獨眠的日子

봄비가 내리고 잠 못 이룬 채 밤을 지샌 그대만이 홀로 남겨졌네요.


댓글(0) 먼댓글(0) 좋아요(18)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

빅데이터 분석을 통한 가치 창출을 처음 시도하는 기업이라면 반드시 1단계 묘사분석과 2단계 진단분석의 단계를 밟은 후에 3단계 예측분석이나 4단계 처방분석으로 가야 한다. 특히 4단계를 수행하려면 반드시 3단계에서의 예측이 필수적이다.

인공지능의 두 번째 구현 방법이 바로 이 귀납적 추론기반이다. 이것을 ‘머신러닝’ 또는 ‘기계학습’이라고 한다.

머신러닝은 인간이 자주 쉽게 수행하는 이 귀납적 추론 방법을 컴퓨터에게 시켜서 인공지능을 구현하는 것이다. 즉, 지식 기반과 달리 컴퓨터에게 명제를 주는 대신, 사진 같은 데이터를 여러 개 반복적으로 보여줌으로써 컴퓨터가 자연스럽게 의자를 인지하고 개와 고양이를 구분할 수 있게 만드는 것이다.

빅데이터는 어떠한 가치를 만들어내고 실제로 우리 삶을 어떻게 변화시키고 있는가? 기획, 이노베이션, 제품 개발부터 제조, 생산, 영업 및 마케팅, AS까지 기업에서 빅데이터가 어떻게 활용되는지 살펴보자. 실로 빅데이터는 개인의 취향과 욕망, 기계 장비 속에서 일어나는 일을 비롯해 우리 일상에서 벌어지는 모든 것을 알고 있다.

우버가 택시와 다른 점은, 기사가 목적지 때문에 승차 거부를 할 수는 없지만 해당 승객에 대한 다른 기사들의 평점을 보고 승차 거부를 할 수 있다는 것이다. 이로써 소위 ‘진상 고객’을 피할 수 있다. 평가 시스템에 의한 자동적인 자정인 셈이다.

우리에게 품질에 대한 정확한 수치를 92점, 91점 등으로 제공한다. 반면 지역 주민에게 물어보면 좋다고 해도 어느 정도로 좋은 건지 사람마다 그 기준이 다를 것이다. 인간의 언어는 애매모호하기 때문에 한 사람의 "꽤 좋다"가 다른 사람의 "아주 좋다"보다 더 좋을 수 있기 때문이다.

이렇게 하는 것이 머리에 띠 두르고 결의대회를 열어 ‘재작업 제로의 원년이 되자!’라는 구호를 외치거나, 화장실 변기 위에 표어를 붙여놓는 것보다 훨씬 효과적이다.

문제의 원인을 데이터로부터 찾아 이를 제거하는 액션을 취해야만 우리가 원하는 문제 해결, 즉 가치 창출을 할 수 있다. 아무리 작은 문제라도 이렇게 해서 제거한 문제는 절대로 재발되지 않는다.

장비의 이상 작동, 데이터로 간파하다

VIP는 돈이 많은 사람들이기 때문에 회비를 10만 원에서 9만 원으로 깎아주겠다는 것 정도에는 그다지 감동받지 않는다. 다만 감동받는 것은 바로 자신이 VIP라는 것을 ‘인정’받을 때다.

우리가 맛과 상관없이 단골집에 자주 가는 이유도 사실은 그런 인정받는 느낌 때문이다. 주인이 다른 손님과 다르게 나를 반기는 것을 좋아하는 것이다.

읽는 것을 안 좋아하는 아이는 아무리 집에 책을 많이 사다 놓아도 책 읽기 싫어하는 자기 엄마를 닮아서 절대로 책을 읽지 않는다

전 세계 모든 나라에는 중앙은행이라는 게 있다. 우리나라는 한국은행이, 일본은 일본은행이, 영국은 영국은행이 중앙은행이다. 유럽연합의 중앙은행은 유럽중앙은행이다. 다만 미국에는 중앙은행이 존재하지 않는다. 18세기에 중앙은행을 만들려는 대통령의 시도가 있었지만 자본가들에 의해 실패한 바 있다. 대신 미국은 연방준비제도federal reserve system라는 조금은 애매한 조직이 중앙은행 역할을 대체하고 있는데, 그곳 의장 임기는 몇 년밖에 되지 않아 벤 버냉키에서 재닛 옐런을 거쳐 지금은 제롬 파월이 맡고 있다.

알파고의 등장으로 인공지능과 빅데이터의 가치에 대한 인식이 많이 바뀌었다. 세상을 움직이는 인공지능과 데이터의 위력을 모두 알게 된 것이다. 이제 빅데이터를 인사이트로 변환시키는 애널리틱스는 무엇인지, 그 가운데 인공지능과 머신러닝은 무엇인지 살펴보자.

시각화, 우선 그림으로 그려야 한다
이제 애널리틱스 태스크에 대해 구체적으로 살펴보겠다. 먼저 시각화다. 시각화는 비즈니스 인텔리전스business intelligence라고도 하는데, 데이터를 그림으로 그려서 보여주는 것이다.

맥주와 기저귀의 연관성은?
두 번째 분석 태스크는 연관분석, 즉 연관성이 있는 것들을 찾는 것이다.

비슷한 것은 비슷한 것끼리 모아야
세 번째 태스크는 클러스터링, 즉 군집화다. 사람 또는 대상을 비슷한 것들끼리 묶는 방법이다.

비행기도 새가 되는 ‘튜링 테스트’
위키피디아에 따르면, 인공지능이란 주변 상황을 인지하고 목표를 달성하는 행동을 하는 컴퓨터로 정의된다.

암묵적 지식은 명제화가 불가능하다
기호주의로 다시 돌아가면, 이들 학파는 현실적인 한계를 세 가지나 만나게 되었다. 첫째는 지식의 방대함이다.

두 번째 현실적 한계는 전문가들의 지식 자체가 비일관적이고 주관적이라는 것이다.

세 번째 한계이자 가장 강력한 한계는 암묵적 지식tacit knowledge, 암묵지에 대한 것이다. 우리가 할 줄은 알지만 어떠한 지식을 이용해서 하는지 체계적으로 설명할 수 없는 것을 암묵적 지식이라고 한다. 반대 개념인 명시적 지식explicit knowledge, 명시지는 공학 지식, 법률 지식, 의학 지식 등으로 결론에 이르는 과정이 명백하고 각 단계에서 사용한 지식이 분명한 것들이다.

인간지능을 따라 만든 인공지능
인공지능 구현의 두 번째 방법은 첫 번째 기호주의와는 극단적으로 다르다. 인간의 뇌는 지능이 있으니 이것이 어떻게 운용되는지 보고 따라서 해보자는 생각에서 출발했다. 인간지능을 따라 하는 인공지능인 셈이다.

얼마 되지 않은 데이터로 무언가를 단정 짓듯 말하는 것은 매우 위험하다. 때마침 데이터의 양이 어마어마해진 빅데이터 시대에 귀납적 추론은 그 어느 때보다도 확실히 경쟁력이 있다고 하겠다.

그런데 1990년대 초중반까지 엄청난 전성기를 누리던 연결주의는 결정적인 현실 문제에 부닥치면서 두 번째 겨울을 맞게 된다. 첫 번째 문제는, 연결주의 지식의 핵심은 데이터에서 오는 것인데 이론적으로 머신러닝하는 알고리즘은 개발되었지만 정작 데이터가 없다는 것이다.

두 번째 이유는 컴퓨터의 계산 속도였다.

단어의 속성tag이 무엇인지 판단하는 과정을 태깅tagging이라고 한다.

빅브라더는 조지 오웰의 소설 『1984』에 등장하는 전체주의 정부를 가리키는 말로서, 정보를 독점해서 사회를 통제하는 권력이나 사회체계를 뜻한다. 그런데 사실상 빅브라더는 빅데이터가 등장하기 훨씬 전부터 존재했다. 지금은 붕괴된 동독과 소련을 포함한 공산국가 대부분이 그와 같은 정보 독점을 통해 사회를 통제했던 것이다.

4차 산업혁명의 재료로써 엄청난 가치를 만들어내는 빅데이터. 이러한 가치를 만들기 위해 구체적으로 누가 어떤 역할을 수행해야 하고 어떤 순서로 일을 진행해야 하는가? 이 과정에서 기관이나 기업이 마주치는 걸림돌은 무엇이며 이를 어떻게 극복할 수 있는가? 실제 데이터를 제공해주는 개개인은 그 혁신의 과실을 따먹을 수 있는가? 이를 위해 어떠한 제도적 장치가 필요한가?

정리해보면 빅데이터 가치를 만드는 과정은 기획plan, 분석do, 확인check, 실행act의 총 4단계로 이루어진다. 기획은 가치→인사이트→데이터 순으로 계획을 만드는 단계, 분석은 데이터로 인사이트를 만드는 단계, 확인은 인사이트의 의미를 검증하는 단계, 끝으로 실행은 인사이트를 비즈니스 가치로 만드는 단계다. 실행이 끝나면 다시 새로운 기획이 자연스럽게 떠오르게 됨으로써 4단계는 반복된다.

좋은 기획은 수많은 브레인스토밍을 거쳐야 한다
기획을 잘하려면 어떤 점에 집중해야 하는가? 성공적인 기획의 3요소는 첫째 임팩트, 둘째 데이터, 셋째 분석이다. 따라서 무엇보다 가장 먼저 비즈니스 임팩트가 큰 가치를 찾아야 한다.

첫째, 기본 이론 및 알고리즘을 공부하고, 둘째, 실제 데이터를 가지고 컴퓨터를 활용해서 애널리틱스 방법론을 적용함으로써 인사이트를 도출하는 실습을 수행하며, 셋째, 비즈니스 문제 상황 및 원하는 가치가 주어졌을 때 어떻게 분석 문제로 변환시키는지 도상 훈련을 한다. 그리고 넷째, 각자의 업무 분야에서 중요한 가치를 줄 수 있는 가치-인사이트-데이터로 이어지는 기획을 수행한 후, 마지막 단계에서는 자신이 수립한 기획에 따라 실제 데이터를 확보하여 애널리틱스 방법으로 인사이트까지 도출하는 것이다.

공대생은 모두 코딩을 잘한다고 생각하지만 실제로 컴퓨터공학과나 산업공학과, 전기공학과 정도에서만 코딩을 배운다. 다른 학과 출신은 자신이 따로 독학하지 않았다면 코딩을 하지 못한다

수레바퀴를 바꾸는 것은 리더의 역할

공공데이터는 엄청난 가치의 무료 빅데이터
그렇다고 현실이 어둡기만 한 것은 아니다. 희망도 있다. 바로 공공데이터 활용이다. 공공데이터란 정부나 공공기관이 보유한 데이터를 말하는데 우리 정부는 수년 전부터 민간에서 사용할 수 있도록 데이터를 개방하고 있다. 공공데이터 포털(data.go.kr)에 가면 다양한 정부 데이터들이 개방돼 있다.

빅데이터 활성화를 위해서는 제도적 지원도 필요하다. 어디까지가 합법이고 어디까지가 불법인지에 대한 분명한 가이드라인, 그리고 이를 뒷받침하는 사회적 합의가 그것이다. 우리나라에는 개인정보보호법이 있는데 주로 유럽의 법률을 참조해서 만들었다. 유럽은 개인정보를 인권으로 바라보고 기본적으로 공개를 금하고 있다. 그렇다 보니 우리나라 개인정보보호법의 규제 강도는 세계에서 두 번째로 강했다.

네이버, 카톡, 구글, 페이스북, 인스타그램 모두가 무료 서비스다. 이렇게 유용한 서비스를 우리에게 무료로 제공하는 회사들은 정말 천사같이 보인다. 그런데 사실 그 천사들은 무료의 대가로 우리의 매우 사적인 데이터를 가져간다. 만일 내가 누구와 대화하는지, 어떤 단어를 검색하는지, 어떤 사진을 찍었는지 아무에게도 알리고 싶지 않다면 위에 언급한 서비스를 사용하지 말아야 한다. 우리는 공짜로 서비스를 받는 대신 우리의 데이터를 건네주고 있다. 사실상의 암묵적인 거래가 발생하고 있는 것이다.

토지를 차지하려면 엄청난 비용을 지불하거나 혁명을 일으켜서 토지 개혁을 하는 방법밖에 없다. 그러나 데이터는 한정된 자원이 아니다. 돈이 많든 적든, 힘이 세든 약하든 누구에게나 데이터를 가질 수 있는 가능성이 열려 있다. 마치 신대륙이 생긴 것과 마찬가지다. 지금의 이 기회를 잘 활용하면 당신도 데이터의 주인이 되지 못할 이유가 없다. 내가 꿈꾸는 세상을 만드는 기획, 바로 우리 자신이 할 수 있는 것이다. 어떠한가, 여러분도 한번 도전해보고 싶지 않은가?


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

코스모스를 거대한 바다라고 생각한다면 지구의 표면은 곧 바닷가에 해당한다. ‘우주라는 바다‘에 대하여 우리가 알고 있는 것은 거의대부분 우리가 이 바닷가에 서서 스스로 보고 배워서 알아낸 것이다. - P37

코스모스는 너무 거대하여 우리가 통상 사용하는 길이 단위인 미터나 마일로는 도무지 그 크기를 가늠할 수 없다. 미터나 마일은 지상에서 쓰기에 편리하도록 고안된 단위일 뿐이다. 천문학에서는 그 대신빛의 빠른 속도를 이용하여 거리를 잰다. - P38

지구는 우주에서 결코 유일무이장소라고 할 수 없다. 그렇한다고 해서 우주 어디에서나 볼 수 있는 아주 전형적인 곳은 더더욱 아니다. 행성이나 별이나 은하를 전형적인 곳이라 할 수 없는 까닭은 코스모스의 대부분이 텅 빈 공간이기 때문이다. - P38

코스모스의 거시적 무늬, 지구에서 10억 광년 내에 있는 은하들 중에서 가장 밝은 것 100만 개만을 골라 늘어놓음으로써 은하 지도를 제작할 수 있었다. 그렇게 만든 지도의 일부를 여기에 옮겨 놓았다. 이 사진에 보이는 작은 정사각형 하나하나가 수십억 개의 별을 포함한 은하이다. 캘리포니아 대학교 리크 천문대 소속의 도널드 셰인DonaldShane과 칼 위르테닌Carl Wirtanen은 이 지도를 만들기 위해 12년 동안 전 하늘을 망원경으로 관측해야 했다. - P39

가. 그러나 현재까지 우리가 생명이 서식한다고 알고 있는 행성은 지구밖에 없다. 그렇지만 지구는 암석과 금속으로 이루어진 조그마한 바위덩어리에 불과하다. 간신히 태양 빛을 반사하고 있기에 조금만 멀리떨어져도 그 존재를 알아볼 수 없다. - P41

푸른색의 별은 뜨거운 젊은 별이고, 노란색의 별은 평범한 중년기의 별이다. 붉은 별은 나이가 들어 죽어 가는 별이며작고 하얀 별이나 검은 별은 아예 죽음의 문턱에 이른 별이다. - P43

이렇게 다양한 성격의 별들이 우리 은하 안에 4000억개 정도 있다. 이 별들이 복잡하면서도 질서정연하고  우아한 법칙에 따라 움직인다. 이 많은 별들 중에서 지구인들이 가까이 알고 지내는 별은, 적어도 아직까지는,
태양 하나뿐이다. - P43


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

산업공학이란? 産業工學, Industrial Engineering
산업 시스템을 구성하는 모든 분야를 조화롭게 조정하는 방법을 탐구하는 학문이다. 다른 공학 분야가 특정 산업의 전문적 기술이나 원리를 연구 개발하고 제공한다면, 산업공학은 과학적 원리와 경영 전략을 접목하여 기업 업무 과정을 혁신하고 체계화하며, 합리적인 방법을 도출하고 종합적 경영 전략을 운영하는 과학적 이론과 실무적 기법을 다룬다. 급변하는 기술 환경에서 복잡한 시스템의 개별 구성 요소에 대한 지식은 물론, 각 구성 요소를 효율적으로 통합하여 시스템 전체에 대한 각종 의사결정을 지원하고 필요한 시점에 효과적인 서비스를 제공하기 위해 시스템의 설계, 설치 및 개선에 관여한다.

데이터 사이언티스트(data scientist)
데이터를 분석해 인사이트를 도출하는 수리과학자로, 분석가라고 부르기도 한다. 많은 양의 데이터가 다양한 형태로 생성되는 오늘날에 더 중요해지고 있다. 대부분 통계학, 컴퓨터공학, 또는 산업공학을 전공한 사람들이다.

인사이트(insight)
사전적 의미로 흔히 ‘통찰력’이라고 풀이되지만, 이 책에서는 빅데이터를 통해 창출되는 지식을 의미한다. ‘안(in)’과 ‘보다(sight)’라는 의미가 결합된 단어로, ‘안을 본다’는 것은 엔지니어는 기계의 안을 보고 마케터는 소비자의 마음을 보고 의사는 환자의 몸속을 본다는 뜻이다. 이를 통해 한 단계 더 나은 의사결정을 하여 새롭거나 더 나은 가치를 만들 수 있다.

포사이트(foresight)
사전적 의미로 ‘예측’이라고 풀이된다. ‘앞(fore)’과 ‘보다(sight)’라는 의미가 결합된 단어로, ‘앞을 본다’는 뜻이다. 이 책에서는 빅데이터로부터 도출된 인사이트 가운데 특히 미래에 대한 부분을 포사이트라고 부른다.

애널리틱스(analytics)
빅데이터에서 인사이트를 도출할 때 사용하는 분석 방법이다. 크게 시각화, 연관분석, 클러스터링, 분류, 예측 등이 있고, 각각의 작업을 구현하는 방법론(알고리즘 또는 모델)은 수십, 수백 가지가 있다. 통계학, 머신러닝, 인공지능, 경영과학 분야에서 연구하고 있으며, 지금 이 순간에도 전 세계 데이터 사이언티스트들이 더 나은 새로운 방법을 계속 만들어내고 있다.

데이터마이닝(data mining)
애널리틱스 중 하나. 데이터 간의 관계, 패턴, 규칙 등을 찾아내고 모형화해 인사이트를 도출함으로써 사실에 근거한 객관적 의사결정을 가능하게 하는 일련의 계산 과정이다.

인공지능(AI, artificial intelligence)
주변 상황을 인지하고 목표 달성을 위해 계획이나 행동을 하는 컴퓨팅 기술. 인간이 시각과 청각 등으로 인지하는 형태의 데이터가 컴퓨터에 입력되면, 알파고처럼 바둑을 두고 자율주행 자동차처럼 운전을 할 수 있다.

머신러닝(machine learning)
인공지능을 구현하는 방법 중 하나. 기계학습이라고도 한다. 충분히 많은 양의 데이터를 반복적으로 컴퓨터에 입력하면, 컴퓨터가 데이터를 인지하고 학습하여 귀납적 추론을 가능하게 한다. 21세기 인공지능의 접근 방식이다.

신경망(neural network)
인간의 뇌는 약 1000억 개의 뉴런이 있고 각 뉴런은 약 7000개의 다른 뉴런과 시냅스로 연결되어 있는데, 우리가 무언가를 학습할 때 반복적 자극에 의해 시냅스의 연결이 강화된다. 신경망은 이 아이디어에서 착안해 컴퓨터 안에 뉴런과 시냅스로 구성된 뉴런의 망을 생성한 것으로, 데이터를 자극처럼 사용하여 운전이나 음성인식 같은 태스크를 할 수 있게 한다. 인공지능 혁명의 핵심 방법론인 딥러닝에서 복잡한 구조의 신경망을 사용한다.

최적화(optimization)
빅데이터를 분석하는 과정의 마지막 단계로, 빅데이터를 활용해 무엇이 왜 어떻게 일어나고 있는지 분석한 후 원하는 결과를 얻기 위해 무엇을 해야 하는지를 찾는 것이다. 고도의 수리와 계산 모델링을 포함한다. 경영과학 분야에서 오랫동안 연구 개발된 분야이다.

시각화(visualization)
데이터를 직관적으로 이해할 수 있게 그림으로 표현하는 애널리틱스의 주요 분야이자 첫 단계다. 확보한 빅데이터가 내가 생각하는 데이터인지 검증할 때도 사용한다. 또, 다른 애널리틱스 방법으로 도출한 인사이트를 의사결정자에게 제시할 때에도 사용된다.

빅데이터는 인공지능 시대를 움직이는 새로운 자원이자 화폐다.

인공지능은 컴퓨터가 빅데이터를 학습해서 지능적으로 행동하는 것이다.

따라서 빅데이터 없이 인공지능은 구현되지 못한다. 휘발유 없이 자동차가 움직이지 못하는 것과 같다. 그래서 데이터를 새로운 자원 또는 신新경제의 화폐라고도 한다.

빅데이터는 기계도 생성하지만 사실 우리 모두가 만들어내는 것이다. 휴대폰의 전원을 켜는 순간 우리의 위치 데이터가 생성되고, 통화와 문자 사용 내역이 데이터화되며, 차를 타서 내비게이션 앱을 켜는 순간부터 우리의 위치와 속도 데이터가 생성된다. 또한 주식 매매, 은행 입출금 모두가 데이터다.

빅데이터는 요리 재료다. 다양한 재료가 대량으로 존재한다. 손님(의사결정자)이 요리사(데이터 사이언티스트)에게 무슨 요리(인사이트)를 먹고 싶은지 이야기하면, 요리사가 필요한 재료를 확보하고 요리를 만든다. 만약 손님이 원하는 요리를 요리사에게 이야기해주지 않으면 요리사는 적당히 상상해서 만든다. 하지만 이런 요리로는 손님을 만족시킬 수 없다. 따라서 의사결정자는 원하는 인사이트를 데이터 사이언티스트에게 정확히 알려줘야 한다.

우리가 만드는 대량의 데이터
빅데이터의 특징은 우선 데이터의 양volume이 많다는 것이다. 그리고 실시간으로 발생하여 끊임없이 밀려들어오는 스트림 데이터stream data처럼 생성 속도velocity가 빠르며, 숫자와 같은 정형 데이터 이외에 텍스트, 이미지, 동영상 같은 비정형 데이터들이 다양하다variety는 것이다.

빅데이터는 이들 해당 영어 단어들의 첫 글자를 따서 ‘VVV’, 즉 3V라고도 한다.

빅데이터의 세 가지 특징을 차례로 살펴보자. 먼저 데이터의 양이다.

이 대량의 데이터는 주로 어디에서 많이 나오는가? 바로 우리의 일상생활에서 생성된다.

빅데이터의 생명은 ‘생성 속도’와 ‘다양성’
빅데이터의 두 번째 특징은 데이터의 생성 속도다.

빅데이터의 세 번째 특징은 데이터의 다양성이다.

마트에서 우리가 물건을 계산할 때 포인트 카드를 두고 왔더라도 휴대폰 번호만 제시하면 친절하게 포인트를 적립해주는 이유도 마찬가지다. 데이터가 아무리 많아도 이것들은 서로 연결돼야만 데이터로서의 가치를 갖는다. 구슬이 서 말이라도 꿰어야만 보배가 되는 것이다.

인도는 실제로 세계에서 가장 큰 홍채 데이터베이스를 가지고 있다. 문맹률이 높은 인도에서는 극빈자들에게 지급하는 정부 보조금을 중간에 누군가가 신분증을 도용해 대신 받아 가는 문제가 있었다. 이를 막기 위해 인도 정부가 나서 전 국민의 홍채 사진을 확보해 신분증에 넣었고, 홍채가 확인되어야만 보조금을 지급하도록 한 것이다.

정리하자면 "빅데이터는 양, 속도, 다양성이다"라는 말의 뜻은 이렇다. "데이터가 커도 괜찮아, 빨리 생성돼도 괜찮아, 다양한 데이터도 괜찮아, 난 뭐든지 할 수 있어!"라고 IT 전문가들이 외치는 것이다.

이제 우리는 새로운 관점을 가져야 한다. 양, 속도, 다양성의 관점이 아닌 비즈니스적인 관점에서 빅데이터를 볼 필요가 있다. 기업에서는 빅데이터로 어떻게 새로운 사업을 만들고, 고객과 소통하고, 매출을 늘리고, 비용을 줄이며, 직원들을 적재적소에 배치하고, 리스크를 최소화할지 깊이 고민해야 한다. 그리고 공공기관은 어떻게 국민들의 마음을 읽고, 비용 대비 효과가 높은 고효율 정책을 시행할 수 있을지 생각해야 한다.

4단계의 진행 방향을 보이는데, 첫 번째가 묘사분석, 두 번째가 진단분석, 세 번째가 예측분석, 네 번째가 처방분석이다. 즉 ‘도대체 무슨 일이 일어났는가 또는 일어나고 있는가’로부터 시작해서 ‘왜 그런 일이 일어났는가’로 이어지고 ‘앞으로 어떤 일이 일어날 것인가’, ‘그러면 우리는 어떻게 해야 하는가’로 나아간다. 과거의 상황 이해, 원인 이해, 미래 예측, 그리고 우리의 액션 플랜을 파악하는 순으로 나아간다.

우선, 지금 무슨 일이 일어나고 있는지 묘사할 것
이 도표를 기업에 적용해보면, 첫 번째 단계인 묘사descriptive는 가장 기본적인 지표로 과거에 일어난 일 그리고 지금 일어나고 있는 일을 정확하게 정리해서 보는 것이다.

진단과 예측, 데이터만한 것이 없다
두 번째 단계는 진단diagnostic이다. 1단계 묘사분석에서 찾아낸 인사이트에 대해 그 원인을 이해함으로써 한 단계 더 깊이 들어가고자 한다.

세 번째 단계는 예측predictive이다. 빅데이터 분석에서 가장 강력한 분석이다


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

1972년 소설가 마틴 케이딘Martin Caidin은사고로 두 다리와 한 팔, 그리고 한쪽 눈을 잃은 스티브 오스틴이라는 주인공이등장하는 소설 『사이보그』를 썼다. 큰 인기를 얻은 이 소설은 ‘600만 불의 사나이‘라는 제목의 드라마 시리즈로 제작, 방영되어 전 세계적인 인기를  끌었다.

이 ‘600만불의 사나이‘가 인기를 끌면서 여성을 주인공으로 한 새로운 시리즈 ‘바이오닉 우먼‘이 나왔으며,  우리나라에서는 이것이 ‘소머즈‘라는 제목으로 방영되었다. 소머즈는 뛰어난 청각을 소유해서 재능을 발휘하는 여성 사이보그이다. 소머즈와 600만 불의 사나이는  같이 임무를 수행하기도 하고, 둘이 사랑에 빠지기도 했다.

만나는 모든 외계민족을 자신들처럼 보그화시켜버리는 이들은 외계를 정복하며 적과 싸울 때 딱 한 마디만 한다.
"저항은 무의미하다Resistance is futile.
실로 무시무시한 사이보그가 아닐 수 없다.

그런데 사실 인간이란 존재도 언제 죽을지모르는 유한한 존재이다. 그래서 하이데거 같은 철학자도 인간은 매일 죽음을 안고 사는 존재라고 표현하지 않았는가.

로이배티가 자신의 수명이 너무 짧다고 하자 이들의 창조주나 마찬가지인 타이렐 박사는그에게 레플리컨트의 삶은 목적에 충실한, 짧지만 불꽃같은 삶이니 그 삶에 만족하라고 한다.

나는 네가 상상하지 못할 것들을 봤어.
오리온 전투에 참가했고, 탄호이저 기지에서 빛으로 물든 바다도 봤어. 그 기억이모두 곧 사라지겠지, 빗속의 내 눈물처럼. 이제 죽을 시간이야.

불길한 로봇이 주인을 공격하고, 머리를 먹으려고 했다.
로봇 진공청소기가 여인을 잡아먹었다.
 
외신 보도에서는 놀랍게도 로봇이 어떤 의도를 가진 것처럼 묘사한 기사 제목이 많았다.

인간이 만든 대상이 결국 인간의 손으로 제어할 수 있는 영역을 넘어선다는 사고를 엿볼 수 있다.

로봇에 대한 두려움, 로봇의 제0법칙
영화의 마지막 장면에서는 최고 자본가와 노동자들이 화해를 한다. 여기서 영화가 주는 메시지는 노동자와 지배자 사이에 중재자가 필요하며, 그 중재자는 마리아나 프레더처럼 선한 존재여야 한다는 것이다. 이 중재자가 로봇 마리아처럼 미쳐 날뛰는 존재일 경우에는 양쪽 사람들이 모두 피해를 입는다는 것이다.

유명한 SF 작가 아이작 아시모프Isaac Asimov는 최초로 로봇의 3가지 원칙을 얘기했다.

첫째, 로봇은 인간에 해를 가해서는 안 된다. 둘째, 인간의 명령에 복종해야 한다. 마지막으로 첫 번째와 두 번째 원칙을 위배할 때를 제외하고 자신을 보호해야 한다.

이 영화에 등장하는 모든 로봇에는 두 가지 프로토콜protocol이 입력되어 있다. 첫 번째는 어떤 생명체도 해쳐서는 안 된다는 것. 두 번째는 아시모프의 법칙과는 다른 것으로, 다른 어떤 로봇도 건드려서 변형시켜서는 안 된다는 것이다.

보스트롬이 『초지능』에서 말했듯이 AI는 인간이 소중하게 생각하는 감정들을 공유하지 않는다는 생각과 공명하는 것이다.

모던보이의 눈에 비친 기이한 과학
경이의 대상, 문명의 상징으로서의 전기
영국의 과학자 출신 작가 찰스 스노가 ‘두 문화two cultures’에 대해 이야기한 것이 1959년이었다. 그는 물리학으로 대표되는 과학적 문화와 문학으로 대표되는 인문 문화 사이의 커다란 간극을 안타깝게 생각했다.

이런 두 문화 사이의 간극을 줄이는 방법에는 여러 가지가 있을 텐데, 그중 하나는 과학과 인문학이 만나는 접점들을 찾아서 이를 드러내는 것이다.

과학은 바로 힘이자 문명이었으니
최초의 신소설로 평가되는 이인직의 『혈의 누』(1906)에는 주인공 옥련이 일본에서 신문명을 접하고 깜짝 놀라는 장면이 있다. 이인직은 일본의 문명을 "이층 삼층집이 구름 속에 들어간 듯"과 같이 묘사하면서 비약과 과장으로 그려냈는데, 이는 신문명을 처음 접한 주인공이 느꼈을 경이감을 전달하는 데에는 더없이 효과적인 수사였다.

이러한 변화는 더 큰 변화인 도시화, 문명화의 일부였다. 그는 "사방에 반작 반작 전기등"이 켜지고 전차와 인력거 소리가 도시에 울려퍼지는 것을 묘사하면서, 도시의 소리가 곧 문명의 소리라고 감탄했다.

염상섭의 소설 『삼대』에서 목사인 상훈은 술집에서 술을 마시다 다른 손님들과 시비가 붙어 파출소에 끌려가면서 겁을 벌벌 내는데, 그는 그 이유를 "낮같이 밝은 전등불이 눈 위에 반사되어 끌려가는 사람들의 얼굴들이 한층 더 분명하게" 보였기 때문이라고 하고 있다.

채만식의 『태평천하』에서는 서울에서 유곽에 들른 윤직원 영감의 아들 종수가 방에 들어온 기생이 부친의 둘째 첩 옥화라는 걸 알게 되는 장면이 있다. 종수는 밤에도 방 안을 환히 밝혀주는 전등 덕에 옥화의 얼굴을 알아볼 수 있었다고 생각하고, "밤에 불을 가진 것이 참으로 고맙고 다행스럽다는 것을 절절히 느끼면서" 그 자리를 빠져나온다.

안드로메다은하에도 태양과 같은 항성이 수천 억~1조 개 정도 존재한다고 한다. 그럼 우주에는 다른 은하계가 몇 개쯤 존재할까? 적어도 1000억 개 정도는 존재할 것이라 가늠해볼 수 있었는데, 그 수는 차츰 늘어나 2000억 개 정도가 되었다가 2016년에 발표된 이론에 따르면 2조 개로 대폭 늘어났다. 우주는 광활하다. 아니 광활하다는 말로는 묘사하기 힘든 것이 우주의 실체이다.

칼 세이건은 우주 어딘가에 고등생명체가 존재할 확률이 매우 높다고 주장한다. 우주가 너무나 광활하기 때문이다. 이 광활한 우주 어딘가에 있는 행성에는 물이 있을 가능성이 높고, 물이 있다면 원시 생명체가 만들어졌을 가능성이 높다.

문과에 속했던 사람이든 이과에 속했던 사람이든, 고등학교 시절 끙끙대면서 배운 미적분이 인생에 얼마나 필요한가에 대해서 한 번 정도는 생각해봤을 것이다. 충만한 삶을 사는 데 미적분이 필요할까? 과연 도덕적인 삶을 사는 데 과학이, 수학이, 양자역학이 필요할까? 더 행복하고 충만한 삶을 사는 데 우리가 우주의 먼지라는 지식이 얼마나 중요한 걸까? 우리가 꼭 우주, 진화, 물리학을 알아야 하는 걸까?

문과에 속했던 사람이든 이과에 속했던 사람이든, 고등학교 시절 끙끙대면서 배운 미적분이 인생에 얼마나 필요한가에 대해서 한 번 정도는 생각해봤을 것이다. 충만한 삶을 사는 데 미적분이 필요할까? 과연 도덕적인 삶을 사는 데 과학이, 수학이, 양자역학이 필요할까? 더 행복하고 충만한 삶을 사는 데 우리가 우주의 먼지라는 지식이 얼마나 중요한 걸까? 우리가 꼭 우주, 진화, 물리학을 알아야 하는 걸까?

살인청부업자인 톰 크루즈는 그 질문에 이렇게 대답한다. "수백만 은하계와 수천만의 별들 중 한순간 반짝 하는 점 하나, 그게 우리다. 우주의 미아에 불과한 우리의 삶은 아무런 의미가 없다. 따라서 그 사람이 지금 죽건 늙어서 죽건 별 차이 없다." 이에 택시운전사는 살인청부업자의 말에 반박하고, 그때부터 이 둘의 긴장감이 고조되기 시작한다.

"(과학적) 사실로부터 가치, 윤리, 도덕 같은 것들이 나올 수 없다"라는 문장이 낯설지 않다. 동시에 우리는 과학과 인문・예술은 상호보완적이라고 말하기도 한다. 전자는 사실, 후자는 당위를 다룬다는 의미에서이다. 결국 이 모든 이야기는 과학과 인문학을 한 테두리 안에 두기보다는 과학의 영역, 인문학의 영역이 각각 따로 존재한다는 생각을 바탕에 두고 있는 것이다.

"과학과 인문학이 상호보완적이다"라는 취지의 언급을 맨 처음 했던 철학자는 잠바티스타 비코Giambattista Vico라는 이탈리아의 사상가였다.

갈릴레오는 그 편지를 받고 "당신이 맞다. 그런데 당신의 실험이 내 이론을 틀렸다고 논박할 수 있는 것은 아니다. 왜냐하면 내 이론적 증명은 저항이 없는 공간에서 성립하기 때문이다"라는 요지의 답을 했다.

갈릴레오는 관성의 법칙이나 자유낙하의 법칙을 발견한 것이 아니다. 이런 법칙은 자연에서 찾아질 수 없다. 그는 마찰이 없는 평면, 저항이 없는 공간을 상상함으로써 이런 법칙을 만들어낼 수 있었다. 다시 말해서 갈릴레오는 자신의 법칙이 만족되는 상황을 창조해낸 것이다.

뉴턴은 지난 1000년간 존재했던 과학자 중 가장 천재적인 과학자로 꼽히는 사람이다. 뉴턴 이전 시대에 살았던 천문학자 케플러는 행성들이 태양을 타원의 형태로 돈다는 것을 밝혔다. 그는 자신의 스승이었던 튀코 브라헤Tycho Brahe의 정확한 관측 결과를 이용해서 행성의 궤도가 원이라는 오래된 관념을 처음으로 극복할 수 있었다.

칼 세이건은 그렇듯 멀리서 찍은 지구 사진을 보다 보면 지구상에서 서로 미워하고, 싸우고, 심지어 서로의 이념과 명분에 ‘목숨을 거는’ 행위가 얼마나 우스운 것인가를 알 수 있다고 했다. 지금까지 태어나서 죽은 모든 사람들이 그 하나의 점 위에 살았고, 지금 종교 때문에, 이데올로기 때문에 서로 싸우고 으르렁거리는 사람들 모두가 그 점 위에서 살고 있는 것이다. 스스로 우주의 중심이라고 믿는 우리의 오만, 내가 우주에서 특별한 위치를 차지한다는 망상은 우주에서 찍은 지구의 사진 한 장으로 근거가 사라진다는 것이다.

우주 속에서 우리의 위치를 알게 되면 우리의 삶의 터전인 희미한 푸른 점을 아끼고 보존해야 한다는 책임감을 느낄 수밖에 없는 것이다.

우주에 그렇게 많은 별이 있고, 그렇게 다양한 조건을 가진 별들이 많이 존재할 수 있는데, 왜 고등 생명체의 흔적이 없는가라는 질문에 대한 한 가지 답변은 이렇다. 사람이 언제까지 생존할 수 있을까? 많은 종들이 멸종한다. 특히 최상위 포식자들이 가장 빨리 멸종하기 마련이다. 공룡도 그렇게 멸종했다. 환경이 바뀌었을 때 멸종하고 말았다. 인간이 100만 년을 더 살 수 있을까? 인류의 문명은 앞으로 고작해야 수천 년 정도 지속될 것이라고 생각하는 사람들도 꽤 많다. 지구 나이가 50억 년 정도이니 수천 년이라는 시간은 한 점에 불과하다.

인간이 전자기파, 즉 전파를 발견한 것이 100여 년 전이고, 우주로 전파를 쏜 것은 불과 몇 십 년이 되지 않는다. 다른 모든 행성에서 고등 생명체가 전파를 발견한 뒤에 수천 년 정도 더 생존하다가 멸종되었다고 생각하면, 인간과 비슷한 모든 고등 생명체는 점 정도에 불과한 기간을 살다 소멸하는 것이다. 고등 생물체가 소멸한 이유는 핵에너지를 잘못 관리해서이다. 오만해서인 것이다.

다른 행성에서 비슷한 생물체가 우리와 같은 과정을 겪었고 과학을 발전시켜서 원자 에너지를 사용하다가 핵전쟁이 발발해서 절멸되었다면, 우주에 왜 우리에게 메시지를 보내는 고등 생명체가 없는지 이해할 수 있다. 왜 인간이 수십 년 동안 메시지를 보내도 왜 답이 없는지 말이다. 우리의 미래는 우주 속에서의 인간의 위치에 대해 우리가 얼마나 성찰하는가에 달려 있다.


댓글(0) 먼댓글(0) 좋아요(7)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo