산업공학이란? 産業工學, Industrial Engineering
산업 시스템을 구성하는 모든 분야를 조화롭게 조정하는 방법을 탐구하는 학문이다. 다른 공학 분야가 특정 산업의 전문적 기술이나 원리를 연구 개발하고 제공한다면, 산업공학은 과학적 원리와 경영 전략을 접목하여 기업 업무 과정을 혁신하고 체계화하며, 합리적인 방법을 도출하고 종합적 경영 전략을 운영하는 과학적 이론과 실무적 기법을 다룬다. 급변하는 기술 환경에서 복잡한 시스템의 개별 구성 요소에 대한 지식은 물론, 각 구성 요소를 효율적으로 통합하여 시스템 전체에 대한 각종 의사결정을 지원하고 필요한 시점에 효과적인 서비스를 제공하기 위해 시스템의 설계, 설치 및 개선에 관여한다.

데이터 사이언티스트(data scientist)
데이터를 분석해 인사이트를 도출하는 수리과학자로, 분석가라고 부르기도 한다. 많은 양의 데이터가 다양한 형태로 생성되는 오늘날에 더 중요해지고 있다. 대부분 통계학, 컴퓨터공학, 또는 산업공학을 전공한 사람들이다.

인사이트(insight)
사전적 의미로 흔히 ‘통찰력’이라고 풀이되지만, 이 책에서는 빅데이터를 통해 창출되는 지식을 의미한다. ‘안(in)’과 ‘보다(sight)’라는 의미가 결합된 단어로, ‘안을 본다’는 것은 엔지니어는 기계의 안을 보고 마케터는 소비자의 마음을 보고 의사는 환자의 몸속을 본다는 뜻이다. 이를 통해 한 단계 더 나은 의사결정을 하여 새롭거나 더 나은 가치를 만들 수 있다.

포사이트(foresight)
사전적 의미로 ‘예측’이라고 풀이된다. ‘앞(fore)’과 ‘보다(sight)’라는 의미가 결합된 단어로, ‘앞을 본다’는 뜻이다. 이 책에서는 빅데이터로부터 도출된 인사이트 가운데 특히 미래에 대한 부분을 포사이트라고 부른다.

애널리틱스(analytics)
빅데이터에서 인사이트를 도출할 때 사용하는 분석 방법이다. 크게 시각화, 연관분석, 클러스터링, 분류, 예측 등이 있고, 각각의 작업을 구현하는 방법론(알고리즘 또는 모델)은 수십, 수백 가지가 있다. 통계학, 머신러닝, 인공지능, 경영과학 분야에서 연구하고 있으며, 지금 이 순간에도 전 세계 데이터 사이언티스트들이 더 나은 새로운 방법을 계속 만들어내고 있다.

데이터마이닝(data mining)
애널리틱스 중 하나. 데이터 간의 관계, 패턴, 규칙 등을 찾아내고 모형화해 인사이트를 도출함으로써 사실에 근거한 객관적 의사결정을 가능하게 하는 일련의 계산 과정이다.

인공지능(AI, artificial intelligence)
주변 상황을 인지하고 목표 달성을 위해 계획이나 행동을 하는 컴퓨팅 기술. 인간이 시각과 청각 등으로 인지하는 형태의 데이터가 컴퓨터에 입력되면, 알파고처럼 바둑을 두고 자율주행 자동차처럼 운전을 할 수 있다.

머신러닝(machine learning)
인공지능을 구현하는 방법 중 하나. 기계학습이라고도 한다. 충분히 많은 양의 데이터를 반복적으로 컴퓨터에 입력하면, 컴퓨터가 데이터를 인지하고 학습하여 귀납적 추론을 가능하게 한다. 21세기 인공지능의 접근 방식이다.

신경망(neural network)
인간의 뇌는 약 1000억 개의 뉴런이 있고 각 뉴런은 약 7000개의 다른 뉴런과 시냅스로 연결되어 있는데, 우리가 무언가를 학습할 때 반복적 자극에 의해 시냅스의 연결이 강화된다. 신경망은 이 아이디어에서 착안해 컴퓨터 안에 뉴런과 시냅스로 구성된 뉴런의 망을 생성한 것으로, 데이터를 자극처럼 사용하여 운전이나 음성인식 같은 태스크를 할 수 있게 한다. 인공지능 혁명의 핵심 방법론인 딥러닝에서 복잡한 구조의 신경망을 사용한다.

최적화(optimization)
빅데이터를 분석하는 과정의 마지막 단계로, 빅데이터를 활용해 무엇이 왜 어떻게 일어나고 있는지 분석한 후 원하는 결과를 얻기 위해 무엇을 해야 하는지를 찾는 것이다. 고도의 수리와 계산 모델링을 포함한다. 경영과학 분야에서 오랫동안 연구 개발된 분야이다.

시각화(visualization)
데이터를 직관적으로 이해할 수 있게 그림으로 표현하는 애널리틱스의 주요 분야이자 첫 단계다. 확보한 빅데이터가 내가 생각하는 데이터인지 검증할 때도 사용한다. 또, 다른 애널리틱스 방법으로 도출한 인사이트를 의사결정자에게 제시할 때에도 사용된다.

빅데이터는 인공지능 시대를 움직이는 새로운 자원이자 화폐다.

인공지능은 컴퓨터가 빅데이터를 학습해서 지능적으로 행동하는 것이다.

따라서 빅데이터 없이 인공지능은 구현되지 못한다. 휘발유 없이 자동차가 움직이지 못하는 것과 같다. 그래서 데이터를 새로운 자원 또는 신新경제의 화폐라고도 한다.

빅데이터는 기계도 생성하지만 사실 우리 모두가 만들어내는 것이다. 휴대폰의 전원을 켜는 순간 우리의 위치 데이터가 생성되고, 통화와 문자 사용 내역이 데이터화되며, 차를 타서 내비게이션 앱을 켜는 순간부터 우리의 위치와 속도 데이터가 생성된다. 또한 주식 매매, 은행 입출금 모두가 데이터다.

빅데이터는 요리 재료다. 다양한 재료가 대량으로 존재한다. 손님(의사결정자)이 요리사(데이터 사이언티스트)에게 무슨 요리(인사이트)를 먹고 싶은지 이야기하면, 요리사가 필요한 재료를 확보하고 요리를 만든다. 만약 손님이 원하는 요리를 요리사에게 이야기해주지 않으면 요리사는 적당히 상상해서 만든다. 하지만 이런 요리로는 손님을 만족시킬 수 없다. 따라서 의사결정자는 원하는 인사이트를 데이터 사이언티스트에게 정확히 알려줘야 한다.

우리가 만드는 대량의 데이터
빅데이터의 특징은 우선 데이터의 양volume이 많다는 것이다. 그리고 실시간으로 발생하여 끊임없이 밀려들어오는 스트림 데이터stream data처럼 생성 속도velocity가 빠르며, 숫자와 같은 정형 데이터 이외에 텍스트, 이미지, 동영상 같은 비정형 데이터들이 다양하다variety는 것이다.

빅데이터는 이들 해당 영어 단어들의 첫 글자를 따서 ‘VVV’, 즉 3V라고도 한다.

빅데이터의 세 가지 특징을 차례로 살펴보자. 먼저 데이터의 양이다.

이 대량의 데이터는 주로 어디에서 많이 나오는가? 바로 우리의 일상생활에서 생성된다.

빅데이터의 생명은 ‘생성 속도’와 ‘다양성’
빅데이터의 두 번째 특징은 데이터의 생성 속도다.

빅데이터의 세 번째 특징은 데이터의 다양성이다.

마트에서 우리가 물건을 계산할 때 포인트 카드를 두고 왔더라도 휴대폰 번호만 제시하면 친절하게 포인트를 적립해주는 이유도 마찬가지다. 데이터가 아무리 많아도 이것들은 서로 연결돼야만 데이터로서의 가치를 갖는다. 구슬이 서 말이라도 꿰어야만 보배가 되는 것이다.

인도는 실제로 세계에서 가장 큰 홍채 데이터베이스를 가지고 있다. 문맹률이 높은 인도에서는 극빈자들에게 지급하는 정부 보조금을 중간에 누군가가 신분증을 도용해 대신 받아 가는 문제가 있었다. 이를 막기 위해 인도 정부가 나서 전 국민의 홍채 사진을 확보해 신분증에 넣었고, 홍채가 확인되어야만 보조금을 지급하도록 한 것이다.

정리하자면 "빅데이터는 양, 속도, 다양성이다"라는 말의 뜻은 이렇다. "데이터가 커도 괜찮아, 빨리 생성돼도 괜찮아, 다양한 데이터도 괜찮아, 난 뭐든지 할 수 있어!"라고 IT 전문가들이 외치는 것이다.

이제 우리는 새로운 관점을 가져야 한다. 양, 속도, 다양성의 관점이 아닌 비즈니스적인 관점에서 빅데이터를 볼 필요가 있다. 기업에서는 빅데이터로 어떻게 새로운 사업을 만들고, 고객과 소통하고, 매출을 늘리고, 비용을 줄이며, 직원들을 적재적소에 배치하고, 리스크를 최소화할지 깊이 고민해야 한다. 그리고 공공기관은 어떻게 국민들의 마음을 읽고, 비용 대비 효과가 높은 고효율 정책을 시행할 수 있을지 생각해야 한다.

4단계의 진행 방향을 보이는데, 첫 번째가 묘사분석, 두 번째가 진단분석, 세 번째가 예측분석, 네 번째가 처방분석이다. 즉 ‘도대체 무슨 일이 일어났는가 또는 일어나고 있는가’로부터 시작해서 ‘왜 그런 일이 일어났는가’로 이어지고 ‘앞으로 어떤 일이 일어날 것인가’, ‘그러면 우리는 어떻게 해야 하는가’로 나아간다. 과거의 상황 이해, 원인 이해, 미래 예측, 그리고 우리의 액션 플랜을 파악하는 순으로 나아간다.

우선, 지금 무슨 일이 일어나고 있는지 묘사할 것
이 도표를 기업에 적용해보면, 첫 번째 단계인 묘사descriptive는 가장 기본적인 지표로 과거에 일어난 일 그리고 지금 일어나고 있는 일을 정확하게 정리해서 보는 것이다.

진단과 예측, 데이터만한 것이 없다
두 번째 단계는 진단diagnostic이다. 1단계 묘사분석에서 찾아낸 인사이트에 대해 그 원인을 이해함으로써 한 단계 더 깊이 들어가고자 한다.

세 번째 단계는 예측predictive이다. 빅데이터 분석에서 가장 강력한 분석이다


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo