무자비한 알고리즘 - 왜 인공지능에도 윤리가 필요할까
카타리나 츠바이크 지음, 유영미 옮김 / 니케북스 / 2021년 1월
평점 :
장바구니담기


비대면, 온라인, 디지털화를 가속화시키고 있는 코로나 사태로 인해 전 산업에 인공지능이 활용되며, 빠르게 확산되고 있는 양상을 보이고 있습니다. 그래서일까요? 최근 SBS TV 에서는 '인간 vs AI' 라는 타이틀로 특정 작업이나 활동 영역에 특화된 인공지능과 숙달된 인간의 대결 양상을 극적인 구성방식으로 방영되어 많은 분들의 호기심과 관심을 끌고 있습니다.

다양한 디지털 기기들(스마트폰, 각종 센서들, CCTV 등)이 네트워크로 연결되면서, 대량의 데이터가 발생하게 되었고, 이를 활용하기 위한 빅데이터와 인공지능이 필연적으로 진화와 발전을 거듭해 왔습니다. '인공지능'은 빅데이터의 가치를 실현할 도구로 포스트 코로나 시대에 더욱 더 활용될 것입니다.

그러나 인공지능이 인간 생활에 밀접하게 적용되기 시작하면서 과거에는 예상치 못한 각종 윤리적인 문제들이 발생하고 있습니다. 16시간만에 서비스가 정지된 MS의 AI 챗봇 '테이(Tay)'나 최근 한국판 테이 사건으로 일컬어지는 AI 챗봇 '이루다' 모두 방대한 데이터를 통해 학습한다는 인공지능 알고리즘의 특성상 'Garbage In Garbage Out(GIGO)'을 여실히 보여준 사건이라 하겠습니다.

 

 

즉, 문제는 알고리즘 자체가 아니라 우리 사회가 '알고리즘을 다루는 방식' 그리고 '학습용 데이터의 질적인 문제'에 있다고 하겠습니다. 이와 같은 맥락에서 오늘 소개해 드리는 <무자비한 알고리즘>에서는 우선 알고리즘이 무엇인지, 무엇을 할 수 있는지, 어떤 유형의 알고리즘이 있는지 그리고 인공지능 시스템이 어떻게 만들어 지는지를 일반인들에게 자세히 설명합니다.

여기서 저자는 자연과학의 팩트 체크를 위해서는 가설 증명을 위해 수 많은 실험이 필요(학문적 방법)하지만, 머신러닝 알고리즘은 가설이 사실인 양 곧장 가설에서 예측으로 비약하기 때문에 오류로 이어지기 쉽다고 지적합니다.

저자는 이를 두고, 우리가 몇 백년 동안 자연과학에서 느리게, 그러나 성공적으로 수행해온 '팩트'찾기 작업이 인공지능의 가장 중요한 요소 중 하나인 머신러닝으로 말미암아 완전히 뒤죽박죽 되어 버렸다고 비판하기에 이릅니다. 머신러닝에서는 원인을 탐구하는(인과성) 대신 중요한 사건과 종종 더불어 존재하는 행동양식이나 특성들을 확인(상관성)할 뿐이기 때문입니다. 예를 들어, 자동차 사고에서 운전자의 나이를 묻거나, 전과자의 재범에 종종 동반되는 인격적 특성을 묻는 것들이 그것입니다.

이렇듯 자동적으로 찾아지는 상관관계들은 검증되지 않을 때가 많으며, 인과관계를 발견하려는 노력은 전혀 이뤄지지 않음에도 불구하고 해당 알고리즘은 사람을들 위험 등급으로 분류하는데 활용되는 우를 범하고 있습니다.

책에서는 포털의 뉴스 순위 결정, 신용도 평가, 대입 전형, 기업의 입사지원자 선발, 재범 및 테러위험 예측, 넷플릭스의 영화 추천 등에 있어 오판이나 오류가 비일비재함을 자세히 설명하고 있으며, 이를 통해 알고리즘이 무조건 객관적이고, 확실하다는 이미지에 호도되어서는 안된다고 강조합니다.

특히 눈에 띄는 점은, 인간에 대한 잘못된 판단을 내리는 것을 막기 위해 '알고리즘 기반의 의사결정 시스템'을 투입해서는 안되는 경우들에 특히 주목하고 있다는 점이며, 사회가 중요한 결정들을 기계(인공지능)에 위임하려면 기계가 이 사회의 문화적, 도덕적 기준에 따라 행동한다는 것을 믿을 수 있어야 함을 역설합니다. 바로 이 지점에서 부제와 같이 "인공지능도 윤리가 필요한 이유"가 있다 하겠습니다.

인공지능 기술의 특성 상 사람이 완벽하게 매커니즘을 이해하거나 검증할 수 없고, 우리 사회의 편향된 데이터로 학습하게 되면서 프라이버시 침해, 공정성과 차별, 투명성, 책임성 등의 문제가 대두되고 있습니다.

이는 데이터를 소유하는 주체들에 의해 데이터를 제공하는 개인의 정보가 과도하게 혹은 원치않는 목적에 활용되거나 식별될 수 있고, 소수의 그룹에 속하는 사람들이 차별을 받을 수 있는 환경이 조성되었음을 의미합니다.

인공지능은 대량의 데이터 활용을 전제로 하며, 복잡한 처리 과정 때문에 결과 도출에 대한 설명과 이해가 어려운 불투명성의 특징을 갖습니다. 이로 인해, 투명성 문제가 발생하게 되며, 인간의 차별적이고 편향된 데이터를 학습한 인공지능의 산출 값의 공정성 결여 문제가 제기되기도 합니다.

일반인들이 접근하기 힘든 인공지능과 이를 구동하는 알고리즘 그리고 인공지능 배후의 매커니즘을 비공학적 워딩으로 쉽게 설명하고, 이를 통한 인공지능의 올바른 이해를 통해 인간에 대한 판단과 예측을 내리는 기계(인공지능)의 프로세스에 적극적으로 개입하기를 촉구하는 저자의 외침이 크게 와닿는 책으로 기억하고 싶습니다.

ABC(알고리즘(A), 빅데이터(B), 컴퓨터 지능(C))가 어떻게 연결되는가를 통해 인공지능의 작동원리를 이해하고, 인공지능에 윤리를 부여함으로써 기계와 함께 더 나은 미래로 공존하는 법을 깨우쳐주는 인사이트가 넘치는 책입니다.

많은 분들의 일독을 권합니다.

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo