-
-
AI는 차별을 인간에게서 배운다 - 인간과 기술의 공존을 위해 다시 세우는 정의 ㅣ 서가명강 시리즈 22
고학수 지음 / 21세기북스 / 2022년 1월
평점 :
챗GPT를 이용하여 레포트를 작성하거나 과제를 해결하는 대학생들의 이야기가 뉴스화되고 있는 시점이다. 인공지능은 실생활에 적용되기 시작했고, 인공지능을 어떻게 활용할 것인가, 어떻게 활용하는 것이 바람직한가 하는 논의가 필요하다. 이 책은 현재 우리 사회가 인공지능을 어느 수준까지 개발했고, 어떻게 활용되고 있는지, 어떤 문제가 있는지를 짚고 있다.
인간은 내가 직간접적으로 경험한 데이터를 가지고 판단한다. 각자는 각자가 경험한 데이터를 기반으로 사람이나 사물, 일을 판단하는 것이다. 때문에 각자가 어떤 사안에 대해 다르게 판단할 수 있고, 그 다른 판단들을 공론장에서 토론을 통해 옳고 그름을 논의하는 것이다. 우리는 보통 사람은 주관적이고, 기계나 컴퓨터는 객관적이라고 여기지만 인공지능은 철저히 사람들이 그동안 쌓아온 데이터를 학습해서 답을 내리거나 판단-이때의 판단은 사람이 내리는 판단과는 성격이 다르다. 인공지능이 답을 내리는 과정을 지칭했다.-한다. 컴퓨터가 내린 답안을 우리는 신뢰할 수 있다고 믿고, 객관적이라고 보지만, 인공지능의 판단에 사용된 데이터 자체가 인간이 쌓은 데이터라 객관적이지 않다. 예를 들어, 가난한 사람들 중 흑인이 백인보다 많이 아파도 병원에 가지 못하는데, 병원이 갖고 있는 데이터는 백인들의 것이 더 많고, 이를 바탕으로 학습한 인공지능은 잘못된 판단을 내릴 수 있다.
세상은 편리해졌고, 더 쉽게 지식을 얻고-쉽게 얻는다기보다는 쉽게 찾는다는 표현이 적절할 것 같다-, 더 쉽게 원하는 정답을 도출할 수 있을 것 같지만, 판단의 영역까지 인공지능에게 넘겨줬을 때 인간으로서의 기능까지 포기하는 것은 아닌가 하는 생각도 든다. 생각하는 것, 사고하는 것, 판단하는 것을 제외하면 살아있는 생물체뿐이지 않을까. 기술의 발전은 놀랍고 환영할 일이지만, 자신을 놓아버리는 사람들이 더 많아질 것 같다. 그래도 되는 세상일 것처럼 느껴지니까.
현재의 인공지능은 풍부한 데이터를 확보하여 학습하는 것이 핵심 관건이다. 특히 현실적으로 가장 많이 쓰이는 인공지능은 지도학습 방식의 인공지능인데, 지도학습을 위해서는 레이블된 데이터를 충분히 확보하는 것이 중요하다. (…) 데이터의 중요성을 강조하여 ‘쓰레기를 넣으면 쓰레기가 나온다’는 관행적 표현이 언급되기도 한다. - P73
아마존에서는 그 이전 10년 정도의 기간에 회사에 지원한 사람들의 이력서를 활용하여 인공 지능 모델을 구축하고자 했는데, 그 기간에 회사에 지원한 사람 중 여성의 비율 자체가 낮았던 것이 문제의 출발점이라는 것이다. 더군다나 IT 업무를 다루는 직군은 여성 비율이 더욱 낮았다는 한계도 있다. 알고리즘의 개발 과정에서, 이력서에 여학교 이름이나 여성 전용 동아리 이름 등 여성임을 파악할 수 있는 표현이 있으면 부정적인 평가가 지속적으로 나타나는 것이 파악되었고, 결국 이 작업은 잠정 중단되었다. - P82
요컨대 인공지능은 그룹화를 통한 분석과 의사결정에 특히 강점을 가진 기술인 것이고, 이는 사회적인 맥락에서는 차별에 관한 논란으로 쉽게 확대될 수 있는 것이다. - P140
오늘날의 인공지능은 데이터의 존재가 핵심적인 관건이다. 적어도 개념적으로는 인공지능 모형을 개발하는 첫 단계는 실제 세상의 데이터에서 출발한다. 사회적 환경을 배경으로 하는 유형의 작업은 실제 세상의 데이터가 더욱 중요하다. 그런데 사회에는 편견과 차별, 불공정이 어느 정도는 있기 마련이다. 인공지능 개발의 기본 배경이 되는 인간 사회의 모습은 인공지능 기술 자체에 관한 문제라기보다는 우리 사회의 근본적인 문제라 하겠다. - P153
사람의 판단은 결국 자기가 살아오면서 겪은 직접 경험, 간접 경험을 그룹화하고 일반화하여 판단하는 것임을 부인할 수는 없다. 만약 그게 가능하지 않다면 인간의 학습이라는 것 자체가 의미가 없어지게 된다. 인공지능의 경우에도 그룹화하고 일반화하는 과정을 통해 학습이 이루어진다는 점은 마찬가지다. - P232
|