- 불평등은 사회가 직면한 가장 큰 난관 중 하나이며 우리의 온라인 생활에 의해 심화된다. '좋아요' 와 '공유' 의 형태를 띤 사회적 자본이 축적되면, 그 결과로 금전적 자본이 축적된다. 그리고 피드백이 지속된다. ... '좋아요 추가' 알고리즘은 당신의 삶 속 어딘가에서 틀림없이 작동하고 있다. 하지만 당신은 '좋아요 추가' 알고리즘이 모든 결정권을 행사하게 하지는 말아야 한다. 우리의 인간적 진정성은 우리가 가진 가장 중요한 것들 중 하나다.
Chapter 11. 필터버블
- 2017년 나는 지난해의 정치를 다룬 수많은 기사들을 이해하려 애쓰고 있었다. 눈에 띄는 설명 하나는 알고리즘이 여론을 망쳐놓았다는 것이었다. 많은 매체들이 알고리즘 때문에 발생하는 고립과 양극화에 관한 이야기를 난해한 수학 용어를 동원해가며 늘어놓았다.
- 소셜미디어는 알고리즘에 의해 창출된 버블들로 가득 차 있었고, 정말로 터무니 없는 몇몇 음모론들이 그 버블들 안에서 떠돌고 있었다. 그러나 우리 대다수는 버블에서 탈출할 수 있는 것으로 보였다. 무엇이 우리가 버블 안에 갇히는 것을 막을까? 이론적으로 페이스북의 '필터' 알고리즘이 우리를 특정 관점 안에 가둘 수 있다면, 실제로 우리는 어떻게 그 관점에서 탈출하는 것일까? 우리는 소셜미디어를 사용하면서 오랜 시간을 보내는데, 왜 우리의 감정은 대체로 소셜미디어의 영향을 받지 않을까? 이 질문들에 답하는 유일한 길은 나 자신의 온라인 버블 안으로 들어가서 과연 내가 탈출구를 발견할 수 있는지 알아보는 것뿐이었다. 물론 아주 흔쾌한 일은 아니었다.
Chapter 12. 축구는 중요하다
- 나처럼 신문들을 팔로우하고 시사 현안을 챙기는 사람들에게 트위터와 페이스북은 그리 강력한 방향실이 아니다. 비록 약간의 진보적 편향이 있기는 하지만, 이 소셜미디어 사이트들은 다양한 정보가 확산되고 공유되는데 기여한다. 전반적으로 우리는 수많은 견해들을 접한다. 그중 일부는 우리가 좋아하는 것이고, 다른 일부는 우리가 싫어하는 것이다. 하지만 그 모든 견해들이 우리가 사는 세계에 관한 정보를 제공한다. 우리의 폭넓은 사회적 연결들이 우리를 필터버블 안에 갇히지 않게 해준다.
Chapter 13. 누가 가짜뉴스를 읽을까?
- 만델라 효과 Mandela effect : 사람들이 진실이 아닌 무언가를 진실이라고 생각하는 현상
- 가짜뉴스는 성장하는 산업이다. 가짜뉴스란 단지 정치적으로 편향된 뉴스가 아니라 명백히 거짓인 뉴스다. 가짜뉴스가 존재하는가 여부는 문제가 아니다. 가짜뉴스는 거의 의심의 여지 없이 존재한다. 문제는 가짜뉴스가 우리의 정치적 견해에 얼마나 큰 영향을 미치는가 하는 것이다. 우리는 탈진실 세계에서 살고 있을까?
- 현재 구글, 페이스북, 트위터가 사용하는 알고리즘들의 가장 큰 한계는 우리가 주고받는 정보의 의미를 제대로 이해하지 못한다는 점이다. ... 결국 회사들은 우리의 게시물을 감시하면서 게시물의 참된 의미에 대한 이해에 기초하여 그것들을 공유하는 것이 적절한지 또 누구에게 전달해야 할지를 자동으로 판단할 수 있는 알고리즘을 보유하기를 원할 것이다.
Session 3. 우리처럼 되는 알고리즘
Chapter 14. 성차별주의 학습
- 우리의 직장을 살펴보면 다양한 인종집단과 남녀 사이에 상당한 불평등이 존재한다. 그 불평등의 부분적인 원인은 우리의 평가가 편파적인 것에 있다. 우리는 우리와 가치관을 공유한 사람들을 선호하는 경향이 있고, 그런 사람들은 우리와 유사한 특징들을 지닌 경향이 있다. 경영자는 인종과 성별이 자신과 같은 직원을 우호적으로 평가할 개연성 이 더 높다. ... 우리는 흔히 우리 자신의 편견을 알아채지 못한다. 그래서 심리학자들은 우리의 무의식적 생각을 들춰내는 교묘한 방법들을 개발했다. '암묵적 연상 검사 implicit association test'
- 글로브를 분석하고 조앤나 브라이슨과 동료들의 논문을 읽음으로써 나는 단어 유추 알고리즘들이 여전히 우리의 통제 아래 놓여 있다는 사실을 알게 되었다. 그 알고리즘들이 우리의 데이터만 보고 자율적으로 학습했을지라도, 우리가 그것들의 내부에서 일어나는 일을 알아내고 그것들이 생산하는 결과를 바꿀 수 있다는 사실이 밝혀졌다. 나의 뇌 속 연결들과 달리 - 그 연결들에서는 단어에 대한 나의 암묵적 반응이 나의 유년기, 성장환경, 직업 경험 등과 얽혀 있다 - 알고리즘의 성차별주의를 유발하는 연결들은 풀어헤치고 수정할 수 있다. 그러므로 알고리즘이 성차별주의적이라고 말하는 것은 부적절하다. 오히려 알고리즘들을 분석하는 작업은 우리 자신의 암묵적 성차별주의를 더 잘 이해하게 해준다. 그 작업은 우리 문화 안에서 정형화가 얼마나 뿌리 깊게 작동하는지 드러낸다.
Chapter 15. 숫자들에 깃든 유일한 생각
- 상향식 봇들은 아직 서비스에 투입될 수준에 이르지 못했다. 사용자들에게 무의미한 정보를 요구하기도 하고 대화를 쳇바퀴 돌리기로 만들기도 한다. 신경망이 약간의 개성을 지닐 수도 있겠지만, 우리 대다수는 온라인 상태에서 구체적인 질문들에 관한 직접적인 도움을 원한다. 우리가 정보를 원할 때 가장 유효한 것은 선택형 질문과 정형화된 하향식 대답이다.
- 순환 신경망의 내부를 더 깊이 들여다보면, 순환 신경망의 한계의 배후에 놓인 이유들도 알 수 있다. 순환 신경망의 이해에 한계가 있는 이유는, 그 신경망이 한 번에 약 25개의 단어들만 받아들일 수 있기 때문이다. 우리가 더 많은 단어들을 입력하여 신경망을 훈련시키려 하면, 신경망의 개념적 이해는 부서지기 시작한다. 신경망은 단 한문장으로 설명할 수 있는 개념은 보유하고 전달할 수 있어도, 두 문장 이상을 사용해야만 설명할 수 있는 개념은 보유하고 전달할 수 없다.
Chapter 16. <스페이스 인베이더> 에서 너를 확실히 밟아주겠어
- 해법에서 중요한 부분 하나는 '곱말기 (합성곱) convolution' 라는 수학적 기법의 사용이었다. 영어에서는 convoluted (대단히 난해한 설명) 이라는 표현에서 쓰인다. 이 표현은 길고 상세하지만 이해하기 어려운 설명을 뜻한다. 그러나 신경망 용어로서의 '곱말기' 에서 두루마리처럼 말리는 것은 게임의 장면이다. <스페이스 인베이더>를 할 때 신경망이 받는 압력은 아타리 2600의 210 X 160 픽셀 스크린 장면이다. 원래 장면은 신경망의 첫째 숨은 층에서 일련의 작은 그림들로 분산되어 숨은 뉴런들에 입력된다. 그 결과로 나오는 이미지들에 이 과정이 (둘째 숨은 층과 셋째 숨은 층에서) 거듭 적용되고, 그 결과로 더 깊게 숨은 뉴런들에서 더 작은 이미지들이 산출된다.
- 온갖 과장과 호들갑에도 불구하고 내가 원하는 답의 큰 부분은 벌써 구글의 검색에서 발견된다. 곱말기 신경망은 <미즈 팩맨> 의 참을성을 필요로 하는 측면들을 전혀 다루지 못한다. 그 알고리즘은 오직 자기 앞에 직접 놓인 것에만 반응할 수 있다. 예컨대 사격 대상인 외계인들, 때려야 할 권투선수, 뛰어올라야 할 정육면체들에만 반응할 수 있다. 곱말기 신경망은 계획할 줄 모른다. 아주 가까운 미래조차도 계획할 수 없다. 그 알고리즘은 계획이 약간이라도 필요한 모든 아타리 게임에서 초라한 성적을 낸다.