제3장은 데이터의 역할에 초점을 맞춘다. (개인적이거나 위험을 초래할 가능성이 있는 데이터를 비롯하여) 공개적으로 접근할 수 있는 모든 디지털 자료는 AI 모형을 생성하는 데 이용되는 훈련 데이터 집합을 위해 자유롭게 수집될 수 있다. 사람들의 셀카, 손짓, 운전 장면, 우는 아기, 1990년대 뉴스그룹 대화 등으로 가득한 거대한 데이터 집합들이 있으며, 이것들은 모두 얼굴 인식, 언어 예측, 대상 탐지 등의 기능을 수행하는 알고리즘을 개선하는 데 쓰인다. 이 데이터 집합들이 더는 사람들의 개인 자료가 아니라 단순한 ‘인프라’로 간주되면 이미지나 동영상의 구체적 의미나 맥락은 무의미한 것으로 치부된다. AI가 데이터를 이용하는 현재의 관행은 개인정보 유출과 감시 자본주의라는 심각한 문제 외에도 적잖은 윤리적·방법론적·인식론적 우려를 낳는다.33 - <AI 지도책> 중에서
광물은 AI의 뼈대이지만 AI의 혈액은 여전히 전기에너지다. 하지만 첨단 연산 행위가 탄소 발자국, 화석연료, 오염의 관점에서 평가되는 일은 드물다. ‘구름(클라우드)’ 등의 비유는 자연 친화적 녹색산업이라는 고상하고 섬세한 분위기를 풍긴다.50 서버는 별 특징이 없는 데이터 센터에 숨겨져 있으며 그 오염 실태는 연기를 내뿜는 석탄 화력발전소 굴뚝에 비해 훨씬 알아보기 힘들다. 기술 부문의 산업들은 자사의 환경 정책, 지속 가능성 사업, (AI를 문제 해결 도구로 이용하여) 기후 관련 문제를 해결하겠다는 계획 등을 열심히 홍보한다. 이것은 탄소를 전혀 배출하지 않는 지속 가능한 산업이라는 대외적 이미지 연출의 일환이다. 실제로는 아마존 웹서비스나 마이크로소프트 애저 같은 연산 인프라를 운영하기 위해서는 막대한 양의 에너지가 필요하며 이런 플랫폼에서 동작하는 AI 시스템의 탄소 발자국은 점점 증가하고 있다.51 - <AI 지도책> 중에서
인공지능은 또 다른 종류의 거대기계다. 전 세계에 뻗어 있지만 분명히 드러나지 않는 산업 인프라, 공급사슬, 인간 노동에 의존하는 기술적 접근법의 집합인 것이다. 우리가 보았듯 AI의 범위는 데이터베이스와 알고리즘, 기계학습과 선형 대수학을 훌쩍 뛰어넘는다. 이것은 은유적이다. AI는 제조, 운송, 물리적 작업에 의존하고, 데이터 센터와 대륙을 가로지르는 해저 케이블에 의존하고, 개인용 기기와 여기에 들어가는 원료에 의존하고, 공기를 통과하는 전송신호에 의존하고, 인터넷에서 긁어모은 데이터 집합에 의존하고, 끊임없는 연산 주기에 의존한다. 이 모든 것에는 비용이 따른다. - <AI 지도책> 중에서
|