[알라딘서재]풀밭 위에 누운 소녀, 이 통계적 생성물은 무얼 의미하는가?

풀밭 위에 누운 소녀, 이 통계적 생성물은 무얼 의미하는가?ｌ마이리뷰

비의식 () l 2026-06-16 15:53

https://blog.aladin.co.kr/729034103/17338222

미디엄 핫: 발열 시대의 이미지 히토 슈타이얼 지음, 이계성 옮김 / 워크룸프레스 / 2026년 6월 평점 :

AI가 만들어내는 평균적 세계의 이미지들,

텍스트들은 어떤 의미들을 함유하고 있는가?

책의 본문을 이야기하기 전에 기괴한 형상의 표지 이미지부터 시작해야겠다. 나는 저자가 2024년 스테빌리티 AI가 공개한 오픈소스 모델 디퓨전 3(SD3) 미디엄에 “‘풀밭 위에 누운 소녀’라는 무해한” 요청을 프롬프트에 입력하고 그에 반응해 내놓은 출력 이미지라는 말 밖에 모른다. 히토 슈타이얼이 정확하게 어떤 형용을 추가한 요구를 써넣었는지는 모르지만, 이 요청에 의해 생성된 사지가 뒤틀린 기괴한 이미지가 책 표지의 생물체 이미지다.

【표지 및 62쪽, 스테이블 디퓨전 3가 ‘풀밭위의 소녀를 생성한 이미지】

이것은 무엇을 의미하는가? 이 이미지를 생성하기 위해 기계학습 재료로 수집된 대량의 데이터와 그 학습을 위한 막대한 에너지자원의 소비의 결과가 이것인가? 우린 AI, 나아가 AGI에 무엇을 기대하고 있는가? 이것을 위해 미친 듯 자원을 쏟아부으며 맹렬하게 독점적 지위를 선점하기위해 광란의 질주를 하는 기업들 정신의 정체는 무엇인가? 우리들이 AI에게 궁극적으로 기대하는 것은 무엇인가? 이들 질문을 향한 2017년부터 2024년에 이르는 이미지 제작 현장에 대해 2025년 출간한 일종의 현장 보고서가 이 저작이다.

히토 슈타이얼의 이 책은 생성형 AI를 단순한 기술 혁신이나 창작 도구로 바라보지 않는, 즉 AI 자체에 대한 기술 비평이나 예술 비평을 넘어선다. 그것은 생성형 AI를 둘러싼 기술, 자본, 국가, 전쟁, 노동, 이미지, 정치의 관계를 총체적으로 분석하려는 오늘 지구촌에서 벌어지는 비판적 현장 보고서에 가깝다. 그녀가 궁극적으로 묻는 것은 ‘AI는 무엇을 만들어 내는가?’가 아니라 ‘AI는 어떤 사회, 세계를 만들어 내고 있으며, 그 과정에서 우리들은 무엇을 잃고 있는가?’라는 질문일 것이다.

1. 위기 자체를 성장 동력으로 하는 AI

우선 슈타이얼은 생성형 AI의 등장을 기술 발전의 자연스러운 결과로 보지 않는다. 오히려 그것은 금융위기, 팬데믹, 기후위기, 전쟁, 극우 정치의 부상이라는 다중 위기 속에서 출현한 현상으로 해독하는 것이다. 따라서 AI는 위기를 해결하기 위해 등장한 기술이라기보다, 위기 자체를 새로운 성장 동력으로 전환하려는 자본주의적 프로젝트와 결부되어 있다고 본다. 즉 생성형 AI는 이러한 세계의 위기와 무관하게 등장한 기술이 아니라, 오히려 그 위기들을 새로운 경제적 기회로 전환하는 자본주의적 욕망체계 속에서 등장했다는 역사적 맥락에 주목한다.

특히 슈타이얼은 AI와 전쟁의 결합을 중요한 문제로 제기한다. 가자지구와 우크라이나는 단순한 전쟁터가 아니라 AI 기반 감시 체계와 표적 생성 시스템, 자동화된 군사 기술이 실험되는 거대한 연구소가 되었다. 팔란티어와 같은 기업들이 군사 데이터를 분석하여 전장에 활용하는 사례는 AI 발전이 국가안보 논리와 군비 경쟁 속으로 깊이 편입되고 있음을 보여준다. 이 과정에서 전쟁은 단순히 정치적 목적을 위한 수단이 아니라, AI 학습을 위한 데이터를 생산하는 장치처럼 기능하기 시작한다. 범용 인공지능과 초지능 개발 경쟁은 결국 ‘승자독식’이라는 자본주의적 논리에 따라 움직이며, 국가와 기업은 이를 피할 수 없는 운명처럼 제시한다. 그러나 슈타이얼은 이러한 가속주의적 담론이 실제로는 소수의 기술 기업과 초고액 자산가들의 이해관계를 정당화하는 이데올로기일 뿐이라고 본다. 이스라엘이 지금 전쟁을 끝낼 의지를 보이지 않은 요인의 하나일 수도 있다.

2. 통계적 산물로서 AI 생성물이 의미하는 것 - 평균성, 누구를 위한 평균인가, 그것이 수렴하는 것은?

그녀의 비판은 이미지 자체에 대한 분석으로 이어진다. 생성형 AI는 흔히 창조적 도구로 포장되지만, 실제로는 미술사와 인터넷 전체에 축적된 방대한 인간의 창작물을 무단으로 수집하고 평균화하여 재가공하는 체계에 가깝다. 따라서 AI가 생산하는 이미지는 현실을 재현하는 사진 이미지와 근본적으로 다르다. 그것은 실재와의 접촉이 아니라 확률과 통계에 기초한다. 과거 사진이 현실의 흔적이었다면, AI 이미지는 데이터세트 속 관계들의 평균값이다. 여기서 이미지는 더 이상 진실이나 사실을 지시하지 않는다. 대신 가장 개연적인 것, 가장 그럴듯한 것, 가장 자주 등장한 것에 수렴한다.

【 본문 78쪽, 상단 이미지: LAION-5B 데이터 세트의 학습재료/ 하단 이미지: 스테이블 디퓨전이 생성한 히토 슈타이얼의 이미지】

이 심층학습 텍스트2 이미지 생성기 중 하나인 LAION-5B데이터 세트에 그녀의 사진도 몇 장 들어있는 모양이다. 슈타이얼은 모델에게 히토 슈타이얼의 이미지를 생성해달라고 요청한다. 어떤 결과물을 내놓았을까? 날조로 증강된, 사회적 신호들을 극단적 논리로 밀어붙인 지극히 편협하고 왜곡된 동양인의 이미지를 내놓는다. 슈타이얼은 화가 많이 났을 테다. 얼굴인식의 편향을 줄이기 위해서라는 위선적 명분에 기대 유령같은 인종화된 표현형으로 사회관계를 고도로 이념화된 최적치로 수렴한 이미지를 만들어낸다.

이것이 슈타이얼이 말하는 ‘통계적 사실주의’에 숨어있는 권력의 편향이다. AI는 대규모 데이터 속에서 패턴을 추출하여 이미지를 생성하지만, 그 과정은 현실에 대한 관찰이 아니라 양적 축적에 의존한다. 충분히 많은 데이터를 모으면 세계의 본질이 드러날 것이라는 믿음이 그 배후에 있다. 그러나 이 방식은 현실을 이해하기보다 평균을 규범으로 만들 위험을 내포한다. 생성된 이미지는 특정 개인이나 사건을 보여주는 것이 아니라, 사회가 상상하는 평균적 인간상과 평균적 세계를 시각화한다.

이를 상징적으로 보여주는 사례가 슈타이얼이 언급하는 ‘야누스 문제’이다. 드림 퓨전이나 텍스트 투 3D와 같은 시스템은 종종 서로 다른 방향을 바라보는 두 개의 얼굴이 결합된 기이한 인물을 생성한다. 이는 기계학습이 얼굴 인식에 지나치게 편중된 결과이기도 하지만, 동시에 개인과 집단의 관계라는 더 근본적인 문제를 드러낸다. 하나의 인간은 어떻게 집단을 대표하는가? 반대로 군중은 어떻게 하나의 얼굴로 표상될 수 있는가? AI가 만들어내는 인물들은 특정 개인이라기보다 수많은 얼굴들의 평균적 합성물이다. 이들은 실제 인간이 아니라 집단적 통계가 만들어낸 유령 같은 존재들이다.

이 지점에서 슈타이얼은 19세기 우생학자 프랜시스 골턴의 합성사진을 떠올린다. 골턴은 범죄자, 유대인, 결핵 환자 등의 사진을 겹쳐 특정 집단의 ‘전형적 얼굴’을 만들려 했다. 오늘날 AI가 생성하는 평균적 얼굴 역시 이와 유사한 위험을 안고 있다. 인종화된 표현형이나 사회적 편견이 데이터세트 속에 축적될 경우, AI는 그것을 객관적 현실인양 재생산한다. 데이터는 복잡한 사회적·역사적 과정을 삭제한 채 마치 특정 특성이 집단에 본질적으로 내재한 것처럼 보이게 만든다. 즉, 매개와 해석의 과정이 사라지고 통계적 결과가 곧 진실인 것처럼 제시된다.

더 나아가 이러한 시스템은 인간 사회의 조건화 방식 자체를 반영한다. AI는 서로 연관된 평균치를 계산하면서도 동시에 극단적이고 비현실적인 이상치를 향해 수렴한다. 예컨대 아름다움, 성공, 생산성의 기준은 평균을 기반으로 형성되지만, 실제로는 거의 도달 불가능한 이상적 모델을 규범으로 제시한다. 문제는 이러한 규범이 자연스럽고 자생적인 결과처럼 보인다는 점이다. 그러나 그 배후에는 시장의 이해관계와 알고리즘적 최적화, 수많은 가중치와 매개변수가 작동하고 있다. 신경망의 은닉층은 이러한 사회적·이념적 개입을 가린 채, 결과만을 객관적 사실처럼 드러낸다.

3. AI의 물질적 토대가 말하는 것 - 거대한 열역학적 생산체계

슈타이얼은 또한 AI의 물질적 토대를 강조한다. 생성형 AI는 막대한 전력과 자원을 소비하며, 데이터센터와 화석연료 기반 인프라에 의존한다. 따라서 AI는 비물질적 정보 기술이 아니라 거대한 열역학적 생산 체계다. 화석연료를 태워 얻은 에너지가 이미지를 생산하고, 그 과정에서 환경 파괴와 사회적 비용이 발생한다. 그녀가 “이익은 사유화되고 위험은 사회화된다”고 말하는 이유도 여기에 있다. 데이터를 제공한 이용자들, 콘텐츠를 만든 창작자들, 편향을 제거하기 위해 저임금 노동을 수행하는 미세노동자들은 보상을 받지 못하지만, 기술 기업들은 그 성과를 독점한다.

결국 슈타이얼이 비판하는 것은 기술 그 자체가 아니다. 그녀가 문제 삼는 것은 AI를 둘러싼 사회적 관계와 권력 구조이다. 생성형 AI는 인간의 창의성을 확장하는 도구일 수 있지만, 동시에 전쟁을 자동화하고, 평균을 규범으로 만들며, 편향과 차별을 재생산하고, 방대한 무급 노동을 수탈하는 체계이기도 하다. 따라서 중요한 것은 AI가 얼마나 더 강력해질 것인가가 아니라, 누가 그것을 소유하고 통제하며, 그 혜택과 위험을 누가 부담하는가를 묻는 일이다. 슈타이얼에게 AI는 미래 기술이 아니라 오늘날 자본주의와 국가 권력의 작동 방식을 압축적으로 보여주는 반향적 실체이며, 우리는 그 반영 속에서 기술의 문제가 아닌 민주주의와 인간 사회의 미래를 보아야 한다.

한편 슈타이얼은 AI가 문화와 정치에 미치는 영향도 우려한다. AI는 대규모 데이터의 평균을 바탕으로 작동하기 때문에 예외적이거나 독창적인 것을 점차 제거하고 가장 그럴듯한 것만 반복한다. 이는 ‘모델 붕괴(model collapse)’ 현상으로 나타나며, 결국 문화는 획일화되고 상투화된다. 인터넷과 AI는 표현 비용을 낮췄지만, 그 결과 형성된 공론장은 깊은 정치적 조직화보다 단기적 관심과 인정 욕구에 의해 움직이는 공간이 되었다. 정치 역시 점점 더 파편화되고 개인화되며, 연대보다는 정체성 경쟁으로 변질된다.

이러한 비판의 밑바탕에는 더욱 근본적인 철학적 질문이 놓여 있다. 상식은 무엇인가? 인간의 직관은 어떻게 형성되는가? 개인과 집단은 어떤 관계에 있는가? AI는 인간의 사고를 모방한다고 주장하지만, 실제로는 통계적 상관관계를 통해 세계를 계산할 뿐이다. 따라서 인간의 판단과 경험을 데이터로 환원하는 순간, 우리는 세계를 이해하는 능력 자체를 잃어버릴 위험에 처한다.

4. 결어 - 생성형 AI, 범용 AGI를 향한 궁극적 각축전의 의미; 현대사회의 권력구조의 거울

반복하지만 슈타이얼의 핵심 주장은 생성형 AI가 단순한 기술 혁신이 아니라 현대 사회의 권력 구조를 압축적으로 드러내는 거울이라는 것이다. AI가 생산하는 것은 이미지뿐 아니라 평균성, 순응성, 군사화, 착취, 그리고 통계적 현실이다. 따라서 우리가 물어야 할 것은 AI가 얼마나 똑똑해질 것인가가 아니다. 오히려 “이 기술은 누구를 위해 존재하는가?”, “그 비용은 누가 지불하는가?”, “누가 이 시스템을 소유하고 통제하는가?”, “확률이 진실을 대체하는 시대에 인간의 판단과 정치적 책임은 무엇이 될 것인가?”라는 물음이다. 슈타이얼에게 AI 비판은 결국 기술의 문제가 아니라 민주주의와 사회의 미래를 둘러싼 정치적 문제인 셈이다.

슈타이얼은 AI 자체를 본질적으로 악한 기술이라고 말하는 것은 아니라 점이다. 오히려 그녀는 반복해서 ‘왜 현재의 AI가 이런 방식으로 개발되고 있는가?’를 묻는 것이다. 따라서 그녀의 비판 대상은 기술 자체라기보다 기술을 둘러싼 자본주의적·군사적·국가주의적 권력장치(dispositif;배치)에 가깝다 라고 판단하는 것이다. 이런 방식이란 바로 이렇게 표현될 것이다.

생성형 AI는 단순한 이미지 생산 기술이 아니라, 현대 자본주의와 국가 권력이 세계를 평균화하고 관리하는 방식을 드러내는 거대한 통계적 장치이며, 따라서 AI의 문제는 기술의 문제가 아니라 정치경제적 문제임을 드러내는 것이다.

끝으로 빼놓을 수 없는 슈타이얼의 통찰로 마무리하련다. “기계 학습 이미지는 정체된 시각적 *슬롭을 만들어내는 최적화 시스템”이라는 지적이다. 이것은 평균을 향해 수렴하여 중간이라는 통계적 조합, 그 주변을 공전하면서 협소한 주류를 만들어내는 자본의 시장성 발현이다. 관습과 상투성을 벗어나지 못하고 가상의 정규분포곡선에 몰려들며 고만고만한 이미지와 텍스트로 귀결되는, 그러함으로써 문화의 교착과 획일화를 조성한다. 결국 과거를 끝없이 변주하는 수구성과 획일성이라는 전체주의는 오늘 AI의 본질에 내재된 것이라는 말일 것이다.

사실 슈타이얼의 글은 문장 하나하나가 굉장히 압축적이고, 철학·미디어이론·정치경제학·기술비평이 뒤섞여 있어서 그대로 읽으면 논점이 흩어져 보이기 쉽지만, 전체를 관통하는 축은 의외로 단순하다. "AI가 만들어낸 평균적 세계를 우리는 현실이라고 받아들여도 되는가?", "지금 AI가 학습하고 있는 것은 세계 자체가 아니라, 자본주의 플랫폼 사회가 이미 왜곡해 놓은 세계상은 아닌가?" 로 압축 할 수 있을는지 모르겠다. ‘AI 기술철학+ AI 정치경제학’이라고 말 할 수 있는 이 책을 읽으며 오늘 우리들이 사용하는 인공지능이 사회가 가진 규범과 편견을 재생산하는 정치적 도구이기도 하다는 생각을 품을 수 있다면 아마 이 글의 소임은 다한 것일 테다.