AI VIDEO BRIEFING

AI의 진짜 위험: 먼 미래가 아니라 지금 벌어지는 탄소 배출·무단 학습·편향 문제

AI 연구자 사샤 루치오니가 TED 강연에서 짚는 AI의 현재적 위험—막대한 에너지와 탄소 배출, 동의 없이 쓰인 학습 데이터, 그리고 차별을 낳는 편향—과 이를 측정·완화하는 도구들을 영상 내용을 바탕으로 정리했습니다.

출처: TED2023년 11월 6일AI 보조 요약

핵심 메시지

10년 넘게 AI를 연구한 사샤 루치오니는 'AI가 인류를 끝낼 것'이라는 메일을 받았지만, 먼 미래의 실존적 위험에 집착하는 것은 지금의 구체적 피해에서 눈을 돌리게 한다고 주장한다.
AI의 현재적 피해는 세 가지로 모인다: 에너지·탄소 배출(기후), 동의 없이 쓰인 예술·저작물(저작권), 그리고 특정 집단을 차별하는 편향이다.
대형 언어모델은 5년간 크기가 2000배 커졌고, 더 큰 모델로 바꾸면 같은 작업에 14배 더 많은 탄소를 배출하지만, 기업들은 이를 측정·공개하지 않는다.
코드카본, 'Have I Been Trained?', 안정 편향 탐색기 같은 도구로 영향을 측정하면 더 지속가능하고 저작권을 존중하며 신뢰할 수 있는 AI를 고를 수 있다.

쉽게 이해하기

사샤 루치오니는 어느 날 자신의 AI 연구가 인류를 멸망시킬 것이라는 낯선 사람의 이메일을 받았다고 말한다. 그는 10년 넘게 AI가 사회에 미치는 영향을 연구해 왔지만 10~20년 뒤를 아는 사람은 아무도 없다며, 정작 지금 벌어지는 나쁜 일들에 주목해야 한다고 강조한다. AI는 진공 속에 있지 않고 사회의 일부로서 사람과 지구에 영향을 미치기 때문이다.

첫째 문제는 지속가능성이다. AI가 사는 '클라우드'는 실제로는 금속과 플라스틱으로 만들어지고 막대한 에너지로 돌아가며, 질의 한 번마다 지구에 비용이 든다. 그가 참여한 빅사이언스 이니셔티브(전 세계 연구자 1000명)는 윤리·투명성·동의를 강조한 최초의 오픈 대형 언어모델 '블룸(Bloom)'을 만들었는데, 학습에만 가정집 30가구의 1년치 에너지가 들고 25톤의 이산화탄소가 나왔다. 비슷한 GPT-3는 그보다 20배 많은 탄소를 배출한다.

'클수록 좋다'는 흐름 속에 대형 언어모델은 최근 5년간 크기가 2000배 커졌고 환경 비용도 함께 치솟았다. 그가 이끈 연구에 따르면 더 작고 효율적인 모델 대신 더 큰 모델로 바꾸면 같은 작업에 14배 많은 탄소가 나온다. 그는 AI 학습 코드와 나란히 돌며 에너지·탄소량을 추정하는 도구 '코드카본(CodeCarbon)'을 만들어, 더 지속가능한 모델을 고르거나 재생에너지로 배포하는 등 정보에 근거한 선택을 돕는다.

둘째는 동의 없는 학습 데이터다. 예술가들이 만든 단체 스포닝(Spawning.ai)은 'Have I Been Trained?'라는 도구로 거대 데이터셋(예: LAION-5B)에 자신의 작품이 있는지 검색하게 해 준다. 루치오니가 자신을 검색하자 동명이인들의 사진이 나왔는데, 이는 'Sasha'라는 이름으로 이미지를 생성하면 비키니 모델 이미지가 나오는 이유와도 연결된다. 작가 카를라 오르티스 등은 이 증거로 저작권 침해 집단소송을 제기했고, 스포닝은 그가 일하는 허깅페이스와 손잡고 데이터셋 옵트인·옵트아웃 장치를 만들었다.

셋째는 편향이다. 조이 부올람위니 박사는 흰 가면을 써야만 AI가 자신의 얼굴을 인식하는 경험을 했고, 얼굴인식 시스템이 백인 남성보다 유색인종 여성에게 훨씬 부정확함을 확인했다. 이런 모델이 법 집행에 쓰이면 잘못된 고발·억울한 수감으로 이어질 수 있는데, 임신 8개월의 포샤 우드러프가 AI 오인으로 차량 탈취 누명을 쓴 사례가 그렇다. 루치오니는 이미지 생성 모델의 직업별 편향을 보여주는 '안정 편향 탐색기'를 만들어, 150개 직업 전반에서 백인·남성 표현이 압도적임을 드러냈고 이를 유엔 행사에서 발표했다.

주요 인사이트

미래의 실존적 위험 담론은 기후·저작권·편향 같은 지금의 구체적 피해와 그것을 줄이는 작업에서 주의를 돌리게 하는 '주의 분산'이 될 수 있다는 것이 강연의 핵심 주장이다.
환경 비용은 측정·공개되지 않아 '빙산의 일각'일 가능성이 크다. 모델이 휴대폰·검색엔진·스마트 가전·스피커에 들어가면서 비용은 빠르게 누적된다.
AI 모델은 제작자조차 작동 방식을 정확히 설명하지 못하는 '블랙박스'다. 그렇기에 영향을 측정하는 도구를 만들어 투명성과 접근성을 확보하는 일이 중요하다.
복잡한 문제에 단일 해법은 없지만, 영향을 측정하면 기업은 더 지속가능하고 저작권을 존중하는 모델을 고르고, 입법자는 규제를 설계하며, 사용자는 신뢰할 모델을 선택할 수 있다. 우리는 길을 걸으며 그 길을 만들고 있고, 방향은 함께 정할 수 있다.

자주 묻는 질문

AI 모델을 학습시키는 데 환경 비용이 얼마나 드나요?

강연에 따르면 오픈 모델 블룸은 학습에만 가정집 30가구의 1년치 에너지를 쓰고 25톤의 이산화탄소를 배출했는데, 이는 자동차로 지구를 다섯 바퀴 도는 것과 비슷합니다. 비슷한 GPT-3는 그보다 20배 많은 탄소를 배출하며, 더 큰 모델로 바꾸면 같은 작업에 14배 더 많은 탄소가 나옵니다.

내 작품이 AI 학습에 쓰였는지 확인할 수 있나요?

AI 편향이 실제로 어떤 피해를 낳나요?

얼굴인식 시스템은 백인 남성보다 유색인종 여성에게 훨씬 부정확해, 법 집행에 쓰일 경우 잘못된 고발이나 억울한 수감으로 이어질 수 있습니다. 실제로 임신 8개월이던 포샤 우드러프가 AI의 오인으로 차량 탈취 누명을 썼습니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗