AI VIDEO BRIEFING

AI는 어떻게 만들어지나 — 만든 사람도 작동 원리를 모르는 머신러닝의 정체

CGP Grey가 추천·사기탐지·가격책정에 쓰이는 알고리즘 봇이 사람이 규칙을 짜는 대신 시험과 선별의 반복으로 "길러지는" 과정을 설명한다. 왜 만든 사람조차 작동 방식을 모르는지 짚는다.

출처: CGP Grey2017년 12월 18일AI 보조 요약

만든 사람도 모르는 AI: 알고리즘 봇이 "학습"으로 만들어지는 방식 영상 대표 이미지

핵심 메시지

오늘날 추천, 사기 탐지, 가격 책정 등 수많은 알고리즘 봇이 우리 일상을 둘러싸고 있지만, 그 작동 방식은 만든 사람조차 점점 더 알지 못한다.
문제가 너무 크고 복잡하면 사람이 "이러면 저렇게" 식의 규칙을 직접 쓸 수 없어, 봇을 만드는 봇과 시험하는 봇으로 봇을 "길러낸다".
빌더 봇이 거의 무작위로 학생 봇을 만들고, 교사 봇은 가르치지 않고 시험만 보며, 성적 좋은 봇만 남겨 복제·변형하는 과정을 수없이 반복한다.
데이터가 많을수록 시험이 길어지고 더 나은 봇이 나오므로 기업이 데이터 수집에 집착한다. "당신은 사람입니까" 테스트도 사실상 시험 문제를 만드는 일이다.
결과로 나온 봇은 잘 작동하지만 그 내부 판단 과정은 누구도, 심지어 봇 자신도 알 수 없는 블랙박스다.

쉽게 이해하기

인터넷에는 알고리즘이 사방에 있다. 이 영상을 보게 된 것도 알고리즘이 추천했기 때문이고, 사진 검색, 결제 시 가격 책정, 은행의 사기 거래 감시, 주식 시장의 자동 매매가 모두 알고리즘으로 돌아간다. CGP Grey는 이 알고리즘 봇들이 어떻게 작동하는지, 그리고 왜 그 작동 방식을 아무도 모르게 되었는지를 풀어낸다.

예전에는 사람이 "이러면 저렇게"라는, 스스로 설명할 수 있는 규칙을 봇에게 직접 주었다. 하지만 초당 수많은 거래 중 무엇이 사기인지, 방대한 영상 중 무엇을 추천할지 같은 문제는 사람이 규칙으로 쓰기엔 너무 크고 어렵다. 봇은 완벽하지 않지만 사람보다 훨씬 나은 답을 내놓는다. 다만 "어떻게" 그러는지는 갈수록 아무도 모른다.

벌과 숫자 3을 구분하는 봇을 예로 들자. 사람에겐 쉽지만 봇의 언어로 규칙을 적어줄 수는 없다. 그래서 봇을 직접 만들지 않고, 봇을 만드는 빌더 봇과 봇을 시험하는 교사 봇을 만든다. 처음엔 빌더 봇이 학생 봇의 회로를 거의 무작위로 연결해, 형편없는 학생 봇들이 만들어진다.

교사 봇도 벌과 3을 구분하지는 못한다. 대신 사람이 정답이 표시된 사진 묶음을 주면, 교사 봇은 가르치지 못해도 시험은 볼 수 있다. 성적이 좋은 학생 봇은 남기고 나머지는 버린 뒤, 빌더 봇이 남은 것들을 변형·조합해 복제한다. 이 시험-제작-시험의 순환을 거대한 규모로 수없이 반복하면, 처음엔 운 좋은 봇뿐이지만 점차 진짜로 벌과 3을 구분하는 봇이 등장한다.

그러나 이렇게 길러진 봇은 자신이 배운 종류의 문제에만 능하다. 사진은 잘 풀어도 영상이나 거꾸로 된 이미지엔 무력하다. 교사 봇이 가르칠 수 없으니 사람이 할 수 있는 일은 더 많은 문제를 주는 것뿐이고, 그래서 데이터가 곧 더 긴 시험이자 더 나은 봇이 된다. 시청 시간을 늘리도록 사람을 대상으로 스스로 시험을 만드는 봇도 있으며, 결국 우리는 만든 사람조차 이해하지 못하는 도구를 쓰거나 그 도구에 쓰이는 처지에 놓인다.

주요 인사이트

복잡한 문제에서는 사람이 명시적 규칙을 쓰는 대신, 무작위 변형과 선별을 반복하는 진화적 방식으로 봇을 "길러내는" 편이 더 나은 답을 낸다.
교사 봇은 가르치지 않고 시험만 본다. 학습의 동력은 "가장 잘한 것만 남기고 나머지는 버리는" 선별과 막대한 반복 횟수에서 나온다.
데이터 수집에 대한 기업의 집착은 "더 많은 데이터 = 더 긴 시험 = 더 나은 봇"이라는 등식으로 설명된다.
"당신은 사람입니까" 같은 인증 테스트는 사람임을 증명하는 동시에, 글자·사물·운전 장면을 읽는 봇을 위한 시험 문제를 우리가 직접 만들어 주는 일이다.
추천 알고리즘은 시청 시간처럼 측정 가능한 목표를 최적화하도록 길러지므로, "어떻게 고르는가"라는 질문엔 사람이 설계한 시험과 데이터를 가리키는 답밖에 없다.

자주 묻는 질문

왜 사람이 직접 규칙을 짜는 대신 봇으로 봇을 만들까요?

초당 수많은 거래 중 사기 식별, 방대한 영상 중 추천 같은 문제는 너무 크고 복잡해 사람이 "이러면 저렇게" 식의 규칙으로 적을 수 없기 때문입니다.

빌더 봇과 교사 봇은 각각 무엇을 하나요?

빌더 봇은 학생 봇을 만들고 변형·복제하며, 교사 봇은 가르치지 않고 정답표로 시험만 봅니다. 성적 좋은 봇만 남기는 과정을 반복합니다.

기업이 데이터 수집에 집착하는 이유는 무엇인가요?

데이터가 많을수록 시험이 길어지고, 더 긴 시험은 더 나은 봇으로 이어지기 때문입니다. 즉 더 많은 데이터가 곧 더 좋은 알고리즘을 의미합니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗