AI VIDEO BRIEFING

AI 에이전트 확장의 난제: 에이전틱 AI를 키울 때 무엇이 무너지는가

데모는 쉽지만 안정적으로 확장하기는 어려운 AI 에이전트. IBM이 에이전트 루프의 비용 폭증, 오류 전파, 단일 에이전트의 한계와 멀티 에이전트 설계, 수평·수직 확장의 트레이드오프를 알기 쉽게 정리합니다.

출처: IBM Technology2026년 6월 9일AI 보조 요약

AI 에이전트는 왜 키우기 어려운가 — 에이전틱 AI 확장의 진짜 난제 영상 대표 이미지

핵심 메시지

AI 에이전트는 데모를 만들기는 쉽지만, 안정적으로 확장하기는 의외로 어렵다.
에이전트 확장은 요청량을 늘리는 전통적 확장이 아니라, '더 많은 일을 하게 만드는 능력 확장'이며 바로 이 지점이 모든 것을 바꾼다.
범위가 넓어질수록 계획·실행·기억·반성 각 단계의 비용과 지연이 비선형적으로 증가하고, 결정당 비용이 치솟는다.
에이전트의 실패는 고립되지 않고 시간 축을 따라 전파되어, 초기의 작은 오해가 전체 작업을 오염시킨다.
해법은 책임을 분산해 시스템을 여러 구성요소로 분해하는 것이며, 멀티 에이전트 시스템은 '올바르게 확장한 결과'로서 등장한다.

쉽게 이해하기

강연은 도발적인 문장으로 시작한다. '에이전트는 데모하기는 쉽지만 확장하기는 놀라울 만큼 어렵다.' 의미 있는 작업을 끝까지 처리하는 에이전트를 만드는 일은 그 어느 때보다 쉬워졌고, 그래서 자연스럽게 '그냥 더 키우면 되지 않나'라는 질문이 따라온다. 더 많은 단계, 더 많은 작업, 더 적은 감독. 하지만 발표자는 에이전트를 확장할 때 실제로 무엇이 달라지는지를 먼저 들여다봐야 한다고 말한다.

전통적인 소프트웨어에서 확장은 잘 이해된 문제다. 사용자와 요청이 늘면 머신을 추가하거나(수평) CPU·메모리를 키워(수직) 대응하며, 본질적으로 더 많은 인프라가 같은 동작을 더 많이 처리한다. 그러나 에이전틱 시스템은 이 패턴을 깬다. 사람들이 '에이전트 확장'을 말할 때는 더 많은 요청을 처리하는 전통적 확장과, 시스템이 더 많은 일을 하도록 능력을 넓히는 확장을 뒤섞는데, 모든 것을 바꾸는 것은 후자다.

대부분의 에이전트는 계획(plan)·실행(도구 사용)·기억(context 저장)·반성(reflect)의 단순한 루프를 따른다. 좁은 범위의 작업에서는 이 루프가 훌륭하게 작동한다. 문제는 한정돼 있고, 몇 번의 결정으로 작업이 끝난다. 그러나 범위를 넓히면 루프 자체는 그대로여도 실행 비용이 달라진다. 계획은 길어지고, 더 많은 도구 중에서 선택해야 하며, 기억이 커지면서 매 단계에 전달되는 맥락이 늘어 잡음 속에서 신호를 찾기 어려워진다. 결국 지연과 비용이 비선형적으로 증가한다.

발표자는 '워싱턴으로 여행을 예약해줘'라는 여행 에이전트 예시로 더 위험한 문제를 보여준다. 에이전트가 항공·호텔·교통을 성공적으로 예약했지만, 모델이 '워싱턴'을 약 4,800km 떨어진 워싱턴주가 아니라 워싱턴 DC로 잘못 해석했다면, 그 잘못된 가정이 계획과 실행을 지배하고 기억에까지 기록된다. 작은 오류 하나가 상호작용 전체를 오염시킨 것이다. 에이전트가 자율적으로 동작할수록 사용자가 끼어들어 바로잡을 자연스러운 체크포인트가 없다는 점에서 이는 더 위험하다.

근본 원인은 '소유권'이다. 단일 에이전트가 모든 결정과 기억을 떠안으면, 회사의 모든 결정을 한 사람이 처리하는 조직처럼 병목이 된다. 이는 모델 능력의 한계가 아니라 책임을 어떻게 분산하느냐의 시스템 설계 문제다. 해법은 시스템을 책임이 분산된 여러 구성요소로 분해하는 것이고, 멀티 에이전트 시스템은 이렇게 올바르게 확장한 결과로 등장한다. 다만 새로운 능력을 별도 에이전트로 둘지(수평), 기존 에이전트에 내장할지(수직)는 트레이드오프이며, 발표자는 '재사용 가능하고 독립적이면 분리하고, 강하게 결합돼 맥락 의존적이면 내장하라'는 경험칙을 제시한다.

주요 인사이트

에이전트 확장의 핵심 비용은 '결정당 비용'이다. 기능을 더한 게 아니라 에이전트가 내려야 할 결정의 복잡도를 곱셈으로 키운 것이다.
에이전트의 오류는 고립되지 않고 전파된다. 자율 동작 중에는 사람이 개입할 자연스러운 체크포인트가 없어 작은 오해가 작업 전체로 번진다.
확장 문제는 모델 능력의 문제가 아니라 시스템 설계의 문제다. 한 에이전트가 너무 많은 책임을 지는 구조 자체가 병목이다.
멀티 에이전트는 목적이 아니라 결과다. 책임을 분산해 결정의 크기·비용·실패 범위를 통제하려는 시도에서 자연스럽게 나온다.
능력 배치 규칙: 재사용 가능하고 독립적인 기능(예: 팩트체크)은 별도 에이전트로, 기존 흐름에 강하게 결합된 기능(예: 검색 결과 재정렬)은 기존 에이전트에 내장한다.

자주 묻는 질문

에이전트 확장이 전통적인 소프트웨어 확장과 다른 점은 무엇인가요?

전통적 확장은 더 많은 요청을 같은 방식으로 더 많이 처리하는 것이지만, 에이전트 확장은 시스템이 '더 많은 일을 하도록' 능력을 넓히는 것이라 결정의 복잡도 자체가 커집니다.

에이전트의 실패는 왜 더 위험한가요?

실패가 고립되지 않고 시간 축을 따라 전파되기 때문입니다. 잘못된 초기 가정이 계획·실행·기억에 기록되어 전체 작업을 오염시키며, 자율 동작 중에는 바로잡을 체크포인트가 없습니다.

새로운 능력을 별도 에이전트로 만들지, 기존 에이전트에 넣을지 어떻게 판단하나요?

재사용 가능하고 독립적인 능력은 별도 에이전트로 분리하고, 기존 처리 과정과 강하게 결합되어 맥락을 공유해야 하는 능력은 기존 에이전트에 내장하는 것이 경험칙입니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗