AI VIDEO BRIEFING

도메인 특화 AI 에이전트: 만능 에이전트의 한계와 컴포지션 전략

하나의 거대한 에이전트에 스킬과 MCP를 끝없이 붙이는 방식의 한계를 짚고, 작은 도메인 특화 에이전트를 조합하는 컴포지션 전략이 토큰 효율·보안·확장성에서 왜 유리한지 정리했다.

출처: AI Engineer2026년 6월 29일AI 보조 요약

"만능 에이전트는 한계가 있다" — 도메인 특화 AI 에이전트가 다음 판을 바꾼다 영상 대표 이미지

핵심 메시지

에이전트는 모델의 비결정적 결과를 특정 목적을 위해 다루는 결정적 소프트웨어이며, 사실상 '하니스'와 같은 개념이다.
기업들이 자사 데이터를 AI에 통합하려고 직접 에이전트를 만들지만, 에이전트 루프 orchestration·관측성·이식성·조합성 문제로 데모 수준을 넘기기 어렵다.
MCP는 사실상 '도구 배포 수단'에 머물렀고 스킬은 문서일 뿐이어서, 거대 에이전트에 컨텍스트를 계속 더하는 방식(상속)은 결국 한계에 부딪힌다.
대안은 컴포지션이다. 각자 자기 시스템 프롬프트·도구·짧은 대화 이력을 가진 작은 도메인 특화 에이전트들이 자연어로 소통하고, 상위 코디네이터가 조율한다.
도메인 특화 에이전트는 토큰 효율(80% 이상 절감 사례), 작은 모델 활용에 따른 비용 절감, 권한 제한, 병렬 확장성 면에서 유리하다.

쉽게 이해하기

발표자 저스틴 슈레이더는 지금을 '가속화된 산업혁명'에 비유한다. 과거 산업혁명의 핵심이 기계로 에너지를 다루는 법을 익힌 것이었다면, 지금은 에이전트로 지능을 다루는 법을 배우는 시기이며, 에이전트가 곧 '지능을 사용하는 기계'에 해당한다는 것이다.

그는 에이전트를 '모델이 만들어내는 비결정적 결과를 특정 목표를 위해 다루는 결정적 소프트웨어'로 정의한다. 흥미롭게도 우리는 이미 에이전트 시대에 깊이 들어와 있으면서도 에이전트의 정의조차 합의하지 못했고, 부동산 중개소부터 포춘 500 기업까지 모두가 자사 데이터를 AI에 통합하려고 직접 커스텀 에이전트를 만들고 있다고 지적한다.

문제는 에이전트가 어렵다는 점이다. 에이전트 루프 orchestration, 다양한 제공자 추상화, 장애 복구를 위한 durable execution, 각종 검증과 중단 조건이 필요하고, 관측성 확보도 매우 어렵다. 게다가 잘 만든 에이전트도 '내 컴퓨터에서만 잘 돌아가고' 남에게 넘기면 환경 차이로 깨지기 쉬우며, 재사용·조합도 쉽지 않다.

많은 사람이 결국 MCP로 후퇴하지만, MCP 클라이언트들이 실제로 끝까지 채운 항목은 '도구(tools)'뿐이어서 MCP는 사실상 도구 배포 수단이 되었다. 도구만으로는 부족하다는 것이 그의 진단이다. 스킬 역시 본질적으로 마크다운 문서이며, 너무 많이 쓰면 오히려 에이전트 성능이 나빠진다는 연구도 있다.

에이전트 스택(모델·시스템 프롬프트·도구·스킬·MCP·메시지)을 뜯어보면 대부분이 컨텍스트다. 거대 에이전트에 계속 레이어를 더해 능력을 확장하는 방식은 객체지향의 '상속'과 같은데, 스킬이 5개일 때는 괜찮아도 100개·1000개가 되면 수확 체감에 빠진다. 그래서 그는 '상속보다 컴포지션'이라는 오래된 격언을 끌어온다.

컴포지션 방식에서는 예컨대 피그마 전용 에이전트가 피그마에 관한 시스템 프롬프트·API·동작과 꼭 필요한 도구, 짧은 메시지 이력만 갖춘 독립된 풀 에이전트로 존재한다. 이런 작은 에이전트들 위에 코디네이터를 두고, 에이전트끼리는 사람처럼 영어(자연어)로 대화한다. 그는 이를 아폴로 11호 발사처럼 각자 다른 전문성을 가진 전문가 팀에 비유한다.

그가 '도메인 특화 에이전트'라 부르는 이 방식의 장점은 분명하다. 작업당 80% 이상의 토큰 효율을 흔히 보고, 코디네이터가 '데비가 보낸 마지막 메일 가져와' 같은 최소 컨텍스트만 넘기면 되므로 작은 언어모델로도 충실히 처리된다. 그는 DeepSeek V4 Flash와 Fable 5의 작업당 비용 차이가 어마어마하다고 언급하며(최대 100배 이상 수준), 작은 모델은 특화된 작업만 맡으면 된다고 강조한다.

또한 각 에이전트가 할 수 있는 일을 명시적으로 제한할 수 있어 보안 측면에서 IT 부서를 안심시킬 수 있고, 각 에이전트가 독립 실행 환경이라 손쉽게 병렬화·클라우드 확장이 가능하다. 다만 아직 이런 도메인 특화 에이전트가 공개적으로 널리 존재하지는 않는다는 점이 한계다.

그는 2026년 하반기에 도메인 특화 에이전트와 관련 프레임워크 논의가 급증하고, 2027년은 '멀티 에이전트 orchestration의 해'가 될 것이라 예측한다. 근거 중 하나로 2026년 들어 토큰 비용이 다시 오르고 있다는 점(IQ 보정 시 약 30%, 비보정 시 약 76% 상승)을 든다. 또 비싼 최상위 모델을 고객 앞에 그대로 내놓기는 어렵기 때문에, 효율과 효과를 동시에 잡는 도메인 특화 에이전트가 답이 될 것이라고 본다.

끝으로 그는 이상적인 에이전트의 모습을 그린다. 도구 계층은 실제 함수, 작은 프롬프트(서브 LLM 호출), 또 다른 완전한 에이전트까지 포함하고, 훅으로 현재 시각 주입 같은 부수효과를 처리하며, 턴 한도 같은 에이전트 규칙을 둔다. 모든 에이전트는 샌드박스 파일시스템과 안전한 코드 실행 환경을 기본으로 갖춰야 하며, 코디네이터 아래에 세일즈포스·구글 워크스페이스·자산 생성·법무·GDPR 준수 같은 재귀적 하위 에이전트를 두되 각자의 컨텍스트는 최소로 유지하는 것이 핵심이라고 정리한다.

주요 인사이트

에이전트 설계의 핵심 긴장은 '상속(거대 에이전트에 컨텍스트를 계속 추가) vs 컴포지션(작은 전용 에이전트의 조합)'으로 요약된다. 규모가 커질수록 컴포지션이 유리하다.
작은 도메인 특화 에이전트는 최소 컨텍스트만 다루기 때문에, 작고 저렴한 모델로도 특정 작업을 충실히 수행해 큰 비용 절감을 가져온다.
각 에이전트의 능력을 명시적으로 제한하는 구조는 '무엇이든 할 수 있어 권한을 마구 우회하는' 거대 에이전트보다 보안·통제 면에서 안전하다.
에이전트 간 통신을 자연어로 두면 사람 조직처럼 코디네이터-전문가 구조를 그대로 흉내 낼 수 있어 직관적으로 작동한다.
2026년 들어 (IQ 보정 기준으로도) 토큰 비용이 다시 상승세로 돌아선 것이 효율적 에이전트 설계의 필요성을 키우고 있다.

자주 묻는 질문

발표자가 말하는 '도메인 특화 에이전트'란 무엇인가?

특정 도메인(예: 피그마, 세일즈포스)에 맞춘 시스템 프롬프트와 꼭 필요한 도구, 짧은 메시지 이력, 자체 에이전트 루프를 갖춘 작은 풀 에이전트를 말한다. 이런 에이전트들을 코디네이터가 자연어로 조율한다.

왜 거대한 만능 에이전트에 스킬과 MCP를 계속 더하는 방식이 한계에 부딪히나?

스킬·MCP·시스템 프롬프트 등 대부분이 컨텍스트로 쌓이는데, 이는 객체지향의 '상속'과 같아 항목이 100개·1000개로 늘면 수확 체감에 빠지기 때문이다. 그래서 '상속보다 컴포지션'이 대안으로 제시된다.

도메인 특화 에이전트의 구체적 이점은?

작업당 80% 이상의 토큰 효율 사례, 작은 모델 활용으로 인한 비용 절감, 에이전트 능력의 명시적 제한을 통한 보안 강화, 독립 실행 환경 덕분의 손쉬운 병렬화·확장이 꼽힌다.

발표자는 향후 흐름을 어떻게 전망하나?

2026년 하반기부터 도메인 특화 에이전트와 관련 프레임워크 논의가 급증하고, 2027년은 멀티 에이전트 orchestration의 해가 될 것이라고 예측한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗