AI VIDEO BRIEFING

멀티 에이전트 아키텍처 개념 가이드: 네트워크·슈퍼바이저·계층형·커스텀 구조

단일 에이전트의 한계에서 출발해 네트워크·슈퍼바이저·계층형 등 멀티 에이전트 아키텍처의 차이와, 에이전트가 상태 공유 또는 도구 호출로 소통하는 방식을 개념적으로 정리한다.

멀티 에이전트 시스템 개념 정리: 네트워크·슈퍼바이저·계층형 구조의 차이 영상 대표 이미지

핵심 메시지

  • 시스템은 LLM이 애플리케이션의 제어 흐름을 많이 결정할수록 더 '에이전트답다'고 본다. 가장 단순한 형태는 도구를 호출하는 LLM이다.
  • 단일 에이전트는 도구가 너무 많거나, 맥락이 너무 복잡해지거나, 여러 전문 분야가 필요할 때 한계를 드러낸다. 도구는 5~10개가 적정선이다.
  • 멀티 에이전트는 모듈성·전문화·제어력에서 이점이 있으며, 핵심은 에이전트들이 서로 어떻게 소통하는가다.
  • 대표 아키텍처로 네트워크형, 슈퍼바이저형, 계층형이 있으나, 프로덕션에서 가장 많이 쓰이는 것은 도메인에 맞춘 커스텀 인지 아키텍처다.
  • 에이전트 간 소통은 공유 상태(state)를 함께 읽고 쓰는 방식과, 도구 호출 파라미터만 주고받는 방식으로 나뉜다.

쉽게 이해하기

영상은 멀티 에이전트 시스템을 개념 수준에서 다룬다. 출발점은 단일 에이전트로, 가장 단순하게는 '도구를 호출하는 LLM'이다. 시작하기엔 좋지만 복잡도가 커지면 한계가 생긴다. 도구가 너무 많으면 어떤 도구를 부를지 잘못 판단하고(적정선은 5~10개), 호출과 상호작용이 늘수록 맥락이 LLM의 컨텍스트 윈도를 넘어서며, 플래너·리서처·수학 전문가·코더처럼 여러 전문 영역이 필요해진다.

멀티 에이전트의 이점은 세 가지다. 개발·테스트·유지보수가 쉬운 모듈성, 특정 도메인에 집중한 전문 에이전트를 만들 수 있는 전문화, 그리고 LangGraph 같은 저수준 제어 프레임워크로 에이전트 간 소통 패턴을 명시적으로 통제할 수 있는 제어력이다.

대표 아키텍처를 비교한다. 네트워크형은 각 에이전트가 자기 도구를 갖고 다음 차례를 스스로 정해 서로 호출하는데, swarm·crew AI가 대표적이지만 통제가 느슨해 신뢰성이 낮고 호출이 많아 시간·비용이 커서 프로덕션에는 권하지 않는다. 슈퍼바이저형은 한 에이전트가 오직 다른 에이전트로 라우팅만 맡아 하위 에이전트는 자기 일에만 집중하게 한다. 이를 단순화하면 하위 에이전트들을 중앙 LLM의 '도구'로 넘기는 형태가 된다.

계층형은 슈퍼바이저를 여러 층으로 쌓아, 하위 에이전트 자체가 또 다른 슈퍼바이저가 되도록 한다. 많은 하위 에이전트를 전문 그룹으로 묶을 때 유용하다. 다만 영상은 실무에서 가장 흔한 것은 기성 슈퍼바이저·계층형이 아니라, 그 요소를 빌리되 도메인에 맞춘 완전한 커스텀 인지 아키텍처라고 강조한다.

소통 방식은 크게 둘이다. 하나는 메시지 목록·아티팩트 등을 담은 공유 상태 객체에 두 에이전트가 함께 쓰는 방식이고, 다른 하나는 에이전트1이 도구 호출 파라미터만 채워 에이전트2에 넘기고 결과만 돌려받는 방식이다. 서로 다른 상태를 가진 에이전트는 공유 키 몇 개로만 소통하면 되고, 메시지 목록을 공유할 때는 모든 도구 호출을 다 쌓을지, 최종 응답만 공유 목록에 올리고 내부 도구 호출은 별도 목록으로 관리할지 선택할 수 있다.

주요 인사이트

  • '에이전트다움'은 이분법이 아니라 정도의 문제이며, LLM이 제어 흐름을 더 많이 결정할수록 더 에이전트답다.
  • 단일 에이전트의 도구는 5~10개가 적정선이라는 경험칙은, 도구가 많을수록 선택 실수가 늘어난다는 실무 관찰에 기반한다.
  • 네트워크형처럼 누구나 누구든 호출할 수 있는 느슨한 구조는 통제가 어려워 비싸고 불안정하므로 프로덕션에는 부적합하다.
  • 하위 에이전트를 '도구'로 넘기면 단순하지만, 에이전트들이 공유 상태가 아닌 도구 호출 파라미터로만 소통하게 되는 차이가 생긴다.
  • 정작 프로덕션에 도달하는 것은 기성 아키텍처가 아니라 도메인에 맞춘 커스텀 인지 아키텍처라는 점이 실무의 핵심 메시지다.

자주 묻는 질문

단일 에이전트는 언제 한계에 부딪히나요?

도구가 너무 많아 어떤 것을 호출할지 잘못 판단할 때, 호출과 상호작용이 늘어 맥락이 컨텍스트 윈도를 넘어설 때, 그리고 플래너·리서처·코더처럼 여러 전문 영역이 한 프롬프트에 다 들어가기 어려울 때입니다. 영상은 도구 수 5~10개를 적정선으로 봅니다.

네트워크형 멀티 에이전트를 프로덕션에 권하지 않는 이유는?

각 에이전트가 언제든 다른 어떤 에이전트로도 라우팅할 수 있어 통제가 너무 느슨하기 때문입니다. 그 결과 LLM 호출이 많아져 불안정하고 시간과 비용이 많이 들어, 영상은 프로덕션용으로는 일반적으로 권하지 않습니다.

에이전트끼리는 어떻게 소통하나요?

두 가지 방식이 있습니다. 메시지 목록 같은 공유 상태 객체에 두 에이전트가 함께 읽고 쓰는 방식과, 한 에이전트가 도구 호출 파라미터만 채워 다른 에이전트에 넘기고 그 결과만 돌려받는 방식입니다. 상태가 서로 달라도 공유 키 몇 개만 맞추면 협업할 수 있습니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식