AI VIDEO BRIEFING

페이블 5와 클로드 코드: 계획은 페이블, 추론은 오퍼스, 실행은 소넷

영상은 페이블 5의 복귀를 계기로, 모델의 지능 수준에 따라 계획·추론·실행 작업을 나눠 클로드 코드에서 비용과 속도를 최적화하는 계층적 에이전트 위임 전략을 소개한다.

'페이블 5'로 코딩 에이전트 계층화하기: 계획·추론·실행을 모델별로 나누는 전략 영상 대표 이미지

핵심 메시지

  • 영상은 앤트로픽의 소넷 5 출시 다음 날 페이블 5가 다시 사용 가능해졌다고 전하며, 오퍼스가 소넷보다 저렴해지는 이상한 가격 역전을 지적한다.
  • 핵심 아이디어는 모델을 지능 수준으로 계층화해, 비싼 상위 모델은 깊은 계획에, 저렴한 하위 모델은 단순 작업에 배치해 비용과 속도를 최적화하는 것이다.
  • 실제 구성 예시로 클로드 코드의 기본 모델을 페이블(effort 'x high')로 두고, 깊은 추론용 오퍼스 서브에이전트와 빠른 실행용 소넷 서브에이전트를 만들어 claude.md에 위임 규칙을 적는다.
  • 영상은 이 구성으로 태양계 인터랙티브 웹사이트와 스타크래프트 풍 게임을 만들었고, 두 예제만으로 세션 사용량의 47%를 소진했다고 밝힌다.
  • 페이블 5는 7월 7일 이후 보조 요금제에서 빠져 크레딧·API 비용으로 청구될 예정이며, 안전 라우팅 탓에 무해한 질문도 오퍼스로 우회되는 일관성 문제가 있다고 짚는다.

쉽게 이해하기

영상은 페이블 5가 '다시 메뉴에 올랐다'는 소식으로 시작한다. 발표자는 앤트로픽의 소넷 5가 나쁜 모델은 아니지만, 오퍼스가 일부 경우 소넷보다 저렴해지는 가격 구조의 역전이 이해되지 않는다고 지적하며, 페이블 5가 이런 애매함을 상쇄해 준다고 평가한다.

가장 실용적인 활용법으로 발표자는 '모델의 지능에 따라 작업을 계층적으로 나누기'를 제시한다. 상위 지능 모델은 비싸므로 깊은 계획과 위임에, 중간 모델은 깊은 추론에, 하위 모델은 잡무에 배치하면 가격과 속도를 함께 최적화할 수 있다는 것이다. 이 구조를 코딩 에이전트인 클로드 코드에 그대로 가져온다.

구체적 구현은 디에고의 방식을 인용한다. 클로드 코드의 기본 모델을 페이블로, effort를 'x high'로 설정한 뒤, 깊은 추론용 오퍼스 서브에이전트와 빠른 실행용 소넷 서브에이전트를 각각 만든다. 그리고 claude.md 파일에 페이블이 두 하위 에이전트에게 어떻게 작업을 위임할지 규칙을 적어 둔다.

발표자는 이 계층 구조로 태양계를 인터랙티브하게 보여주는 웹사이트와 즐겨 하던 스타크래프트를 닮은 게임을 만들어 보였다. 다만 이 두 예제만으로 세션 사용량의 47%와 7월 8일 만료 예정인 페이블 사용량의 7%를 소진했다고 덧붙인다.

영상 후반부는 산업적 함의로 넘어간다. 발표자에 따르면 앤트로픽은 6월 9일 미시스·페이블을 공개했다가 12일 수출 통제로 중단했고, 17일간 안전장치를 개편해 위험한 프롬프트를 오퍼스로 우회시키도록 만든 뒤 6월 30일 통제를 풀었다. 이 라우팅 탓에 네 자리 키패드 순열 같은 무해한 질문조차 오퍼스로 넘어가, 사용자가 답이 어느 모델에서 왔는지 확인해야 하는 혼란이 생긴다고 지적한다.

주요 인사이트

  • 단일 최강 모델을 고집하기보다, 작업 난이도에 맞춰 여러 모델을 계층적으로 배치하는 것이 비용과 속도를 동시에 잡는 현실적인 전략이라는 점을 보여준다.
  • 클로드 코드의 서브에이전트와 claude.md 위임 규칙을 활용하면, 상위 모델이 오케스트레이터 역할을 하고 하위 모델이 실행을 맡는 분업 구조를 실제로 구현할 수 있다.
  • 강력한 모델도 짧은 데모 두 개에 세션 사용량의 절반 가까이를 소진할 만큼 토큰 비용이 크므로, 사용량 관리와 모델 배분이 실전에서 중요하다.
  • 안전을 위한 프롬프트 라우팅은 필요하지만, 무해한 질문까지 상위 모델로 우회시키면 사용자 경험의 일관성이 떨어진다는 딜레마를 영상은 드러낸다.

자주 묻는 질문

계층적 모델 위임은 구체적으로 어떻게 설정하나요?

영상에 따르면 클로드 코드의 기본 모델을 페이블로 두고 effort를 'x high'로 설정한 뒤, 깊은 추론을 담당할 오퍼스 서브에이전트와 빠른 실행을 담당할 소넷 서브에이전트를 만듭니다. 그리고 claude.md 파일에 페이블이 이 하위 에이전트들에게 작업을 어떻게 위임할지 규칙을 적어 둡니다.

페이블 5의 요금은 앞으로 어떻게 되나요?

영상에 따르면 페이블 5는 현재 자체 사용량 바가 있는 보조 요금제에 포함되어 있지만, 7월 7일 이후에는 보조 요금제에서 빠져 사용자의 크레딧이나 API 비용으로 청구될 예정입니다.

안전 라우팅이 사용자 경험에 어떤 문제를 일으키나요?

영상은 네 자리 키패드 순열 개수를 묻는 무해한 질문조차 안전 메커니즘에 걸려 오퍼스 모델로 우회된 사례를 듭니다. 사용자가 페이블을 골랐는데도 답이 실제로 어느 모델에서 나왔는지 매번 확인해야 하는 혼란이 생긴다고 지적합니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식