AI VIDEO BRIEFING
Claude Opus 4.6 핵심 정리: 100만 토큰·에이전트 팀·요금·벤치마크
Claude Opus 4.6의 100만 토큰 컨텍스트, 새로운 에이전트 팀 기능, 요금 체계와 벤치마크, 병렬 에이전트로 C 컴파일러를 만든 사례까지 핵심만 정리했습니다.

핵심 메시지
쉽게 이해하기
이 영상은 Claude Opus 4.6을 약 10분 분량으로 훑으며 핵심 변화와 새 기능을 정리한다. 앤스로픽은 이 모델을 현재까지 가장 똑똑한 모델로 소개하며, 코딩 실력이 좋아지고 더 신중하게 사고·계획하며, 장기적인 에이전트 작업을 더 오래 지속하고 큰 코드베이스에서 더 안정적으로 동작한다고 밝혔다. 특히 큰 도약은 100만 토큰 컨텍스트로, 다만 현재 베타 단계임에 유의해야 한다.
벤치마크에서는 지식 노동, 에이전트 검색, 코딩, 추론 등 여러 항목에서 다수 모델을 앞선다. 다만 결과는 다소 엇갈린다. 에이전트 코딩에서는 오히려 Opus 4.5가 근소하게 앞서지만, 에이전트 터미널 코딩에서는 4.6이 4.5·Sonnet·Gemini 3 Pro를 크게 앞지른다. 에이전트 검색은 전 영역에서 확연히 우수하고, 도구를 사용한 '인류 최후의 시험(Humanities Last Exam)' 다분야 추론에서는 53.1%를 기록했다. 반면 일부 항목은 여전히 Opus 4.5가, 또 일부는 GPT 5.3이 앞선다. 발표 직후 GPT 5.3 Codex가 나온 점도 언급된다.
API에는 컨텍스트 압축(context compaction)과, 작업 난이도에 따라 모델이 사고량을 스스로 정하는 '적응형 사고(adaptive thinking)'가 추가됐다. 사용 경로는 Claude 앱과 API이며, 요금은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러다. 다만 컨텍스트가 20만 토큰을 넘으면 상위 요금대가 적용돼 비용이 크게 늘어나므로 입·출력이 많은 작업에서는 주의해야 한다.
가장 흥미로운 실험적 기능은 Claude Code의 '에이전트 팀'이다. settings.json에서 실험 기능을 켜면, 여러 에이전트가 매번 메인 오케스트레이터로 돌아가지 않고 서로 직접 조율한다. 덕분에 부모 스레드를 깨끗하게 유지해 장기 과제에서 더 오래 일관성을 유지할 수 있다. 팀 리더가 자원을 분배하듯 동작하고, 팀원들끼리 토큰을 공유한다. 세션을 자동으로 띄워 각 팀원을 개별 Claude Code 세션처럼 탭으로 오가며 개입할 수 있으며(shift+방향키), 설정에는 tmux와 iTerm 2가 선호된다. 여러 세션을 동시에 돌리므로 비용이 늘 수 있지만, 상위 요금제 구독자라면 큰 문제가 아닐 수 있다.
주요 인사이트
- 서브 에이전트는 오케스트레이터에게 보고해야 하지만, 에이전트 팀은 팀원들이 직접 소통하고 공유 스크래치패드·할 일 목록 같은 공통 자원을 함께 쓴다는 점이 핵심 차이다.
- 100만 토큰 컨텍스트는 긴 컨텍스트 검색과 장기 추론에서 큰 도약을 가져와, Opus 4.6이 Sonnet 4.5보다 확연히 낫다고 영상은 전한다.
- 앤스로픽의 엔지니어링 사례에서는 병렬 Claude 팀이 2천 회 이상의 Claude Code 세션과 약 2만 달러의 API 비용으로 10만 줄짜리 C 컴파일러를 만들었고, 그 컴파일러로 Linux 6.9를 빌드하고 Doom까지 구동했다.
- 그 사례의 교훈으로는 아주 높은 품질의 테스트 작성, Claude의 관점에서 생각하기, 상세한 readme·진행 파일로 컨텍스트를 외부화하고 오염을 피하기, LLM의 '시간 감각 부재'를 보완하기 위해 무작위로 시간 정보를 주입하기 등이 제시됐다.
- 에이전트에 백엔드·프론트엔드 엔지니어, 팀 리더, 제너럴리스트 같은 역할을 부여해 작업을 분담시키는 방식이 소개되며, 커서(Cursor)는 에이전트가 시간당 최대 1천 건의 커밋을 하는 실험도 했다고 언급된다.
자주 묻는 질문
Claude Opus 4.6의 가장 큰 변화는 무엇인가요?
베타로 제공되는 100만 토큰 컨텍스트와, 코딩·계획·장기 에이전트 작업에서의 향상입니다. 또한 API에 컨텍스트 압축과 작업 난이도에 따라 사고량을 스스로 정하는 적응형 사고가 추가됐습니다.
'에이전트 팀'은 서브 에이전트와 어떻게 다른가요?
서브 에이전트는 결과를 메인 오케스트레이터 에이전트에게 보고해야 하지만, 에이전트 팀은 팀원들이 서로 직접 협력하고 공통 자원을 공유합니다. 덕분에 부모 스레드를 깨끗이 유지해 장기 과제에서 더 오래 일관성을 지킬 수 있습니다.
요금은 어떻게 되나요?
입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러입니다. 다만 컨텍스트가 20만 토큰을 넘어가면 상위 요금대가 적용돼 비용이 크게 늘어나므로, 입력과 출력이 많은 작업에서는 주의가 필요합니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗