AI VIDEO BRIEFING

Anthropic Mythos·Fable 5 공개 — 벤치마크·가격·특징 총정리

Anthropic이 Mythos 모델과 그 가드레일 버전인 Fable 5를 공개했다. 영상은 직접 사용 경험을 토대로 벤치마크, 가격, 그리고 매우 장황하고 느리지만 강력한 모델의 특징을 정리한다.

Anthropic, "너무 위험하다던" Mythos 공개… 가드레일 입힌 Fable 5도 함께 출시 영상 대표 이미지

핵심 메시지

  • Anthropic이 Mythos와 그 안전 버전인 Fable 5를 공개했다. Fable은 가드레일이 있는 일반용, Mythos는 가드레일을 제거해 보안 커뮤니티에 제공되는 버전이다.
  • 영상에 따르면 Fable 5는 SWE-bench Pro에서 80%로 Opus 4.8(69%), GPT 5.5(58%)를 앞섰고 여러 벤치마크에서 최상위를 기록했다.
  • 가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로, 발표자는 대부분의 작업에는 더 저렴한 모델 라우팅을 권한다.
  • 모델은 긴 자율 작업에 강하지만 매우 장황하고 정보 밀도가 높으며, 명확화 질문이 잦고 시작이 느리다는 특징이 있다.
  • Anthropic은 Mythos급 모델에 대해 30일 데이터 보존 정책을 두고, 디스틸레이션 시도로 분류된 요청은 Opus 4.8로 대체한다고 밝혔다.

쉽게 이해하기

영상은 Anthropic이 한때 "공개하기엔 너무 위험하다"고 했던 Mythos 모델을 실제로 공개했다는 소식으로 시작한다. 함께 발표된 Fable 5는 Mythos 계열을 일반 사용에 맞게 안전화한 모델로, 기존 Haiku·Sonnet·Opus에 더해지는 새로운 세대다. Mythos는 가드레일을 제거해 소프트웨어 취약점 탐색 등 보안 강화 목적에 제공되고, Fable은 가드레일을 갖춰 일반 용도에 쓰인다. 발표자는 이를 10조 파라미터 규모의 모델이라고 전한다.

벤치마크에서는 에이전트 코딩 지표인 SWE-bench Pro에서 80%를 기록해 Opus 4.8(69%), GPT 5.5(58%)를 앞섰고, Frontier Code, GDPval, 컴퓨터 사용, Terminal Bench, Humanity's Last Exam 등에서 최상위권을 보였다고 소개한다. 다만 발표자는 벤치마크 수치가 실제 사용 느낌과 항상 일치하지는 않는다는 점도 덧붙인다.

가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로 책정됐다. 발표자는 이것이 비싸지만 대부분의 작업에는 Fable이 필요하지 않다며, 가장 어려운 문제에만 최상위 모델을 쓰고 나머지는 Sonnet·Haiku로 돌리는 모델 라우팅을 권한다. 예로 Stripe가 5천만 줄 규모의 Ruby 코드베이스 마이그레이션을, 팀이 두 달 걸릴 작업을 하루 만에 처리했다는 사례를 든다.

실사용 인상으로는 모델이 작은 작업도 코드베이스 전체를 탐색하듯 크게 받아들이고, 긴 시간이 걸리는 복잡한 작업도 막힘없이 처리했다고 한다. 토큰 효율은 높지만 출력이 매우 장황하고 정보 밀도가 높아 읽기 어려웠고, 어떤 작업이든 명확화 질문을 거듭 던지며 확인을 요구하고, 시작이 느려 첫 5~8분간 무엇을 하는지 알기 어려웠다는 점을 단점으로 꼽는다.

안전·정책 측면에서는 보호장치를 보수적으로 설정해 평균적으로 5% 미만의 세션에서 작동한다고 전한다. 또한 Mythos급 모델에는 30일 데이터 보존 정책을 적용하고, 디스틸레이션(증류) 시도로 분류된 요청은 Fable 대신 Opus 4.8로 대체한다고 밝혔다. 발표자는 이를 경쟁사가 자사 모델을 베껴 학습하는 것을 막으려는 의도로 해석한다.

끝으로 영상은 Fable이 수백 개의 서브 에이전트를 병렬로 돌리는 워크플로(ultra code) 기능, 그리고 목표 달성까지 반복하는 "루프"와 결합될 때의 잠재력을 강조한다. 루빅스 큐브 시뮬레이션, 실시간 유체 시뮬레이션, 비전만으로 포켓몬 파이어레드 클리어 같은 데모도 소개한다.

주요 인사이트

  • 하나의 모델을 가드레일 유무로 나눠, 보안 연구용(Mythos)과 일반용(Fable)으로 분리해 내놓는 전략이 눈에 띈다.
  • 최상위 모델은 비싸므로 작업 난이도에 따라 모델을 골라 쓰는 "모델 라우팅"의 중요성이 점점 커지고 있다.
  • 높은 정보 밀도는 효율을 높이지만 사람이 읽기 어려워질 수 있어, 모델이 더 압축적인 표현을 쓸수록 가독성과 투명성의 긴장이 생긴다.
  • 디스틸레이션 차단과 30일 데이터 보존 같은 정책은 기술 유출 방지와 안전 대응이라는 목적과 함께, 경쟁 우위 유지라는 동기도 함께 읽힌다.
  • 강력한 모델, 병렬 워크플로, 반복 루프가 결합되면 "소프트웨어를 만드는 공장"의 잠재력이 커지지만, 토큰 비용 폭증이라는 현실적 제약이 따른다.

자주 묻는 질문

Mythos와 Fable 5의 차이는 무엇인가?

둘은 같은 Mythos 계열 모델이지만 가드레일 유무가 다르다. Mythos는 가드레일을 제거해 보안 취약점 탐색 등에 쓰이도록 보안 커뮤니티에 제공되고, Fable 5는 가드레일을 갖춰 일반 용도에 안전하게 쓸 수 있게 만든 버전이다.

Fable 5의 가격은 어떻게 되나?

입력은 100만 토큰당 10달러, 출력은 100만 토큰당 50달러다. 영상은 이를 비싸다고 보면서도, 대부분의 작업에는 더 저렴한 모델을 쓰고 가장 어려운 문제에만 최상위 모델을 쓰는 라우팅을 권한다.

발표자가 꼽은 Fable 5의 단점은 무엇인가?

출력이 매우 장황하고 정보 밀도가 높아 읽기 어렵고, 어떤 작업이든 명확화 질문과 확인을 거듭 요구하며, 시작이 느려 초반 몇 분간 무엇을 하는지 파악하기 어려웠다는 점이다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식