AI VIDEO BRIEFING

Fable 5 코딩 후기: 강력한 성능과 안전장치, 높은 비용까지 직접 검증

앤트로픽의 ‘Mythos 계열’ 모델 Fable 5를 직접 코딩에 써본 후기. 병렬 에이전트와 보안 점검 능력, 사이버보안·생물학 차단 안전장치, 2배 비싼 가격과 느린 속도까지 실사용 경험을 정리했다.

‘안전장치 두른 최강 모델’ Fable 5 직접 써보니… 강력하지만 느리고 비쌌다 영상 대표 이미지

핵심 메시지

  • 영상 제작자는 앤트로픽이 ‘Mythos 계열’을 일반에 안전하게 공개한 버전이라며 내놓은 Fable 5를 하루 남짓 직접 코딩에 써본 후기를 전한다.
  • Fable 5는 사이버보안·생물학·ML/LLM 연구 관련 질의가 감지되면 곧바로 차상위 모델인 Opus 4.8로 전환되는 강한 안전장치를 갖고 있어, 평범한 코딩 중에도 종종 작업이 막힌다.
  • 성능은 제작자가 써본 코딩 모델 중 최고라고 평가하지만, Opus의 2배 가격에 같은 작업이 약 10배 느리고 5배 비쌌다고 말한다.
  • 단일 목표를 주면 8개의 병렬 에이전트를 띄워 프런트엔드 재설계와 보안 취약점 점검을 동시에 수행하는 등, ‘목표 기반’ 작업에서 특히 강점을 보였다.
  • AI가 찾은 결과를 직접 코드로 확인하지 않으면 안 된다는 점도 강조한다. 실제로 멀쩡한 의도된 기능을 버그로 오탐하는 등 거짓 양성이 있었다.

쉽게 이해하기

영상은 앤트로픽이 ‘Mythos 계열’ 모델을 일반 사용자가 안전하게 쓸 수 있게 만든 버전이라며 공개한 Fable 5를, 제작자가 출시 하루 만에 직접 코딩에 써본 경험을 다룬다. 제작자는 평소 월 100달러짜리 상위 요금제를 거의 한도까지 쓰지 않는데, Fable 5는 약 30분 만에 사용 한도를 모두 소진시킬 만큼 자원을 많이 쓴다고 전한다. 가격도 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로 Opus 4.8의 약 2배이며 한도도 2배 빠르게 소모된다.

가장 큰 화두는 ‘안전장치’다. 영상에 따르면 Fable 5는 사이버보안, 생물학·생명과학, ML/LLM 연구처럼 민감한 주제가 조금이라도 감지되면 질의를 차상위 모델인 Opus 4.8로 넘긴다. 특히 ML·LLM 개발 영역에서는 모델 전환 사실을 사용자에게 알리지 않고, 다른 모델로 ‘되돌리는’ 대신 프롬프트 수정·스티어링 벡터·파라미터 효율적 파인튜닝 같은 방법으로 성능 자체를 제한한다고 한다. 제작자는 ‘미토콘드리아가 세포의 발전소냐’ 같은 단순 질문조차 생물학으로 분류돼 차단되는 사례를 들며, 안전장치가 지나치게 민감하다고 지적한다.

제작자는 자신의 URL 단축 서비스(타입스크립트 TanStack Start 프로젝트)를 대상으로 보안 점검을 시켰다. Fable 5는 6개의 병렬 리뷰 에이전트를 띄워 코드베이스를 훑었고, 인증 검사 없이 비밀번호 해시가 담긴 행 전체를 반환하던 ‘죽은 코드’ 엔드포인트를 찾아 삭제하는 좋은 수정을 해냈다. 반면 관리자가 다른 관리자를 초대할 수 있는 ‘의도된 기능’을 권한 상승 버그로 오인하는 거짓 양성도 냈는데, 실제로는 코드에 역할 검증이 있었음에도 그 부분을 놓친 것이다. 제작자는 그래서 AI의 점검 결과를 직접 코드로 확인하지 않고 그대로 반영해선 안 된다고 강조한다.

성능과 비용의 트레이드오프도 솔직하게 정리한다. 제작자는 Fable 5가 자신이 써본 코딩 모델 중 최고이며 버그 탐지·수정에서 Opus 4.8과 GPT 5.5보다 나았다고 본다. 단, 같은 기능을 구현시켰을 때 Opus·GPT는 2~3분에 2~3달러였던 반면 Fable 5는 23분에 11달러로, 약 10배 느리고 5배 비쌌다. 또한 한 번에 수십만 줄의 코드를 쏟아내 검토 부담이 크고, 비주얼·일상적 코딩보다는 명확한 목표를 주고 알아서 끝까지 수행하게 하는 ‘목표 기반’ 작업에서 진가를 발휘한다고 말한다.

그 강점의 예로, 제작자는 225줄짜리 설계 문서 하나를 주고 ‘끝까지 알아서 완성하라’고 지시해 여러 병렬 에이전트가 협업해 ‘사운드스케이프 타임머신’ 웹앱을 만들어 낸 사례를 보여준다. 1850년부터 2026년까지 특정 도시 거리의 소리를, 녹음이 아니라 브라우저에서 수학적으로 합성해 들려주는 앱이다. 끝으로 제작자는 Fable 5가 6월 23일부터 구독 요금제에서 빠지고 API 사용 크레딧으로만 제공되며, 30일 데이터 보존 정책 때문에 제로 데이터 보존이 필요한 기업·규제 환경에서는 쓰기 어렵다는 점을 짚는다. 모델 자체는 인상적이지만 앤트로픽이 최상위 모델을 소수 승인 기업에만 제공하려는 흐름에는 비판적인 시각으로 마무리한다.

주요 인사이트

  • Fable 5는 사이버보안·생물학·ML/LLM 연구 주제가 감지되면 차상위 모델로 전환되는 강한 안전장치를 갖고 있어, 평범한 코딩 중에도 작업이 예기치 않게 막힐 수 있다.
  • 안전장치는 단순히 모델을 되돌리는 데 그치지 않고, 일부 영역에서는 사용자에게 알리지 않은 채 프롬프트 수정이나 스티어링 등으로 성능 자체를 제한한다고 영상은 전한다.
  • AI가 보고한 보안 점검 결과에는 거짓 양성이 섞일 수 있어, 의도된 기능을 버그로 오인하기도 한다. 결과는 반드시 사람이 코드로 직접 검증해야 한다.
  • Fable 5는 강력하지만 같은 작업 기준으로 Opus·GPT보다 약 10배 느리고 5배 비싸, 일상적 코딩보다는 명확한 목표를 맡겨 끝까지 수행시키는 방식에 적합하다.
  • 한 번 실행으로 수십만 줄의 코드를 생성하기 때문에, 속도·비용뿐 아니라 방대한 코드 검토 부담도 함께 고려해야 한다.
  • 6월 23일 이후 구독 요금제에서 제외되고 30일 데이터 보존이 요구돼, 제로 데이터 보존이 필요한 기업·규제 환경에는 부적합하다는 점도 도입 전 짚어야 할 제약이다.

자주 묻는 질문

Fable 5의 ‘안전장치’는 구체적으로 어떻게 작동하나요?

사이버보안, 생물학·생명과학, ML/LLM 연구 같은 민감 주제가 조금이라도 감지되면 질의가 차상위 모델인 Opus 4.8로 전환됩니다. 영상에 따르면 ML·LLM 개발 영역에서는 전환 사실을 사용자에게 알리지 않고, 프롬프트 수정·스티어링 벡터·파라미터 효율적 파인튜닝 등으로 성능 자체를 제한하기도 합니다.

Fable 5의 코딩 성능과 비용은 어떤가요?

제작자는 Fable 5가 자신이 써본 코딩 모델 중 최고이며 버그 탐지·수정에서 가장 뛰어났다고 평가합니다. 다만 같은 기능을 구현했을 때 Opus·GPT가 2~3분에 2~3달러였던 반면 Fable 5는 23분에 11달러로, 약 10배 느리고 5배 비쌌다고 합니다.

Fable 5는 어떤 작업에 가장 적합한가요?

비주얼 작업이나 주고받는 일상적 코딩보다는, 명확한 목표나 설계 문서를 한 번에 주고 모델이 여러 병렬 에이전트를 띄워 끝까지 알아서 수행하게 하는 ‘목표 기반’ 작업에서 강점을 보입니다. 제작자는 225줄 설계 문서만으로 완성된 웹앱 사례를 예로 듭니다.

기업 환경에서 Fable 5를 쓸 때 주의할 점은 무엇인가요?

Fable 5는 6월 23일부터 구독 요금제에서 빠지고 API 사용 크레딧으로만 제공되며, 모든 트래픽에 30일 데이터 보존이 요구됩니다. 따라서 제로 데이터 보존이 필요한 규제 산업이나 일부 기업 환경에서는 사용하기 어렵다고 영상은 설명합니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식

#Fable5#앤트로픽#AI코딩#AI안전장치#코딩모델