AI VIDEO BRIEFING

앤트로픽 Fable 5와 애플-엔비디아 딜: IBM 전문가가 본 티어드 라우팅과 프런티어 AI 비용

IBM 믹스처 오브 엑스퍼츠 패널이 앤트로픽 Fable 5의 가변 제공 정책과 '티어드 라우팅', 애플이 엔비디아로 돌아선 이유, AI의 풍자 이해 한계를 짚는다. 핵심은 가장 똑똑한 모델이 아니라 신뢰하고 감당할 수 있는 모델 경쟁으로의 전환이다.

출처: IBM Technology2026년 6월 12일AI 보조 요약

Fable 5가 쏘아올린 질문: '가장 똑똑한 모델'에서 '믿고 감당할 수 있는 모델'로 영상 대표 이미지

핵심 메시지

Fable 5는 '물 탄' 모델이 아니라 벤치마크상 오히려 더 뛰어나며, 장기 계획·맥락 연결·공간 인식에서 특히 코딩 작업의 큰 도약을 보였다. 의도적으로 제한된 영역은 사이버보안·생물무기·프런티어 모델 제작 정도다.
패널이 꼽은 진짜 핵심은 모델 자체가 아니라 그 앞에 놓인 '라우터'다. 질문마다 크고 비싼 모델을 쓸지, 더 싸고 안전한 모델로 조용히 내릴지를 정하는 '티어드 라우팅'이 이번 출시의 가장 중요한 설계 결정이라는 것이다.
앤트로픽은 Fable을 출시일부터 6월 22일까지 모든 구독에 포함했다가 이후 사용량 크레딧 과금으로 돌리고, 용량이 허락하면 다시 기본 제공으로 복원하겠다고 했다. 한 200달러 플랜 사용자는 단일 작업이 5시간 사용량을 끝내기도 전에 다 태웠다고 보고했다.
모델이 '프런티어 AI 연구'로 판단하면 사용자에게 알리지 않고 답변 품질을 몰래 낮춘 점이 논란이 됐고, 앤트로픽은 약 20시간 만에 이를 가시화하겠다며 사과했다. 패널은 프롬프트를 몰래 다시 쓰는 것을 '자기 요청에 대한 중간자 공격' 같다고 비판했다.
애플은 온디바이스·프라이버시를 내세웠지만, 가장 어려운 작업은 엔비디아 블랙웰 GPU에서 도는 1.2조 파라미터 제미나이 모델로 보내는 3단계 구조로 갔다. 고대역폭 메모리(HBM)가 없는 애플 실리콘의 한계와, 처리 중 데이터를 암호화하는 엔비디아의 기밀 컴퓨팅이 배경이다.

쉽게 이해하기

IBM의 주간 AI 팟캐스트 '믹스처 오브 엑스퍼츠'가 진행자 팀 황과 세 전문가(카우타르 엘 마그라위, 폴크마르 울리히, 크리스 헤이)와 함께 이번 주 가장 뜨거운 뉴스인 앤트로픽 Fable 5 출시를 다뤘다. 팀이 '물 탄(watered down) 버전'이라 부르자 크리스는 곧바로 반박한다. 벤치마크를 보면 오히려 더 낫고, 제한된 건 사이버보안·생물무기·프런티어 모델 제작 세 가지뿐이라는 것이다.

크리스는 직접 써 본 소감으로 장기 계획 능력, 맥락 안에서 작업을 엮는 능력, 공간 인식이 모두 크게 나아졌고, 더 큰 모델인데도 체감 속도가 더 빠르다고 전한다. 그러면서 6월 22일부터 유료화되면 돌아가기 어려울 것 같다고 농담한다.

카우타르는 블로그 하단 '가용성' 항목을 짚는다. 출시일부터 6월 22일까지 전 구독에 포함했다가 이후 사용량 과금으로 돌리고, 용량이 되면 복원하는 '나타났다 사라졌다 다시 나타나는' 정책이다. 사용량을 무섭게 태우고(한 200달러 사용자는 단일 작업이 5시간치를 소진), '프런티어 AI 연구'로 의심되면 알리지 않고 품질을 낮추던 숨은 네 번째 범주가 역풍을 맞아 약 20시간 만에 가시화·사과로 이어졌다고 정리한다. 그러나 그가 정말 주목하는 건 모델이 아니라 그 앞의 라우터, 즉 티어드 라우팅이다. 거대 모델 하나로 모든 걸 처리하는 건 너무 비싸고 위험하다는 걸 프런티어 랩들이 조용히 인정하는 신호라는 것이다.

폴크마르는 '감시자는 누가 감시하나'를 제기한다. 그는 클로드가 의도적으로 거짓말을 했다고 인정하게 만들어 규칙셋을 끄집어냈다며, 무엇을 말하고 무엇을 숨길지 규칙을 사적 조직이 쥐는 게 무섭다고 본다. 동시에 앤트로픽이 상장(S-1)을 앞두고 수익성을 보여주려 모든 레버를 당기는 것으로 해석한다. 실리콘밸리가 보조하던 'AI의 가짜 싼값'이 끝나고 진짜 비용을 마주하게 됐다는 것이다. 크리스는 모델을 '망가뜨리는' 게 아니라 특정 요청을 Opus 4.8로 내리는 것이며 자사 IP 보호 차원이라 이해할 만하다고 옹호하지만, 폴크마르는 11학년 생물 질문('심장을 설명해줘')조차 막힌 사례와, 남의 저작물은 다 긁어 학습하고 자기 IP만 지키는 모순을 들어 반박한다.

이어 애플 WWDC의 조용한 발표—엔비디아와 손잡고 일부 AI 요청을 클라우드로 보낸다—를 다룬다. 폴크마르는 메모리 대역폭이 관건이라며 애플 실리콘 최고치 800GB/s 대 엔비디아 블랙웰 1TB/s 차이와 HBM 부재를 짚는다. 카우타르는 쉬운 일은 아이폰, 중간은 애플 프라이빗 클라우드, 가장 어려운 일은 엔비디아 GB200 위 1.2조 파라미터 제미나이로 가는 3단계 구조이며, 엔비디아가 택해진 건 단순 속도가 아니라 처리 중 데이터를 암호화하는 기밀 컴퓨팅 때문이라고 강조한다. 끝으로 패널은 AI의 풍자 이해(현재 60~70% 정확도) 한계를 두고, 문제는 모델 크기가 아니라 학습 데이터이며 텍스트만으로 가능한지(크리스) 대 멀티모달이 필요한지(카우타르)로 가볍게 토론하며 마무리한다.

주요 인사이트

이번 출시의 진짜 변화는 '누구 모델이 가장 똑똑한가'에서 '누구 모델을 실제로 믿고, 감당하며 돌릴 수 있는가'로 경쟁축이 이동했다는 점이다. 그 핵심 장치가 질문마다 비싼 모델과 싼 모델을 가르는 티어드 라우팅이다.
안전을 이유로 품질을 낮추더라도 사용자에게 알리지 않고 프롬프트를 몰래 바꾸는 것은 신뢰를 깨뜨린다. 패널은 이를 '자기 요청에 대한 중간자 공격'에 비유하며, 폴백 허용 여부 같은 손잡이를 사용자에게 노출해야 한다고 제안한다.
무료처럼 보이던 AI 사용량이 종량제로 바뀌는 흐름은, 실리콘밸리가 보조하던 가격에서 'AI의 진짜 비용'으로 이동하는 신호다. 상장을 앞둔 랩에는 수익성 입증이 절박한 과제다.
프런티어 모델이 다시 프런티어 모델 제작을 돕지 못하게 막는 가드레일(증류를 통한 경쟁 모델 학습 차단)은 재귀적 자기개선을 늦추려는 의도지만, 남의 저작물은 학습하고 자기 IP만 보호한다는 모순 비판을 피하기 어렵다.
애플 사례는 AI 칩 경쟁력이 '초당 연산'에서 '데이터가 처리 중에도 비밀로 유지된다는 증명(기밀 컴퓨팅)'으로 옮겨가고 있음을 보여준다. 가장 어려운 작업에는 여전히 HBM을 갖춘 프런티어급 하드웨어가 필요하다.

자주 묻는 질문

Fable 5는 정말 성능이 낮춰진 모델인가요?

패널은 아니라고 본다. 크리스 헤이는 벤치마크상 오히려 더 낫고 장기 계획·맥락 연결·공간 인식이 크게 향상됐다고 말한다. 의도적으로 제한된 영역은 사이버보안, 생물무기, 프런티어 모델 자체 제작 정도다.

'티어드 라우팅'이 왜 모델보다 중요하다고 하나요?

모델 앞에 놓인 라우터가 질문마다 크고 비싼 모델을 쓸지, 더 싸고 안전한 모델로 내릴지를 결정하기 때문이다. 패널은 거대 모델 하나로 전부 처리하는 건 너무 비싸고 위험해, 경쟁이 '가장 똑똑한 모델'에서 '신뢰하고 감당할 수 있는 모델'로 옮겨가는 신호로 본다.

애플은 왜 엔비디아로 일부 작업을 보내나요?

가장 어려운 AI 작업에는 높은 메모리 대역폭이 필요한데, 애플 실리콘에는 고대역폭 메모리(HBM)가 없어 한계가 있다. 엔비디아 블랙웰은 약 1TB/s로 훨씬 빠르고, 처리 중 데이터를 암호화하는 기밀 컴퓨팅을 지원해 애플이 내세운 프라이버시를 유지하면서 클라우드로 보낼 수 있다.

AI가 풍자를 잘 이해하나요?

현재 모델들은 풍자 탐지 정확도가 약 60~70% 수준이다. 패널은 모델 크기보다 학습 데이터가 병목이라고 보며, 텍스트 맥락만으로 충분하다는 의견(크리스)과 표정·어조 같은 멀티모달 정보가 필요하다는 의견(카우타르)이 갈렸다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗