AI VIDEO BRIEFING

사카나 AI 후구·클로드 태그·신모델 출시 규제 — 이번 주 AI 뉴스 정리

매트 울프가 정리한 이번 주 AI 소식. 프롬프트를 최적 모델로 보내는 사카나 AI '후구', 슬랙에서 사람처럼 호출하는 '클로드 태그', 미국 정부의 신모델 출시 통제 움직임을 짚는다.

사카나 AI '후구', 프롬프트를 알아서 배분하는 오케스트레이터로 등장…클로드는 슬랙에 합류한다 영상 대표 이미지

핵심 메시지

  • 사카나 AI의 '후구'는 답을 직접 내놓기보다 프롬프트를 가장 적합한 모델로 라우팅하는 오케스트레이터(관리자) 모델로, 특정 제공사가 멈춰도 다른 모델로 우회해 작업을 잇는다.
  • 후구는 빠르고 저렴한 기본형과 어려운 다단계 문제용 '후구 울트라'로 나오며, 영상의 벤치마크에서는 일부 항목에서 기존 최고로 꼽히던 '페이블 5'에 견주거나 앞섰다.
  • 앤트로픽은 슬랙에서 사람을 멘션하듯 클로드를 호출해 일을 맡기는 '클로드 태그'를 공개했고, 사내 코드의 65%가 이 기능으로 작성된다고 밝혔다.
  • 미국 정부가 보안을 이유로 오픈AI에 신모델(GPT 5.6) 출시를 단계적으로 하고 고객별로 접근을 승인하도록 요구하면서, 갑작스러운 공개로 이어지던 'AI 서부 개척 시대'가 저물 수 있다는 관측이 나온다.

쉽게 이해하기

이번 주 AI 뉴스는 양은 적었지만 굵직한 소식이 몇 개 있었다고 영상은 전한다. 가장 먼저 사카나 AI가 '후구(Fugu)'를 내놓았다. 이 모델은 새 GPT나 클로드처럼 하나의 모델이 아니라, 사용자의 프롬프트를 어떤 모델로 보낼지 스스로 판단하고 때로는 여러 모델에 동시에 보내는 오케스트레이터(관리자) 모델이다. 덕분에 내부에서 쓰는 오픈AI나 앤트로픽 모델 중 하나가 다운되더라도 다른 모델로 즉시 우회해 작업 진행을 잃지 않는다는 게 강점이다.

후구는 두 가지로 나온다. 기본형 후구는 준수한 성능과 낮은 지연을 균형 있게 맞춰 일상 작업의 기본값으로 적합하고, '후구 울트라'는 어려운 다단계 문제에서 답변 품질을 끌어올리도록 조정됐다. 영상이 제시한 벤치마크에서 후구와 울트라는 라이브 코드 벤치에서 페이블 5를 앞섰고, GPQA에서는 미토스보다 나았으며, 사이코드에서는 페이블 5와 비슷했다. 스위트벤치 프로에서는 다소 뒤졌지만 전반적으로 기존 최고 모델에 필적했다.

진행자는 콘솔에서 API 키를 만들고 코덱스 CLI로 후구를 연결해 게임 클론과 웹사이트 클론을 직접 만들어 봤다. 두 작업에 약 한 시간이 걸렸고 입력 2,200만 토큰·출력 21만 토큰을 써 비용은 약 30달러가 나왔다. 결과물은 모두 작동했지만, 게임은 기대했던 3D 대신 2D 클론에 가까웠고 전반적으로 페이블로 만든 버전보다 그래픽 등이 조금 아쉬웠다고 평했다.

두 번째 소식은 앤트로픽의 '클로드 태그'다. 별도 앱을 띄우지 않고도 슬랙에서 동료를 멘션하듯 클로드를 태그해 프로젝트를 맡기면, 클로드가 작업을 여러 단계로 쪼개 회사 도구를 활용하며 백그라운드에서 처리한다. 여러 사람이 있는 채널에서 함께 보고 지시할 수 있고, 맥락을 매번 복사해 넣지 않아도 채널에 머무르며 회사를 점점 더 이해한다. 관리자가 접근 권한을 촘촘히 통제할 수 있어 보안에도 신경 썼다. 앤트로픽은 사내 코드의 65%가 이 기능으로 작성된다고 밝혔고, 안드레이 카르파티는 이를 웹 챗·독립 앱에 이은 'AI 사용 방식의 세 번째 큰 재설계'라고 평가했다. 다만 현재는 팀·엔터프라이즈 요금제에서만 쓸 수 있다.

세 번째는 규제 움직임이다. 트럼프 행정부가 보안 우려를 이유로 오픈AI에 신모델 출시를 단계적으로 진행하라고 요구했고, 프리뷰 기간에는 정부가 고객을 하나씩 승인하는 방식으로 GPT 5.6 접근을 통제한다고 한다. 출시 시점이 불투명해졌고, 누구나 깜짝 신모델을 받아보던 시대가 끝날 수 있다는 관측이 나온다. 이 밖에 베이징 콘퍼런스에서 30초 길이 영상을 한 번에 만들고 최대 50개 멀티모달 참고 자료를 받는 '시드댄스 2.5'가 예고됐고, 크레아는 크레아 2를 오픈 웨이트로 공개했으며, 오픈AI와 브로드컴은 자체 추론 칩 개발을 발표했다.

주요 인사이트

  • 모델 경쟁의 축이 '가장 똑똑한 단일 모델'에서 '여러 모델을 상황에 맞게 배분·우회하는 오케스트레이션'으로 옮겨가고 있다.
  • 클로드 태그처럼 AI가 우리가 이미 쓰는 협업 도구 안으로 들어오는 흐름은, AI를 별도로 찾아가 쓰던 방식과 근본적으로 다른 사용 경험을 만든다.
  • 정부가 모델 출시 속도와 접근 대상을 통제하기 시작하면, 신모델이 즉시 누구에게나 열리던 관행은 사라지고 출시 일정의 예측 가능성도 떨어진다.
  • 에이전트에 최고 설정을 던지면 한 시간 만에 30달러가 나가듯, 강력한 자동화일수록 비용 관리가 실사용의 관건이 된다.

자주 묻는 질문

사카나 AI의 후구는 일반 모델과 무엇이 다른가요?

후구는 답을 직접 생성하기보다 사용자의 프롬프트를 어떤 모델로 보낼지 판단하는 오케스트레이터(관리자) 모델입니다. 필요하면 여러 모델에 동시에 보내고, 내부에서 쓰는 특정 제공사 모델이 다운되면 다른 모델로 우회해 작업을 이어 갑니다.

클로드 태그는 어떻게 쓰나요?

슬랙에서 사람을 멘션하듯 클로드를 태그해 일을 맡기면 됩니다. 클로드가 작업을 여러 단계로 나눠 회사 도구를 활용해 백그라운드에서 처리하며, 채널에 머무르며 맥락을 학습합니다. 다만 영상 기준으로는 팀·엔터프라이즈 요금제에서만 제공됩니다.

미국 정부의 신모델 출시 통제는 무슨 의미인가요?

트럼프 행정부가 보안을 이유로 오픈AI에 GPT 5.6 출시를 단계적으로 진행하고 프리뷰 기간에 고객별로 접근을 승인하도록 요구했다는 내용입니다. 갑작스러운 모델 공개가 줄고 출시 시점이 불투명해질 수 있습니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식