AI VIDEO BRIEFING

클로드 오푸스 4.6: AI 에이전트 16개가 2주간 자율 코딩으로 C 컴파일러를 완성하다

클로드 오푸스 4.6 에이전트 16개가 사람 개입 없이 2주간 코딩해 10만 줄 규모의 러스트 C 컴파일러를 만들었다. 컨텍스트 창 5배 확장과 에이전트 팀 기능, 라쿠텐 운영 사례와 보안 실험까지 정리했다.

오푸스 4.6, AI 에이전트 16개가 2주간 스스로 코딩해 C 컴파일러를 만들다 영상 대표 이미지

핵심 메시지

  • 클로드 오푸스 4.6 에이전트 16개가 2주 동안 사람이 코드를 쓰지 않고 협업해 10만 줄이 넘는 러스트 C 컴파일러를 완성했다.
  • 자율 코딩 지속 시간이 1년 전 30분에서 2주로 늘어난 것을 영상은 단순한 추세가 아니라 '상전이'라고 표현한다.
  • 컨텍스트 창이 4.5의 20만 토큰에서 100만 토큰으로 5배 늘었고, 긴 문맥에서 정보를 찾아내는 능력(MRCR v2)이 76%로 크게 올랐다.
  • 여러 클로드 코드 인스턴스가 리드-전문가 구조로 협업하는 '에이전트 팀' 기능이 새로 도입됐다.
  • 라쿠텐 운영 사례와 직원당 매출 지표는 인력 규모와 산출량의 관계가 흔들리고 있음을 보여 준다.

쉽게 이해하기

영상은 클로드 오푸스 4.6 에이전트 16개가 2주 동안 사람 개입 없이 자율적으로 코딩해 완전히 작동하는 C 컴파일러를 만들었다는 사례로 시작한다. 러스트로 10만 줄이 넘는 코드이며, 세 가지 아키텍처에서 리눅스 커널을 빌드하고 컴파일러용 시험 스위트의 99%를 통과하며 포스트그레스도 컴파일한다. 제작 비용은 약 2만 달러였다.

변화 속도가 핵심이다. 1년 전만 해도 자율 AI 코딩은 30분을 넘기기 어려웠고, 지난여름 라쿠텐이 클로드로 7시간을 끌어낸 것조차 놀랍게 여겨졌다. 12개월 만에 30분에서 2주로 늘어난 것을 진행자는 추세선이 아니라 상전이라고 강조한다. 오푸스 4.5가 2025년 11월에 나왔고 불과 몇 달 만에 4.6이 나왔다는 점도 함께 짚는다.

오푸스 4.6은 컨텍스트 창이 4.5의 20만 토큰에서 100만 토큰으로 5배 늘었고, 한 세션에 담을 수 있는 코드가 1만 줄에서 5만 줄로 늘었다. 다만 진행자는 창 크기보다 'OpenAI가 만든 MRCR v2'로 측정하는 검색·활용 능력이 더 중요하다고 본다. 100만 토큰 환경에서 바늘 찾기 정확도가 소네트 4.5는 약 18.5%, 제미나이 3 프로는 약 26.3%였지만 오푸스 4.6은 76%, 25만6천 토큰에서는 93%에 이른다.

새로 도입된 '에이전트 팀'은 여러 클로드 코드 인스턴스가 각자의 컨텍스트에서 동시에 일하며, 리드 에이전트가 작업을 분해·배정하고 전문가 에이전트끼리 직접 메시지를 주고받는 구조다. 실제 라쿠텐은 이슈 트래커에 오푸스 4.6을 적용해 하루 만에 13개 이슈를 스스로 처리하고 12개를 50명 규모 조직의 적임자에게 배정했으며, 6개 저장소를 넘나들며 작업을 조율하고 사람에게 넘겨야 할 시점도 판단했다. 비개발 직원도 클로드 코드 터미널로 개발에 기여한다고 한다. 별도 실험에서는 기본 도구만 주고 오픈소스 코드베이스를 가리키자, 별다른 지시 없이 500개가 넘는 알려지지 않은 고위험 제로데이 취약점을 찾아냈다.

경제적 함의도 다룬다. CNBC 기자 두 명은 코드를 쓰지 않고 한 시간도 안 되어 5~15달러 비용으로 먼데이닷컴 같은 프로젝트 관리 대시보드를 만들었는데, 진행자는 이를 배포용이 아닌 '개인용 소프트웨어'라는 새 범주로 설명한다. 또한 커서(직원 20명 ARR 1억 달러), 미드저니, 러버블처럼 직원당 매출이 전통적 SaaS의 5~7배에 이르는 사례, 맥킨지가 2026년 말까지 AI 에이전트 수를 인간 직원 수와 맞추겠다는 목표, 앤트로픽 CEO 다리오 아모데이가 연말까지 1인 창업 10억 달러 기업이 나올 확률을 70~80%로 본다는 점을 전하며, 경쟁력의 무게중심이 실행에서 판단으로 옮겨가고 있다고 결론짓는다.

주요 인사이트

  • 단순한 컨텍스트 창 크기보다 그 안에서 정보를 찾아 활용하는 능력(MRCR v2)이 실질적 도약의 핵심이라고 본다.
  • 에이전트들이 리드-전문가-피어 메시징 구조를 스스로 형성하는 모습은, 관리가 지능이 대규모로 협업할 때 나타나는 창발적 속성임을 시사한다.
  • 별도 지시 없이 500개 이상의 제로데이를 찾고 깃 히스토리까지 분석한 사례는 보안 분야의 잠재적 파급력을 보여 준다.
  • 비개발자에게도 '결과를 설명하면 된다'는 바이브 워킹 방식이 확산되며, 핵심 역량이 기술 숙련에서 의도의 명확성으로 이동한다.

자주 묻는 질문

16개 에이전트가 만든 C 컴파일러는 어느 정도 규모인가?

러스트로 10만 줄이 넘으며, 세 가지 아키텍처에서 리눅스 커널을 빌드하고 컴파일러 시험 스위트의 99%를 통과하며 포스트그레스도 컴파일한다. 제작 비용은 약 2만 달러였다.

오푸스 4.6의 컨텍스트 관련 수치는 어떻게 되나?

컨텍스트 창이 4.5의 20만 토큰에서 100만 토큰으로 5배 늘었고, 한 세션에 약 5만 줄의 코드를 담을 수 있다. 긴 문맥에서 정보를 찾는 MRCR v2 점수는 100만 토큰에서 76%, 25만6천 토큰에서 93%다.

라쿠텐은 오푸스 4.6을 어떻게 활용했나?

이슈 트래커에 적용해 하루 만에 13개 이슈를 스스로 처리하고 12개를 50명 규모 조직의 적임자에게 배정했으며, 6개 저장소에 걸쳐 작업을 조율하고 사람에게 넘겨야 할 때를 판단했다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식

#클로드오푸스4.6#AI에이전트#자율코딩#앤트로픽#AI생산성