AI VIDEO BRIEFING

메이투안 LongCat 2.0: 1.6조 파라미터 오픈 AI 모델 공개와 실제 성능 검증

중국 메이투안이 1.6조 파라미터 규모의 초거대 오픈 모델 LongCat 2.0을 공개했다. 희소 어텐션과 비엔비디아 ASIC 학습이 주목받지만, 무료 채팅 환경 실사용 평가에서는 코딩 성능이 기대에 못 미쳤다.

출처: AICodeKing2026년 6월 30일AI 보조 요약

메이투안, 1.6조 파라미터 오픈 모델 'LongCat 2.0' 공개…거대 규모에 실사용 평가는 엇갈려 영상 대표 이미지

핵심 메시지

메이투안은 총 1.6조 파라미터, 토큰당 약 480억 파라미터가 활성화되는 전문가 혼합(MoE) 오픈 모델 LongCat 2.0을 공개했다.
가중치가 공개되면 현존 최대 규모의 오픈 모델이 될 수 있으나, 현재 허깅페이스 페이지에는 가중치가 아직 업로드되지 않았다(coming soon).
'LongCat 희소 어텐션'과 N그램 임베딩 모듈 등 긴 문맥과 에이전트 작업을 겨냥한 구조 변경이 적용됐다.
엔비디아 GPU가 아닌 AI ASIC 슈퍼팟에서 35조 토큰 이상으로 사전학습했다고 밝혀, 비엔비디아 하드웨어의 프런티어급 학습 가능성을 시사했다.
다만 영상 제작자의 무료 채팅 환경 단발성 테스트에서는 코딩 성능이 낮게 나와, 공식 벤치마크와 실사용 체감이 엇갈렸다.

쉽게 이해하기

메이투안은 중국에서 음식 배달과 지역 서비스로 알려진 기업이지만, 앞서 첫 LongCat 모델에 이어 이번에 LongCat 2.0을 내놨다. 첫 모델이 총 5,600억 파라미터에 평균 약 270억이 활성화되던 것과 비교하면, 2.0은 총 1.6조 파라미터에 약 480억이 활성화되는 큰 도약이다.

구조 면에서는 긴 문맥 처리를 효율화하는 'LongCat 희소 어텐션'과, 임베딩 공간을 확장하는 N그램 임베딩 모듈이 추가됐다. 제작자에 따르면 N그램 임베딩에만 약 1,350억 파라미터가 배정됐고, 100만 토큰 길이의 문맥 데이터 수천억 토큰으로 학습해 코딩·에이전트·리서치 같은 장기 과제를 겨냥했다.

특히 학습과 대규모 배포를 통상적인 엔비디아 GPU가 아닌 AI ASIC 슈퍼팟에서 진행했고 사전학습에 35조 토큰 이상을 썼다고 밝힌 점이 눈길을 끈다. 사실이라면 단순한 오픈 모델 공개를 넘어, 프런티어급 학습이 비엔비디아 하드웨어에서도 가능하다는 신호가 된다.

메이투안이 제시한 벤치마크에서는 코딩 에이전트·검색 에이전트·추론·장문 문맥 지표가 강하게 나타났다. 그러나 이 지표들은 대부분 모델이 도구를 쓰고 파일을 수정하며 과제를 이어가는 '에이전트형' 평가라는 점이 중요하다.

반면 제작자가 직접 확인한 결과는 달랐다. 코딩 플랜과 API가 현재 중국에서만 제공돼 자신의 에이전트 환경에 넣어 볼 수 없었고, 무료 채팅 사이트에서 단발성 과제로 테스트하자 자체 벤치마크에서 약 21.6%에 그쳤다. 그는 채팅 환경이 벤치마크 설정과 다를 수 있고 이 모델이 단발성이 아닌 에이전트형일 가능성을 들며, 가중치·API가 열리면 에이전트로 다시 검증하겠다고 밝혔다.

주요 인사이트

규모(파라미터)와 실사용 체감 성능은 별개다. 1.6조 파라미터라는 종이 위 스펙이 단발성 코딩 과제의 결과를 보장하지 않는다.
'에이전트형 모델'과 '단발성 응답 모델'의 구분이 중요하다. 계획·파일 작성·오류 수정을 반복하는 에이전트 루프에서 진가가 드러나는 모델일 수 있다.
가중치 미공개·중국 한정 API 같은 접근성 제약은 독립적인 검증을 늦추고, 공식 벤치마크만으로 성능을 단정하기 어렵게 만든다.
음식 배달 기업이 초거대 오픈 모델을 내놓았다는 사실 자체가, 폐쇄형을 고수하는 대형 AI 랩들에 개방 압력으로 작용한다.

자주 묻는 질문

LongCat 2.0의 규모는 얼마나 되나요?

총 1.6조 파라미터의 전문가 혼합(MoE) 모델로, 토큰당 약 480억 파라미터가 활성화됩니다. 가중치가 공개되면 현존 최대 규모의 오픈 모델이 될 수 있습니다.

지금 바로 가중치를 내려받을 수 있나요?

아직 아닙니다. 허깅페이스 페이지와 저장소는 존재하지만 모델 가중치는 '곧 공개(coming soon)' 상태이며, 코딩 플랜과 API도 현재 중국에서만 제공됩니다.

제작자의 실사용 평가는 어땠나요?

무료 채팅 사이트에서 단발성 과제로 테스트한 결과 자체 벤치마크에서 약 21.6%로 낮게 나왔습니다. 다만 채팅 환경이 벤치마크 설정과 다를 수 있어, 에이전트 환경에서 재검증이 필요하다고 봤습니다.

이 모델이 특별히 주목받는 이유는 무엇인가요?

엔비디아 GPU가 아닌 AI ASIC 슈퍼팟에서 35조 토큰 이상으로 학습했다고 밝혀, 비엔비디아 하드웨어로도 프런티어급 학습이 가능함을 시사했기 때문입니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗