AI VIDEO BRIEFING

엔비디아 네모트론 3 울트라: 5500억 매개변수 무료 개방형 AI의 강점과 한계, 라이선스까지

엔비디아가 5500억 매개변수의 개방형 AI 모델 '네모트론 3 울트라'를 가중치·논문·학습 데이터까지 공개했다. 매우 빠르고 에이전트 작업에 강하지만 까다로운 코딩에는 약하다. MoE·맘바 층·NVFP4 등 속도 비결과 텍스트 전용이라는 한계를 짚는다.

엔비디아의 새 무료 개방형 AI '네모트론 3 울트라' — 빠르지만 코딩은 약점 영상 대표 이미지

핵심 메시지

  • 엔비디아가 5500억 매개변수 규모의 개방형 모델 '네모트론 3 울트라'를 공개했다.
  • 가중치뿐 아니라 제작 방법을 담은 논문과 재배포 가능한 학습 데이터·레시피까지 공개해 매우 개방적이다.
  • 라이선스는 머신러닝 가중치에 맞춘 Open MDW로, 사실상 아파치 2.0에 가까워 상업적 활용이 자유롭다.
  • 속도가 매우 빠르고 파일 정리·설치 오류 수정 같은 에이전트형 작업에 강하지만, 까다로운 코딩에는 약점을 보였다.
  • 텍스트 전용(비멀티모달)이며 5500억 매개변수라 로컬 구동에는 수백 GB의 GPU 메모리가 필요하다.

쉽게 이해하기

발표자는 엔비디아의 새 개방형 모델 '네모트론 3 울트라'를 벤치마크에 의존하지 않고 직접 실험했다. 첫인상은 '눈부시게 빠르다'였지만, 코딩에서는 실망스러웠다. 자신의 연구 분야인 빛 시뮬레이션 프로그램을 짜게 하자 검은 화면만 나왔고, 실시간 전략 게임도 사각형 하나에 그쳤다. 게다가 손으로 짜면 250줄이면 되는 작업에 1000줄이 넘는 코드를 쏟아냈다.

반면 에이전트형 작업에서는 탁월했다. 터미널에서 깨진 설치를 고치고, 빠른 실험을 만들고, 파일을 정리하는 일을 매우 빠르게 해냈다. 발표자는 까다로운 코딩을 빼면 거의 모든 일에 점점 더 이 모델을 찾게 되었다고 말한다.

개방성은 이 모델의 가장 큰 강점이다. 가중치는 물론 제작 과정을 담은 논문, 그리고 재배포 가능한 부분의 학습 데이터와 레시피까지 공개됐다. 라이선스는 머신러닝 가중치에 맞춘 Open MDW로, 사실상 아파치 2.0에 가깝다. 상업적·파생적 활용이 자유롭지만, 이 모델이 자신의 권리를 침해한다며 소송을 걸면 라이선스를 잃는 조건이 붙는다.

직접 구동할 수 있느냐는 질문에는 '예와 아니오'가 동시에 답이다. 완전히 공개돼 있어 내려받아 영원히 쓸 수 있지만, 5500억 매개변수라 수백 GB의 GPU 메모리가 필요해 발표자는 클라우드(람다)에서 쓴다. 100만 토큰의 긴 컨텍스트를 지원하지만 비전 기능이 없는 텍스트 전용 모델이라, 하나의 만능 모델보다 용도별 모델의 묶음이 필요하다.

작동 원리도 소개된다. 토큰당 약 10%(전문가 일부)만 활성화하는 MoE(혼합 전문가) 구조, 한 번 읽고 압축된 메모만 남기는 맘바(Mamba) 층, 연산을 줄이는 저정밀 수치(NVFP4), 여러 미래 토큰을 동시에 초안 잡는 다중 헤드가 속도의 비결이다. 발표자는 이 모든 것이 무료로 공개됐다는 점에 거듭 감탄한다.

주요 인사이트

  • '하나의 만능 모델'보다 용도별 모델의 묶음(로스터)을 갖추는 편이 현실적이며, 비전이 없는 네모트론에 젬마 같은 모델을 붙여 보완할 수 있다.
  • 맘바 층은 교과서를 매번 다시 읽는 대신 한 번 읽고 압축된 메모만 남기는 방식이라 긴 데이터를 효율적으로 처리한다.
  • 토큰당 전체의 약 10%(전문가 일부)만 활성화하는 MoE 구조 덕분에 거대한 크기에도 빠르게 동작한다.
  • 라이선스 종류는 흔히 간과되지만, Open MDW처럼 자유로운 라이선스는 모델의 실제 활용도를 좌우하는 핵심 요소다.
  • 모델의 강점과 약점이 분명히 갈리므로(에이전트 강·코딩 약) 벤치마크 점수만 믿지 말고 직접 테스트해야 한다.

자주 묻는 질문

네모트론 3 울트라의 매개변수는 몇 개이며 어떤 점이 특별한가요?

총 5500억 개입니다. 다만 토큰마다 전체의 약 10%만 활성화하는 MoE 구조라 크기에 비해 매우 빠르게 동작합니다.

라이선스는 어떤가요?

머신러닝 가중치에 맞춘 Open MDW 라이선스로, 사실상 아파치 2.0에 가깝습니다. 상업적·파생적 활용이 자유롭지만, 이 모델이 자기 권리를 침해한다며 소송하면 라이선스를 잃습니다.

멀티모달인가요? 로컬에서 돌릴 수 있나요?

아니요, 텍스트 전용이라 이미지·영상은 다루지 못합니다. 완전 공개라 내려받을 수 있지만 5500억 매개변수라 수백 GB의 GPU 메모리가 필요해 발표자는 클라우드(람다)에서 사용한다고 합니다.

어떤 작업에 강하고 약한가요?

파일 정리, 설치 오류 수정 같은 에이전트형 작업과 속도에는 강하지만, 까다로운 코딩(빛 시뮬레이션, 실시간 전략 게임 작성 등)에서는 검은 화면이 나오는 등 약점을 보였습니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식

#엔비디아#네모트론#개방형AI#MoE#오픈소스모델