AI VIDEO BRIEFING
딥시크 혁명 쉽게 정리: 600만 달러 AI가 엔비디아를 흔든 5가지 비결
중국의 한 퀀트 회사가 약 600만 달러로 만든 딥시크가 미국 증시 시가총액 1조 달러를 날렸다. 강화학습·전문가 혼합·다중토큰 예측 등 비용을 90% 낮춘 혁신과, 월가가 놓친 '제번스의 역설'을 정리한다.

핵심 메시지
쉽게 이해하기
영상은 한 주 만에 벌어진 충격적 사건으로 시작한다. 중국의 한 퀀트 트레이딩 회사가 남는 GPU로 '부업'처럼 만든 딥시크가 약 600만 달러의 비용으로, 오픈AI가 수억 달러를 들여 학습한 최신 모델급 성능을 냈다는 것이다. 그 여파로 미국 증시에서 약 1조 달러의 시가총액이 증발했고 그중 6천억 달러가 엔비디아 한 종목에서 빠졌다.
진행자는 먼저 일반적인 AI 학습 방식을 설명한다. 인터넷의 방대한 데이터를 수만 개의 3만 달러짜리 GPU로 처리하고, 수천 명의 사람 라벨러가 답변이 좋은지 일일이 평가하는 강화학습(RL)을 거친다. 이 방식은 인상적이지만 인건비와 연산비가 천문학적으로 든다. 마이크로소프트가 매년 800억 달러를 AI 인프라에 쓰겠다고 할 정도다.
딥시크의 혁신은 사람의 주관적 평가 대신, 과제가 정확히 완료됐는지를 '객관적으로' 판별하는 방식을 고안한 데 있다. '2+2=4'처럼 정오를 기계가 스스로 채점하게 하니 사람 라벨러가 필요 없어 비용이 급감하고, 시험 횟수를 대규모로 늘려 정확도와 성능을 함께 끌어올릴 수 있었다. 흥미롭게도 이 방식은 수학·공학뿐 아니라 창의적 글쓰기 같은 주관적 영역에서도 잘 작동했다.
학습뿐 아니라 실행 방식도 바꿨다. 질문마다 모델 전체를 동원하는 대신, 콜센터의 소수 전문가만 호출하듯 모델 용량의 일부(약 5%)만 쓰는 '전문가 혼합(MoE)'을 적용해 실행(추론) 비용을 크게 줄였다. 또 한 번에 한 단어씩 예측하던 방식을 문장 단위로 묶어 예측하는 '다중토큰 예측', 소수점 자릿수를 줄여 계산하는 'FP8 학습'까지 더해 연산량을 거듭 낮췄다.
이 혁신들을 합치면 비용이 기존 대비 90% 낮아지고, 일반 컴퓨터에서도 돌릴 만큼 가벼워진다. 시장은 'AI 비용이 90% 싸지니 엔비디아 매출도 90% 준다'며 폭락으로 반응했지만, 진행자는 이를 오판이라 본다. 19세기 제번스의 역설처럼 무언가 싸지면 쓰임새가 폭발적으로 늘어 총수요가 오히려 증가한다는 것이다. 게다가 딥시크가 모델을 오픈소스로 공개해, 오픈AI·앤스로픽도 이 기법을 흡수하며 고급 AI 비용은 더 떨어지고 응용·소비자 단의 혁신이 폭발할 것이라 전망한다.
주요 인사이트
- 딥시크의 진짜 돌파구는 단일 기술이 아니라 학습·추론·연산을 동시에 싸게 만든 다섯 가지 혁신의 결합이다.
- 사람 라벨러를 객관적 자동 채점으로 대체하니 비용이 줄 뿐 아니라 시험 규모를 키워 성능까지 좋아지는 이중 효과가 났다.
- 전문가 혼합은 질문마다 모델의 5%만 활성화해, 학습비뿐 아니라 사용자가 쓸 때마다 드는 추론비까지 낮춘다.
- 월가는 비용 하락을 수요 감소로 직결했지만, 제번스의 역설상 AI가 싸질수록 쓰임새가 늘어 장기 수요는 커진다.
- 오픈소스 공개로 기법이 업계 전반에 퍼지면 모델 제작사는 경쟁이 치열해지지만, 응용 개발자와 소비자는 가장 큰 수혜를 본다.
자주 묻는 질문
딥시크는 얼마로 무엇을 해냈나?
약 600만 달러로, 오픈AI 등이 수억 달러를 들여 학습한 최신 모델에 맞먹는 성능을 냈다. 그 충격으로 미국 증시 시총 약 1조 달러, 그중 엔비디아에서만 6천억 달러가 빠졌다.
비용을 어떻게 그렇게 낮췄나?
사람 라벨러 대신 객관적 자동 채점 기반 강화학습, 전문가 혼합(MoE)으로 모델의 약 5%만 사용, 다중토큰 예측, FP8 저정밀 연산을 결합해 학습·실행 비용을 90% 가까이 낮췄다.
왜 엔비디아 주가 폭락이 과민 반응이라는 건가?
제번스의 역설처럼 AI가 싸지면 쓰임새가 폭발적으로 늘어 총수요가 오히려 증가하기 때문이다. 장기적으로 엔비디아 칩 수요는 줄지 않고 커질 수 있다는 게 영상의 주장이다.
오픈소스 공개가 왜 중요한가?
누구나 코드를 받아 자신의 서버에서 직접 돌릴 수 있어 API 비용과 데이터 유출 우려를 피할 수 있고, 오픈AI·앤스로픽도 기법을 흡수해 고급 AI 비용이 더 내려가기 때문이다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗