AI VIDEO BRIEFING

딥시크 혁명 쉽게 정리: 600만 달러 AI가 엔비디아를 흔든 5가지 비결

중국의 한 퀀트 회사가 약 600만 달러로 만든 딥시크가 미국 증시 시가총액 1조 달러를 날렸다. 강화학습·전문가 혼합·다중토큰 예측 등 비용을 90% 낮춘 혁신과, 월가가 놓친 '제번스의 역설'을 정리한다.

출처: AI Alfie2025년 1월 31일AI 보조 요약

단돈 600만 달러로 시장을 흔든 딥시크, 무엇이 진짜 혁명이었나 영상 대표 이미지

핵심 메시지

딥시크는 약 600만 달러로 수억 달러급 최신 모델에 맞먹는 성능을 냈고, 미국 증시 시총 약 1조 달러(엔비디아만 6천억 달러)를 흔들었다.
핵심은 사람 라벨러 대신 정답을 객관적으로 판별하는 강화학습으로 학습을 값싸게 대규모로 확장한 것이다.
전문가 혼합(MoE)·다중토큰 예측·FP8 저정밀 연산으로 학습과 실행 비용을 함께 90% 가까이 낮췄다.
모델을 오픈소스로 공개해 누구나 자신의 컴퓨터에서 돌리고 데이터 유출 없이 활용할 수 있게 했다.
비용이 싸지면 수요가 줄기는커녕 늘어난다는 '제번스의 역설'상, 장기적으로 엔비디아 칩 수요는 오히려 커질 수 있다.

쉽게 이해하기

영상은 한 주 만에 벌어진 충격적 사건으로 시작한다. 중국의 한 퀀트 트레이딩 회사가 남는 GPU로 '부업'처럼 만든 딥시크가 약 600만 달러의 비용으로, 오픈AI가 수억 달러를 들여 학습한 최신 모델급 성능을 냈다는 것이다. 그 여파로 미국 증시에서 약 1조 달러의 시가총액이 증발했고 그중 6천억 달러가 엔비디아 한 종목에서 빠졌다.

진행자는 먼저 일반적인 AI 학습 방식을 설명한다. 인터넷의 방대한 데이터를 수만 개의 3만 달러짜리 GPU로 처리하고, 수천 명의 사람 라벨러가 답변이 좋은지 일일이 평가하는 강화학습(RL)을 거친다. 이 방식은 인상적이지만 인건비와 연산비가 천문학적으로 든다. 마이크로소프트가 매년 800억 달러를 AI 인프라에 쓰겠다고 할 정도다.

딥시크의 혁신은 사람의 주관적 평가 대신, 과제가 정확히 완료됐는지를 '객관적으로' 판별하는 방식을 고안한 데 있다. '2+2=4'처럼 정오를 기계가 스스로 채점하게 하니 사람 라벨러가 필요 없어 비용이 급감하고, 시험 횟수를 대규모로 늘려 정확도와 성능을 함께 끌어올릴 수 있었다. 흥미롭게도 이 방식은 수학·공학뿐 아니라 창의적 글쓰기 같은 주관적 영역에서도 잘 작동했다.

학습뿐 아니라 실행 방식도 바꿨다. 질문마다 모델 전체를 동원하는 대신, 콜센터의 소수 전문가만 호출하듯 모델 용량의 일부(약 5%)만 쓰는 '전문가 혼합(MoE)'을 적용해 실행(추론) 비용을 크게 줄였다. 또 한 번에 한 단어씩 예측하던 방식을 문장 단위로 묶어 예측하는 '다중토큰 예측', 소수점 자릿수를 줄여 계산하는 'FP8 학습'까지 더해 연산량을 거듭 낮췄다.

이 혁신들을 합치면 비용이 기존 대비 90% 낮아지고, 일반 컴퓨터에서도 돌릴 만큼 가벼워진다. 시장은 'AI 비용이 90% 싸지니 엔비디아 매출도 90% 준다'며 폭락으로 반응했지만, 진행자는 이를 오판이라 본다. 19세기 제번스의 역설처럼 무언가 싸지면 쓰임새가 폭발적으로 늘어 총수요가 오히려 증가한다는 것이다. 게다가 딥시크가 모델을 오픈소스로 공개해, 오픈AI·앤스로픽도 이 기법을 흡수하며 고급 AI 비용은 더 떨어지고 응용·소비자 단의 혁신이 폭발할 것이라 전망한다.

주요 인사이트

딥시크의 진짜 돌파구는 단일 기술이 아니라 학습·추론·연산을 동시에 싸게 만든 다섯 가지 혁신의 결합이다.
사람 라벨러를 객관적 자동 채점으로 대체하니 비용이 줄 뿐 아니라 시험 규모를 키워 성능까지 좋아지는 이중 효과가 났다.
전문가 혼합은 질문마다 모델의 5%만 활성화해, 학습비뿐 아니라 사용자가 쓸 때마다 드는 추론비까지 낮춘다.
월가는 비용 하락을 수요 감소로 직결했지만, 제번스의 역설상 AI가 싸질수록 쓰임새가 늘어 장기 수요는 커진다.
오픈소스 공개로 기법이 업계 전반에 퍼지면 모델 제작사는 경쟁이 치열해지지만, 응용 개발자와 소비자는 가장 큰 수혜를 본다.

자주 묻는 질문

딥시크는 얼마로 무엇을 해냈나?

약 600만 달러로, 오픈AI 등이 수억 달러를 들여 학습한 최신 모델에 맞먹는 성능을 냈다. 그 충격으로 미국 증시 시총 약 1조 달러, 그중 엔비디아에서만 6천억 달러가 빠졌다.

비용을 어떻게 그렇게 낮췄나?

사람 라벨러 대신 객관적 자동 채점 기반 강화학습, 전문가 혼합(MoE)으로 모델의 약 5%만 사용, 다중토큰 예측, FP8 저정밀 연산을 결합해 학습·실행 비용을 90% 가까이 낮췄다.

왜 엔비디아 주가 폭락이 과민 반응이라는 건가?

제번스의 역설처럼 AI가 싸지면 쓰임새가 폭발적으로 늘어 총수요가 오히려 증가하기 때문이다. 장기적으로 엔비디아 칩 수요는 줄지 않고 커질 수 있다는 게 영상의 주장이다.

오픈소스 공개가 왜 중요한가?

누구나 코드를 받아 자신의 서버에서 직접 돌릴 수 있어 API 비용과 데이터 유출 우려를 피할 수 있고, 오픈AI·앤스로픽도 기법을 흡수해 고급 AI 비용이 더 내려가기 때문이다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗