AI VIDEO BRIEFING

2026 AI 상태 점검 대담: 트랜스포머·스케일링 법칙·오픈모델·중국 LLM 흐름 총정리

렉스 프리드먼이 세바스찬 라슈카, 네이선 램버트와 나눈 대담. 딥시크 모멘트와 오픈웨이트 흐름, 트랜스포머의 지속, 스케일링 법칙, 코딩과 일자리, 중국 모델의 영향까지 지난 1년의 AI를 짚습니다.

2026 AI 현주소: 트랜스포머는 여전히 왕좌, 오픈웨이트와 스케일링 법칙의 향방 영상 대표 이미지

핵심 메시지

  • 텍스트 확산 모델·맘바(상태공간) 등 대안이 나왔지만, 최첨단 자리는 여전히 GPT-2에서 이어진 자기회귀 트랜스포머가 지키고 있다.
  • 약 1년 전의 '딥시크 모멘트'는 오픈웨이트 중국 모델이 업계 흐름을 바꾼 전환점으로 회고된다.
  • 스케일링 법칙은 사전학습·사후학습·추론·문맥·데이터 등 여러 축에 걸친 멱법칙 관계로 이해해야 한다.
  • AI는 지루하고 반복적인 작업을 덜어주는 데 특히 유용하며, 코딩에서는 '함께 헤매주는 동료' 같은 가치를 준다.
  • 오픈모델이 충분히 최적화·저렴해지면 폐쇄형보다 우세해질 수 있고, 국가안보 우려로 연구소가 중앙집중·비밀화될 가능성도 거론된다.

쉽게 이해하기

이 대담은 지난 1년의 AI 기술 발전과 다가올 해의 전망을, 비전문가도 따라올 수 있게 풀어낸 에피소드다. 진행자 렉스 프리드먼은 머신러닝 연구자이자 교육자인 세바스찬 라슈카(《밑바닥부터 만드는 LLM》·《밑바닥부터 만드는 추론 모델》 저자)와 네이선 램버트(앨런 AI 연구소 사후학습 리드, RLHF 분야 저서로 유명)를 초대해, 무언가를 진짜로 이해하려면 직접 만들어 보라는 관점을 공유한다.

대화의 한 축은 '딥시크 모멘트'다. 약 1년 전인 2025년 1월, 오픈웨이트 중국 기업 딥시크가 일으킨 파장을 출발점 삼아, 오픈웨이트 모델이 업계 분위기를 어떻게 바꿨는지 짚는다. 이후 세 사람은 아키텍처 논의로 들어가, FP4 최적화나 전문가 혼합(MoE) 같은 기법이 속도(월클럭) 면에서 큰 이득을 주지만 그 자체로 새로운 능력을 부여하진 않는다고 정리한다.

핵심 쟁점은 '트랜스포머의 지속'이다. 텍스트 확산 모델이나 맘바 같은 상태공간 모델 등 대안이 등장했지만, 이들은 저렴한 영역에서 절충을 택한 선택지일 뿐 최첨단을 대체하진 못했다. 결론적으로 최첨단은 여전히 GPT-2에서 파생된 자기회귀 트랜스포머다. 이어 스케일링 법칙을 '무엇을 키울 때 성능이 어떻게 따라오는가'를 나타내는 멱법칙 관계로 정의하고, 사전학습·사후학습·추론·문맥 등 여러 축에서의 유효성을 논한다.

기술을 넘어 일상과 노동 이야기도 오간다. 한 출연자는 아내가 100개에 달하는 깨진 링크를 일일이 고치는 대신 ChatGPT로 단번에 정리한 사례를 들며, AI가 지루하고 손 많이 가는 작업에서 빛난다고 말한다. 코딩에서는 디버깅을 '사막을 건넌 뒤 마시는 물 한 모금'에 비유하며, 버그를 대신 찾아주진 못해도 직관을 나눠주는 '동료'가 있다는 점에서 외로움을 덜어준다고 표현한다.

후반부는 커리어와 산업 구조다. 출판 중심의 학계, 비공개 산업 연구소, 그리고 고위험·고보상의 스타트업이라는 세 갈래 선택지와, 실리콘밸리에 번지는 '9-9-6'(오전 9시~오후 9시, 주 6일) 문화가 논의된다. 마지막으로 코딩이 계산기처럼 '풀린' 미래, AI가 슬랙·워드 같은 제품의 기능을 끝단까지 구현하는 시나리오, 딥시크 V3.2 같은 모델이 촉발한 오픈소스 경쟁, 그리고 국가안보 우려로 연구소가 중앙집중·비밀화되는 'AI 2027'식 전망까지 폭넓게 다룬다.

주요 인사이트

  • 여러 대안 아키텍처에도 최첨단이 트랜스포머에 머무는 것은, 속도 최적화와 '새 능력 획득'이 별개의 문제임을 보여준다.
  • 딥시크 모멘트의 의미는 단일 모델의 성능이 아니라, 오픈웨이트 공개가 업계 전체의 행동을 바꿨다는 데 있다.
  • AI의 가장 확실한 현재 가치는 거창한 자동화보다 '지루한 반복 작업의 제거'에 있다는 현실적 진단이 인상적이다.
  • 디버깅을 '함께 사막을 건너는 동료'로 비유한 대목은, 코딩 도구의 가치가 정답 제시만이 아니라 과정의 동반에도 있음을 짚는다.
  • 오픈모델이 표준화·저렴화로 우세해질 수 있다는 전망과, 국가안보로 인한 중앙집중·비밀화 전망이 공존하는 점이 향후 구도의 불확실성을 드러낸다.

자주 묻는 질문

트랜스포머를 대체할 아키텍처가 나왔나요?

텍스트 확산 모델이나 맘바 같은 상태공간 모델 등 대안이 등장했지만, 출연자들은 이들이 주로 저렴한 영역에서 절충을 택한 선택지이며 최첨단을 대체하진 못했다고 봅니다. 최첨단은 여전히 GPT-2에서 이어진 자기회귀 트랜스포머입니다.

'딥시크 모멘트'란 무엇인가요?

약 1년 전인 2025년 1월, 오픈웨이트 중국 기업 딥시크가 일으킨 파장을 가리킵니다. 대담은 이를 오픈웨이트 모델이 AI 업계의 흐름과 분위기를 바꾼 전환점으로 회고합니다.

오픈모델이 폐쇄형 모델을 이길 수 있을까요?

출연자들은 진보가 곧 포화한다면, 오픈모델이 더 최적화되고 저렴하게 운영돼 표준으로 자리 잡으며 우세해질 수 있다고 봅니다. 다만 국가안보 우려로 연구소가 중앙집중·비밀화되는 반대 방향의 전망도 함께 제시됩니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식