AI VIDEO BRIEFING
제미나이 3.1·젬마4·로보틱스까지, 구글 딥마인드 AI 모델 최신 정리
구글 딥마인드의 데이비드 대커와 리플릿 미켈레 카타스타가 제미나이 3.1 모델 라인업, 젬마4, 음성·음악·로보틱스 모델, 그리고 기업용 에이전트 플랫폼 전략을 설명했다.

핵심 메시지
쉽게 이해하기
구글 클라우드 행사에서 제미나이 엔터프라이즈 에이전트 플랫폼 총괄 마이클 그레슬, 구글 딥마인드 제품 부사장 데이비드 대커, 바이브 코딩 플랫폼 리플릿의 AI 총괄 미켈레 카타스타가 한자리에 모여 최신 AI 모델과 에이전트 전략을 발표했다. 대커는 2010년 런던에서 인공일반지능(AGI)을 목표로 출발한 딥마인드가 2014년 구글에 인수된 뒤 지금은 구글의 AI 모델 개발을 총괄하는 "엔진룸" 역할을 하고 있다고 소개했다.
제미나이는 출시 약 2년 만에 버전 3.1에 이르렀다. 라인업은 에이전트·코딩·수학 등 고난도 작업에 강한 최상위 프로, 성능과 효율의 균형을 갖춘 가장 인기 있는 주력 모델 플래시, 가장 작고 빠른 플래시라이트로 나뉜다. 발표자들은 구글 제품을 구동하는 바로 그 모델을 같은 날 클라우드에 올리는 경우가 많아, 고객이 구글 내부와 동일한 지능을 곧바로 쓸 수 있다고 강조했다.
딥마인드는 제미나이만 내놓는 것이 아니다. 2B~30B 규모로 기기 내 실행에 적합한 오픈웨이트 모델 젬마4, 음성을 입력받아 음성으로 답하는 제미나이 라이브, 텍스트나 이미지로 최대 3분짜리 곡을 만드는 리리아3 프로, 텍스트·이미지로 조작 가능한 3D 세계를 생성하는 월드모델 지니3, 그리고 로봇에 제미나이의 추론·시각 능력을 부여하는 로보틱스 모델을 함께 공개했다. 로보틱스 모델 ER 1.6은 보스턴 다이내믹스의 4족 로봇 스폿에 적용돼 물체를 세고 계기판을 읽는 작업을 수행한다.
그레슬은 모든 작업에 최신 최고 모델이 필요한 것은 아니라고 짚었다. 세계 최고 수준의 코드 작성에는 프런티어 지능이 필요하지만, 911 상황실이나 배달 기사처럼 즉답이 중요한 경우에는 지연 시간이 관건이라 플래시가 빛을 발하고, 인터넷 전체를 검열하듯 무한한 양을 처리해야 할 때는 검색용으로 설계된 플래시라이트가 적합하다는 것이다. 그는 또 모델에게 일하는 방법을 일일이 지시하기보다, 목표와 맥락을 충분히 주고 알아서 풀게 맡기라고 조언했다.
리플릿의 카타스타는 누구나 소프트웨어를 만들 수 있게 하는 것을 목표로, 설립 초기부터 제미나이를 써왔다고 밝혔다. 리플릿 사용자는 직접 코드를 짜는 대신 계획을 세우고 백그라운드의 여러 에이전트를 부리는 프로젝트 매니저가 된다. 그는 기존 3~5천만 명 개발자를 넘어 15억~20억 명의 지식 노동자가 대상이 됐다고 말했다. 리플릿은 클라우드 런과 구글 클라우드 스토리지 위에서 돌아가며, 배포 상태를 점검하고 보안 취약점(CVE)을 알려 고치도록 제안하는 프로덕션 에이전트도 운영한다.
주요 인사이트
- 구글은 TPU 칩부터 데이터센터, 소비자 제품까지 풀스택을 갖춘 덕에 모델을 대규모로 효율적으로 학습·서비스할 수 있다고 본다.
- 플래시 모델은 대략 6개월 전 프런티어 수준에 해당해, 오늘은 비싸 보이는 기능도 6개월 뒤에는 저렴하게 대중화될 수 있다는 점이 제품 로드맵을 바꾼다.
- 컨텍스트 엔지니어링은 긴 영어 지시문을 손으로 쓰는 일이 아니라, 잘했거나 못한 실행 기록(trace)을 컨텍스트 창에 넣어 다시는 같은 실수를 하지 않게 하는 일이다.
- 에이전트를 사람을 거치지 않고 클라우드 규모로 확장하려면 입력 단계의 신뢰와 출력 단계의 감사·관찰 가능성이 모두 필요하다.
자주 묻는 질문
제미나이 모델은 어떻게 구분되나요?
고난도 작업에 강한 프로, 성능과 효율의 균형을 갖춘 주력 모델 플래시, 가장 작고 빠른 플래시라이트로 나뉩니다. 같은 모델이 구글 제품과 클라우드에 거의 동시에 제공됩니다.
딥마인드가 제미나이 외에 공개한 모델은 무엇인가요?
오픈웨이트 모델 젬마4, 음성 모델 제미나이 라이브, 음악 모델 리리아3 프로, 월드모델 지니3, 그리고 로봇용 로보틱스 모델 등이 있습니다.
리플릿 사용자는 어떤 방식으로 소프트웨어를 만드나요?
직접 코드를 작성하기보다 계획을 세우고 백그라운드에서 도는 여러 에이전트를 관리하는 프로젝트 매니저처럼 작업합니다. 복잡한 코드 작성·유지·배포는 플랫폼이 숨깁니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗