AI VIDEO BRIEFING
구글 I/O 2026 AI 에이전트 스택 정리 — ADK 2.0·Gemini 3.5 Flash·Spark·Omni
구글이 I/O 2026에서 공개한 AI 에이전트 스택을 4단계 사다리 구조로 풀이한다. ADK 2.0, 관리형 에이전트 API, 스킬 레지스트리, Gemini 3.5 Flash와 Omni까지 핵심을 정리했다.

핵심 메시지
쉽게 이해하기
구글 클라우드 팀은 I/O 2026에서 쏟아진 발표 가운데 '에이전트 스택'에 초점을 맞춰 정리했다. 이들은 에이전트 구축을 네 개의 층으로 본다. 개선된 모델(Gemini 3.5 Flash), 오케스트레이션(ADK 2.0과 에이전트 CLI), 관리형 에이전트 API와 스킬 레지스트리, 그리고 모델 가든을 포함한 플랫폼이다. 이 모든 요소를 옆에서 떠받치는 '레일'은 에이전트 간 통신 규약인 A2A로, 어디서 만들든 서로 연동된다는 점을 강조한다.
이를 사다리에 비유해 네 개의 발판으로 설명한다. 첫 발판은 UI 중심의 로우코드 도구 Agent Studio로, 시각적으로 시작한 뒤 ADK용 코드로 전환할 수 있다. 두 번째는 단 한 번의 호출로 완전 호스팅 에이전트를 띄우는 관리형 에이전트 API로, 설정 중심 접근을 원하는 입문자에게 적합하다. 세 번째는 빌더 경험인 안티그래비티 2.0, 네 번째는 완전한 코드 수준 제어를 주는 ADK 2.0이다. 하나에 묶이지 않고 팀의 현재 수준에서 시작해 위로 올라갈 수 있다는 점이 핵심이다.
정식 출시(GA)된 ADK 2.0은 기존의 명령형 방식에서 그래프 기반으로 바뀌었다. 에이전트 워크플로를 단계의 그래프로 기술할 수 있어, 결정론적으로 움직여야 할 때와 더 창의적이어도 될 때 사이를 슬라이더처럼 조절한다. 수 분에서 수 시간 이어지는 장기 작업도 더 잘 지원한다. 같은 엔진이 상위 발판들을 떠받치며, 에이전트 CLI로 새 에이전트를 만들고 로컬 실행·평가·배포까지 할 수 있고 배포 대상인 에이전트 플랫폼은 인프라 관리가 필요 없는 오토스케일링 서비스가 된다.
관리형 에이전트 API는 단일 API 호출로 추론하고 도구를 부르며 코드를 실행하는 에이전트를 띄운다. 샌드박스를 직접 프로비저닝하거나 환경을 돌볼 필요가 없고, 상태와 파일이 유지돼 후속 호출에서 이어갈 수 있다. 스킬은 재학습 없이 에이전트에게 새 능력을 가르치는 마크다운 파일(지시와 도구 포함)이며, 스킬 레지스트리는 이를 조직 범위의 비공개 저장소로 관리한다. 핵심은 동적 발견으로, 에이전트가 스킬을 미리 품지 않고 작업에 필요한 것만 런타임에 불러온다.
모델 측에서는 새 기본 모델 Gemini 3.5 Flash가 발표됐다. 비용과 효과의 균형을 맞추고 장기 실행 에이전트 작업에 맞춰 튜닝됐으며, 이전 모델보다 훨씬 빠르고 신형 TPU와 함께 설계됐다. 사용자 대면 측면에서는 전용 VM에서 24시간 돌아가는 개인 에이전트 Gemini Spark, 거래에 한도를 거는 가드레일인 에이전트 결제 프로토콜(AP2), 그리고 텍스트·이미지·오디오·영상을 한 장면으로 융합하는 영상 생성 모델 Gemini Omni(첫 모델 Omni Flash)가 소개됐다.
주요 인사이트
- 여러 진입점을 두되 그 뒤에서 A2A 프로토콜과 단일 플랫폼으로 묶는 설계는, 사용자가 한 도구에 종속되지 않고 점진적으로 고도화할 수 있게 하려는 의도다.
- ADK가 명령형에서 그래프 기반으로 옮겨간 것은 결정성과 창의성을 작업 성격에 따라 조절하려는 흐름을 보여주며, 장기 실행 작업 지원이 함께 강화됐다.
- 스킬을 에이전트에 내장하지 않고 레지스트리에서 동적으로 불러오는 방식은 조직 차원의 재사용·거버넌스와 에이전트 경량화를 동시에 노린다.
- Gemini Spark가 작업마다 격리된 일회용 VM에서 돌아가고 AP2가 지출 한도를 강제하는 것은, 자율 에이전트의 안전성과 '예상치 못한 청구서' 같은 위험을 다루려는 장치다.
- Omni가 단순 생성이 아니라 입력들 사이의 관계를 추론해 하나의 일관된 장면을 만든다는 점, 그리고 SynthID 워터마크가 항상 들어간다는 점이 기존 영상 도구와의 차별점으로 제시된다.
자주 묻는 질문
구글이 말하는 에이전트 스택의 네 단계(사다리 발판)는 무엇인가?
로우코드·UI 중심의 Agent Studio, 한 번의 호출로 완전 호스팅되는 관리형 에이전트 API, 빌더 경험인 안티그래비티 2.0, 그리고 완전한 코드 수준 제어를 주는 ADK 2.0입니다. 모두 A2A 프로토콜로 상호 연동됩니다.
ADK 2.0에서 가장 크게 바뀐 점은?
기존의 명령형 오케스트레이션에서 그래프 기반으로 전환된 점입니다. 워크플로를 단계의 그래프로 기술하고 결정성과 창의성 사이를 조절할 수 있으며, 수 분~수 시간의 장기 작업을 더 잘 지원하고 정식 출시(GA)됐습니다.
Gemini Omni는 기존 영상 생성 도구와 무엇이 다른가?
대개 프롬프트만 받는 도구와 달리 Omni는 이미지·스케치·음성 클립·기존 영상·텍스트 등 여러 참조를 함께 받아 하나의 일관된 장면으로 융합합니다. 실세계 추론에 기반해 물리(중력·관성 등)를 이해하고, 결과물에는 SynthID 워터마크가 들어갑니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗