AI VIDEO BRIEFING

IBM 2026 AI 전망: 슈퍼 에이전트, 오픈소스 한계, 컴퓨트 부족, 멀티모달 정리

IBM 'Mixture of Experts' 연말 특집 — 슈퍼 에이전트와 '정문' 경쟁, 오픈소스의 패키징 한계, 구조적 컴퓨트 부족, 모듈형 멀티모달까지 2026 AI 전망을 정리했다.

IBM 전문가들이 보는 2026 AI: '슈퍼 에이전트' 전쟁, 오픈소스의 한계, 컴퓨트 부족과 멀티모달 영상 대표 이미지

핵심 메시지

  • 에이전트는 2025년에 '사라진' 게 아니라 우리 도구 속으로 스며들었다. 추론과 도구 사용이 모델에 들어오면서 여러 작업을 처리하는 '슈퍼 에이전트'와 이를 지휘하는 오케스트레이터로 진화했다.
  • 누가 에이전트의 '정문(front door)'을 차지하느냐가 시장의 핵심 전장이며, 그 싸움은 챗봇 창을 넘어 브라우저·모바일로 번지고 있다.
  • 2025년은 '오픈소스의 해'였지만, 오픈소스는 모델 성능이 아니라 부품들을 5분 만에 묶어 폐쇄형 수준의 사용자 경험을 내는 '패키징' 문제에서 아직 뒤처진다.
  • AI 하드웨어는 수요가 공급을 앞질러 '구조적 희소성'에 들어섰고, 기업들은 모델 성능이 아니라 컴퓨트 가용성을 중심으로 전략을 짜기 시작했다.
  • 2026년 멀티모달의 화두는 거대한 만능 모델이 아니라, 어댑터와 소프트웨어 오케스트레이션으로 필요한 능력만 조합하는 '모듈형' 접근이다.

쉽게 이해하기

이 영상은 IBM 테크놀로지의 팟캐스트 'Mixture of Experts'가 연말마다 진행하는 전통, 즉 전문가들이 지난해 예측을 돌아보고 다음 해를 전망하는 클립 모음 에피소드다. 진행자 팀 황이 에이전트, 오픈소스, 하드웨어, 멀티모달 네 분야의 전문가와 차례로 짧은 대담을 나눈다.

첫 주제는 에이전트다. 크리스 헤이는 2025년을 '슈퍼 에이전트의 해'로 예측했었고, 진행자가 "에이전트는 짖지 않은 개 아니냐"고 반문하자 그는 추론과 테스트타임 컴퓨트가 모델에 들어오면서 에이전트가 더 오래 계획하고 더 많은 도구를 쓰게 됐다고 반박한다. 작업 하나를 던지면 30분 뒤 발표 자료를 완성하는 마누스(Manus), 클로드 코드, 커넥터를 붙인 챗GPT·클로드·제미나이가 모두 '슈퍼 에이전트'로 수렴하고 있으며, 사용자가 일일이 전용 에이전트를 붙이는 대신 하나의 오케스트레이터에게 말하는 방식이 이긴다고 본다. 이 '정문' 경쟁은 퍼플렉시티 코멧 같은 에이전트 브라우저, 모바일(시리·안드로이드 속 제미나이)로 확산되고, 2026년에는 에이전트를 중앙에서 통제하는 '제어 평면'·대시보드가 화두가 될 것이라 전망한다.

둘째 주제는 오픈소스다. 게이브는 2025년이 '오픈소스의 해'였고 키미 K2 등으로 격차가 좁혀졌다고 인정하면서도, 냉정하게 보면 오픈소스는 '패키징' 문제를 안고 있다고 짚는다. 사용자가 기뻐하는 지점은 모델 자체가 아니라 그 위의 소프트웨어·UX 계층인데, 오픈소스는 최고의 부품을 모두 갖췄지만 이를 폐쇄형처럼 5분 만에 묶어낼 사실상의 표준이 아직 없다는 것이다. 그는 2026년에 오픈 모델과 짝을 이룬 고품질 범용 에이전트가 등장하겠지만, 규모의 한계로 폐쇄형 랩과 완전히 동등해지긴 어렵다고 본다. 리눅스가 데스크톱은 못 잡아도 서버·안드로이드를 떠받치듯, 오픈과 폐쇄가 공존하는 '양면 세계'가 될 것이라는 전망이다.

셋째 주제는 하드웨어다. 카타르는 2025년을 '수요가 공급망을 앞지른 해'로 규정한다. AI 하드웨어 희소성이 일시적 현상이 아니라 구조적 제약이 되면서, 기업들은 처음으로 모델 성능보다 컴퓨트 가용성을 중심으로 전략을 짰다는 것이다. 그는 거대 클러스터 중심의 '스케일 업'과 양자화·소형 모델·NPU 중심의 '스케일 아웃(엣지)'으로 하드웨어가 양분됐다고 보고, 2026년에는 프런티어급과 효율형 모델 클래스가 갈리고, 4비트 양자화·플래시 어텐션으로 엣지 추론이 현실이 되며, 엔비디아의 지배력이 ASIC·칩렛·TPU·AMD 등으로 도전받을 것이라 예측한다.

넷째 주제는 멀티모달이다. 애런과 에이브는 모델이 보고 듣고 읽는 다중 감각으로 인간처럼 인지·행동하는 방향으로 간다고 본다. 다만 IBM 그래니트의 초점은 거대한 옴니 모델이 아니라, LoRA·aLoRA 같은 가벼운 어댑터를 필요할 때 끼워 쓰는 '모듈형 멀티모달'이며, 소프트웨어 오케스트레이션으로 여러 모델을 엮어 정확도를 높이고 사람이 개입(human-in-the-loop)할 수 있게 하는 데 있다고 설명한다.

주요 인사이트

  • "에이전트가 제대로 작동하면 그냥 AI가 된다"는 말처럼, 딥리서치나 챗GPT 웹 검색은 이미 에이전트지만 우리는 더 이상 그것을 에이전트로 의식하지 않는다.
  • 기존 패러다임(브라우저·코드 에디터·쇼핑)에 에이전트를 얹어 '부트스트래핑'하는 것이, 새로운 채팅 창을 처음부터 알리는 것보다 채택을 끌어내기 쉬운 전략이다.
  • 오픈소스에는 거의 모든 범주에서 더 나은 부품이 있지만, 그것을 묶어 즉시 쓸 수 있는 '사실상의 표준 스택'이 없다는 점이 가장 큰 약점이다.
  • 컴퓨트 부족이 구조화되면서 효율(희소성·양자화·하드웨어 인지 설계)이 새로운 경쟁축이 됐고, 엣지에서 돌릴 작은 모델과 거대 프런티어 모델로 시장이 갈린다.
  • 멀티모달의 미래는 만능 단일 모델보다, 비전·음성·문서 추출 같은 특화 능력을 어댑터로 조합하는 '오케스트레이션'에 있다는 것이 IBM 그래니트 팀의 관점이다.

자주 묻는 질문

'슈퍼 에이전트'와 '정문(front door)' 경쟁이란 무엇인가?

슈퍼 에이전트는 추론으로 계획을 세우고 여러 도구를 호출해 다양한 작업을 처리하는 오케스트레이터형 에이전트다. 사용자가 그 하나에게만 말하면 되므로, 누가 그 '정문'을 차지하느냐가 시장 지배의 관건이다. 그래서 챗GPT·구글·클로드·아마존이 챗봇 창, 브라우저, 모바일에서 그 자리를 두고 다투고 있다.

왜 오픈소스가 폐쇄형을 곧바로 이기지 못한다고 보나?

게이브는 사용자 만족이 모델이 아니라 그 위의 소프트웨어·UX에서 나오는데, 오픈소스는 뛰어난 부품을 다 갖췄지만 이를 폐쇄형처럼 매끄럽게 묶어내는 표준이 없다고 말한다. 2026년에 고품질 오픈 범용 에이전트가 나오겠지만, 거대 모델을 돌릴 규모의 한계 때문에 완전히 동등해지긴 어렵다고 본다.

2025년 AI 하드웨어의 가장 큰 사건은 무엇인가?

수요가 공급망을 앞질러 하드웨어 희소성이 구조적 제약이 된 것이다. 엔비디아의 기록적 출하에도 LLM·멀티모달·에이전트 워크로드 수요가 생산 능력을 앞질렀고, 기업들은 모델 성능보다 컴퓨트 가용성을 중심으로 전략을 재편했다.

IBM 그래니트가 추구하는 멀티모달 방향은?

하나의 거대한 옴니 모델 대신, 음성·이미지·문서 추출 같은 특화 능력을 LoRA·aLoRA 어댑터로 필요할 때 끼워 쓰는 모듈형 접근이다. 소프트웨어로 여러 모델을 엮어(orchestration) 사용 사례에 맞추고, 가벼운 어댑터로 자원 사용을 줄이면서도 최신 성능을 활용하는 것을 목표로 한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식

#AI에이전트#슈퍼에이전트#오픈소스AI#AI하드웨어#멀티모달