AI VIDEO BRIEFING
MCP와 AI 에이전트 완전 입문: 모델 컨텍스트 프로토콜이 하는 일과 작동 원리 정리
ChatGPT부터 시작해 LLM·AI 에이전트·도구·API, 그리고 앤트로픽이 만든 MCP와 구글의 에이전트 간(A2A) 모델까지, 코딩 지식 없이도 이해되도록 비행기 예약 비유로 정리한 입문 해설입니다.

핵심 메시지
쉽게 이해하기
영상은 모두가 이야기하지만 막상 설명하기 어려운 MCP·AI 에이전트·에이전트 간 프로토콜을, 사전 지식 없이도 따라올 수 있도록 비유 중심으로 풀어낸다. 출발점은 익숙한 ChatGPT다. ChatGPT는 채팅 애플리케이션과 거기 붙은 GPT, 즉 LLM이라는 두 부분으로 나뉜다. 사용자가 질문하면 앱이 LLM에 요청을 보내고 LLM이 응답을 만들어 화면에 보여주는 구조다.
문제는 LLM이 텍스트·이미지·영상 같은 '응답 생성'은 해도, 스스로 무언가를 '실행'하지는 못한다는 점이다. 가령 항공권 예약 앱을 만들어 '런던행 비행기를 예약해줘'라고 하면 LLM은 방법을 글로 알려줄 뿐 실제 예약은 못 한다. 그래서 외부 서비스와 상호작용하고, 과거 대화 기반 메모리를 활용하며, LLM과 여러 차례 주고받아 결정을 내리고 끝까지 작업을 수행하는 존재가 필요한데 그것이 AI 에이전트다.
에이전트가 외부 플랫폼과 연결되는 통로는 '도구(tool)'이고, 도구는 각 서비스의 API를 호출한다. 사람이 웹사이트(UI)로 접속한다면, 애플리케이션끼리는 구조화된 데이터를 주고받는 API로 소통한다. 그런데 항공사마다 엔드포인트와 응답 형식이 제각각이라, 수많은 서비스에 일일이 어댑터 코드를 짜야 하는 부담이 생긴다.
여기서 MCP가 등장한다. MCP는 에이전트가 어떤 API를, 어떤 입력·출력 구조로 호출해야 하는지 알려주는 '안내서' 역할을 한다. 앤트로픽이 도입했고 오픈소스로 공개돼 이제 사실상 표준이 됐다. 각 에이전트에는 MCP 설정 파일이 있어 사용할 MCP 서버(예: MongoDB)와 실행 명령·인자를 지정하며, MCP는 클라이언트-서버 모델로 동작한다.
마지막은 확장이다. 항공권 에이전트에 호텔 기능까지 욱여넣으면 비대해지므로, 호텔만 잘하는 별도 에이전트를 두고 서로 호출하게 하는 편이 낫다. 이때 구글이 만든 에이전트 간(A2A) 모델이 한 에이전트가 다른 에이전트의 능력을 발견하고, 작업을 맡기고 상태를 확인하며, 맥락과 결과를 주고받는 표준을 정의한다. 영상은 코드클라우드의 실습 랩에서 Cline 확장으로 비행 MCP 서버를 붙여 실제 예약까지 시연한다.
주요 인사이트
- AI를 '응답 생성'과 '행동 수행'으로 나눠 보면 에이전트의 존재 이유가 분명해진다 — LLM은 전자만, 에이전트는 후자까지 책임진다.
- 에이전트 모드(커서·윈드서프·깃허브 코파일럿)는 한 번의 답이 아니라 코드베이스·터미널·깃 히스토리를 오가며 작업이 끝날 때까지 멈추지 않는다는 점이 챗봇과의 결정적 차이다.
- MCP의 본질은 새로운 마법이 아니라 'API 연결의 표준화'다 — 서비스마다 다른 API를 사람이 직접 어댑터로 잇던 작업을 표준 맥락으로 대체한다.
- 에이전트는 한 가지를 아주 잘하도록 좁게 두고, 필요하면 A2A로 다른 전문 에이전트를 호출하는 '분업' 설계가 권장된다.
- n8n 같은 노코드 도구나 agent.ai의 사전 제작 에이전트, 랭체인·랭그래프 같은 프레임워크 등 진입 경로가 다양해, 비개발자도 시작할 수 있다.
자주 묻는 질문
LLM과 AI 에이전트는 어떻게 다른가요?
LLM은 질문에 대해 텍스트·이미지·영상 같은 응답을 생성할 뿐 스스로 행동하지 못합니다. AI 에이전트는 외부 도구와 메모리, LLM을 여러 번 오가며 결정을 내리고 실제 예약·실행 같은 작업을 끝까지 수행합니다.
MCP는 정확히 어떤 역할을 하나요?
MCP(모델 컨텍스트 프로토콜)는 에이전트가 외부 플랫폼의 어떤 API를 어떤 입력·출력 구조로 호출해야 하는지 알려주는 표준 안내서입니다. 앤트로픽이 도입해 오픈소스로 공개했고, 클라이언트-서버 모델로 동작합니다.
에이전트 간(A2A) 모델은 왜 필요한가요?
하나의 에이전트에 모든 기능을 넣으면 비대해지기 때문에, 기능별 전문 에이전트를 두고 서로 호출하게 합니다. 구글이 만든 A2A 모델은 에이전트가 서로의 능력을 발견하고 작업을 맡기며 결과를 주고받는 표준을 정의합니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗