AI VIDEO BRIEFING

LLM vs AI 워크플로 vs AI 에이전트 차이 — 비전공자용 쉬운 정리

ChatGPT 같은 LLM부터 워크플로, 그리고 스스로 추론·행동하는 AI 에이전트까지의 차이를 음식 추천 예시로 단계별로 풀어내고, RAG와 ReAct 같은 용어도 쉽게 정리했습니다.

LLM·AI 워크플로·AI 에이전트, 비전공자를 위한 3단계 쉬운 설명 영상 대표 이미지

핵심 메시지

  • ChatGPT·Gemini·Claude·Grok 같은 앱은 모두 LLM(대규모 언어 모델) 위에 만들어진 응용이며, LLM은 이들 AI 앱의 '뇌'에 해당한다.
  • LLM은 입력을 받아 학습한 내용으로 답하지만, 당신의 선호·파일·실시간 정보를 모르고 수동적이다. 스스로 무언가를 하지 않기에 워크플로가 필요하다.
  • 워크플로는 레시피와 같아서 작성된 대로만 동작한다(제어 로직). 정해 둔 경로에 없는 요청이 들어오면 실패하고, 결과가 나쁘면 사람이 다시 설정을 고쳐 돌려야 한다.
  • AI 에이전트는 워크플로가 못 하는 세 가지를 한다: 추론(reason), 행동(act), 반복(iteration). 사람 대신 어떤 도구를 쓰고 어떤 단계를 밟을지 스스로 결정한다.
  • RAG는 '답하기 전에 무언가를 찾아보는' 것일 뿐이고, ReAct는 Reason(추론)+Act(행동)의 약자로 AI 에이전트를 만드는 대표적 프레임워크다.

쉽게 이해하기

영상은 AI 콘텐츠가 너무 어렵거나 너무 기초적인 양극단에 치우쳐 있다고 보고, 비전공자도 이해하도록 LLM → AI 워크플로 → AI 에이전트의 순서로 설명한다. 익숙한 것(ChatGPT 같은 앱)에서 시작해 점차 'rag', 'react', 'agent' 같은 위협적으로 들리는 용어를 실생활 예시로 풀어낸다.

1단계는 LLM(대규모 언어 모델)이다. ChatGPT·Gemini·Claude·Grok 등은 모두 LLM 위에 세워진 앱이고, LLM은 그 앱들의 뇌다. 구글에 검색어를 넣으면 답을 받듯, LLM에 프롬프트를 주면 학습한 내용을 바탕으로 응답한다. 다만 LLM은 많은 데이터로 학습됐어도 당신의 선호나 파일·주문 내역·실시간 정보를 알지 못하며, 직접 연결해 주기 전까지는 그렇다. 무엇보다 LLM은 수동적이어서 입력을 기다릴 뿐 스스로 행동하지 않는다.

그래서 2단계인 워크플로가 등장한다. 예컨대 'Uber Eats의 과거 주문 내역을 보고 추천해 줘'라고 해도 접근 권한이 없으면 LLM은 실패한다. 워크플로를 만들어 주문 내역에 접근하게 하고 '별점 5점 이상에서 골라 제안' 같은 단계를 지정하면 작동한다. 하지만 '새로운 걸 추천해 줘'라고 하면 프로그래밍한 경로에 '새 옵션 찾기'가 없어 실패한다. 워크플로는 레시피처럼 쓰인 대로만 동작하며, 이를 제어 로직이라 부른다. 여기서 RAG(검색 증강 생성)는 '답하기 전에 무언가를 찾아보는' 워크플로 안의 한 도구일 뿐이다.

워크플로의 한계는, 결과가 마음에 들지 않으면 사람이 직접 설정을 고치고 다시 돌려야 한다는 점이다. 즉 사고와 통제의 주체가 여전히 사람이다. 3단계 AI 에이전트는 그 의사결정자 자리를 AI 자신으로 바꾼다. 에이전트는 세 가지를 한다. 추론(오늘 춥다 → 따뜻한 걸 원하겠지, 최근 초밥을 자주 먹었으니 다른 걸 권하자), 행동(근처 식당이 있는지·문을 열었는지 확인하고 리뷰를 읽음), 반복(리뷰가 별로면 더 나은 선택지를 찾아 개선된 결과만 보냄). 심지어 다른 AI 모델로 자기 답을 비평한 뒤 보낼 수도 있다.

여기서 ReAct는 Reason(추론)과 Act(행동)의 합성어로, AI 에이전트를 만드는 가장 인기 있는 프레임워크 중 하나다. 영상은 landing AI 사이트에서 산불 감지 예시를 보여준다. 모든 숲의 카메라를 사람이 동시에 감시할 수 없지만 AI는 가능하며, 신뢰 임계값(threshold)을 낮추면 불처럼 보이는 것을 더 많이 찾고 높이면 더 확실할 때만 알린다. 정리하면 LLM은 질문에 답하는 뇌, 워크플로는 사람이 설계한 과정을 단계대로 따르는 것, 에이전트는 목표를 주면 도달 방법을 스스로 찾아내는 것이다.

주요 인사이트

  • ChatGPT 같은 친숙한 앱이 곧 AI의 전부가 아니라 LLM이라는 '뇌' 위에 얹힌 응용이라는 점을 구분하면, 이후의 워크플로·에이전트 개념이 자연스럽게 이어진다.
  • 워크플로와 에이전트의 결정적 차이는 '사고와 통제의 주체'다. 워크플로에서는 사람이 도구·단계·수정을 결정하지만, 에이전트에서는 AI가 그 역할을 대신한다.
  • RAG와 ReAct처럼 위협적으로 들리는 용어도 본질은 단순하다. RAG는 '답하기 전 검색', ReAct는 'Reason+Act'일 뿐이며, 개념을 분해하면 입문자도 다룰 수 있다.
  • 에이전트가 자기 답을 다른 모델로 비평하고 더 나은 선택지로 교체한 뒤에만 결과를 내보내는 '반복(iteration)' 능력이, 단순 자동화·워크플로와 에이전트를 가르는 핵심이다.

자주 묻는 질문

LLM과 ChatGPT 같은 앱은 어떤 관계인가요?

ChatGPT, Gemini, Claude, Grok 같은 앱은 모두 LLM(대규모 언어 모델) 위에 만들어진 응용 프로그램입니다. LLM은 이런 AI 앱들의 '뇌'에 해당하며, 프롬프트를 받아 학습한 내용을 바탕으로 응답을 생성합니다.

AI 워크플로와 AI 에이전트의 차이는 무엇인가요?

워크플로는 레시피처럼 사람이 작성한 단계대로만 동작하며, 정해진 경로에 없는 요청에는 실패하고 사람이 직접 수정해야 합니다. AI 에이전트는 추론·행동·반복을 스스로 수행해, 어떤 도구를 어떤 순서로 쓸지 직접 결정하고 결과가 미흡하면 스스로 개선합니다.

RAG와 ReAct는 무엇인가요?

RAG(검색 증강 생성)는 답하기 전에 무언가를 찾아보는 것으로, 워크플로 안의 한 도구입니다. ReAct는 Reason(추론)과 Act(행동)의 약자로, AI 에이전트를 만드는 데 널리 쓰이는 대표적 프레임워크입니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식