AI VIDEO BRIEFING
에이전트형 RAG(Agentic RAG)로 복잡한 추천 검색 문제 해결하기
전통적 RAG로는 풀기 어려운 복잡한 자연어 검색을, 질의 이해·검색 최적화·반복 생성을 갖춘 에이전트형 RAG가 어떻게 해결하는지 AWS re:Invent 2025 발표로 정리했다.

핵심 메시지
쉽게 이해하기
발표자는 식당·요리 추천 서비스를 예로 든다. 처음 방문한 커플이 ‘예산 안에서 호텔 근처, 채식·유제품 제외, 매운맛 가능, 공유 가능한 요리, 로맨틱한 분위기’ 같은 길고 복잡한 조건을 한꺼번에 제시하는 상황이다. 이런 질의는 한 번의 추천 실패가 곧 사용자 이탈로 이어지기 때문에 단 한 번에 정확히 맞혀야 한다.
이 문제가 어려운 이유로 발표자는 네 가지를 든다. 리뷰·메뉴·이미지·위치·알레르기 등 서로 다른 데이터 소스를 조율해야 하고, 첫 추천의 성패가 큰 결과로 이어지는 고위험·고보상 상황이며, 질의 자체가 길고 추론과 계획을 요구하고, 그래서 단순 RAG로는 실패해 추가 엔지니어링이 필요하다는 것이다.
에이전트형 RAG가 기여하는 지점은 세 가지다. 첫째 질의 이해(사용자가 실제로 무엇을 원하는지 해석), 둘째 검색 최적화(필요한 맥락을 가장 잘 가져오는 방법), 셋째 반복 생성(첫 검색에서 멈추지 않고 더 나은 응답을 생성)이다. 이를 구현하는 기본 구조가 에이전트가 도구와 워크플로에 접근해 스스로 호출 순서를 정하는 도구 사용 아키텍처다.
질의 이해 단계에서는 하위 질의 생성, 질의 라우팅(어떤 데이터베이스로 보낼지), 질의 확장(추가로 포함할 용어·제약)이라는 세 기법이 소개된다. 검색 단계에서는 에이전트에게 스키마 등 데이터 맥락을 제대로 넘기고, 강력한 검색 기법과 필터를 적극 활용해 검색 공간과 지연을 줄이라고 강조한다. 식당·요리·리뷰처럼 데이터 성격이 다르면 색인도 따로 두고, 이미지가 섞인 멀티모달 검색이나 재랭킹을 적용한다.
마지막 생성 단계에서는 검색 루프를 돌려 추가로 필요한 정보를 찾고, 사용자가 말로 다 표현하지 못한 ‘암묵적 선호’를 파악하며, 구조화된 생성으로 응답을 정돈한다. 특히 알레르기·분위기 같은 핵심 조건을 체크리스트로 만들어, 에이전트가 만든 추천을 워크플로 끝에서 한 번 더 검증하는 패턴이 인상적이다.
주요 인사이트
- 개발자가 가장 흔히 저지르는 실수는 데이터베이스를 에이전트에 연결만 하고 스키마 등 ‘무엇이 들어 있는지’를 제대로 알려주지 않는 것이다.
- 질의 라우팅은 많은 개발자가 과소평가하지만, 들어온 질의를 어떤 데이터베이스로 보낼지 정하는 일이 검색 품질을 크게 좌우한다.
- 정확도를 위해 지연(latency)을 일부 희생하는 트레이드오프는 ‘첫 추천을 반드시 맞혀야 하는’ 고위험 상황에서 합리적인 선택이다.
- 체크리스트는 초기 추천 생성과 병렬로 동적으로 만들어, 검색이 길어져도 끝까지 유지되며 결과를 검증하는 수단이 된다.
자주 묻는 질문
전통적 RAG는 왜 이런 복잡한 질의에서 실패하나요?
발표에 따르면 일반적인 RAG에는 질의 이해 단계가 없어서, 길고 추론·계획이 필요한 자연어 질의를 그대로 데이터베이스에 던지면 의도를 해석하지 못하고 실패하기 쉽기 때문입니다.
에이전트형 RAG가 더하는 세 가지 핵심 능력은 무엇인가요?
질의 이해(복잡한 질의를 분해해 의도 파악), 검색 최적화(에이전트가 다루기 쉽게 만든 데이터 소스에서 최적의 맥락 확보), 반복 생성(루프를 돌려 결과 품질을 높임)입니다.
체크리스트 평가는 어떻게 동작하나요?
초기 추천을 생성하는 동시에, 충족해야 할 조건(예: 알레르기 회피, 데이트 분위기)을 항목으로 동적으로 만들어 두고, 검색·생성이 끝난 결과가 그 항목들을 통과하는지 마지막에 다시 검증합니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗