AI VIDEO BRIEFING
RAG(검색증강생성)란? 내 콘텐츠로 답하는 LLM 아키텍처 쉽게 이해하기
검색증강생성(RAG)은 대규모 언어모델이 내 회사 문서·웹사이트 같은 자체 콘텐츠로 답하게 만드는 솔루션 패턴이다. '프롬프트 앞의 프롬프트', 청크 분할, 벡터 임베딩과 벡터 DB 검색까지 원리를 정리했다.

핵심 메시지
쉽게 이해하기
발표자는 RAG가 AI 분야의 사소한 구석이 아니라, LLM을 활용하는 프로젝트에서 거듭 등장하는 매우 중요하고 보편적인 솔루션 패턴이라고 강조한다. 자신이 보는 LLM 프로젝트의 다수가 바로 이 방식, 즉 '내 콘텐츠'를 LLM과 묶어 ChatGPT 같은 경험을 직원·고객·사용자에게 제공하는 형태라고 말한다.
먼저 검색엔진과 LLM의 차이를 설명한다. 검색엔진이 관련 링크를 나열해 사용자가 직접 읽고 답을 찾게 한다면, LLM은 그 내용을 소화·결합·조립해 새로운 답을 생성한다. 문제는 이 경험을 인터넷이 아닌 '내 콘텐츠'(웹사이트, PDF 문서, 서비스 티켓 등)에 적용하고 싶을 때 발생하며, RAG가 그 해법이다.
동작은 의료 챗봇 예시로 설명된다. '주차 가능한가요?' 같은 환자 질문에 일반 답변 대신 우리 병원의 답을 주려면, 프롬프트에 ① 지시문(예: 병원 상담원 역할로 친절하게 답하라)과 ② 우리 콘텐츠에서 가져온 관련 정보, ③ 실제 질문을 함께 담아 LLM에 보낸다. 이렇게 질문 앞에 붙는 맥락이 '프롬프트 앞의 프롬프트'이며, 이를 잘 다듬는 것이 프롬프트 엔지니어링이 중요한 이유다.
마지막 핵심은 방대한 콘텐츠에서 관련 부분만 추리는 방법이다. 콘텐츠를 문단 같은 청크로 쪼개 각각을 벡터(숫자의 나열)로 변환하는데, 비슷한 주제의 문단은 비슷한 벡터값을 갖는다. 사용자의 질문도 실시간으로 벡터화한 뒤 콘텐츠 벡터들과 수학적으로 비교해 가장 가까운 상위 문서(예: 5개)를 찾아내고, 그 문단들을 프롬프트에 넣어 답을 생성한다. 이렇게 콘텐츠를 벡터화해 저장하는 것이 벡터 데이터베이스다.
주요 인사이트
- RAG의 가치는 LLM의 강력한 생성 능력을 인터넷이 아닌 '내 데이터'에 적용할 수 있게 해 준다는 데 있다.
- 질문에 지시문과 관련 콘텐츠를 덧붙이는 '프롬프트 앞의 프롬프트' 설계가 답변 품질을 좌우한다.
- 콘텐츠를 청크로 쪼개 벡터로 만들면, 의미가 비슷한 문단끼리 벡터값이 가까워져 유사도 검색이 가능해진다.
- 질문 벡터와 가장 가까운 상위 문서만 골라 프롬프트에 넣으므로, 거대한 콘텐츠에서도 관련 부분만 효율적으로 활용한다.
- 제품 문서 챗봇, 서비스 티켓 해결, 의료 상담 등 '내 콘텐츠 기반 질의응답'이 대표적 활용처다.
자주 묻는 질문
RAG는 어떤 문제를 해결하나요?
ChatGPT 같은 LLM이 일반적인 답이 아니라 내 회사 웹사이트·PDF 문서·내부 시스템 등 자체 콘텐츠에 근거해 답하도록 만들어, 조직 고유의 정확한 질의응답 경험을 제공합니다.
'프롬프트 앞의 프롬프트'란 무엇인가요?
사용자 질문만 LLM에 보내는 대신, 역할·태도를 정한 지시문과 내 콘텐츠에서 검색한 관련 정보를 질문 앞에 함께 묶어 보내는 것을 말합니다. 이 맥락 설계가 RAG 답변 품질의 핵심입니다.
방대한 콘텐츠에서 관련 내용만 어떻게 골라내나요?
콘텐츠를 문단 단위 청크로 쪼개 벡터(숫자 표현)로 변환해 벡터 DB에 저장합니다. 질문도 벡터로 바꿔 콘텐츠 벡터들과 비교한 뒤, 가장 가까운 상위 문서들을 찾아 그 문단을 프롬프트에 넣습니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗