AI VIDEO BRIEFING
벡터 데이터베이스란? 임베딩과 유사도 검색으로 LLM에 장기 기억 더하기
투자금이 몰리는 벡터 데이터베이스의 정체를 쉽게 풀어낸다. 벡터와 임베딩의 개념부터 유사도 검색, 그리고 LLM에 외부 데이터와 장기 기억을 더하는 핵심 활용법까지 정리했다.

핵심 메시지
쉽게 이해하기
영상은 2023년 당시 Weaviate, Pinecone, Chroma 등 벡터 데이터베이스 스타트업에 대규모 투자가 잇따른 상황을 소개하며 '도대체 벡터 DB가 뭔가'라는 질문을 던진다. 진행자는 특유의 빠른 호흡으로 벡터와 임베딩이라는 기본 개념부터 풀어 나간다.
벡터는 단순한 숫자 배열이지만, 단어·문장·이미지·오디오 같은 대상을 '임베딩'이라는 고차원 연속 공간에 표현할 수 있다는 점이 특별하다. 파티에서 비슷한 사람들끼리 모이듯, 임베딩 공간에서는 의미가 가까운 대상이 서로 가까이 모인다. 이런 성질 덕분에 임베딩은 추천 시스템, 검색 엔진, ChatGPT 같은 텍스트 생성에 쓰인다.
임베딩을 만든 뒤에는 '어디에 저장하고 어떻게 빠르게 조회하느냐'가 과제가 된다. 관계형 DB는 행과 열, 문서 DB는 문서와 컬렉션을 다루지만, 벡터 DB는 유사도로 군집화된 숫자 배열을 초저지연으로 질의한다. postgres의 pgvector나 Redis처럼 기존 DB도 벡터를 지원하고, Weaviate·Milvus(오픈소스), Pinecone, Chroma 등 전용 DB도 등장했다.
코드 예시에서는 Chroma와 자바스크립트로 클라이언트를 만들고, OpenAI API로 임베딩 함수를 정의해 데이터가 추가될 때마다 임베딩을 갱신한다. 문자열로 질의하면 결과 문서와 함께 거리(distance) 배열이 반환되며, 거리가 작을수록 유사도가 높다.
진행자는 벡터 DB가 뜨거운 진짜 이유로 LLM에 장기 기억을 더할 수 있다는 점을 꼽는다. GPT-4 같은 범용 모델에 자체 데이터를 벡터 DB로 연결하면, 사용자의 프롬프트에 맞춰 관련 문서를 불러와 맥락을 보강하고 응답을 맞춤화할 수 있으며 과거 데이터를 불러와 장기 기억도 부여할 수 있다. LangChain 같은 도구와의 연동도 함께 언급한다.
주요 인사이트
- 벡터의 힘은 숫자 배열 자체가 아니라, 단어·이미지 등 복잡한 대상의 '의미'를 좌표로 옮겨 비슷한 것끼리 가깝게 배치하는 데 있다.
- 벡터 DB는 키워드가 아니라 의미적 유사도로 검색하므로, 추천·검색·생성형 AI 애플리케이션에 자연스럽게 들어맞는다.
- 전용 벡터 DB가 쏟아지지만 pgvector나 Redis처럼 기존 데이터베이스에 벡터 기능이 더해지는 흐름도 무시할 수 없다.
- 벡터 DB의 폭발적 관심은 결국 LLM의 한계를 보완하는 데서 나온다. 외부 데이터 연결로 답변을 맞춤화하고 장기 기억을 부여하기 때문이다.
- 쿼리 결과의 거리(distance) 값은 작을수록 유사도가 높다는 직관적 지표로, 검색 품질을 가늠하는 출발점이 된다.
자주 묻는 질문
벡터와 임베딩은 무엇인가요?
벡터는 숫자의 배열입니다. 임베딩은 단어·문장·이미지·오디오 같은 대상을 고차원 연속 공간의 벡터로 표현한 것으로, 의미가 비슷한 대상일수록 공간에서 서로 가깝게 배치됩니다.
벡터 데이터베이스는 기존 데이터베이스와 어떻게 다른가요?
관계형 DB는 행과 열, 문서 DB는 문서와 컬렉션을 다루지만, 벡터 DB는 유사도로 군집화된 숫자 배열을 저장하고 이를 초저지연으로 질의합니다. 그래서 AI 기반 애플리케이션에 적합합니다.
벡터 데이터베이스에는 어떤 것들이 있나요?
Weaviate와 Milvus는 Go로 작성된 오픈소스이고, Pinecone은 비공개이지만 매우 인기가 많으며, Chroma는 ClickHouse 기반입니다. 또한 postgres의 pgvector나 Redis처럼 기존 DB도 벡터를 지원합니다.
벡터 데이터베이스가 LLM과 어떻게 연결되나요?
GPT-4 같은 범용 모델에 자체 데이터를 벡터 DB로 연결하면, 사용자의 프롬프트와 관련된 문서를 불러와 맥락을 보강하고 응답을 맞춤화할 수 있습니다. 과거 데이터를 불러와 장기 기억을 부여하는 것도 가능합니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗