AI VIDEO BRIEFING

풀스택 GenAI 4시간 빌드 — FastAPI·React·Supabase로 문서 코파일럿

프런트엔드부터 백엔드·DB·인제스트·RAG 파이프라인·배포까지, 실제 AI 개발 회사의 작업 방식 그대로 4시간 동안 문서 코파일럿을 만드는 풀스택 GenAI 실전 빌드를 정리했다.

4시간 풀스택 GenAI 실전 빌드: 모노레포·RAG 파이프라인·AI 에이전트로 문서 코파일럿 만들기 영상 대표 이미지

핵심 메시지

  • 수백 개 문서에 근거해 질문에 답하는 문서 코파일럿을, 프런트엔드·백엔드·DB·인제스트·RAG 파이프라인까지 전체 아키텍처로 만든다.
  • 백엔드와 프런트엔드를 하나의 모노레포에 담고, 최상위·프런트·백엔드별 agents.md 파일을 둬 코딩 에이전트가 전체 맥락을 파악하게 한다.
  • 이 영상은 초보용 단계별 클릭 가이드가 아니라, 실수와 디버깅까지 포함한 실제 엔지니어링 과정을 자연스러운 속도로 보여준다.
  • 인제스트 파이프라인은 docling으로 문서를 처리하고 청킹한 뒤 임베딩해 Supabase에 저장하며, 비용이 드는 임베딩은 한 청크로 먼저 테스트한다.
  • 스택을 이해하면 AI 코딩 도구(cursor·codex 등)를 쓰는 일은 질문하기만큼 쉬워지며, 더 좋은 도구가 나오면 그냥 갈아타면 된다.

쉽게 이해하기

이 영상은 발표자가 채널에서 처음 시도하는 대형 프로젝트로, 사용자가 질문하면 데이터베이스에 적재한 수백 개 문서에 근거해 답을 주는 풀스택 GenAI 애플리케이션을 만든다. 프런트엔드, 백엔드, 데이터베이스 연결, 인제스트·RAG 파이프라인이 어떻게 맞물리는지 전체 아키텍처를 다루며, 약 40시간 분량의 학습을 4시간으로 압축했다고 밝힌다. 다만 초보 친화적인 단계별 클릭 가이드가 아니라 자연스러운 작업 속도로 AI 에이전트를 활용하는 실전 과정임을 분명히 한다.

프로젝트는 GitHub 저장소의 main 브랜치(거의 빈 시작점)와 development 브랜치(최종 결과)로 나뉜다. 발표자는 따라 하려면 main을 클론해 함께 코딩하되, 막히면 자신의 채널에서 해당 주제(하이브리드 검색, 에이전틱 검색, CI/CD 등) 영상을 찾아보라고 안내한다. 백엔드와 프런트엔드를 단일 저장소에 담는 모노레포 구조를 채택하고, 최상위·프런트·백엔드 폴더마다 agents.md 파일을 둬 코딩 에이전트가 전체 맥락을 추론하도록 한 점이 핵심 준비 작업이다.

실제 작업은 가상의 클라이언트 브리프에서 출발한다. 독립 투자 리서치 회사 'Driftwood Capital'이 헤지펀드·연기금 같은 기관 고객에게 심층 주식 리서치를 구독 형태로 판매한다는 설정으로, 애널리스트가 다루는 상장사들의 연차·분기 보고서가 곧 코파일럿이 근거로 삼을 문서가 된다. 발표자는 좋은 사전 준비가 AI 에이전트의 작업 속도를 좌우한다는 점을 반복해 강조한다.

인제스트와 RAG 파이프라인 구축에서는 먼저 계획을 세우게 한 뒤 실행한다. HTML 파일에서 docling 문서를 만들어 페이지 번호 등을 보존하고, 하이브리드 청커로 청킹한 다음 임베딩해 Supabase 테이블에 적재한다. 임베딩은 비용이 드는 과정이라 전체를 돌리기 전에 한 청크로 먼저 테스트해 정상 동작을 확인하는 신중한 절차를 따른다. 발표자는 진행 중 OpenAI API 사용 비용(수십 센트 수준)도 실시간으로 점검해 보여준다.

마지막에 발표자는 이것이 끝이 아니라 '진짜 AI 엔지니어링의 시작'이라고 말한다. 거창한 에이전틱 설정이나 복잡한 커스텀 스킬·루프를 신봉하지 않으며, 유능한 엔지니어들은 그저 도구를 쓸 뿐이고 지금은 codex가, 다음엔 또 다른 도구가 더 나을 수 있으니 그때그때 갈아탄다고 말한다. 스택과 다루는 대상을 이해하면 AI 도구 사용은 질문하기만큼 단순해진다는 것이 핵심 결론이다.

주요 인사이트

  • 모노레포 + 폴더별 agents.md 구성은 코딩 에이전트가 백엔드·프런트엔드 전체 맥락을 한 번에 추론하게 해 실전 생산성을 크게 높인다.
  • 잘 정리된 사전 준비(저장소 구조, 에이전트 지침, 브리프)가 AI 에이전트의 작업 속도를 결정한다는 점이 반복해서 강조된다.
  • 임베딩처럼 비용이 드는 작업은 전체 실행 전에 한 청크로 먼저 테스트하는 절차가 실수와 비용 낭비를 막는 실무 습관이다.
  • 깔끔한 강의가 아니라 실수·디버깅까지 포함한 실제 엔지니어링 과정을 보여주는 것이 오히려 현실적인 학습 경험과 포트폴리오로 이어진다.
  • 발표자는 복잡한 에이전틱 셋업보다 '좋은 도구를 그냥 쓰고 더 나으면 갈아타는' 실용주의를 택하며, 스택 이해가 도구 활용의 전제임을 강조한다.

자주 묻는 질문

이 프로젝트로 무엇을 만드나?

사용자가 질문하면 데이터베이스에 적재한 수백 개 문서에 근거해 답하는 풀스택 GenAI 문서 코파일럿을 만든다. 프런트엔드·백엔드·DB 연결·인제스트·RAG 파이프라인을 모두 다룬다.

왜 모노레포와 agents.md 파일을 쓰나?

백엔드와 프런트엔드를 단일 GitHub 저장소(모노레포)에 담고 최상위·프런트·백엔드별로 agents.md 파일을 두면, 코딩 에이전트가 전체 맥락을 추론할 수 있어 작업이 훨씬 원활해진다.

인제스트 파이프라인은 어떻게 구성되나?

docling으로 HTML 문서를 처리해 페이지 번호 등을 보존하고, 하이브리드 청커로 청킹한 뒤 임베딩해 Supabase에 적재한다. 비용이 드는 임베딩은 전체 실행 전에 한 청크로 먼저 테스트한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식