AI VIDEO BRIEFING

데이터 사이언티스트에서 AI 엔지니어 되기: LLM·RAG·에이전트 6개월 학습 로드맵 정리

컨설턴트 데이터 사이언티스트 Anas Riad가 자신이 실제 진행 중인 6개월 전환 로드맵을 공유한다. LLM 기초에서 RAG, 에이전트, 배포·모니터링까지 이어지는 월별 학습 주제와 실습 프로젝트 순서를 정리한다.

데이터 사이언티스트에서 AI 엔지니어로: 실전 6개월 전환 로드맵 영상 대표 이미지

핵심 메시지

  • 에이전트 같은 복잡한 시스템에 뛰어들기 전에 LLM의 기초부터 다지는 것이 로드맵의 출발점이다.
  • 이 6개월 계획은 데이터 사이언스와 머신러닝의 기본기가 이미 있다는 전제에서 설계됐다.
  • 핵심 축은 LLM 기초 → RAG 시스템 → 에이전트 → 하나의 제대로 된 프로젝트 순서다.
  • 학습은 이론 20%·실습 80%로, 관심 있는 실제 프로젝트를 만들며 익히는 방식을 강조한다.
  • 최종 목표는 데모가 아니라 배포·모니터링까지 갖춘, 포트폴리오가 될 실제 시스템을 완성하는 것이다.

쉽게 이해하기

영국에서 활동하는 컨설턴트 데이터 사이언티스트 Anas Riad가 자신이 실제로 진행 중인(절반쯤 진행한) 데이터 사이언티스트에서 AI 엔지니어로의 6개월 전환 로드맵을 공유한다. 그는 이 계획이 비기술 배경에서 곧바로 시작하는 것이 아니라 데이터 사이언스와 머신러닝의 탄탄한 기초가 있다는 전제에서 설계됐다고 분명히 한다.

1개월차는 LLM과 AI 기초에 집중한다. 튜토리얼 코드를 베끼는 대신 LLM 앱이 어떻게 동작하는지 이해하는 것이 목표다. 토큰화와 프롬프트, 컨텍스트 윈도, 임베딩과 벡터 검색, 검색 증강 생성(RAG)의 기초, 그리고 에이전트 개념을 익힌다. 주 교재는 Chip Huyen의 'AI Engineering'이며, 노트북에서 간단한 프롬프트·임베딩 검색·RAG 실험을 직접 해보는 실습 중심으로 진행한다.

2개월차는 본격적인 RAG 시스템을 만든다. 원문 문서를 검색 가능한 AI 시스템으로 바꾸는 과정으로, 문서를 불러와 파싱하고 메타데이터를 뽑아 청킹하는 인제스션, 임베딩해 벡터 데이터베이스에 넣고 키워드 매칭과 결합한 하이브리드 검색을 구성하는 인덱싱, 그리고 관련 청크를 뽑아 답변 근거로 삼는 리트리벌의 세 단계를 다룬다. arXiv 논문을 다루는 고급 RAG 프로젝트로 실전 감각을 쌓는다.

3개월차는 노트북 데모를 실제 시스템으로 끌어올린다. FastAPI 기반 API 계층, Docker 컨테이너와 로그, 검색·생성 품질을 점검하는 평가, 실패·지연·비용을 관찰하는 모니터링(Opik 활용)을 더해 시스템을 사용 가능하고 측정 가능하며 신뢰할 수 있게 만든다. 이 지점부터 '엔지니어'라는 이름이 실감난다고 그는 말한다.

4~6개월차는 에이전트로 넘어간다. 4개월차는 도구 사용·함수 호출·가드레일·휴먼인더루프를 익히며 UK 비자 안내 어시스턴트를 만들고, 5개월차는 멀티에이전트 오케스트레이션(CrewAI 등)으로 역할을 나눈 에이전트 협업과 유튜브 제작 보조 어시스턴트를 다룬다. 6개월차는 이 모든 것을 배포·최적화·문서화해 실제로 쓰는 포트폴리오 프로젝트로 완성한다. 'LLM Engineer's Handbook', 'Context Engineering for Multi-Agent Systems' 등을 참고 자료로 든다.

주요 인사이트

  • 에이전트 열풍에 휩쓸려 기초 없이 복잡한 시스템부터 만들면 튜토리얼 코드를 복사할 뿐 원리를 이해하지 못한다.
  • RAG는 온라인의 논란과 무관하게 여전히 가장 유용한 AI 엔지니어링 기술 중 하나로 꼽힌다.
  • 노트북 데모와 실제 시스템은 다르며, API·컨테이너·평가·모니터링을 갖춰야 신뢰할 수 있는 애플리케이션이 된다.
  • 하나의 만능 에이전트보다 역할을 나눈 여러 에이전트가 협업하는 멀티에이전트 구조가 더 효율적인 경우가 많다.
  • 관심 있는 실제 문제를 프로젝트로 삼으면 오래 몰입할 수 있고 결과물이 그대로 포트폴리오가 된다.

자주 묻는 질문

이 로드맵은 완전 초보자도 따라갈 수 있나요?

이 6개월 계획은 데이터 사이언스와 머신러닝의 탄탄한 기초가 이미 있다는 전제에서 설계됐으며, 비기술 배경에서 곧바로 AI 엔지니어가 되는 것을 가정하지 않는다.

RAG란 무엇인가요?

검색 증강 생성(Retrieval Augmented Generation)으로, 모델에 우리 데이터의 관련 맥락을 제공해 인터넷 전반이 아니라 우리 문맥에 근거해 정확히 답하게 하는 방식이다.

학습에서 이론과 실습 비중을 어떻게 두나요?

발표자는 실습 80%, 이론 20%를 권한다. 먼저 만들 프로젝트를 떠올리고 진행하면서 필요한 자료를 찾아 공부하는 방식을 선호한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식