AI VIDEO BRIEFING
2026 LLM 공부 순서 가이드: 기초부터 AI 에이전트까지 4단계
구글·마이크로소프트 출신 AI 리더가 제안하는 대규모 언어 모델 학습 로드맵. 기초 머신러닝부터 트랜스포머, 파인튜닝·RAG, AI 에이전트까지 순서대로 정리했다.

핵심 메시지
쉽게 이해하기
발표자는 10년 넘게 머신러닝·AI 분야에서 일했고 컬럼비아대에서 데이터 사이언스 석사를 받았으며, 마이크로소프트·구글·IBM을 거쳐 현재 추론 분야 스타트업 Fireworks AI에서 AI 개발자 관계를 이끌고 있다. 수백 개의 LLM 강좌가 쏟아지는 상황에서 '무엇을 어떤 순서로 배워야 하는가'라는 혼란을 풀어주는 것이 이 영상의 목적이다.
왜 순서가 중요할까. 많은 사람이 곧바로 에이전트를 만들거나 원리도 모른 채 파인튜닝부터 시도한다. 그러다 무언가 작동하지 않으면 왜 그런지 모르고, 튜토리얼 코드를 복사만 하다가 자신의 문제에 맞게 고쳐야 할 때 완전히 막힌다. 집을 지을 때 기초 → 골조 → 마감 순으로 가야 하듯, 기초를 건너뛰면 무너진다.
1단계는 전통적인 머신러닝·딥러닝 기초다. LLM도 결국 딥러닝 모델이라 경사하강법, 역전파, 신경망 구조, 손실함수와 최적화 위에 서 있다. 이를 모르면 이후 모든 것이 '마법'처럼 느껴지고 디버깅과 설계 판단이 불가능해진다. 추천 자료로 앤드루 응의 머신러닝 스페셜라이제이션(DeepLearning.AI)과 MIT의 딥러닝 입문 강좌를 든다. 영상만 보지 말고 직접 실습하며 직관을 기르라고 강조한다.
2단계는 트랜스포머와 어텐션이다. GPT, 클로드, 라마, 미스트랄 등 모든 주요 LLM이 트랜스포머 구조를 기반으로 한다. 핵심은 자기어텐션(self-attention)으로, 문장을 처리할 때 각 단어가 다른 모든 단어를 살펴보며 현재 문맥에 무엇이 가장 관련 있는지 파악한다. 제이 알라마르의 'Illustrated Transformer' 블로그와 허깅페이스 LLM 강좌를 추천하며, 쿼리·키·값, 멀티헤드 어텐션, 위치 인코딩을 이해하고 간단한 트랜스포머를 직접 구현해 보라고 권한다.
3단계는 사전학습·파인튜닝·RAG다. 사전학습은 방대한 텍스트로 기반 모델을 처음부터 학습시키는 과정이고, 파인튜닝은 사전학습된 모델을 특정 작업·도메인에 맞게 가중치를 조정하는 것이며, RAG는 가중치를 바꾸지 않고 추론 시점에 외부 지식을 검색해 활용하는 방식이다. 코히어의 LLM University, DeepLearning.AI의 사전학습·파인튜닝 단기 강좌(LoRA 같은 효율적 기법 포함)를 추천한다. 항상 파인튜닝이 정답은 아니며, 프롬프트 엔지니어링이나 RAG가 더 효율적일 때가 많다고 조언한다. 마지막 4단계는 애플리케이션과 AI 에이전트 구축으로, 도구를 쓰고 자율적으로 작업을 수행하는 시스템을 다룬다.
주요 인사이트
- 학습 경로는 서로 위에 쌓인다. 각 단계가 다음 단계의 토대가 되므로, 기초를 탄탄히 하면 나중의 몇 달을 아낄 수 있다.
- 트랜스포머의 어텐션을 직접 코드로 구현해 보는 것은 읽기만 하는 것과 비교할 수 없을 만큼 이해를 굳혀 준다.
- 파인튜닝은 강력하지만 연산·데이터 준비·유지보수 비용이 따른다. 문제에 따라 프롬프트 엔지니어링이나 RAG가 더 나은 선택일 수 있다.
- RAG는 모델 가중치를 바꾸지 않고도 회사의 비공개 데이터를 LLM에 연결할 수 있어 기업 응용에서 특히 유용하다.
- AI 에이전트는 강력하지만 예측하기 어렵다. 처음에는 도구와 권한을 좁게 제한하고 안정적으로 작동시킨 뒤 점진적으로 확장하는 것이 안전하다.
자주 묻는 질문
LLM을 배우려는데 왜 전통적인 머신러닝부터 시작해야 하나요?
LLM도 딥러닝 모델이라 경사하강법, 역전파, 신경망, 손실함수 같은 개념 위에 서 있기 때문입니다. 이 기초가 없으면 이후 내용이 마법처럼 느껴지고, 디버깅이나 설계 판단을 할 수 없습니다.
파인튜닝과 RAG는 어떻게 다른가요?
파인튜닝은 사전학습된 모델의 가중치를 특정 작업이나 도메인에 맞게 조정하는 것이고, RAG는 가중치를 바꾸지 않고 추론 시점에 외부 문서를 검색해 응답에 활용하는 방식입니다. RAG는 비공개 데이터를 파인튜닝 없이 연결할 수 있어 기업에서 유용합니다.
AI 에이전트를 만들 때 흔히 하는 실수는 무엇인가요?
너무 빨리 많은 자율성을 부여하는 것입니다. 처음에는 도구와 권한을 제한한 제약된 에이전트로 시작해 안정적으로 작동시키고, 이해와 자신감이 쌓인 뒤 점진적으로 기능을 확장하는 것이 좋습니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗