AI VIDEO BRIEFING

LLM 총정리 — 토큰·임베딩·트랜스포머 원리와 학습·파인튜닝, 한계와 윤리

신경망의 일종인 LLM이 토큰화·임베딩·트랜스포머로 다음 단어를 예측하는 방식, 학습과 파인튜닝 과정, 트랜스포머 등장의 역사, 그리고 환각·편향 같은 한계와 윤리 쟁점을 입문자 눈높이로 정리했다.

출처: Matthew Berman2024년 3월 7일AI 보조 요약

대규모 언어모델(LLM) 완전 정복: 작동 원리부터 한계와 윤리까지 영상 대표 이미지

핵심 메시지

LLM은 방대한 텍스트로 학습한 신경망의 일종으로, "무엇을 할지"가 아니라 "배우는 법"을 가르치는 점에서 전통적 프로그래밍과 근본적으로 다르다.
LLM은 토큰화 → 임베딩(벡터화) → 트랜스포머의 세 단계로 작동하며, 어텐션 메커니즘으로 문맥을 파악해 다음 단어를 예측한다.
2017년 구글의 "Attention is all you need" 논문이 트랜스포머를 제시했고, 이것이 GPT 계열과 ChatGPT로 이어지며 규모가 폭발적으로 커졌다.
사전학습된 거대 모델을 특정 용도에 맞게 다시 다듬는 파인튜닝은 전체 학습보다 빠르고 정확해 일반인도 접근하기 쉽다.
LLM은 수학·논리, 편향, 지식 시점 한계, 환각, 막대한 하드웨어 비용과 저작권 등 윤리 문제를 함께 안고 있다.

쉽게 이해하기

LLM(대규모 언어모델)은 웹·책·자막 등 방대한 텍스트로 학습한 신경망의 한 종류다. 신경망은 데이터의 패턴을 찾아 인간 두뇌의 작동을 모사하려는 알고리즘 묶음이고, LLM은 그중 자연어 이해에 특화돼 있다. 핵심 차별점은 전통적 프로그래밍이 "x면 y"처럼 명시적 지시를 내리는 반면, LLM은 컴퓨터에게 "하는 법"이 아니라 "배우는 법"을 가르친다는 데 있다. 손글씨 인식처럼 모든 규칙을 일일이 코딩하기 어려운 문제에 예시를 주어 추론하게 하는 방식이 강력한 이유다.

역사적으로는 1966년 엘리자(Eliza)가 키워드 기반의 정해진 답을 내놓던 초기 모델이었고, 순환신경망(RNN)이 처음으로 다음 단어를 예측했다. 큰 전환점은 2017년 구글의 논문 "Attention is all you need"가 제시한 트랜스포머였다. 이 구조는 학습 시간을 줄이고 셀프 어텐션 같은 기능을 갖춰, 2018년 GPT-1(1억1700만 파라미터)과 양방향 처리를 도입한 BERT(3억4000만)를 거쳐 GPT-2, GPT-3(1750억), 그리고 ChatGPT를 대중화한 GPT-3.5, 약 1.76조 파라미터로 전문가 혼합(MoE) 방식을 쓴 것으로 알려진 GPT-4까지 규모가 급격히 커졌다.

작동은 세 단계다. 먼저 토큰화로 문장을 토큰(대략 단어의 4분의 3 크기) 단위로 쪼개고, 임베딩으로 각 토큰을 의미와 관계를 담은 숫자 벡터로 바꾼다. 이 벡터들은 벡터 데이터베이스에 저장돼 서로의 유사도(거리)로 관계가 표현되는데, "book"과 "worm"처럼 자주 함께 등장하는 단어는 가까운 좌표를 갖는다. 마지막으로 트랜스포머가 멀티헤드 어텐션과 내적(dot product) 계산으로 각 단어가 문장에 얼마나 기여하는지를 따져 문맥을 파악하고 다음 단어를 만들어낸다.

학습은 데이터 수집 → 전처리 → 훈련 → 평가로 이어진다. 데이터 품질이 곧 모델 품질이라 "쓰레기를 넣으면 쓰레기가 나온다". 모델은 다음 단어를 예측하며 가중치를 수백만 번 조정하고, 일부 데이터로 성능을 평가할 때는 단어 유사도를 보는 퍼플렉시티(perplexity) 지표와 사람 피드백을 활용하는 RLHF를 쓴다. 한편 파인튜닝은 사전학습된 기반 모델을 피자 주문 대화 같은 특정 용도의 데이터로 다시 다듬는 것으로, 전체 학습보다 빠르고 정확하며 하나의 기반 모델을 여러 용도로 거듭 활용할 수 있다.

한계도 분명하다. 수학·논리·추론에서 자주 약하고, 인간이 만든 데이터에서 비롯된 편향과 안전 문제를 안으며, 학습 시점 이후 지식이 끊기는 문제(웹 브라우징으로 일부 보완), 자신 있게 틀리는 환각, 막대한 하드웨어·전기 비용이 대표적이다. 저작권 자료 학습을 둘러싼 소송, 사기·허위정보 악용, 화이트칼라 직군의 대대적 변화, 그리고 AGI의 정렬(alignment) 같은 윤리 쟁점도 함께 다룬다. 최신 흐름으로는 지식 증류, RAG, 전문가 혼합(MoE), 멀티모달, 단계적 추론, 더 큰 컨텍스트 창과 외부 메모리가 소개된다.

주요 인사이트

LLM의 본질은 "하는 법"이 아니라 "배우는 법"을 가르치는 것 — 이 유연성이 손글씨 인식처럼 규칙을 일일이 코딩하기 어려운 문제를 푸는 힘이다.
2017년 트랜스포머 논문이 분기점이었고, 이후 핵심 기술 변화보다 "규모 확장"이 성능 도약을 이끌었다(GPT-1의 1억대에서 GPT-4의 조 단위로).
토큰·임베딩·벡터 데이터베이스는 단어의 의미와 관계를 "좌표"로 다루는 장치다 — 가까운 좌표가 곧 비슷한 의미다.
파인튜닝은 거대 모델을 처음부터 학습하지 않고도 특정 도메인에 맞추는 현실적 방법이라 일반 사용자·개발자에게 진입장벽이 낮다.
LLM은 자신 있게 틀릴 수 있다(환각) — 수학·논리 약점, 편향, 저작권·일자리 같은 윤리 문제를 함께 이해해야 한다.

자주 묻는 질문

LLM은 전통적인 프로그래밍과 무엇이 다른가요?

전통적 프로그래밍은 "x면 y"처럼 컴퓨터가 할 일을 명시적으로 지시합니다. 반면 LLM은 컴퓨터에게 하는 법이 아니라 "배우는 법"을 가르쳐, 예시로부터 새 입력을 추론하게 합니다. 그래서 손글씨 인식처럼 규칙을 일일이 코딩하기 어려운 문제에 강합니다.

LLM은 어떤 단계로 작동하나요?

토큰화·임베딩·트랜스포머의 세 단계입니다. 문장을 토큰으로 쪼개고, 각 토큰을 의미를 담은 숫자 벡터로 바꾼 뒤, 트랜스포머의 어텐션 메커니즘으로 문맥을 파악해 다음 단어를 예측합니다.

트랜스포머는 왜 중요한가요?

2017년 구글의 "Attention is all you need" 논문이 제시한 구조로, 학습 시간을 줄이고 셀프 어텐션 등을 갖춰 GPT 계열과 ChatGPT의 토대가 됐습니다. 영상은 이 논문이 사실상 현대 LLM의 출발점이라고 설명합니다.

파인튜닝이란 무엇인가요?

GPT·BERT 같은 사전학습된 기반 모델을 특정 용도의 데이터로 다시 다듬는 것입니다. 예컨대 피자 주문 대화 데이터로 다듬으면 그 분야 대화에 훨씬 능숙해집니다. 전체 학습보다 빠르고 정확하며, 하나의 기반 모델을 여러 용도로 반복 활용할 수 있습니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗