AI VIDEO BRIEFING

LLM 작동 원리 완전 정리: 두 개의 파일부터 학습·파인튜닝·보안까지

안드레이 카파시의 LLM 입문 강연 요약. 모델이 사실은 두 개의 파일이라는 비유부터 사전학습과 파인튜닝, 스케일링 법칙, 도구 사용, LLM 운영체제 비유, 보안 위협까지 핵심을 정리한다.

출처: Andrej Karpathy2023년 11월 23일AI 보조 요약

거대 언어 모델 입문: 카파시가 설명하는 LLM의 작동 원리와 미래 영상 대표 이미지

핵심 메시지

LLM은 본질적으로 '파라미터 파일'과 그것을 돌리는 '실행 코드'라는 두 개의 파일로 볼 수 있다. Llama 2 70B는 140GB짜리 파라미터 파일과 약 500줄의 코드면 맥북에서도 돌릴 수 있다.
학습은 인터넷 텍스트를 신경망 파라미터로 '손실 압축'하는 매우 비싼 과정이고, 추론(실행)은 상대적으로 값싸다.
신경망이 하는 일은 다음 단어를 예측하는 것이며, 이 단순한 목표가 세계에 대한 지식을 파라미터 안에 학습하게 만든다.
어시스턴트는 사전학습(지식)과 파인튜닝(정렬)의 2단계로 만들어지며, 선택적 3단계로 인간 피드백 기반 강화학습(RLHF)이 더해진다.
카파시는 LLM을 챗봇이 아니라 도구를 조율하는 '신흥 운영체제의 커널 프로세스'로 보고, 동시에 탈옥·프롬프트 주입·데이터 오염 같은 새로운 보안 위협을 경고한다.

쉽게 이해하기

강연은 LLM이 무엇인지 가장 단순한 비유로 시작한다. 모델은 사실 두 개의 파일이다. 메타가 공개한 Llama 2 70B를 예로 들면, 700억 개의 파라미터를 각각 2바이트로 저장한 140GB짜리 파라미터 파일과, 그 파라미터로 신경망을 돌리는 약 500줄짜리 코드 파일이면 충분하다. 이 두 파일만 있으면 인터넷 연결 없이 맥북에서 자족적으로 모델과 대화할 수 있다.

어려운 부분은 실행이 아니라 그 파라미터를 얻는 '학습'이다. 카파시는 학습을 인터넷의 상당 부분을 압축하는 과정으로 설명한다. 약 10테라바이트 규모의 텍스트를 약 6,000개의 GPU로 12일가량 돌려 약 200만 달러를 들이면 Llama 2 70B가 나온다. 결과물인 파라미터는 인터넷의 zip 파일과 비슷하되, 원본을 그대로 담지 못하는 '손실 압축'이다. 게다가 오늘날 최첨단 모델은 이 수치가 10배 이상이라 학습 비용이 수천만에서 수억 달러에 이른다.

신경망이 실제로 하는 일은 단어 시퀀스에서 다음 단어를 예측하는 것이다. 단순해 보이지만, 다음 단어를 정확히 맞히려면 세계에 관한 많은 지식을 파라미터에 담아야 하므로 강력한 학습 목표가 된다. 추론은 모델이 단어를 하나씩 샘플링해 다시 입력으로 넣는 과정을 반복하는 것으로, 카파시는 이를 모델이 인터넷 문서를 '꿈꾼다'고 표현한다. 이 과정에서 존재하지 않는 ISBN처럼 그럴듯하지만 사실이 아닌 환각이 나타날 수 있다.

내부 구조는 트랜스포머 아키텍처다. 수학적 연산 자체는 완전히 이해하지만, 수천억 개의 파라미터가 구체적으로 무엇을 하는지는 알지 못한다. 우리는 파라미터를 조금씩 조정해 다음 단어 예측을 더 잘하게 만들 수 있을 뿐이다. '톰 크루즈의 어머니는 누구인가'는 답하면서 그 역방향은 답하지 못하는 '역전의 저주' 사례처럼 지식은 기묘하고 일방향적이다. 그래서 카파시는 LLM을 대체로 불가해한 경험적 산물로 다뤄야 한다고 말한다.

어시스턴트는 두 단계로 만들어진다. 사전학습은 방대하지만 품질이 고르지 않은 인터넷 텍스트로 지식을 쌓는 단계이고, 파인튜닝은 사람이 라벨링 지침에 따라 작성한 약 10만 건의 고품질 질의응답으로 모델의 형식을 '도움이 되는 어시스턴트'로 바꾸는 정렬 단계다. 파인튜닝은 상대적으로 저렴해 매주·매일 반복하며 오작동을 고칠 수 있다. 여기에 선택적 3단계로, 답을 직접 쓰기보다 여러 후보 중 더 나은 것을 고르는 비교 라벨을 활용하는 RLHF(인간 피드백 기반 강화학습)가 더해진다.

강연 후반은 발전 방향과 위험을 다룬다. 성능은 파라미터 수와 학습 데이터 양이라는 두 변수로 매끄럽게 예측되는 '스케일링 법칙'을 따르며, 이것이 컴퓨팅 골드러시를 부추긴다. 모델은 점점 브라우저·계산기·파이썬·이미지 생성 같은 도구를 쓰고, 이미지와 음성을 다루는 멀티모달로 확장된다. 카파시는 LLM을 메모리와 도구를 조율하는 운영체제의 커널 프로세스에 비유하면서, 동시에 탈옥·프롬프트 주입·데이터 오염 같은 새로운 보안 위협이 전통적 보안의 고양이와 쥐 게임처럼 이어질 것이라 경고한다.

주요 인사이트

다음 단어 예측은 단순해 보여도, 정확히 예측하려면 세계 지식을 파라미터에 담아야 하므로 사실상 인터넷을 압축하는 강력한 학습 목표가 된다.
스케일링 법칙 덕분에 더 큰 모델을 더 많은 데이터로 학습하면 성능이 거의 보장된 듯 향상되며, 이 흐름에 아직 정체 조짐이 보이지 않는다는 점이 대규모 투자의 근거가 된다.
도구 사용은 LLM 발전의 핵심 축으로, 모델은 머릿속 연산 대신 검색·계산기·파이썬·이미지 생성기 등을 엮어 사람처럼 문제를 푼다.
카파시는 현재 LLM이 즉각적·직관적인 '시스템 1'만 갖췄다고 보고, 시간을 정확도로 바꾸는 '시스템 2'와 알파고식 자기개선을 앞으로의 과제로 꼽는다.
탈옥(할머니 역할극, base64 인코딩, 적대적 접미사, 잡음 섞은 이미지), 프롬프트 주입(이미지·웹페이지에 숨긴 명령), 데이터 오염(트리거 단어) 등 LLM 특유의 공격 표면이 빠르게 늘고 있다.

자주 묻는 질문

카파시는 LLM을 어떻게 비유하는가?

가장 단순하게는 파라미터 파일과 실행 코드라는 '두 개의 파일'로 비유한다. 더 나아가 메모리와 도구를 조율해 문제를 푸는 '신흥 운영체제의 커널 프로세스'로도 설명한다.

LLM 학습과 추론은 비용 측면에서 어떻게 다른가?

학습은 인터넷 텍스트를 파라미터로 압축하는 매우 비싼 과정으로, Llama 2 70B의 경우 약 6,000개 GPU로 12일, 약 200만 달러가 들었다. 반면 추론은 맥북에서도 돌릴 만큼 상대적으로 값싸다.

어시스턴트 모델은 어떤 단계로 만들어지는가?

방대한 인터넷 텍스트로 지식을 쌓는 사전학습과, 사람이 작성한 고품질 질의응답으로 형식을 정렬하는 파인튜닝의 2단계로 만들어진다. 여기에 비교 라벨을 활용하는 RLHF가 선택적 3단계로 더해질 수 있다.

LLM에 특유한 보안 위협으로는 무엇이 있는가?

안전장치를 우회하는 탈옥, 이미지나 웹페이지에 숨긴 명령으로 모델을 가로채는 프롬프트 주입, 학습 데이터에 트리거 단어를 심는 데이터 오염(백도어) 공격 등이 소개된다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗