AI VIDEO BRIEFING

AI 입문 정리: 머신러닝·딥러닝·생성형 AI·LLM은 어떻게 연결되나

구글의 4시간짜리 AI 입문 강의를 10분으로 압축한 영상을 바탕으로, AI·머신러닝·딥러닝·생성형 AI·LLM의 포함 관계와 핵심 개념을 비전공자 눈높이로 정리했습니다.

출처: Jeff Su2023년 11월 14일AI 보조 요약

비전공자를 위한 AI 기초: 머신러닝·딥러닝·생성형 AI·LLM의 관계 한 번에 정리 영상 대표 이미지

핵심 메시지

AI는 물리학 같은 하나의 ‘학문 분야’이고, 머신러닝은 그 하위 분야, 딥러닝은 머신러닝의 한 종류다.
머신러닝은 입력 데이터로 모델을 학습시켜, 한 번도 본 적 없는 데이터에 대한 예측을 만든다.
지도학습은 라벨이 있는 데이터를, 비지도학습은 라벨이 없는 데이터를 사용한다는 점이 핵심 차이다.
출력이 숫자·분류·확률이면 생성형 AI가 아니고, 자연어·이미지·음성처럼 새 결과물을 만들면 생성형 AI다.
LLM은 대규모 데이터로 사전 학습한 뒤 특정 목적에 맞게 파인튜닝하는 방식으로 활용된다.

쉽게 이해하기

영상은 기술 배경이 없는 사람도 AI의 기초를 잡을 수 있도록 구글의 4시간 입문 강의를 10분으로 압축한다. 발표자는 처음엔 너무 개념적일까 우려했지만, 기본 개념을 알고 나니 챗봇 같은 도구를 더 잘 쓰게 되고 AI에 대한 오해도 풀렸다고 말한다.

가장 큰 그림부터 보면, AI는 물리학처럼 하나의 학문 분야이고 머신러닝은 그 하위 분야다(물리학과 열역학의 관계와 비슷하다). 한 단계 더 들어가면 딥러닝은 머신러닝의 하위 집합이며, 딥러닝 모델은 다시 판별형(discriminative)과 생성형(generative)으로 나뉜다. LLM도 딥러닝에 속하고, 생성형과 LLM이 겹치는 지점에서 우리가 익히 아는 챗봇류 애플리케이션이 나온다.

머신러닝은 입력 데이터로 모델을 훈련시키고, 그 모델이 본 적 없는 데이터에 예측을 내놓는 프로그램이다(나이키 판매 데이터로 학습해 아디다스 신제품의 판매를 예측하는 식). 대표적으로 라벨이 있는 데이터를 쓰는 지도학습과 라벨이 없는 데이터를 쓰는 비지도학습이 있다. 지도학습은 예측을 학습 데이터와 비교해 차이를 줄이려 하지만, 비지도학습은 그렇게 하지 않고 데이터가 자연스럽게 어떤 그룹으로 나뉘는지를 본다.

딥러닝은 인간의 뇌에서 영감을 받은 인공 신경망을 쓰는 머신러닝의 한 종류로, 층(layer)이 많을수록 강력하다. 신경망 덕분에 소량의 라벨 데이터와 대량의 비라벨 데이터를 함께 쓰는 준지도학습이 가능하다. 예컨대 은행이 거래의 5%만 사기 여부로 라벨링하고 나머지 95%는 그대로 두면, 모델이 5%에서 개념을 배워 95%에 적용하고 미래 거래를 예측한다. 딥러닝은 다시 판별형과 생성형으로 갈리는데, 판별형은 라벨 관계를 배워 분류(고양이/개, 사기/정상)하고, 생성형은 데이터의 패턴을 배워 입력을 받으면 새로운 결과물을 만들어 낸다.

생성형 여부를 가리는 간단한 기준도 제시한다. 출력이 숫자·분류(스팸/정상)·확률이면 생성형이 아니고, 자연어 텍스트·음성·이미지·오디오처럼 학습 데이터와 비슷한 새 표본을 만들어 내면 생성형 AI다. 생성형 모델 유형으로는 텍스트→텍스트, 텍스트→이미지, 텍스트→영상, 텍스트→3D, 그리고 ‘읽지 않은 메일 요약’처럼 특정 작업을 수행하는 텍스트→작업 모델 등이 소개된다. 끝으로 LLM은 딥러닝의 하위 집합으로 생성형 AI와 겹치지만 같지는 않으며, 대규모 데이터로 사전 학습한 뒤 산업별 소규모 데이터로 파인튜닝해 쓰인다. 큰 기업이 막대한 비용으로 범용 LLM을 만들어, 자체 모델을 만들 여력은 없지만 도메인 데이터를 가진 병원·은행·유통사 등에 제공하는 구조가 양측 모두에 이득이라는 점도 짚는다.

주요 인사이트

AI·머신러닝·딥러닝·LLM은 경쟁 개념이 아니라 ‘포함 관계’로 이해해야 한다. 큰 분야 안에 작은 분야가 들어 있는 구조다.
지도/비지도 학습의 본질적 차이는 라벨의 유무이며, 지도학습만 예측을 학습 데이터와 대조해 오차를 줄인다.
준지도학습은 라벨링 비용 문제를 푸는 현실적 해법으로, 사기 탐지처럼 전부 라벨링하기 어려운 상황에 잘 맞는다.
‘출력이 무엇인가’만 봐도 생성형 AI인지 아닌지 빠르게 구분할 수 있다(숫자·분류·확률은 아님, 새 콘텐츠는 맞음).
사전 학습+파인튜닝 구조 덕분에, 대형 모델을 직접 만들지 못하는 기관도 자신의 도메인 데이터로 특화된 모델을 가질 수 있다.

자주 묻는 질문

AI, 머신러닝, 딥러닝은 어떤 관계인가요?

AI는 물리학 같은 하나의 학문 분야이고, 머신러닝은 그 하위 분야이며, 딥러닝은 머신러닝의 한 종류(하위 집합)입니다. LLM 역시 딥러닝에 속합니다.

지도학습과 비지도학습의 차이는 무엇인가요?

지도학습은 라벨이 붙은 데이터를, 비지도학습은 라벨이 없는 데이터를 사용합니다. 또한 지도학습은 예측을 학습 데이터와 비교해 차이를 줄이려 하지만, 비지도학습은 데이터가 자연스럽게 이루는 그룹을 찾습니다.

어떤 것이 생성형 AI인지 어떻게 구분하나요?

출력이 숫자, 분류(예: 스팸/정상), 확률이면 생성형 AI가 아닙니다. 반대로 자연어 텍스트나 음성, 이미지, 오디오처럼 학습 데이터와 비슷한 새 결과물을 만들어 내면 생성형 AI입니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗