AI VIDEO BRIEFING

생성형 AI 입문 - 구글 클라우드가 설명하는 AI·ML·딥러닝·트랜스포머

구글 클라우드의 생성형 AI 입문 강의를 한국어로 정리했다. AI와 머신러닝의 차이, 지도·비지도 학습, 딥러닝, 생성형과 판별형 모델, 트랜스포머와 환각, 프롬프트와 모델 유형까지 기초를 짚는다.

출처: Google Cloud2024년 4월 8일AI 보조 요약

생성형 AI 입문: 구글 클라우드가 풀어주는 AI·머신러닝·딥러닝의 관계 영상 대표 이미지

핵심 메시지

생성형 AI는 텍스트·이미지·오디오 등 새로운 콘텐츠를 만들어내는 AI 기술이며, AI→머신러닝→딥러닝의 하위 분야에 속한다.
머신러닝은 지도학습(라벨 있음)과 비지도학습(라벨 없음)으로 나뉘고, 딥러닝은 신경망으로 더 복잡한 패턴을 학습한다.
모델은 데이터를 분류·예측하는 판별형과 새 데이터를 만드는 생성형으로 나뉘며, 출력이 자연어·이미지·오디오면 생성형 AI다.
생성형 AI의 힘은 인코더-디코더 구조의 트랜스포머에서 나오지만, 사실과 다른 ‘환각’이라는 약점이 있다.
텍스트-투-텍스트·이미지·영상·3D·태스크 등 다양한 모델 유형이 있고, 파운데이션 모델과 Vertex AI 같은 도구로 활용한다.

쉽게 이해하기

구글 클라우드의 개발자 관계 엔지니어 로저 마르티네스는 ‘생성형 AI 입문’ 강의에서 네 가지, 즉 생성형 AI의 정의, 작동 방식, 모델 유형, 응용을 가르치겠다고 시작한다. 그는 생성형 AI를 텍스트·이미지·오디오·합성 데이터 같은 다양한 콘텐츠를 만들어내는 인공지능 기술로 정의한다. 이를 이해하려면 먼저 AI가 무엇인지 짚어야 한다고 말한다.

마르티네스는 AI를 물리학처럼 하나의 ‘학문 분야’에 비유한다. AI는 추론·학습·자율 행동이 가능한 지능적 에이전트를 만드는 컴퓨터 과학의 한 갈래다. 머신러닝은 AI의 하위 분야로, 입력 데이터로 모델을 학습시켜 처음 보는 새 데이터에 대해 유용한 예측을 하게 한다. 머신러닝 모델은 라벨이 있는 지도학습과 라벨이 없는 비지도학습으로 나뉘며, 지도학습은 과거 사례로 미래 값을 예측하고 비지도학습은 원데이터에서 자연스러운 군집을 발견하는 데 쓰인다.

딥러닝은 인간 뇌에서 영감을 받은 인공 신경망을 사용하는 머신러닝의 한 유형으로, 여러 층의 뉴런으로 더 복잡한 패턴을 학습한다. 신경망은 소량의 라벨 데이터와 대량의 비라벨 데이터를 함께 쓰는 준지도학습도 가능하다. 생성형 AI는 바로 이 딥러닝의 하위 집합이며, 거대 언어모델 역시 딥러닝의 한 부분이다.

딥러닝(또는 머신러닝) 모델은 크게 판별형과 생성형으로 나뉜다. 판별형은 데이터 포인트의 라벨을 분류·예측하고, 생성형은 학습한 확률 분포를 바탕으로 새로운 데이터를 만들어낸다. 마르티네스는 출력(y)이 숫자·범주·확률이면 생성형 AI가 아니고, 출력이 자연어·오디오·이미지이면 생성형 AI라고 구분하는 방법을 제시한다. 또 Y=f(x)로 표현하면, 출력이 숫자면 생성형이 아니고 문장이면 생성형이라고 설명한다.

생성형 AI의 힘은 2018년 자연어 처리 혁명을 일으킨 트랜스포머에서 나온다. 트랜스포머는 입력을 인코딩하는 인코더와 이를 과제에 맞게 디코딩하는 디코더로 구성된다. 다만 데이터가 부족하거나 잡음이 많거나 맥락·제약이 충분치 않으면 무의미하거나 틀린 내용을 만들어내는 ‘환각’이 생긴다. 강의는 프롬프트와 프롬프트 설계의 개념, 텍스트-투-텍스트·이미지·영상·3D·태스크 같은 모델 유형, 그리고 파운데이션 모델과 Vertex AI Studio·Agent Builder·Gemini 같은 구글 클라우드 도구로 마무리한다.

주요 인사이트

AI·머신러닝·딥러닝·생성형 AI는 포함 관계로 이해해야 하며, 생성형 AI는 딥러닝의 하위 집합이라는 위치가 명확하다.
지도학습과 비지도학습의 차이는 ‘라벨의 유무’이며, 이는 생성형 AI를 이해하는 토대가 된다.
출력의 형태(숫자·범주 vs 자연어·이미지·오디오)로 생성형 AI인지 아닌지를 간단히 판별할 수 있다.
생성형과 판별형의 구분은 결국 새 데이터를 ‘만드는가’ 아니면 ‘분류·예측하는가’의 차이로 요약된다.
트랜스포머가 성능의 원천이지만 환각은 데이터 부족·잡음·맥락 부족 등에서 비롯되므로, 데이터와 제약 설계가 중요하다.

자주 묻는 질문

AI와 머신러닝의 차이는 무엇인가?

AI는 추론·학습·자율 행동이 가능한 지능적 에이전트를 만드는 컴퓨터 과학의 한 분야(학문)다. 머신러닝은 그 하위 분야로, 입력 데이터로 모델을 학습시켜 처음 보는 데이터에 대해 예측하게 하는 것, 즉 명시적 프로그래밍 없이 컴퓨터가 학습하는 능력을 말한다.

생성형 모델과 판별형 모델은 어떻게 다른가?

판별형 모델은 데이터 포인트를 분류하거나 라벨을 예측한다. 생성형 모델은 기존 데이터에서 학습한 확률 분포를 바탕으로 새로운 데이터 인스턴스를 만들어낸다. 한마디로 생성형은 새 데이터를 생성하고, 판별형은 서로 다른 데이터를 구별한다.

트랜스포머에서 ‘환각’은 왜 생기나?

환각은 모델이 만들어내는, 종종 무의미하거나 문법적으로 틀린 단어·구절을 말한다. 모델이 충분한 데이터로 학습되지 않았거나, 잡음이 많은 데이터로 학습됐거나, 충분한 맥락이나 제약이 주어지지 않았을 때 발생할 수 있다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗