AI VIDEO BRIEFING
앤드루 응의 스탠퍼드 CS229 머신러닝 1강 정리: 지도학습과 비지도학습 핵심 기초 개념
앤드루 응이 진행한 스탠퍼드 CS229 머신러닝 첫 강의를 정리했다. AI는 새로운 전기라는 비유부터 머신러닝의 두 가지 정의, 지도학습의 회귀와 분류, 비지도학습, 그리고 체계적인 학습 전략까지 핵심 개념을 두루 담았다.

핵심 메시지
쉽게 이해하기
앤드루 응은 스탠퍼드에서 오래 이어져 온 CS229 머신러닝 강의의 첫 시간을 'AI는 새로운 전기'라는 비유로 연다. 약 100년 전 전기의 등장이 모든 주요 산업을 바꿨듯, 머신러닝이 지금 세상을 재편하고 있다는 것이다. 그는 제조·의료·물류·법률 등 기술 기업이 아닌 곳에서도 머신러닝 수요가 폭발하고 있어, 지금이 이 분야에 뛰어들 최적의 시기라고 강조한다.
이어 그는 머신러닝의 정의를 두 가지로 소개한다. 하나는 체커 게임 프로그램으로 유명한 아서 새뮤얼의 정의로, '명시적으로 프로그래밍하지 않고도 컴퓨터가 학습하는 능력을 갖게 하는 분야'다. 다른 하나는 톰 미첼의 '잘 정의된 학습 문제'로, 어떤 작업 T를 성능 지표 P로 측정했을 때 경험 E가 쌓일수록 성능이 향상되면 그 프로그램은 학습한다고 말한다.
강의의 핵심은 지도학습이다. 응은 집 크기로 가격을 예측하는 예시로, 데이터에 직선이나 곡선을 맞춰 입력 X에서 출력 Y로의 매핑을 배우는 과정을 설명한다. 예측값이 연속적이면 회귀, 종양이 양성인지 악성인지처럼 이산적인 값이면 분류라고 구분한다. 실제 문제에서는 특징(feature)이 여러 개이며, 서포트 벡터 머신과 커널을 쓰면 무한 차원의 특징까지 다룰 수 있다고 소개한다.
응은 카네기멜런대에서 만든 자율주행 시연 영상(ALVINN)을 예로 든다. 사람이 운전하는 동안 전방 카메라 이미지와 조향 방향을 함께 기록해 신경망을 학습시키면, 처음에는 흐릿하던 출력이 역전파 학습을 거치며 점점 사람의 운전을 정확히 따라 하게 된다. 이것이 입력과 정답을 함께 주는 지도학습의 전형이라는 설명이다.
그는 알고리즘을 아는 것만큼 '전략'이 중요하다고 강조한다. 같은 알고리즘을 써도 팀마다 성과가 크게 갈리는데, 데이터를 더 모을지, 다른 알고리즘을 쓸지, GPU를 늘릴지 같은 결정을 잘하는 사람이 뛰어난 실무자라는 것이다. 그는 머신러닝을 경험에 의존한 '주먹구구'에서 체계적인 공학으로 바꾸는 것이 강의의 목표라고 말하며, 마지막으로 정답 없이 데이터의 구조를 찾는 비지도학습(구글 뉴스의 기사 군집화, 유전자 데이터 분석 등)을 소개한다.
주요 인사이트
- 머신러닝의 가치는 돈벌이를 넘어, 의료 개선이나 개인 맞춤 교육처럼 세상을 더 낫게 바꿀 기회를 준다는 데 있다고 응은 강조한다.
- 회귀와 분류의 구분은 예측하려는 값이 연속적인지(집값) 이산적인지(양성/악성)에 달려 있으며, 이 구분이 알고리즘 선택의 출발점이 된다.
- 서포트 벡터 머신의 커널 기법은 무한 차원의 특징을 다루면서도 메모리 한계를 우회하는, 실용적으로 효과적인 방법이다.
- 머신러닝 알고리즘은 대개 첫 시도에서 작동하지 않으므로, 디버깅과 개선을 얼마나 체계적으로 하느냐가 개발 효율을 좌우한다.
- 코드 최적화 시 프로파일러로 병목을 먼저 찾듯, 머신러닝도 무엇을 개선할지 진단부터 하는 전략적 접근이 6개월의 헛수고를 막는다.
자주 묻는 질문
아서 새뮤얼과 톰 미첼의 머신러닝 정의는 어떻게 다른가?
아서 새뮤얼은 '명시적으로 프로그래밍하지 않고도 컴퓨터가 학습하게 하는 분야'라고 직관적으로 정의했다. 톰 미첼은 더 형식적으로, 작업 T를 성능 지표 P로 측정했을 때 경험 E가 늘어날수록 성능이 향상되면 학습이라고 규정했다.
지도학습에서 회귀와 분류는 어떻게 구분하나?
예측하려는 값 Y가 집값처럼 연속적인 실수면 회귀, 종양의 양성·악성처럼 이산적인 범주(0 또는 1, 혹은 몇 가지 유형)이면 분류라고 부른다. 둘 다 입력 X에서 출력 Y로의 매핑을 학습한다는 점은 같다.
비지도학습은 지도학습과 무엇이 다른가?
지도학습은 입력 X와 정답 Y를 함께 주지만, 비지도학습은 정답 없이 입력 X만 주고 데이터 안의 흥미로운 구조를 찾게 한다. K-평균 군집화로 데이터를 무리 짓거나, 구글 뉴스가 같은 사건의 기사들을 묶는 것이 예다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗