AI VIDEO BRIEFING

머신러닝이란? 지도학습·비지도학습·강화학습 쉽게 이해하기

머신러닝의 개념과 KNN 알고리즘, 지도·비지도·강화학습의 차이를 노래 취향과 동전 분류 같은 친숙한 예시로 풀어 설명한다.

출처: Simplilearn2018년 9월 19일AI 보조 요약

머신러닝 기초: 지도·비지도·강화학습을 노래와 동전으로 이해하기 영상 대표 이미지

핵심 메시지

머신러닝은 기계가 과거 데이터로부터 스스로 학습해 사람처럼, 그리고 더 빠르게 일을 하도록 만드는 것이다.
k-최근접 이웃(KNN)은 새 데이터 주변 이웃들의 다수결로 분류하는 기본 알고리즘이다.
지도학습은 레이블된 데이터로, 비지도학습은 레이블 없는 데이터에서 군집을 찾아 학습한다.
강화학습은 보상·피드백 기반으로, 틀리면 피드백을 받아 점차 올바르게 학습한다.
오늘날 머신러닝이 가능한 이유는 방대한 데이터, 향상된 메모리 처리와 강력한 연산 능력 덕분이다.

쉽게 이해하기

영상은 사람이 경험에서 배우듯 기계도 과거 데이터로 학습할 수 있다는 점에서 출발한다. 그것이 머신러닝이며, 단순한 학습을 넘어 이해와 추론까지 포함한다고 설명한다. 예시로 등장하는 폴은 노래의 템포와 강도를 기준으로 좋아하는 곡과 싫어하는 곡을 나눈다. 빠른 템포에 강렬한 곡은 좋아하고, 느린 템포에 가벼운 곡은 싫어한다.

새로운 곡 A가 빠른 템포·강한 강도를 가지면 과거 취향으로 쉽게 ‘좋아함’으로 분류된다. 하지만 곡 B처럼 템포와 강도가 모두 중간이면 판단이 애매해진다. 이때 머신러닝이 필요하다. 곡 B 주위에 원을 그려 이웃을 보면 ‘좋아함’ 4표, ‘싫어함’ 1표이므로 다수결로 좋아할 것이라 예측한다. 이것이 바로 k-최근접 이웃(KNN) 알고리즘이며, 데이터가 많을수록 모델은 더 정확해진다.

학습 방식은 크게 셋으로 나뉜다. 지도학습은 세 가지 통화의 동전을 무게라는 특징과 통화라는 레이블로 학습해, 새 동전의 무게로 통화를 예측한다. 비지도학습은 크리켓 선수들의 득점과 위킷 데이터를 군집으로 묶는데, ‘타자’나 ‘투수’라는 레이블 없이도 두 무리를 스스로 찾아낸다. 즉 차이의 핵심은 레이블의 유무다.

강화학습은 보상과 피드백으로 배운다. 개 이미지를 고양이로 잘못 분류하면 부정적 피드백을 주고, 기계는 그로부터 학습해 다음에는 올바르게 분류한다. 이런 머신러닝은 의료 진단 보조, 소셜미디어 감성 분석, 금융 사기 탐지, 이커머스 이탈 예측, 우버의 실시간 급증 요금(surge pricing), 시리 같은 음성 비서까지 폭넓게 쓰인다. 이 모든 것이 가능한 배경에는 온라인 활동으로 쏟아지는 방대한 데이터와 커진 메모리·연산 능력이 있다.

주요 인사이트

데이터가 많을수록 모델의 예측 정확도가 높아진다.
지도학습과 비지도학습을 가르는 핵심은 레이블이 있느냐 없느냐다.
강화학습은 틀린 결과에 피드백을 주는 루프로 점진적으로 개선된다.
페이스북의 얼굴 인식, 넷플릭스 추천, 은행의 사기 탐지 같은 일상 서비스가 모두 머신러닝 사례다.

자주 묻는 질문

지도학습과 비지도학습의 차이는 무엇인가?

지도학습은 레이블된 데이터로 학습한다(동전 무게로 통화 예측). 비지도학습은 레이블이 없는 데이터에서 패턴과 군집을 스스로 찾는다(크리켓 기록으로 타자·투수 구분).

KNN(k-최근접 이웃)은 어떻게 동작하나?

새 데이터 포인트 주위의 이웃들을 보고 다수결로 분류한다. 예시에서 곡 B 주변에 ‘좋아함’ 4표, ‘싫어함’ 1표가 있어 ‘좋아함’으로 분류한다.

오늘날 머신러닝이 가능해진 이유는?

온라인 활동으로 생성되는 방대한 데이터, 크게 향상된 메모리 처리 능력, 그리고 강력한 연산 능력 덕분이다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗