AI VIDEO BRIEFING

머신러닝 기본 용어 정리 — AI, 알고리즘, 모델, 학습·테스트 데이터 한눈에

머신러닝을 처음 접할 때 헷갈리는 핵심 용어를 22분 분량으로 정리한 영상 요약. AI와 ML의 차이부터 모델·모델 학습·학습 데이터와 테스트 데이터까지 예시로 짚는다.

출처: Infinite Codes2024년 11월 27일AI 보조 요약

22분으로 끝내는 머신러닝 기본 용어: AI·알고리즘·모델·학습 데이터의 차이 영상 대표 이미지

핵심 메시지

모든 AI가 머신러닝은 아니다. 규칙 기반 시스템처럼 데이터에서 학습하지 않는 AI도 있다.
머신러닝 모델은 입력을 출력으로 잇는 수학적 매핑 함수이며, 선형 회귀의 직선이 가장 단순한 예다.
모델 학습(피팅)은 예측과 실제 데이터가 가장 잘 맞도록 모델의 파라미터를 조정하는 과정이다.
학습 데이터와 테스트 데이터는 분리해야 하며, 테스트 데이터로 처음 보는 예시에 대한 성능을 평가한다.
데이터는 숫자·텍스트·이미지 등 알고리즘이 처리할 수 있는 모든 형태의 입력을 가리킨다.

쉽게 이해하기

이 영상은 머신러닝 입문자가 자주 마주치는 기본 용어들을 22분 안에 압축해 설명한다. 인공지능(AI)은 언어 이해, 이미지 인식, 문제 해결, 의사결정처럼 보통 인간 지능이 필요한 일을 기계가 수행하는 능력을 뜻한다.

중요한 구분은 'AI가 곧 머신러닝은 아니다'라는 점이다. 예를 들어 규칙 기반 시스템은 미리 정해진 논리 규칙으로 의료 데이터를 분석해 진단을 제시하며, 데이터의 패턴에서 학습하지 않는다. 머신러닝은 AI를 구현하는 여러 기법 중 하나다.

알고리즘은 문제를 풀기 위한 잘 정의된 절차나 규칙의 집합이다. 정렬·검색부터 암호화, 그리고 지도 앱에서 최단 경로를 찾는 다익스트라 알고리즘까지 컴퓨팅 전반에 쓰인다. 모델은 데이터의 패턴을 학습해 예측이나 분류를 수행하는 수학적 표현으로, 입력과 출력을 잇는 매핑 함수가 가장 흔한 형태다.

선형 회귀를 예로 들면, 집의 면적과 가격 데이터를 직선으로 맞췄을 때 1제곱피트가 늘 때마다 평균 200달러가 오른다면, 그 기울기 200과 절편이 바로 학습된 모델이다. 모델 학습(피팅)은 여러 직선을 시도해 가장 잘 맞는 선을 찾는 과정이며, 이때 패턴을 가르치는 데 쓰는 입력·정답 쌍이 학습 데이터, 학습에 쓰지 않고 성능 평가에만 쓰는 별도 묶음이 테스트 데이터다.

주요 인사이트

용어를 정확히 구분하는 것만으로도 머신러닝 문서나 강의의 이해 속도가 크게 빨라진다.
모델을 '입력→출력 매핑 함수'로 바라보면 선형 회귀부터 복잡한 신경망까지 같은 틀로 이해할 수 있다.
학습 데이터와 테스트 데이터를 섞으면 '처음 보는 데이터에 대한 성능'을 제대로 측정할 수 없다.
스팸 필터나 고양이·개 분류처럼, 좋은 라벨이 붙은 학습 데이터의 품질이 모델 성능을 좌우한다.

자주 묻는 질문

AI와 머신러닝은 같은 말인가요?

아닙니다. 머신러닝은 AI를 구현하는 기법 중 하나일 뿐입니다. 규칙 기반 시스템처럼 데이터에서 학습하지 않고 미리 정한 규칙으로 동작하는 AI도 있습니다.

머신러닝에서 '모델'이란 무엇인가요?

데이터의 패턴을 학습해 예측이나 분류를 하는 수학적 표현입니다. 가장 흔한 형태는 입력과 출력을 잇는 매핑 함수이며, 선형 회귀의 직선 방정식이 단순한 예입니다.

학습 데이터와 테스트 데이터는 왜 나누나요?

학습 데이터로 패턴을 가르치고, 학습에 쓰지 않은 별도의 테스트 데이터로 모델이 처음 보는 예시에서 얼마나 잘 작동하는지 평가하기 위해서입니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗