AI VIDEO BRIEFING
ChatGPT·LLM 활용법 총정리 — 카파시가 알려주는 실전 사용 가이드
카파시가 일상과 업무에서 ChatGPT를 비롯한 LLM을 어떻게 쓰는지 정리했다. 토큰·사고 모델·검색·딥리서치·코드 실행·음성·메모리까지 실전 기능을 한눈에 짚는다.

핵심 메시지
쉽게 이해하기
안드레이 카파시는 일반 청중을 위한 LLM 시리즈의 후속편으로, 이번에는 ChatGPT 같은 도구를 실제로 어떻게 쓰는지에 초점을 맞춘다. 그는 모델의 본질을 인터넷 전체를 손실·확률적으로 압축한 거대한 "zip 파일", 즉 약 1조 개 파라미터의 신경망으로 설명한다. 사전학습이 세상에 대한 지식을, 사후학습이 어시스턴트라는 성격을 입히지만, 사전학습은 비싸고 드물게 이뤄지기에 모델에는 "지식 컷오프"가 생기고 최신 정보에는 취약하다.
대화의 작동 방식도 짚는다. 우리가 보는 말풍선은 사실 사용자와 모델이 함께 써 내려가는 1차원 토큰 시퀀스이며, 이 컨텍스트 윈도우가 모델의 작업 기억이다. 토큰이 많아질수록 모델이 산만해지고 비용도 늘기 때문에, 주제가 바뀌면 새 대화를 시작해 윈도우를 비우라고 권한다. 또 자신이 어떤 모델·요금제를 쓰는지 늘 인지해야 하며, 그는 여러 모델에 같은 질문을 던지는 "LLM 의회" 방식을 즐겨 쓴다.
핵심은 도구 사용이다. 그냥 두면 모델은 계산기도 브라우저도 없는 고립된 zip 파일이지만, 인터넷 검색 토큰으로 최신 정보를 컨텍스트에 끌어오고, 파이썬 인터프리터로 계산·시각화를 수행하며, 파일 업로드로 PDF나 책을 함께 읽을 수 있다. "딥리서치"는 검색과 사고를 수십 분간 길게 결합해 사실상 맞춤 리포트를 만들어 준다. 다만 그는 이런 결과를 모두 "첫 초안"으로 취급하고 인용 출처를 직접 확인하라고 거듭 강조한다.
코딩 작업에서는 웹 챗봇 대신 커서(Cursor)와 컴포저(Composer) 같은 전용 앱으로 파일 전체 맥락을 주고 자율적으로 코드를 짜게 하는 "바이브 코딩"을 소개한다. 멀티모달도 비중 있게 다룬다. 음성은 단순 받아쓰기/읽어주기인 "가짜 오디오"와, 모델이 오디오 토큰을 직접 다루는 "진짜 오디오(고급 음성 모드)"로 구분되고, 이미지 입력(영양 성분·혈액검사·밈 해석)과 출력(DALL·E), 영상 입력, NotebookLM의 맞춤 팟캐스트까지 예시로 보여 준다.
마지막으로 삶의 질을 높이는 기능들을 정리한다. 메모리는 대화를 거치며 사용자를 점점 더 잘 알게 하고, 커스텀 지시는 말투·정체성·언어 학습 톤 등을 전역으로 고정하며, 커스텀 GPT는 자주 쓰는 프롬프트(특히 그의 한국어 학습용 번역·어휘 추출기)를 저장해 재사용하게 해 준다. 그는 빠르게 변하는 이 생태계에서 ChatGPT가 가장 기능이 풍부한 기본값이지만, 검색은 퍼플렉시티, 다이어그램은 클로드 아티팩트처럼 상황별로 강점이 다르다고 마무리한다.
주요 인사이트
- 모델을 "압축된 인터넷"으로 이해하면 환각과 지식 컷오프가 왜 생기는지 자연스럽게 납득된다. 자주 언급된 정보일수록 모델의 기억이 정확하고, 희귀하거나 최신인 정보일수록 검색 같은 도구가 필요하다.
- 컨텍스트 윈도우를 "비싼 작업 기억"으로 보면 사용 습관이 달라진다. 관련 없는 토큰을 쌓아 두지 말고 주제마다 새 대화를 여는 것만으로 속도와 정확도를 모두 얻을 수 있다.
- 도구의 강력함과 위험은 동전의 양면이다. 데이터 분석가처럼 코드를 짜 주지만 2015년 가치를 임의로 가정하거나 추세 외삽값을 1.7조로 잘못 말하기도 했듯, "주니어 분석가"의 결과는 반드시 검증해야 한다.
- 같은 작업이라도 모델·앱마다 보유한 도구가 달라 결과가 갈린다. 어떤 모델은 파이썬으로 정확히 계산하고 어떤 모델은 머릿속으로 풀다 틀리므로, 내가 쓰는 도구가 무엇을 할 수 있는지 추적하는 것이 중요하다.
자주 묻는 질문
LLM이 왜 최근 정보를 잘 모르나요?
사전학습이 수천만 달러가 드는 값비싼 과정이라 자주 이뤄지지 않아, 모델 지식이 학습 시점에서 멈추는 "지식 컷오프"가 생기기 때문입니다. 지난주 일정처럼 최신 정보는 인터넷 검색 도구로 컨텍스트에 끌어와야 답할 수 있습니다.
"사고(thinking) 모델"은 언제 써야 하나요?
강화학습으로 추론을 훈련한 모델이라 수학·코드처럼 깊은 사고가 필요한 어려운 문제에서 정확도를 크게 높여 줍니다. 다만 답을 내기까지 몇 분씩 걸리므로, 여행 추천 같은 단순한 질문에는 빠른 일반 모델로 충분합니다.
주제가 바뀌면 왜 새 대화를 시작하라고 하나요?
대화의 토큰이 쌓인 컨텍스트 윈도우는 모델의 작업 기억인데, 관련 없는 토큰이 많아지면 모델이 산만해져 정확도가 떨어지고 토큰당 비용·속도도 나빠집니다. 그래서 더 이상 필요 없는 맥락은 새 대화로 비우는 편이 낫습니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗