AI VIDEO BRIEFING

AI 모델 선택 5원칙: 데일리 드라이버와 저비용 모델을 구분하는 법

모델 이름이 아니라 눈앞의 '일'에서 출발하라. 데일리 드라이버와 저비용 모델을 구분하고, 하니스와 난이도를 따져 나에게 맞는 AI 모델을 고르는 다섯 가지 원칙을 정리했다.

AI 모델, 어떻게 골라야 할까 — 나에게 맞는 모델을 고르는 다섯 가지 원칙 영상 대표 이미지

핵심 메시지

  • 모델을 고르는 출발점은 모델 이름이 아니라 지금 눈앞의 '일'이다. 무엇을 시킬지 먼저 정하고 모델로 넘어가라.
  • 익숙하고 반복적인 작업은 GLM 5.2 같은 저렴하고 강한 모델로 충분하고, 형태가 불분명한 까다로운 작업은 Claude·ChatGPT 같은 프론티어 모델이 제값을 한다.
  • 모델만큼 '하니스(harness)'가 중요하다. 작업을 넣고 빼기 쉬운 도구라야 모델 고르기 자체가 또 다른 일이 되지 않는다.
  • 업무를 특정 모델 하나에 묶지 말고 라우팅으로 대체 가능하게 하라. 여러 기업이 비용 절감을 위해 오픈소스로 옮기고 있다.
  • 다섯 가지 원칙: 남 따라하지 말 것, 일의 '양'이 아니라 '난이도'를 물을 것, 결과가 좋은지 판별할 수 있을 것, 모델 선택이 일이 되지 않게 할 것, 너무 많은 모델을 쓰지 말 것.

쉽게 이해하기

최근 몇 주 사이 선택할 수 있는 AI 모델이 폭발적으로 늘었다. 발표자는 Fable이 한동안 내려갔다가 7월 1일 Fable 5로 복귀한 사건을 예로 들며, 특정 모델이 내일도 그대로 있으리라 가정하지 말라고 강조한다. 코인베이스·커서·린디처럼 흔들리지 않은 기업들은 애초에 업무를 한 모델에 묶지 않고 하니스를 직접 소유해 다른 곳으로 라우팅했다.

그는 모델을 고를 때 '데일리 드라이버'와 '저비용 일꾼'을 구분하라고 말한다. 데일리 드라이버는 작업이 끝나기 전 가장 먼저 손이 가는, 넓은 범위에서 두루 잘하는 모델이고, 저비용 일꾼은 익숙하고 반복적이며 이해하기 쉬운 일에 어울린다. 핵심은 모델 카드에 적힌 이름보다 '지금 무슨 일을 시키려 하는가'라는 질문이 먼저라는 것이다.

GLM 5.2 같은 저렴하고 강한 모델은 '분포의 중심'에 있는 일에 강하다. 평범한 파워포인트, 랜딩페이지 초안, 회의 요약, 익숙한 형태의 코드, 표·고객 메모·응대 답변처럼 사람들이 시간에 쫓겨 매일 만들어내는 익숙한 산출물이 여기 해당한다. 반면 형태가 아직 분명하지 않은 지저분한 작업, 판단과 취향이 중요한 어려운 문제에는 Claude나 ChatGPT 최신 모델 같은 프론티어 모델을 써야 하며, 이때는 비용보다 '제대로 하기'가 우선이다.

발표자는 모델만큼 '하니스'가 중요하다고 반복한다. 그는 자신은 코덱스(codex)의 하니스가 쓰기 편해 데일리 드라이버로 쓰지만, 그 안의 지능 자체가 가장 중요한 부분은 아니라고 말한다. 오픈소스든 클로즈드소스든, 작업을 넣고 빼기 쉽고 나를 방해하지 않는 하니스를 의도적으로 고르라는 것이다.

역할에 따라 접근이 달라진다. 회사에서는 먼저 '권한'이 필터가 되고, 모델이 일을 못 해내면 그것을 프롬프트 탓으로 돌리지 말고 IT 부서에 더 강한 모델을 요청할 신호로 삼으라고 한다. 작은 사업자는 20개 모델을 라우팅하려 들기보다, 고객에게 가장 중요한 반복 산출물 다섯 가지를 골라 가치로 가는 가장 단순한 경로를 그려야 한다.

주요 인사이트

  • 이미지·영상·실시간 정보 같은 영역에서는 전문 모델이 유용하다. 이미지엔 Flux·Zimage·Grok image, 영상엔 로컬용 LTX·고품질 API인 Seedance·빠르고 일회성인 Grok, 실시간 웹 정보엔 Grok 등이 언급된다. 다만 이름을 먼저 외우지 말고 '내가 하려는 일'부터 정하라는 것이 요지다.
  • 여러 대기업이 비용 절감을 위해 오픈소스로 이동 중이다. 린디는 DeepSeek, 커서는 Kimi 기반, 코인베이스는 GLM·Kimi로 스마트 라우팅, 쇼피파이·에어비앤비는 Qwen 계열 라우팅, 마이크로소프트는 DeepSeek 아키텍처를 시험한다고 소개한다.
  • 데일리 드라이버는 자신이 실제로 다루는 입력(스프레드시트·PDF·코드 등)으로 직접 돌려보기 전에는 확정하지 말라. 사람은 일을 해보고 나서야 그 복잡도를 더 정확히 가늠하기 때문이다.
  • 지능이 강해도 하니스가 약하면 활용이 어렵다. 발표자는 Gemini가 지능은 뛰어나지만 결과물을 빼내기가 불편하다고 지적하며, 오픈소스 모델들이 하니스 개선에 빠르게 나서고 있다고 본다.

자주 묻는 질문

저비용 모델과 프론티어 모델은 어떤 기준으로 나눠 쓰나요?

온라인에 비슷한 예시가 많은 '분포의 중심'에 있는 익숙한 작업이라면 GLM 5.2 같은 모델이 때로는 Claude보다 더 잘하기도 한다. 반대로 일반화된 지능이 필요한 낯설고 비표준적인 작업에는 현재로선 Claude나 ChatGPT 같은 프론티어 모델을 대체할 수 없다고 발표자는 말한다.

영상에서 제시한 다섯 가지 원칙은 무엇인가요?

(1) 남이 하는 대로(발표자 자신 포함) 그대로 따라하지 말 것, (2) 일의 양이 아니라 난이도를 물을 것, (3) 결과가 좋은지 나쁜지 판별할 수 있을 것(평가와 '감별' 모두), (4) 모델 선택 자체가 일이 되지 않게 최종 가치로 가는 단순한 길을 찾을 것, (5) 너무 많은 모델을 쓰지 말 것이다.

회사 안에서 쓸 모델을 제대로 못 고를 때는 어떻게 하나요?

회사에서는 우선 사용 권한이 첫 번째 제약이다. 선택지가 여러 개라면 자신의 실제 업무를 여러 모델에 넣어 신뢰도 있게 테스트해 데일리 드라이버를 정하고, 모델이 일을 못 해낸다면 그것을 프롬프트 탓으로 돌리지 말고 IT 부서에 더 강한 모델을 요청할 근거로 삼으라고 조언한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식