AI VIDEO BRIEFING

주요 LLM 비교: ChatGPT·클로드·제미나이·딥시크·라마 특징 정리

영상이 소개하는 ChatGPT, 클로드, 제미나이, 그록, 딥시크, 큐원, 라마 등 주요 대형 언어모델의 강점과 약점, 어떤 작업에 어떤 모델을 골라야 하는지를 쉽게 정리했다.

출처: Codist2026년 5월 6일AI 보조 요약

ChatGPT부터 클로드·제미나이·딥시크까지, 주요 AI 모델 한눈에 비교 영상 대표 이미지

핵심 메시지

ChatGPT는 단일 벤치마크 1등은 아니어도 음성·이미지·브라우징을 한 앱에 모아 가장 다듬어진 생태계를 가졌다 — 영상은 이를 'AI의 아이폰'에 빗댄다.
클로드(Anthropic)는 글쓰기와 코딩에서 강점이 뚜렷하고, 헌법적 AI 학습 덕에 불확실하면 솔직히 인정하고 환각률이 낮다는 점이 부각된다.
제미나이는 Gmail·문서·픽셀에 이미 녹아 있어 '모델 자체보다 모델이 사는 위치'가 강점이고, 그록은 X의 실시간 데이터, 딥시크는 압도적으로 싼 비용이 무기다.
큐원·라마·젬마·미스트랄·GLM 등 오픈웨이트 모델은 직접 내려받아 자체 호스팅·미세조정할 수 있고, 특히 큐원은 한국어를 포함한 다국어에 강하다.
퍼플렉시티는 모델이 아니라 여러 모델을 골라 쓰는 AI 검색엔진으로, 출처가 달린 근거 있는 답변이 필요할 때 유용하다고 소개된다.

쉽게 이해하기

영상은 2022년 AI를 대중어로 만든 ChatGPT부터 짚는다. 어떤 단일 지표에서 최고는 아니지만 음성 모드, 이미지 생성, 커스텀 GPT, 에이전트형 브라우징을 하나의 앱에 담아 가장 폭넓고 다듬어진 경험을 준다는 점을 강점으로 든다. 주간 사용자와 유료 구독자 규모, 가장 큰 플러그인 생태계를 근거로 '대부분의 일상 작업에서 생각 없이 먼저 집어 드는 도구'라고 설명한다.

이어 클로드를 '파워 유저가 조용히 갈아타는 모델'로 소개한다. 깃허브 이슈를 실제로 고치는 능력을 재는 SWE-bench에서 높은 점수를 받고, 긴 문서에서 표면 요약이 아니라 핵심 논지를 짚어낸다는 점, 그리고 헌법적 AI(constitutional AI) 학습으로 모르면 모른다고 인정하고 환각이 적다는 점을 강조한다. 영상은 ChatGPT가 아이폰이라면 클로드는 맥북 프로 같은 작업 도구라고 비유한다.

제미나이에 대해선 '모델이 똑똑한가'보다 '모델이 어디에 사는가'가 핵심이라고 말한다. 이미 Gmail·문서·픽셀 안에 들어가 있어 '상사의 최근 메일 20개를 요약해줘' 같은 요청을 바로 처리한다는 것이다. 큰 컨텍스트 창과 강력한 동영상 생성 모델을 장점으로, 답변 일관성이 들쭉날쭉한 점을 약점으로 든다.

그록(xAI)은 X에 내장돼 방금 올라온 글까지 실시간으로 끌어오는 점이 강점이지만 대화를 닫으면 기억이 사라지는 한계가 있다고 본다. 딥시크는 프런티어급 성능을 훨씬 싼 값에 제공하고 가중치를 공개하지만, 중국 관할 서버에서 데이터를 처리한다는 점이 기업에는 걸림돌이라고 짚는다.

마지막으로 큐원·키미·라마·젬마·미스트랄·GLM 같은 오픈웨이트 계열을 묶어 설명한다. 직접 내려받아 호스팅·미세조정이 가능하고 기기에서 오프라인으로 돌릴 수 있다는 공통점을 든다. 특히 큐원은 한국어·중국어·일본어 등 다국어에 강해 아시아 시장 앱의 출발점으로 자주 쓰인다고 소개한다. 퍼플렉시티는 질문을 가장 적합한 모델로 보내 출처가 달린 답을 주는 'AI 검색엔진'으로, ChatGPT의 경쟁자가 아니라 '어느 전문가에게 보낼지 아는 안내원'에 가깝다고 정리한다.

주요 인사이트

어떤 모델이 절대적으로 우월하다기보다, 작업 성격(일상 대화·코딩·실시간 검색·비용·오프라인·다국어)에 따라 적합한 모델이 다르다는 게 영상의 일관된 메시지다.
오픈웨이트 모델(라마·큐원·젬마·미스트랄·GLM)은 데이터가 기기를 떠나지 않게 하거나 자체 제품에 내장하려는 개발자에게 핵심 선택지로 제시된다.
클로드의 낮은 환각률과 '모르면 모른다'고 말하는 태도는 헌법적 AI 학습이라는 훈련 방식에서 비롯된다고 영상은 설명한다.
제미나이 사례처럼, 같은 성능이라도 사용자의 기존 도구(메일·문서) 안에 들어가 있는지가 실제 체감 편의를 크게 좌우한다.
딥시크·GLM처럼 비용이 수 배~수십 배 저렴한 모델이 등장하면서 'AI에는 수십억 달러가 필요하다'는 통념이 흔들렸다고 본다.

자주 묻는 질문

영상은 ChatGPT를 왜 'AI의 아이폰'이라고 부르나요?

단일 벤치마크에서 최고는 아니지만 음성·이미지·브라우징 등 기능을 하나의 앱에 가장 잘 다듬어 담았고, 가장 큰 생태계와 서드파티 지원을 갖춰 일상 작업에서 기본값처럼 쓰이기 때문이라고 설명합니다.

코딩과 글쓰기에는 어떤 모델이 강하다고 하나요?

영상은 클로드를 꼽습니다. 실제 깃허브 이슈 수정 능력을 재는 SWE-bench에서 높은 점수를 받고, 긴 문서의 핵심 논지를 짚어내며, 어조를 살리고 무리한 요청에는 반박한다는 점을 근거로 듭니다.

오픈웨이트 모델은 어떤 점이 다른가요?

라마·큐원·젬마·미스트랄·GLM 등은 가중치가 공개돼 직접 내려받아 자체 호스팅하거나 자신의 데이터로 미세조정할 수 있고, 일부는 노트북·휴대폰 등 기기에서 오프라인으로 구동할 수 있습니다.

퍼플렉시티도 대형 언어모델인가요?

아니라고 설명합니다. 퍼플렉시티는 질문을 클로드·GPT 등 적합한 모델로 보내고 실시간 웹 출처에 근거해 인용과 함께 답하는 AI 검색엔진으로, 출처가 필요한 조사·확인 작업에 강점이 있다고 소개합니다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗