AI VIDEO BRIEFING

GLM-5.2 리뷰: 오픈웨이트 중국 AI 모델의 코딩·에이전트 성능을 직접 실험

중국 Z.ai가 공개한 오픈웨이트 모델 GLM-5.2를 웹사이트·API·에이전트 하니스에서 직접 테스트한 결과를 정리했다. 값싼 비용과 100만 토큰 컨텍스트, 코딩·에이전트 성능이 왜 주목받는지 실제 활용 사례와 함께 살펴본다.

GLM-5.2 실전 테스트: 프런티어급에 도전하는 중국산 오픈웨이트 AI 영상 대표 이미지

핵심 메시지

  • GLM-5.2는 중국 Z.ai가 내놓은 플래그십 롱컨텍스트 모델로, MIT 라이선스의 오픈웨이트이며 코딩·에이전트 작업에 최적화돼 있다.
  • 파라미터가 7,530억 개, 가중치 용량이 1.5테라바이트를 넘어 개인 PC에서 직접 돌리기는 사실상 어렵고, 대부분은 웹사이트나 API로 사용한다.
  • 오픈웨이트의 진짜 가치는 집에서 돌릴 수 있다는 점이 아니라, 저렴한 가격과 통제권으로 폐쇄형 프런티어 모델에 경쟁 압력을 준다는 데 있다.
  • 웹페이지 제작, 크롬 확장 프로그램, 게임 클론, 폴더 정리, 자동화 스킬 생성 등 다양한 실전 과제를 대체로 무난히 처리했다.
  • 모든 면에서 클로드·GPT·제미나이를 앞서지는 못하지만, 길고 코드·문서가 많고 토큰 비용이 큰 작업이라면 시도해볼 값어치가 있다.

쉽게 이해하기

미국 정부가 최상위 AI 모델의 사용을 제한하는 흐름 속에서, 중국에서 나온 모델들이 대안으로 떠오르고 있다. 이 영상은 Z.ai(ZAI)가 공개한 GLM-5.2를 직접 여러 방식으로 사용해 보며 실제 능력을 검증한다. 발표자는 이 모델로 웹사이트 제작, 미니 앱 개발, 대용량 문서 분석, 지저분한 데이터 정리, 크롬 확장 프로그램 제작, 코드 버그 수정, 게임 제작, 에이전트 워크플로 처리까지 폭넓게 시도했다.

GLM-5.2는 텍스트를 입력받아 텍스트를 내보내는 롱컨텍스트 모델로, 100만 토큰의 컨텍스트 창과 12만 8천 토큰의 최대 출력을 지원한다. 함수 호출, 구조화된 출력, 컨텍스트 캐싱, MCP를 지원하며 코딩과 에이전트 작업에 맞춰 튜닝돼 있다. 단순한 챗봇이 아니라 여러 파일과 문서, 코드를 던져 주고 "이걸 전부 이해해서 계획을 세우고 작업하라"고 지시하는 용도에 적합하다.

이 모델은 MIT 라이선스의 오픈웨이트지만, 오픈웨이트가 곧 개인이 쉽게 로컬 구동할 수 있다는 뜻은 아니다. 파라미터가 7,530억 개에 달하고 가중치를 내려받으면 1.5테라바이트가 넘으며, 1비트로 극단 압축해도 약 200기가바이트의 메모리가 필요하다. 사용 방법은 사실상 세 가지로 나뉜다. Z.ai 웹사이트에서 바로 쓰기, API로 커서·클로드 코드·오픈 코드 같은 에이전트 하니스에 연결하기, 그리고 직접 자체 호스팅하기다.

발표자는 웹사이트에서 무료로 여러 테스트를 진행했다. 딸기(strawberry)의 R 개수는 맞혔지만 occasion의 S 개수 문제에서는 여전히 헷갈려 했고, 세차장까지 걸어갈지 운전해 갈지 묻는 논리 문제와 부상 중 300파운드 데드리프트 요청 같은 모순 함정은 제대로 걸러냈다. HTML·CSS로 차트를 그리게 하거나 SVG 이미지를 그리게 하는 등 시각적 산출물도 무난했다.

에이전트 하니스에서는 커서에 GLM-5.2를 연결해 3D 게임 클론을 여섯 번의 프롬프트 만에 동작하게 만들었고, 웹페이지를 요약해 주는 크롬 확장 프로그램을 제작했으며, 어질러진 다운로드 폴더를 자동 분류했다. 회의 노트 도구 그래놀라를 MCP로 연결해 매주 문제를 찾아 스킬을 자동 생성하는 자동화, 레모션을 이용한 애니메이션 차트 생성까지 시연했다.

주요 인사이트

  • 값싸고 유능한 모델은 AI 사용 방식 자체를 바꾼다. 비용이 비싸면 망설이지만, 저렴하면 더 많은 맥락을 주고 재시도하며 에이전트를 오래 돌리는 실험을 하게 된다.
  • 린디는 딥시크 V4, 커서는 키미 2.5, 코인베이스는 GLM-5.2 등 서구권 기업들이 비용과 통제권, 규제 위험을 이유로 중국산 모델로 워크로드를 옮기는 흐름이 커지고 있다.
  • 오픈웨이트는 한번 공개되면 회수할 수 없어, 규제로 최상위 모델 접근이 어려워질수록 이런 대안 모델의 존재감이 커진다.
  • GLM-5.2가 만든 글은 GPTZero 같은 AI 탐지기에 100% AI 작성으로 잡혔다. "AI처럼 안 보이게" 요청해도 특유의 문체는 남아 탐지를 피하기 어려웠다.
  • 실전 과제는 대개 한 번에 완벽하지 않고 스크린샷 피드백을 몇 차례 주고받아야 완성됐지만, 프런티어 모델의 몇 분의 일 비용이라는 점이 이를 상쇄한다.

자주 묻는 질문

GLM-5.2는 개인 컴퓨터에서 직접 돌릴 수 있나?

사실상 어렵다. 7,530억 개 파라미터에 가중치가 1.5테라바이트를 넘고, 극단적으로 압축한 버전도 약 200기가바이트 메모리가 필요해 일반 소비자용 컴퓨터로는 구동이 거의 불가능하다. 대신 Z.ai 웹사이트나 API로 사용하는 것이 현실적이다.

GLM-5.2는 어떤 작업에 특히 추천되나?

발표자는 길고 코드가 많거나 문서 분량이 크고 에이전트 방식이며 토큰 비용이 많이 드는 작업이라면 시험해볼 만하다고 정리한다. 저렴한 비용, 오픈웨이트, 100만 토큰의 긴 컨텍스트, 준수한 코딩·에이전트 성능이 강점이기 때문이다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식