AI VIDEO BRIEFING
GLM 5.2 + Z-Code 세팅 가이드: 킹 모드·검증 워크플로우·MCP 구성
AICodeKing이 소개하는 GLM 5.2 실전 세팅. 모델만이 아니라 하네스·시스템 프롬프트·스킬·MCP·검증 루프를 결합해 앱 개발 실무 성능을 끌어올리는 방법을 정리한다.

핵심 메시지
쉽게 이해하기
제작자는 흔한 Z-Code 둘러보기 대신, GLM 5.2에서 최대 성능을 뽑아내는 실제 세팅법을 보여준다고 밝힌다. 다만 GLM 5.2가 모든 벤치마크·안전 라우팅·장기 에이전트 테스트에서 마법처럼 Fable 5가 된다는 뜻은 아니며, 앱 빌드·리팩터링·대시보드 제작·버그 수정·문서 활용·테스트 반복 같은 '일반 코딩 작업'에서 제대로 된 하네스와 결합하면 값비싼 프런티어 모델의 실용 결과에 놀랄 만큼 가까워질 수 있다는 취지라고 선을 긋는다.
기본 세팅은 Z-Code에 ZAI 계정으로 로그인해 GLM 5.2를 선택하는 것이다. 이 모델은 100만 토큰 컨텍스트 창과 (공식 문서 기준) 최대 12만 8천 토큰 출력을 지원하며, 큰 숫자 자체보다 이전 GLM보다 컨텍스트를 더 잘 활용하고 계획·집중·장기 과제에 강해진 점이 중요하다고 설명한다. 무료 일일 체험 쿼터가 있으나(프로모션에서 하루 약 500만 토큰 사례를 봤다고 언급) 영구·무제한이 아니며, 민감한 회사 코드·비밀·고객 데이터는 무료 체험 엔드포인트에 넣지 말라고 당부한다.
그 위에 얹을 첫 요소는 '킹 모드'다. 지능을 더하는 게 아니라 규율을 주입해 모델이 초점을 잡고 복잡도를 판단하며 제대로 된 구현 경로에 전념하게 한다. 핵심 트리거는 ultra think로, 무한정 생각하는 게 아니라 깊은 계획이 필요한지 스스로 판단해 필요하면 계획하고 아니면 작은 수정만 하고 넘어가게 한다. 매 메시지에 프롬프트를 붙이지 말고 스킬로 저장해 재사용하라고 권한다.
다음은 스펙·검증 워크플로우다. Addy Osmani의 에이전트 스킬 리포에서 스펙→계획→빌드→테스트→리뷰→단순화→출시의 수명주기를, Obra의 Superpowers에서 브레인스토밍·명세·구현 계획·리뷰·레드그린 TDD 같은 방법론을 빌리되, 리포 전체를 컨텍스트에 밀어넣지 말고 계획·검증·프런트엔드 품질 정도의 짧은 스킬로 추리라고 조언한다. 단 Z-Code는 아직 사용자 정의 서브에이전트를 지원하지 않고 읽기 전용 Explorer만 있으므로, 기능을 1:1로 옮기려 하지 말고 철학만 이식하라고 강조한다.
MCP는 최소화가 핵심이다. ZAI 자체 웹검색/리더, 문서용 Context7, UI 검증용 Playwright·프리뷰, 스크린샷 분석용 비전 경로 정도만 두라는 것이다. 실사용은 먼저 'explore 전용'으로 저장소 구조를 파악하게 한 뒤 goal 모드로 목표를 주고, 계획이 모호하면 멈춰 다듬고, 빌드 후엔 diff를 스스로 리뷰하게 하고 실제로 앱을 띄워 확인한다. 프런트엔드에선 '보라색 그라디언트·글래스모피즘·장식용 블롭 금지' 같은 부정형 제약을 주면 흔한 AI 디자인을 피할 수 있다고 팁을 준다. 결론적으로 GLM 5.2(엔진)+Z-Code(하네스)+킹 모드(규율)+스킬/Superpowers(프로세스)+MCP·프리뷰(현실 점검)의 조합이 지금 가장 좋은 가성비 워크플로우 중 하나라고 평가한다.
주요 인사이트
- '모델만이 전부가 아니다' — 동일 모델도 하네스·시스템 프롬프트·스킬·MCP·검증 루프에 따라 실무 결과가 크게 달라진다.
- AI 코딩 에이전트의 최대 실패 모드는 '코드를 못 쓰는 것'이 아니라 지루한 엔지니어링 단계를 건너뛰고 자신 있게 구는 것이며, 검증 스킬이 이를 막는다.
- 컨텍스트를 프롬프트 파일로 가득 채우지 말라 — 킹 모드는 상시, 계획·검증은 코어, 프런트엔드·보안 규칙은 해당 작업 때만 붙이는 '적시·적정 규모'가 중요하다.
- '그럴듯해 보이는 성공'을 믿지 말라 — 앱을 실제로 실행하고 콘솔·주요 플로우·모바일 레이아웃까지 확인해야 한다.
- 부정형 디자인 제약(무엇을 하지 말지 명시)이 '모던하게'라는 막연한 지시보다 흔한 AI 디자인을 훨씬 효과적으로 피하게 해 준다.
자주 묻는 질문
이 영상의 핵심 주장은 무엇인가요?
GLM 5.2를 Z-Code 안에서 킹 모드·계획/검증 스킬·최소한의 MCP와 결합하면, 실무 앱 개발에서 값비싼 프런티어 모델의 실용 결과에 근접할 수 있다는 것입니다.
GLM 5.2의 컨텍스트와 출력 한도는 얼마로 소개되나요?
제작자는 100만 토큰 컨텍스트 창과, 공식 문서 기준 최대 12만 8천 토큰 출력을 언급하며, 숫자보다 컨텍스트를 잘 활용하는 능력이 더 중요하다고 말합니다.
'킹 모드'는 무엇인가요?
지능을 더하는 게 아니라 규율을 주입하는 레이어로, ultra think 트리거로 과제가 깊은 계획을 필요로 하는지 스스로 판단해 계획하거나 바로 작은 수정을 하게 만듭니다.
무료 체험을 쓸 때 주의할 점은?
무료 일일 쿼터는 개인·오픈소스·테스트 프로젝트에 쓰고, 민감한 회사 코드·비밀·고객 데이터는 데이터 정책을 확인하기 전엔 넣지 말라고 당부합니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗