AI VIDEO BRIEFING

클로드 오퍼스 4.6 실사용 후기 - 긴 스레드 지시 준수·컨텍스트 수집·게임/PPT 테스트

앤트로픽 오퍼스 4.6을 출시 전 써본 후기. 긴 스레드 지시 준수, 행동 전 맥락 수집, 끈기라는 세 가지 변화와 팟캐스트·게임·프레젠테이션 세 가지 실사용 테스트를 정리한다.

클로드 오퍼스 4.6 직접 써보니: 긴 대화 기억·선(先)맥락 수집·끈기 세 가지가 달라졌다 영상 대표 이미지

핵심 메시지

  • 오퍼스 4.6은 긴 대화에서도 처음 준 지시를 더 잘 기억해 흐트러지지 않는다.
  • 행동에 앞서 전체 맥락을 더 많이 수집해, 첫 응답은 느려도 이어지는 작업의 품질이 높아진다.
  • 어려운 문제에서 쉽게 포기하지 않고 여러 접근을 스스로 시도하는, 더 에이전트다운 동작을 보인다.
  • 확장 사고가 “적응형 사고”로 바뀌어 간단한 질문엔 적게, 복잡한 작업엔 더 길게 생각한다.
  • 팟캐스트 후반작업, 게임 제작, 프레젠테이션 생성 세 가지 실사용에서 모두 쓸 만한 결과를 냈다.

쉽게 이해하기

발표자는 앤트로픽의 새 모델 오퍼스 4.6을 출시 전에 사용해보고 첫인상을 전한다. 그가 테스트로 확인한 변화는 세 가지다. 첫째, 긴 스레드에서 지시를 훨씬 잘 따른다. 이전에는 대화가 길어지면 클로드가 초기 지시를 잊는 경우가 있었지만, 4.6은 깊은 대화 속에서도 처음 프롬프트를 기억한다.

둘째, 행동하기 전에 맥락을 더 많이 모은다. 앤트로픽 모델은 특히 코딩에서 곧장 코드부터 쓰려는 경향이 있어 플랜 모드 같은 우회법으로 먼저 생각하게 만들어야 했는데, 4.6은 변경 전에 전체 그림을 읽어 들인다. 그 탓에 첫 응답은 더 오래 걸릴 수 있지만 이어지는 작업의 품질이 높아진다. 셋째, 어려운 문제에서 쉽게 포기하지 않고 여러 접근을 독립적으로 시도한 뒤에야 사용자에게 확인을 구해, 더 오래 자율적으로 일한다.

팁도 두 가지 제시한다. 확장 사고(extended thinking)가 적응형 사고로 바뀌어, 간단한 수학 질문엔 길게 생각하지 않고 바로 답하고 복잡한 작업엔 더 오래 생각한다. 또 4.6이 기본적으로 맥락을 더 모으므로, “자세히 해” “게으르게 굴지 마” 같은 프롬프트는 더 이상 필요 없고 오히려 과도한 생각을 유발해 결과를 나쁘게 만들 수 있다.

첫 번째 실사용 테스트는 일반 클로드의 팟캐스트 후반작업 프로젝트다. 원본 인터뷰 트랜스크립트를 넣으면 유튜브 제목·썸네일 조합, 잘라낼 구간, 쇼노트, 핵심 요약, 소셜 포스트를 한 번에 만들어낸다. 발표자는 오래 다듬어 온 매우 긴 프롬프트에서 4.6이 놀랄 만큼 잘 작동했고 매주 한두 시간을 아껴준다고 말한다.

두 번째는 클로드 코드로 게임 만들기다. 4,000개가 넘는 픽셀 아트 에셋이 든 폴더를 탐색하게 한 뒤 함께 게임을 만들도록 시켰고, 모델은 에셋을 훑고 어떤 게임을 만들지 되물었다. 그는 비트엠업(beat-em-up)을 골라 Phaser 3로 만들게 했다. 약 15분 만에 빌드됐지만 처음엔 실행되지 않았고, 버그를 수정하자 이동·점프·킥·펀치가 되는 게임이 작동했다. 적 종류를 더하니 라운드마다 다른 적이 나오는 “스트리트 오브 레이지” 비슷한 게임이 완성됐다.

주요 인사이트

  • 세 번째 테스트로 발표자는 클로드 데스크톱 앱의 코워크(Co-work) 기능을 써 프레젠테이션을 만든다 — 가상 머신을 띄워 베스트 프랙티스를 리서치하고 파워포인트를 코드로 생성한 뒤, 정렬·간격 같은 시각적 QA까지 거쳐 깔끔한 결과를 냈다.
  • 앤트로픽은 자체 이미지 모델이 없어, 코워크가 만든 발표 자료는 사진 대신 아이콘과 이모지로 시각 요소를 채웠다.
  • 코딩 시장은 치열한 접전으로, 같은 날 OpenAI가 오퍼스 4.6 출시 20분 뒤 코덱스(Codex) 5.3을 내놓으며 서로 광고로 견제했다.
  • 발표자의 개발자 지인들 정서는, 오퍼스는 개성이 강하고 제로투원과 일상 코딩에 강한 반면 까다로운 버그나 난해한 문제에는 코덱스가 더 낫다는 것이다 — 다만 변화 속도가 빨라 언제든 뒤집힐 수 있다.

자주 묻는 질문

오퍼스 4.6의 핵심 변화 세 가지는?

긴 스레드에서 초기 지시를 더 잘 기억하고, 행동 전에 맥락을 더 많이 수집하며, 어려운 문제에서 쉽게 포기하지 않고 여러 접근을 스스로 시도하는 점이다.

4.6에서 프롬프트 방식이 어떻게 달라지나?

기본적으로 맥락을 더 모으기 때문에 “자세히 해” “게으르지 마” 같은 지시가 필요 없어졌고, 오히려 그런 프롬프트가 과도한 생각을 유발해 결과를 나쁘게 만들 수 있다. 확장 사고도 질문 난이도에 맞춰 생각 길이를 조절하는 적응형으로 바뀌었다.

같은 날 경쟁사 동향은?

같은 날 OpenAI가 오퍼스 4.6 출시 약 20분 뒤 코덱스 5.3을 출시하며 코딩 시장에서 정면으로 경쟁했고, 벤치마크 결과는 영상마다 엇갈렸다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗

관련 AI 소식