AI VIDEO BRIEFING

AI 프롬프트 4계층 설계: 브랜드 보이스를 망치지 않는 구조

한 시스템 프롬프트에 정체성·상황·말투·검증을 모두 맡기면 결정적 순간에 무너진다. 웨딩 베뉴 AI를 운영한 개발자가 제시하는 4계층 프롬프트 아키텍처를 정리했다.

출처: AI Engineer2026년 6월 26일AI 보조 요약

AI 챗봇 말투를 한 프롬프트에 다 넣지 마라: 4계층으로 분리하는 설계법 영상 대표 이미지

핵심 메시지

AI는 '룰을 박아 넣고 떠나는 로봇'이 아니라 '기억력은 완벽하지만 눈치가 없는 인턴'으로 다뤄야 하며, 그래서 구조를 만들고 결과물을 내보내기 전에 검수해야 한다.
상세한 시스템 프롬프트 하나는 예상한 질문(해피 패스)까지만 통하고, 예시가 닿지 않는 '21번째 턴'에서 기술적으로는 맞지만 브랜드답지 않은 답을 내놓으며 무너진다.
한 프롬프트에 정체성·상황·표현·자기검증이라는 네 가지 다른 일을 동시에 시키는 것이 실패의 근본 원인이다.
해법은 네 개의 계층으로 분리하는 것: ①절대 불변의 정체성 ②실시간 상황 모드 ③예시 기반 말투 ④생성 후 거부(veto).
앞의 세 계층은 '부탁(확률적 지시)'이고 네 번째 계층만이 실제 출력물을 읽고 통과 여부를 결정하는 '허가(결정론적 검증)'다.

쉽게 이해하기

버지니아에서 225년 된 웨딩 베뉴를 운영하는 이사도라는 예비부부와 대화하는 AI 에이전트를 직접 만들었고, 이후 다른 베뉴와 실종자 가족용 도구까지 확장했다. 그가 강조하는 출발점은 관점이다. AI를 프로그래밍하는 로봇이 아니라, IQ는 높지만 EQ가 형편없는 똑똑한 인턴을 관리한다고 보면 만들어야 할 것이 달라진다. 로봇이라면 규칙을 적고 떠나면 되지만, 인턴이라면 구조를 만들고 결과물이 나가기 전에 검토해야 한다.

흔한 조언은 '브랜드 보이스를 자세히 적은 시스템 프롬프트를 써라'다. 이는 예상한 모든 질문, 즉 해피 패스에서는 작동한다. 그러나 예시가 다루지 못한 21번째 턴에서 모델은 기술적으로는 맞지만 우리 브랜드라면 결코 하지 않을 말을 한다. 틀린 건 아니지만 '우리'가 아니다. 말투 자체가 상품인 럭셔리 호텔이나 고급 부동산, 웨딩 베뉴처럼 한 문장이 환불 이상의 비용을 치르게 하는 곳에서 이 문제는 치명적이다.

이사도라가 도달한 구조는 네 계층이다. 1계층은 불변의 정체성으로, 브랜드가 구조적으로 절대 말할 수 없는 하드 룰이며 그 아래 어떤 설정·사용자 지시로도 덮어쓸 수 없다. 2계층은 상황 모드로, 상대가 누구이고 지금 어떤 상황인지에 따라 경로를 바꾼다. 3계층은 예시로 다듬은 말투이고, 4계층은 생성된 결과를 실제로 읽고 거부할 수 있는 값싼 최종 검증이다. 순서가 곧 구조이며, 모든 표면은 하나의 조립 지점을 통과한다.

발표자는 구글 지도에 비유한다. 목적지는 같아도 실시간 교통·공사 정보를 올바른 순서로 반영해야 옳은 경로가 나온다. 1계층은 면허처럼 경로와 무관하게 참인 규칙, 2계층은 실시간 조건, 3계층은 여정의 선호, 4계층은 출발 전 최종 점검이다. 공사 구간은 이미 잘못 들어선 뒤에 확인하면 늦다.

핵심 통찰은 앞의 세 계층이 모두 '지시'라는 점이다. 모델은 지시를 대개 따르지만 '대개'일 뿐이다. 네 번째 계층만이 실제 출력물을 읽고 사업 밖으로 내보낼지 결정한다. 지시는 확률적이고 허가는 결정론적이다. 1~3계층까지가 프롬프트 엔지니어링이라면, 4계층은 검증하고 확신하는 시스템 엔지니어링이다.

주요 인사이트

1계층(불변 정체성)의 대표 사례는 'AI는 몸이 없다'는 제약이다. 따뜻함을 원하는 말투 계층은 '직접 안내해 드릴게요'라고 말하고 싶어 하지만, 몸이 없는 AI가 그렇게 말하면 거짓이 된다. 사용자가 그 사실을 깨닫는 순간 신뢰는 떨어지는 정도가 아니라 역전된다.
같은 아키텍처를 실종자 가족용 도구(Thread Light)에 적용했을 때 1계층은 'confirmed, matched, solved' 같은 단어를 절대 쓰지 못하게 막는다. 모델은 통계적으로 자연스럽다는 이유로 'match'를 자신 있게 꺼내지만, 수년간 자녀의 행방을 모르는 사람에게 그 확신은 가장 파괴적인 행위가 된다.
2계층은 상대의 역할이 아니라 처지를 반영한다. 항암치료 중인 부모가 있는 부부의 응답 빈도가 떨어지면, 이를 '식은 리드'가 아니라 '힘든 시기를 보내는 가족'으로 읽도록 부드러운 맥락 노트를 숫자보다 먼저 렌더링한다.
4계층의 거부는 베뉴가 제공할 수 없는 날짜를 모델이 따뜻하고 자신 있게 제안하는 실패에서 나왔다. 앞 계층이 모두 제 일을 해도 캘린더를 모르는 모델은 존재하지 않는 날짜를 약속할 수 있고, 따뜻한 거짓 약속은 차가운 거절보다 나쁘다.
멀티테넌트에서 정체성에 기본값을 두면 모든 베뉴가 'sage@...' 같은 남의 정체성으로 메일을 보내는 화이트라벨 누수가 생긴다. 정체성 누락은 폴백이 아니라 크래시여야 하며, 조용한 실패가 신뢰를 먼저 갉아먹는다.

자주 묻는 질문

왜 잘 쓴 시스템 프롬프트 하나로는 부족한가?

한 프롬프트는 예상한 질문(해피 패스)까지만 통한다. 예시가 닿지 않는 '21번째 턴'에서는 기술적으로 맞지만 브랜드답지 않은 답을 내놓는다. 하나의 프롬프트에 상황 대응·불가침 규칙·표현·자기검증이라는 네 가지 다른 일을 동시에 시키기 때문에 가장자리에서 무너진다.

네 개의 계층은 각각 무엇을 담당하나?

1계층은 브랜드가 구조적으로 절대 말할 수 없는 불변의 정체성, 2계층은 상대가 누구이고 무엇을 겪는지에 따른 실시간 상황 모드, 3계층은 예시로 다듬은 말투, 4계층은 생성된 결과를 읽고 통과 여부를 결정하는 생성 후 거부다.

4계층이 다른 계층과 본질적으로 다른 점은?

앞의 세 계층은 모델에게 보내는 '지시'로 확률적이다. 모델이 대개 따르지만 보장은 없다. 4계층만이 실제 출력된 결과를 읽고 거부할 권한을 가진 '허가'이며 결정론적이다. 잘못된 날짜처럼 실제 사람이 행동에 옮길 사실을 모델이 자신 있게 지어낼 때 이 계층이 막아낸다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗