AI VIDEO BRIEFING
Ideogram 4 사용법: 무료 오픈소스 AI 이미지 생성기 ComfyUI 설치와 바운딩 박스
오픈소스 AI 이미지 생성기 Ideogram 4를 ComfyUI에서 무료로 오프라인 실행하는 방법과, 바운딩 박스로 화면 구성을 제어하는 독특한 사용법을 자막 내용을 토대로 정리했다.

핵심 메시지
쉽게 이해하기
영상은 Ideogram 4를 현재 쓸 수 있는 최고의 오픈소스 이미지 생성기로 소개한다. 화자는 처음 써봤을 때 거의 포기할 뻔했지만 몇 가지 설정을 바꾼 뒤 매우 강력하고 저평가된 모델임을 알게 됐다고 말한다. 이 모델은 텍스트-투-이미지 방식인데도 마리오·링크·피카츄 같은 게임 캐릭터를 별도 설명 없이도 정확히 그려낼 만큼 많은 지식을 담고 있고, 여러 캐릭터의 단체 사진도 대체로 올바르게 생성한다.
강점 중 하나는 텍스트 렌더링과 프롬프트 충실도다. 영상은 발레리나·토끼·코끼리가 등장하는 복잡한 프롬프트를 정확히 그려내는 예시를 보여준다. 그러나 이 모델을 다른 모델과 단순 비교할 수 없는 가장 큰 차이는 캔버스에 바운딩 박스를 끌어다 놓아 각 요소의 위치를 정하는 기능이다. 음악 페스티벌 포스터를 만들 때 제목·태그라인·인물·배경을 각각 박스로 배치하고 폰트와 색까지 지정하면, 결과물이 지정한 레이아웃을 그대로 따른다.
설치는 ComfyUI 플랫폼을 사용한다. ComfyUI는 오픈소스 이미지·영상 생성기를 오프라인에서 돌리는 가장 인기 있는 플랫폼으로, 자동 CPU 오프로딩 기능이 있어 GPU의 VRAM이 부족해도 일반 RAM으로 모델을 떠넘길 수 있다. 덕분에 Ideogram이 모델당 9GB로 크더라도 6GB VRAM만으로 실행한 사례가 있다. 영상은 추천 워크플로 파일을 내려받아 드래그 앤 드롭하고, ComfyUI Manager로 누락된 노드를 설치하며, KJ 프롬프트 빌더 노드를 깃으로 직접 클론하는 과정을 단계별로 안내한다.
필요한 모델 파일도 여러 개다. Ideogram 4의 메인 모델과 무조건(unconditional) 모델 두 가지가 모두 필요하고, GPU에 따라 FP8 또는 더 압축된 NVFP4 버전을 고른다. 여기에 Qwen 3 VL 계열 클립 텍스트 인코더와 Flux 2 VAE(약 336MB)까지 받아 각 드롭다운에서 선택하면 오류 표시가 사라진다. 화면 비율은 9:32 같은 극단적 세로부터 32:9 초광각까지 지원해 활용도가 높다.
실제 사용에서 핵심은 바운딩 박스다. 박스 없이 프롬프트만 넣으면 종종 'safety filter'로 차단된 듯한 이미지가 나오는데, 화자는 이것이 검열이 아니라 캔버스에 박스를 그리지 않아 생긴 현상이라고 설명한다. 박스로 인물·사물·텍스트의 위치를 지정하고, 겹친 요소는 Alt+클릭으로 뒤쪽을 선택하며, 시드(seed)를 고정하면 같은 구도를 유지한 채 일부 요소만 옮길 수 있다. 영상은 생성 속도가 Z image나 Flux보다 느려 이미지 한 장에 약 1분이 걸리지만, 품질·프롬프트 충실도·구성 제어력은 더 낫다고 평가한다.
주요 인사이트
- Ideogram 4의 차별점은 '그린 뒤 고치는' 방식이 아니라 '미리 설계하는' 방식이다. 바운딩 박스로 손·발·얼굴·포즈 같은 미세 요소까지 위치를 통제할 수 있다.
- ComfyUI의 CPU 오프로딩 덕분에 고사양 GPU가 없어도 큰 모델을 돌릴 수 있어, 오픈소스 이미지 생성의 진입 장벽이 크게 낮아졌다.
- 프롬프트만 넣었을 때 나오는 차단된 듯한 이미지는 검열이 아니라 바운딩 박스를 그리지 않아 생기는 현상이라는 점이, 이 모델을 다루는 가장 큰 학습 포인트다.
- 시드를 고정하면 전체 스타일을 유지하면서 특정 요소만 재배치할 수 있어, 결과물을 참고 삼아 구도를 다듬는 반복 작업에 유리하다.
- 강력한 성능에도 비상업 라이선스라는 제약이 있어, 수익을 내는 상업적 용도라면 별도의 영업 계약이 필요하다는 점을 유의해야 한다.
자주 묻는 질문
Ideogram 4를 무료로 쓸 수 있나요?
그렇다. 영상은 ComfyUI 플랫폼을 통해 컴퓨터에서 무료로, 무제한, 오프라인으로 실행하는 방법을 안내한다. 다만 모델은 비상업 라이선스라 개인·비영리 용도로만 자유롭게 쓸 수 있고, 상업적 이용에는 별도 계약이 필요하다.
Ideogram 4가 다른 이미지 생성 모델과 다른 점은 무엇인가요?
캔버스 위에 바운딩 박스를 끌어다 놓아 각 요소(인물·사물·텍스트)가 이미지의 어디에 위치할지 직접 지정할 수 있다는 점이다. 이를 통해 손·발·얼굴·포즈 같은 미세한 부분까지 구성을 제어할 수 있어, 단순히 텍스트 프롬프트만 넣는 다른 모델과 차별화된다.
고사양 GPU가 없어도 실행할 수 있나요?
가능하다. ComfyUI의 자동 CPU 오프로딩 기능이 VRAM이 부족할 때 일반 RAM으로 모델을 떠넘기기 때문에, 모델당 9GB 크기에도 불구하고 6GB VRAM만으로 실행한 사례가 있다. RAM이 충분하면 접근성이 높다.
이미지가 'safety filter'로 차단되는 이유는 무엇인가요?
영상에 따르면 이는 실제 검열이 아니라 캔버스에 바운딩 박스를 그리지 않아 생기는 현상이다. 프롬프트만 입력하지 말고 각 요소의 위치를 박스로 지정해 주면 정상적으로 이미지가 생성된다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗