AI VIDEO BRIEFING
Krea 2 리뷰 — 오픈소스 이미지 생성기 설치·성능·기술보고서
오픈 웨이트로 공개된 이미지 생성 모델 Krea 2를 ComfyUI로 설치·실행하는 방법과 속도·사양, LoRA 활용, 그리고 합성 데이터 배제 같은 기술 보고서의 핵심 통찰을 정리했다.

핵심 메시지
쉽게 이해하기
이 영상은 오픈 웨이트로 공개된 이미지 생성 모델 Krea 2를 소개하고 설치·사용법을 안내한다. 무료로 내려받아 오프라인에서 무제한 생성할 수 있고, 약 10초 내외로 빠르며 VRAM 8GB의 보급형 GPU에서도 돌아간다는 점이 강조된다. 진행자는 RTX 5080(16GB)에서 모델 로딩을 포함해 14초, 수채화 호랑이 이미지는 12초 만에 생성되는 것을 보여준다.
강점으로는 '플라스틱 같은' 인공적 느낌 없이 자연스러운 결점을 담은 사실적 사진, 다양한 예술 양식(특히 애니메이션), 정확한 해부학, 까다로운 다요소 프롬프트 이해, 기존 캐릭터에 대한 세계 지식, 텍스트·타이포그래피 렌더링이 꼽힌다. 한편 이 모델은 검열이 거의 없어 다른 모델과 달리 성인용 콘텐츠도 별도 보정 없이 생성된다는 점도 언급되는데, 영상은 이를 모델 특성 중 하나로 사실 위주로 설명한다.
설치는 오픈소스 이미지·영상 생성에 널리 쓰이는 ComfyUI에서 진행한다. 먼저 ComfyUI를 최신으로 업데이트한 뒤 'Krea text-to-image' 템플릿(API가 아닌 완전 오프라인 버전)을 선택하고, 필요한 모델을 내려받는다. Krea 2 모델은 파인튜닝용 raw와 속도가 빠른 turbo로 나뉘고, turbo도 BF16(26GB)·FP8(절반 크기)·MXFP8·NVFP4 등 GPU에 맞춰 고를 수 있다. 여기에 Qwen 3 VL 텍스트 인코더(약 4.8GB)와 VAE(약 250MB)가 필요하다.
워크플로 설정으로는 프롬프트, 프롬프트 보강(LLM 재작성, 느려져 보통 끔), 21:9까지의 종횡비와 최대 4K, 시드, LoRA 토글, 스텝 수(turbo는 8스텝 권장), 프롬프트 충실도를 정하는 CFG, 샘플러·스케줄러 등이 설명된다. 현재는 텍스트→이미지만 지원하며 편집 모델은 곧 공개 예정이다. 스타일·캐릭터를 더하는 LoRA는 공식 ComfyUI Krea 2 폴더에서 받을 수 있고 트리거 단어로 활성화한다. 검열을 더 확실히 풀려면 프롬프트와 K 샘플러 사이에 'Conditioning Krea 2 Rebalance' 커스텀 노드를 끼워 넣어야 한다.
영상은 Krea 2 기술 보고서의 통찰도 전한다. 사전학습 데이터에 AI 생성 이미지를 의도적으로 전혀 넣지 않았는데, 소량의 합성 데이터도 출력을 편향시키고 결과를 더 '뻔하게' 만들 수 있기 때문이라고 한다. 또 미관이 뛰어난 이미지만 보상하면 편향이 생기므로, 흐릿하거나 못난 이미지라도 프롬프트와 일치하면 벌점을 주지 않았다. OCR·메타데이터·다양한 길이의 캡션을 쓰는 풍부한 캡셔닝 파이프라인도 소개된다. 끝으로 GPU를 128장에서 더 늘리자 학습이 자주 크래시해 대규모에서는 한 번의 런도 완주하지 못했다는, 프런티어 이미지 학습의 인프라 난제까지 솔직히 공개됐다고 전한다. 라이선스는 연 매출 100만 달러 미만이면 상업적 사용을 허용해 Ideogram·Flux보다 관대하다.
주요 인사이트
- 사실성의 비결은 데이터 위생이다 — 사전학습에서 AI 생성 이미지를 배제해 합성 데이터로 인한 편향과 '뻔한' 출력을 피했다.
- 미관 기준의 과도한 필터링은 오히려 편향을 부른다. 프롬프트와 일치한다면 못난 이미지도 벌하지 않는 것이 정렬에 도움이 된다.
- 프런티어 이미지 학습의 병목은 모델 구조만이 아니다. GPU 수를 늘리자 잦은 크래시로 대규모 런을 완주하지 못한 인프라·디버깅 문제가 솔직히 공개됐다.
- 오픈 웨이트와 낮은 VRAM 요구(8GB) 덕분에 보급형 GPU에서도 빠른 로컬 생성이 가능해 접근성이 높다.
- 라이선스 조건이 실사용을 좌우한다 — 연 매출 100만 달러 미만 상업 사용 허용은 Ideogram·Flux보다 관대한 편이다.
자주 묻는 질문
Krea 2는 어떤 하드웨어에서 돌릴 수 있나요?
VRAM 8GB 정도의 보급형 GPU에서도 동작하며, 영상에서는 RTX 5080(16GB)으로 모델 로딩 포함 약 14초 만에 이미지를 생성합니다. 사용 GPU가 지원하는 정밀도(FP8, MXFP8, NVFP4 등) 버전을 고르면 됩니다.
설치하려면 무엇이 필요한가요?
ComfyUI를 최신으로 업데이트한 뒤 'Krea text-to-image(오프라인)' 템플릿을 쓰고, Krea 2 모델(raw 또는 turbo)·Qwen 3 VL 텍스트 인코더(약 4.8GB)·VAE(약 250MB)를 내려받아야 합니다.
상업적으로 사용할 수 있나요?
커뮤니티 라이선스에 따라 연 매출이 100만 달러 미만이면 상업적 사용이 가능합니다. Apache 2나 MIT만큼 자유롭진 않지만 Ideogram·Flux보다는 관대하다고 설명합니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗