AI VIDEO BRIEFING

IBM watsonx 기업용 생성형 AI: 파운데이션 모델·데이터 모델 팩토리·거버넌스

IBM Think 2023에서 다리오 길이 소개한 watsonx의 청사진. AI 사용자와 가치 창출자의 차이, 데이터·모델 팩토리, AI 거버넌스, 허깅페이스 파트너십까지 기업용 AI 전략을 정리했다.

출처: IBM Research2023년 5월 13일AI 보조 요약

AI 사용자에 머물지 말고 '가치 창출자'가 되라 — IBM watsonx가 그린 기업용 AI 영상 대표 이미지

핵심 메시지

IBM 연구 책임자 다리오 길은 단순히 남이 만든 모델에 프롬프트를 넣는 'AI 사용자'가 아니라, 자기 데이터로 모델을 소유하는 'AI 가치 창출자'가 되라고 강조한다.
watsonx는 데이터(x.data), 모델 학습·튜닝(x.ai), 거버넌스(x.governance) 세 축으로 구성돼 파운데이션 모델의 전 수명 주기를 관리한다.
데이터 준비→학습→검증→튜닝→배포로 이어지는 워크플로를 데이터 카드·모델 카드·팩트 시트로 추적 가능하게 만들어 거버넌스를 확보한다.
'데이터 및 모델 팩토리'는 규정·법률·데이터 변화가 생기면 모델을 지속적으로 업데이트하며, 기업용 AI의 책임성과 신뢰를 뒷받침한다.
하나의 모델이 모든 것을 지배할 수 없다는 철학 아래, IBM은 허깅페이스와 파트너십을 맺어 오픈 커뮤니티의 다양성과 기업용 보안을 결합한다.

쉽게 이해하기

IBM Think 2023 마지막 세션에서 수석 부사장 겸 연구 책임자 다리오 길 박사는, AI 생성 예술이나 노래처럼 재미있는 사례를 넘어 기업이 파운데이션 모델을 제대로 활용하려면 신뢰성·보안·적응성이라는 더 높은 기준이 필요하다고 말한다. 그의 핵심 조언은 명확하다. 'AI 사용자'가 아니라 'AI 가치 창출자'가 되라는 것이다. 남이 만든 모델에 프롬프트만 넣으면 모델도 데이터도 내 것이 아니지만, 자기 데이터로 학습한 기반 모델은 가장 가치 있는 자산이 된다.

이를 구현하는 플랫폼이 watsonx다. 크게 세 부분으로 나뉜다. x.data는 학습·튜닝에 바로 쓸 수 있는 방대한 큐레이션 데이터 저장소이고, x.ai는 머신러닝·파운데이션 모델을 학습·검증·튜닝·배포하는 엔터프라이즈 스튜디오이며, x.governance는 모델의 전 수명 주기에서 책임 있는 실행을 보장하는 도구 모음이다. 전체는 레드햇 오픈시프트 기반의 하이브리드 클라우드 위에 구축돼 어떤 IT 환경에서도 AI 워크로드를 배포할 수 있다.

길 박사는 AI 워크플로를 데이터 준비, 학습, 검증, 튜닝, 배포의 5단계로 시연한다. 다양한 출처의 데이터를 연결해 언어·프로그래밍 언어별로 분류하고, 중복·혐오 표현·개인정보·라이선스 문제를 필터링한 뒤 데이터 카드로 버전 관리한다. 학습에는 클라우드 네이티브 AI 슈퍼컴퓨터 'Vela'가 쓰이고, PyTorch·Ray·허깅페이스 등 오픈소스 기술을 통합한다. 검증을 통과한 모델은 모델 카드로 문서화되며, 데이터 카드와 결합된 '팩트 시트'가 거버넌스 카탈로그에 등록된다.

배포된 모델은 지속적으로 모니터링하고 데이터·모델 양쪽에서 업데이트하는데, 이 순환 과정을 '데이터 및 모델 팩토리'라 부른다. 새 데이터가 생기거나 규정·법률·라이선스가 바뀌면 팩토리가 이를 감지해 기존 애플리케이션에 지장 없이 모델을 갱신한다. IBM은 이미 언어·코드·지리공간·화학 등 여러 분야에서 20개 이상의 모델을 개발해 IBM·레드햇·파트너 제품에 통합했으며, Granite 모델과 Watson Code Assistant가 대표 사례다.

행사에서는 허깅페이스 공동창업자 겸 CEO도 무대에 올라 오픈소스 AI 커뮤니티의 폭발적 성장세를 전했다. 1만 5천 개 이상의 기업이 플랫폼을 쓰고, 5만 개 데이터셋과 지난 한 주에만 4천 개의 새 모델이 공유됐다는 것이다. 길 박사는 마무리로 네 가지 조언을 남긴다. 긴급하게 행동하라, 가치 창출자가 되라, 커뮤니티에 투자하라, 그리고 무엇보다 책임감을 가지라 — 신뢰야말로 궁극의 '운영 허가증'이라는 메시지다.

주요 인사이트

기업 AI 경쟁력의 분기점은 '모델을 쓰느냐'가 아니라 '자기 데이터로 모델을 소유하느냐'다. 아웃소싱은 통제력과 차별화를 함께 잃게 만든다.
데이터 카드·모델 카드·팩트 시트로 데이터 출처와 학습 과정을 추적 가능하게 만드는 것은, 기업용 AI에서 거버넌스가 부가기능이 아니라 기본 설계임을 보여준다.
'데이터 및 모델 팩토리'는 모델을 한 번 만들고 끝내는 게 아니라, 규정·데이터 변화에 맞춰 계속 갱신하는 운영 체계로 AI를 다룬다.
하나의 거대 모델이 모든 것을 지배한다는 통념과 달리, 사용 사례에 맞춘 더 작고 전문화된 모델이 더 저렴하고 효율적이라는 관점이 오픈소스 생태계를 키우고 있다.
허깅페이스에 매주 수천 개의 모델이 추가되는 현상은, 기업이 커뮤니티의 다양성을 활용하되 보안·지원은 신뢰할 파트너로 보완하는 조합이 필요함을 시사한다.

자주 묻는 질문

다리오 길이 말하는 'AI 사용자'와 'AI 가치 창출자'의 차이는?

AI 사용자는 남이 만든 모델에 프롬프트만 제공하는 사람으로, 모델과 데이터에 대한 제어권이 없다. 반면 가치 창출자는 자기 데이터로 기반 모델을 학습·소유하며, 그 자산과 그것이 만드는 가치를 직접 통제한다. 길 박사는 AI 전략을 단순한 API 호출로 축소하지 말라고 조언한다.

watsonx는 어떤 구성 요소로 이뤄져 있나?

크게 세 부분이다. x.data는 학습·튜닝용 큐레이션 데이터 저장소, x.ai는 모델을 학습·검증·튜닝·배포하는 엔터프라이즈 스튜디오, x.governance는 모델 전 수명 주기에서 책임 있는 실행을 보장하는 거버넌스 도구다. 전체는 레드햇 오픈시프트 기반 하이브리드 클라우드 위에 구축된다.

'데이터 및 모델 팩토리'는 무엇을 하는가?

배포된 모델을 지속적으로 모니터링하고, 새 데이터가 생기거나 규정·법률·데이터 라이선스가 바뀌면 이를 감지해 데이터와 모델을 갱신하는 순환 프로세스다. 기존 애플리케이션에 지장을 주지 않으면서 적절한 AI 거버넌스를 유지하는 것이 목표다.

IBM과 허깅페이스 파트너십의 의미는?

하나의 모델이 모든 것을 지배할 수 없다는 전제 아래, 오픈 커뮤니티의 다양한 모델·데이터셋과 IBM의 기업용 보안·지원을 결합하려는 것이다. 이를 통해 기업이 자체 내부용 챗봇 같은 솔루션을 구축하도록 돕는다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗