AI VIDEO BRIEFING
메타 CXL 메모리 확장 칩 비스타라와 DDR4 재활용, HBM과 CXL의 결정적 차이는 무엇인가
메타가 ISCA 2026에서 공개한 CXL 메모리 확장 칩 비스타라로 구형 DDR4를 재활용한 사례를 정리했습니다. HBM과 CXL이 푸는 문제가 왜 다른지, 국내 메모리 기업에는 어떤 의미인지 함께 살펴봅니다.

핵심 메시지
쉽게 이해하기
디램 가격이 천정부지로 뛰고 만성적 공급 부족 전망까지 나오는 상황에서, 세계 최대 데이터센터 운영사 중 하나인 메타가 '있는 메모리를 더 알뜰하게 쓰자'는 발상을 실제로 구현했다. 6월 29일 미국 롤리에서 열린 컴퓨터 구조 학회 ISCA 2026 산업 세션에서 발표된 이 기술의 이름은 '비스타라'이며, 최종 논문이 공개돼 있다.
비스타라는 운영 방법이 아니라 메타가 직접 설계한 CXL 타입3 메모리 확장용 실물 칩이다. 한쪽에는 PCIe 5세대 기반 CXL 인터페이스, 반대쪽에는 DDR4 메모리 컨트롤러가 있어, CPU가 보는 메모리 요청을 DDR4 명령으로 바꿔 주는 통역사 역할을 한다. 이를 통해 이미 수명을 다한 구형 서버의 DDR4를 새 서버가 정상적인 시스템 메모리처럼 쓸 수 있게 만든다.
메타가 공개한 구성은 CPU에 직접 붙은 빠른 DDR5 768GB에, 비스타라 카드 두 장으로 재활용 DDR4 256GB를 더해 서버 한 대를 총 1TB로 만드는 구조다. 로컬 DDR5의 이론적 최대 대역폭은 초당 약 614GB인 반면 CXL의 DDR4 쪽 피크 대역폭은 약 76GB로 여덟 배 가까이 느리다. 그런데도 성과가 났는데, 핵심은 비교 대상이다. 느린 DDR4라도 붙여 두면 플래시나 원격 저장 장치로 떨어질 데이터를 DRAM 계층에 잡아 둘 수 있기 때문이다.
따라서 CXL이 연산을 빠르게 만든 것이 아니라, 메모리 부족 때문에 생기던 더 큰 손실을 피한 것으로 봐야 한다. 실제 사용 패턴을 봐도 자주 쓰는 데이터는 로컬 DDR5에 남고, 접근 빈도가 낮은 페이지가 CXL로 배치돼 CXL 쪽 대역폭 사용량이 모든 워크로드에서 로컬보다 훨씬 낮았다. 또한 비스타라는 서버마다 전용 카드를 붙이는 구조라 여러 서버가 하나의 메모리를 공유하는 '메모리 풀'과는 거리가 있다.
국내에서는 삼성전자가 CXL 2.0·PCIe 5세대 기반 CMM-D 제품군으로 용량 확장과 메모리 디스어그리게이션을, SK하이닉스가 DDR5 기반 CXL 메모리와 소프트웨어 도구를 준비하고 있다. 국내 팹리스 파네시아는 이번 ISCA26에서 CXL 컨트롤러와 포트 기반 라우팅 스위치를 발표하며 패브릭과 메모리 풀 영역을 겨냥했다. 다만 CXL 성장이 곧바로 국내 디램 판매 증가로 이어진다고 단정하기는 어렵다.
주요 인사이트
- CXL의 가치는 '많이 붙일수록 좋은' 것이 아니라 '느린 메모리로 내려도 되는 데이터가 얼마나 많은가'에 따라 갈린다. 대용량 캐시, 데이터 분석, 개발용 가상머신, 추천 시스템의 거대한 임베딩 테이블처럼 용량이 먼저 부족하고 상당 부분이 오래 읽히지 않는 워크로드에 잘 맞는다.
- GPU가 매 순간 읽어야 하는 대규모 AI 학습의 가중치·활성값을 CXL 메모리에 두고 직접 계산하는 것은 어렵다. 메타의 머신러닝 사례도 HBM을 CXL로 대체한 것이 아니라 CPU 파라미터 서버의 용량을 늘린 것이다.
- 여러 서버가 메모리를 진짜로 공유하려면 CXL 스위치·패브릭 매니저·주소 할당·장애 관리가 함께 필요하며, 공유 경로에서 트래픽이 겹치면 접근 지연이 몇 배로 늘 수 있다. '공유할 수 있다'와 '예측 가능한 성능으로 공유한다'는 전혀 다른 문제다.
- CXL 메모리를 붙이면 속도가 다른 메모리 계층이 늘어나 '무엇을 어디에 둘지' 판단하는 복잡성이 운영체제 몫으로 넘어온다. 메타도 작업을 섞자 처리량이 최대 65% 떨어지고 OOM으로 종료되는 일까지 겪어, 작업별 빠른 메모리 분배 정책을 따로 넣어야 했다.
자주 묻는 질문
비스타라는 소프트웨어인가, 칩인가?
단순한 서버 운용 방법이 아니라 메타가 직접 설계한 CXL 타입3 메모리 확장용 실물 칩(ASIC)이다. 한쪽에 PCIe 5세대 CXL 인터페이스, 반대쪽에 DDR4 메모리 컨트롤러를 두어 CPU의 메모리 요청을 DDR4 명령으로 바꿔 준다.
느린 CXL DDR4를 붙였는데 어떻게 성능이 좋아졌나?
CXL DDR4는 로컬 DDR5보다 느리지만, 비교 대상은 DDR5가 아니라 플래시나 추가 서버다. 느린 DDR4라도 용량을 더 두면 플래시로 떨어질 데이터를 DRAM 계층에 붙잡아 두고 모델을 더 적은 서버에 담을 수 있어, 메모리 부족이 만들던 더 큰 손실을 피한다.
이 기술이 디램 공급 부족을 해결해 주나?
아니다. 기존 DDR4 재활용으로 신규 DDR5 구매를 일부 줄일 수는 있지만 디램 공급 자체를 늘리지는 않는다. 새 CXL 모듈을 사면 그 안에도 결국 새 디램이 들어가므로, 공급 부족의 해법이라기보다 이미 만든 디램을 덜 낭비하는 방법에 가깝다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗