(출처: 엔비디아)
엔비디아가 2028년까지 AI GPU 로드맵을 공개했습니다. 올해 출시 예정인 블랙웰 울트라 B300/GB300에 이어 2026년에는 새로운 GPU인 루빈 (Rubin)이 출시될 예정입니다. 구체적인 스펙이나 제조 공정은 역시 미정이지만, 72개의 GB300을 모은 서버랙 시스템인 블랙웰 울트라 B300 B300 NVL72과 비교해서 베라 루빈 NVL144는 3.3배의 FP4 (Dense) 성능은 3.6 EFLOPS의 성능을 지니고 있습니다. 88개의 커스텀 Arm CPU와 176 쓰레드를 지닌 베라 CPU와 루빈 GPU는 2026년 하반기 출시 목표입니다.
2027년에 나올 루빈 울트라는 루빈의 업그레이드 형으로 4개의 직사각형 GPU가 하나로 합쳐져 100PFLOPS (PF4 기준)의 성능을 지니고 있습니다. 루빈 울트라는 576개 (144x 4)의 GPU를 이용해 15 EFLOPS의 PF4 성능을 확보할 수 있습니다. 다만 이를 위해 얼마나 많은 전력을 사용하는지는 밝히지 않았습니다. 이정도로 칩을 고밀도로 높일 경우 발열을 제어하는 일도 쉽지 않을 텐데 대체 어떻게 냉각을 하는지도 궁금해지는 대목입니다.
하지만 전력을 많이 소모하는 것은 GPU만이 아닙니다. 루빈 GPU는 288GB HBM4 메모리를 탑재하는데, 대역폭이 8TB/s에서 13TB/s로 넘어가면서 전력 소모가 크게 줄지는 않을 것으로 생각됩니다. 이를 576개나 집적한 루빈 울트라의 전력 소모는 어마어마할 것으로 생각됩니다. (루빈 울트라는 HBM4e 사용)
그리고 이렇게 많아진 GPU를 하나처럼 연결하기 위해 NVLink 7은 대역폭을 1.5PB/s로 높일 예정입니다. 여기에 광섬유 기반 데이터 전송 기술인 Spectrum-X Photonics와 Quantum-X Photonics 역시 함께 공개됐습니다. 2028년에는 리처드 파인만의 이름을 딴 리처드 CPU와 파인만 GPU가 등장할 예정입니다. 다음 세대 GPU도 이전처럼 더 많은 전기를 먹을지 아니면 이제는 합리적인 수준에서 타협을 시도할지 궁금합니다.
참고
댓글
댓글 쓰기