(출처: 엔비디아)
엔비디아가 GTC 2025 행사를 통해 거대한 베라 루빈 슈퍼칩 실물을 최초 공개했습니다. 베라 루빈 슈퍼칩은 한 개의 베라 CPU와 두 개의 루빈 GPU를 사용하는데 베라 CPU도 88개의 커스텀 ARM 코어를 통해 176 스레드를 구현했습니다. 여기에 총 32개의 LPDDR 메모리를 촘촘히 탑재했는데, 용량은 2TB에 달합니다.
루빈 GPU는 두 개의 직사각형 다이가 서로 연결된 구조로 8개의 HBM4 메모리를 통해 288GB의 메모리 용량과 50 PFLOPS의 FP4 연산 능력을 지니고 있습니다. 이를 이용한 랙 시스템인 베라 루빈 NVL 144는 총 3.6 EFLOPS의 FP4 연산 능력을 지녀 GB300 NVL 72의 3.3배의 연산 능력을 확보했습니다.
루빈 GPU는 2026년 3분기와 4분기에 대량 양산에 들어가 보급될 예정입니다. 그리고 다음 해인 2027년 하반기에 등장할 루빈 울트라는 4개의 직사각형 다이와 16개의 HBM4e 메모리를 통해 100 FLOPS의 FP4 연산 능력과 1TB의 거대한 메모리를 확보할 계획입니다. 메모리 크기가 엄청나게 커진 만큼 루빈 울트라는 이전에는 가능하지 않았던 초대형 모델을 구동할 수 있게될 것입니다.
루빈 울트라 NVL 576 시스템은 15 EFLOPS FP4 추론 능력과 5 EFLOPS FP8 훈련 능력을 지녀 GB 300 NVL72보다 14배나 높은 능력을 지니게 됩니다. 다만 발열은 어떻게 해결할 수 있을지 다소 의문입니다.
아무튼 극한까지 끌어올린 AI 연산 능력을 감안하면 앞으로 LLM의 능력은 지금보다 훨씬 강력해질 것으로 예상됩니다. 과연 세상이 어떻게 바뀔지, 그리고 좋은 방향으로 바뀔 수 있을지 다소 우려 섞인 기대를 할 수밖에 없어 보입니다.
참고





댓글
댓글 쓰기