(출처: 엔비디아)
ARM과 합병을 진행 중인 엔비디아가 차세대 ARM 아키텍처에 기반한 고성능 컴퓨팅 (HPC) 및 AI 연산 SoC인 그레이스 (Grace)를 발표했습니다. (다만 렌더링 이미지를 볼 때 CPU/GPU 일체형 SoC가 아니라 SoC 옆에 GPU가 붙은 게 아닌가 하는 생각이 드네요) 그레이스는 기존의 HPC 및 슈퍼컴퓨터보다 CPU와 GPU 코어가 더 직접적으로 연결되어 메모리를 공유하기 때문에 성능이 높다는 것이 엔비디아의 설명입니다. 하지만 아직 실물을 보여준 것은 아니고 현재 개발 중인 프로젝트에 대한 설명이지만, ARM과 물리적 결합을 넘어 화학적 결합을 노린다는 점에서 흥미로운 이야기입니다.
일반적인 서버나 HPC 시스템은 엄청난 양의 시스템 메모리를 CPU가 독점하고 빠른 메모리가 필요한 GPU는 별도의 GDDR/HBM 메모리에 접속하는 형태입니다. 그런데 실제로는 CPU와 GPU가 하나의 데이터를 두고 함께 연산하거나 서로 데이터를 주고 받으면서 처리해야 하는 경우가 종종 생깁니다. 따라서 시스템 메모리 - CPU - GPU - GPU 메모리라는 여러 단계를 거치는 경우 효율이 떨어질 수밖에 없습니다.
엔비디아의 그레이스 SoC는 차량용 AI 칩인 자비에 (Xavier)와 비슷한 SoC 구조로 CPU 코어가 보다 직접적으로 GPU 코어와 연결되어 메모리에 접속할 수 있습니다. 예를 들어 EPYC 2 CPU와 A100 GPU를 탑재한 서버의 경우 CPU - GPU간 대역폭은 PCIe 4.0 x16의 최대 대역폭인 64GB/sec를 넘을 수 없습니다. Infinity Fabric 2가 적용된 CPU간 대역폭 역시 304GB/sec 정도입니다. 그레이스는 NV Link4를 이용해 CPU/GPU간 900GB/s 이상, CPU간 600GB/s 이상의 대역폭을 확보할 수 있습니다. CPU/GPU 대역폭은 최대 2,000GB/s로 PCIe 4.0 x 16의 30배에 달합니다.
물론 이런 주장이 설득력을 얻으려면 실제 결과물을 보여줘야 할 것입니다. 엔비디아 그레이스는 2023년에야 등장할 것으로 보이는데, 실물도 없는 제품을 벌써 들고 나온데는 그럴만한 이유가 있습니다. 엔비디아는 그레이스 기반 슈퍼컴퓨터를 스위스 국립 슈퍼컴퓨팅 센터 Swiss National Supercomputing Centre (CSCS)와 미 국립 로스 알라모스 연구소 Los Alamos National Laboratory에 공급할 예정입니다. 시스템 전체는 HPE의 슈퍼컴퓨터 전문 회사인 크레이 (Cray)가 담당합니다.
통상 슈퍼컴퓨터 도입은 시스템 개발과 함께 이뤄지며 주문 역시 소비자용 제품과 달리 몇 년 앞서 되는 경우도 많습니다. 그래야 도입 시점에서 최신 성능의 시스템 구매가 가능합니다. 따라서 엔비디아 역시 실제 제품이 나오기도 전에 이미 도입 계약 및 프로젝트를 발표한 것으로 보입니다. 물론 이런 국가 기관들이 계약을 해준 것도 어느 정도 성능에 대한 보장을 받고 했을 것입니다. 구체적인 성능 목표는 앞으로 공개할 것입니다.
과거 엔비디아가 발표한 슈퍼컴퓨팅 및 AI 용 거대 GPU는 인텔, AMD, IBM 같은 다른 CPU 제조사와 함께 탑재되었습니다. 이번에는 아예 독자 서버 CPU 개발을 공언한 셈인데, 어떤 결과가 나올지 주목됩니다. 시기적으로 봤을 때 GPU는 암페어 다음 세대를 사용하고 CPU는 Armv9 아키텍처에 기반했을 것으로 예상됩니다. 미세 공정 역시 최소 5nm 정도 예상할 수 있을 것입니다. 과연 기존의 CPU 제조사들을 긴장시킬 결과가 나올지 주목됩니다.
참고
댓글
댓글 쓰기