(출처: 엔비디아)
엔비디아가 HBM3e 메모리를 탑재한 그레이스 호퍼 GH200 슈퍼칩의 GPU 버전인 H200과 이를 이용한 주피터 슈퍼컴퓨터에 대한 정보를 공개했습니다.
GH200: https://blog.naver.com/jjy0501/223178886149
H200은 메모리 인터페이스를 6144비트로 확장하고 메모리 용량도 141GB로 늘리면서 대역폭도 4.8TB/s로 높인 제품입니다. GPU는 동일한 GH100을 사용하므로 연산 능력은 H100과 큰 차이가 없겠지만, 더 빠르고 용량이 많은 HBM3E 메모리를 사용하는 만큼 대용량 데이터 분석과 처리에 병목 현상을 줄이고 실제 성능을 높일 수 있습니다.
물론 HBM3E 메모리가 아직 공급되지 않았기 때문에 실제 제품 출시는 GH200과 함께 내년이 될 예정입니다. 8개의 H100 SXM5 패키지를 모은 HGX H100 플랫폼은 물론 H200과도 완전히 호환되며 내년에 HGX H200으로 출시 될 예정입니다.
엔비디아는 여기에 4개의 GH200을 한 개의 보드에 올린 쿼드 GH200도 같이 공개했습니다. 4개의 CPU와 GPU가 4way NVLink로 연결되어 있으며 288개의 ARM CPU 코어와 총 2.3TB의 대용량 메모리를 지니고 있습니다. 각각의 CPU가 480GB LPDDR5X 메모리를 사용하고 GPU는 96GB HBM3 메모리를 사용하기 때문입니다.
마지막으로 공개한 것은 유럽의 엑사 스케일 컴퓨터인 주피터 (Jupiter)입니다. 쿼드 GH200 보드를 기반으로 만든 슈퍼컴퓨터로 23,762개의 그레이스 GPU와 같은 숫자의 H100 GPU를 사용하고 있습니다. 따라서 메모리 용량도 엄청나서 총 10.9PB의 LPDDR5X 메모리와 2.2PB의 HBM3 메모리가 사용됩니다.
주피터의 연산 능력은 AI 연산 기준 93 EFLOPS에 달하고 일반적인 HPC 연산 기준으로는 1 EFLOPS에 달한다는 것이 엔비디아의 설명입니다. 다만 GPU와 AI 연산에 특화된 만큼 슈퍼컴퓨터의 연산 능력을 비교하는 LINPACK 순위는 생각보다 높지 않을지도 모릅니다.
자세한 성능은 역시 2024년에 실물이 등장해야 알 수 있는데, 독일 율리히 연구소 (Forschungszentrum Jülich)에 내년에 설치된다는 것만 공개되고 정확한 가동 일자는 밝히지 않았습니다. 엔비디아 GPU는 이미 슈퍼 컴퓨터에 많이 사용되었지만, CPU + GPU 조합은 처음인데, 100% 엔비디아표 슈퍼컴퓨터의 실제 성능이 궁금합니다.
참고
댓글
댓글 쓰기