(출처: AMD)
AMD가 여러 개의 AI GPU를 하나의 랙 (Rack) 시스템에 담아 유기적으로 연결할 수 있는 헬리오스 랙 스케일 플랫폼 (Helios rack-scale platform)을 캘리포니아 산호세에서 개최된 오픈 컴퓨트 프로젝트 글로벌 서밋 (Open Compute Project Global Summit in San Jose, California)에서 공개했습니다. 랙 시스템 자체는 올해 초부터 존재를 밝혀왔던 것인데, 실물을 공개한 것입니다.
이전 포스트: https://blog.naver.com/jjy0501/223898890811
구슬이 서말이라도 꿰어야 보배라는 속담처럼 AI GPU들도 높은 성능을 보장하기 위해서는 여러 개의 고성능 GPU 간의 유기적인 연결이 필수입니다. 오래전부터 HPC 시장에 진입한 엔비디아는 네트워크 분야에도 상당한 기술을 축적해 대규모 하이퍼스케일 AI 데이터 센터 구축에 유리한 입지를 차지하고 있습니다. 따라서 AMD가 여기에 도전하기 위해서는 엔비디의 GB 300 NVL 72 같은 랙 시스템과 네트워크 개발이 필수적입니다.
헬리오스는 이 문제에 대한 AMD의 해결책으로 AMD 에픽 서버 CPU와 instinct IM400 GPU, AMD 펜사도 네트워킹 인터페이스 (Pensando networking interfaces), AMD ROCm 소프트웨어 등을 하나의 플랫폼으로 묶게 됩니다. 헬로오스 랙 시스템에는 IM 400 GPU가 72개 탑재됩니다.
한편 AMD는 2027년에 오라클에 5만 개의 MI 450 GPU를 공급하기로 계약을 맺었다고 발표했는데, 여기에도 헬리오스 랙 시스템이 사용됩니다. 인스팅트 MI 450은 432GB HBM4 메모리를 탑재했으며 19.6TB/s의 엄청난 대역폭을 지니고 있습니다. 헬로오스 랙에 72개의 MI 450을 탑재할 경우 31TB의 HBM4 메모리와 1.4 exaFLOPS (FP 8 기준) 연산 능력을 지니게 됩니다.
여전히 AI GPU 시장에서는 엔비디아의 독주가 계속되고 있지만, AMD가 사실상 유일한 대항마로 성장하고 있는 것도 사실입니다. 만년 2인자인 AMD가 서버 시장에서 약진할 수 있을지 주목됩니다.
참고
https://wccftech.com/amd-showcases-its-helios-rack-scale-platform/


댓글
댓글 쓰기