AMD Instinct MI355X CDNA4 스펙 공개 - 출시는 2025년 하반기

(출처: AMD)

현재 AI 가속기 시장의 최강자는 엔비디아지만, 몇몇 도전자들이 존재합니다. 가장 큰 도전자는 오래전부터 GPU를 만들어온 AMD입니다. 물론 AMD는 게이밍 GPU 시장보다 HPC 시장에서 본래 더 밀리는 상황이었습니다. 엔비디아는 돈이 안되던 시절부터 CUDA를 무료로 풀면서 HPC 시장에서 입지를 다저왔고 GPU를 이용한 AI 연산 역시 당연히 엔비디아 GPU를 이용해서 연구가 시작됐습니다. 현재 AI 하드웨어 시장에서 점유율이 90%에 달하는 것도 놀라운 일이 아닌 것입니다.

도전자인 AMD는 후발 주자로 불리한 상황이지만, 한 가지 이점이 있습니다. 바로 엔비디아의 GPU가 과도한 수요로 인해 공급이 원활하지 않은 틈을 타서 틈새 시장을 노릴 수 있다는 것입니다. 이렇게 해서 일부라도 점유율을 확보하면 AI 개발 생태계에 끼어 들어가면서 자신만의 자리를 차지할 수 있습니다. 다만 블랙웰 GPU를 내놓으면서 시장에서 입지를 더 굳건하게 다지고 있는 엔비디아를 따라가기 위해 AMD 역시 신제품을 내놓을 수밖에 없는 상황입니다.

AMD는 우선 현재 인스팅트 MI325X를 먼저 출하하고 내년 하반기에 MI350 시리즈를 출시한다는 로드맵을 발표했습니다. 인스팅트 MI325X는 기본적으로 MI300X와 같은 스펙을 지닌 칩이지만, 33% 정도 높은 대역폭을 지닌 HBM3E 메모리를 256GB나 탑재해 대규모 AI 연산에서 성능을 높였습니다. 참고로 FP16 연산 능력은 1.3PF (페타플롭스) FP8 연산 능력은 2.61PF입니다. AMD의 주장에 따르면 MI325X는 메타 라마 3.1에서 H200보다 약간 더 빠릅니다.

인스팅트 MI 350 시리즈는 이름만 보면 같은 CDNA3를 사용한 것 같지만, 사실은 CDNA4를 사용한 최신 GPU입니다. 왜 MI400이 아닌지는 알 수 없지만, TSMC의 3nm 공정으로 제조되며 288GB 용량의 HBM3E 메모리를 탑재합니다. (대역폭은 8TB/s) FP16과 8에서 각각 2.3PF와 4.6PF의 연산 능력을 지녔으며 이미 엔비디아가 제공하는 FP4 및 FP6 연산 능력도 추가했습니다. 연산 능력은 FP4 기준으로 9.2FP입니다. 이는 B200과 비슷하고 GB200보다 약간 낮은 수준입니다.

블랙웰의 출시가 훨씬 빠르고 아직 AI 생태계 자체가 엔비디아 위주로 되어 있다는 점을 보면 엔비디아의 독주가 예상되긴 하지만, 공급이 부족한 상황에서는 MI350 역시 비집고 들어갈 틈이 있을 것으로 보입니다. 게이밍 GPU 시장에서의 열세와 AI 시장에서 엔비디아의 강세를 생각하면 쉽지만 않은 상황이지만, 독주를 견제할 경쟁자의 존재는 어느 시장에서든 필요하기 때문에 AMD의 선전을 기대해 봅니다.

참고

https://www.tomshardware.com/tech-industry/artificial-intelligence/amd-reveals-core-specs-for-instinct-mi355x-cdna4-ai-accelerator-slated-for-shipping-in-the-second-half-of-2025

고든의 블로그 구글 분점

이 블로그 검색

AMD Instinct MI355X CDNA4 스펙 공개 - 출시는 2025년 하반기

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

통계 공부는 어떻게 하는 것이 좋을까?

9000년 전 소녀의 모습을 복원하다.

근육 떨림을 막는 전자 임플란트