(출처 : AMD)
AMD가 고성능 서버, HPC 시장 및 인공 지능 가속기 시장을 노린 Instinct IM 200 시리즈를 공개했습니다. 별도의 코드 네임 없이 공개된 새 GPU는 몇 가지 점에서 과거 AMD 라데온 GPU와 차별점을 가지고 있는데, 서버 영역 뿐 아니라 소비자용 GPU 시장에서도 비슷한 구성을 취할지 궁금해지는 부분들이 있습니다.
(AMD Instinct 시리즈 스펙 비교 )
가장 눈에 띄는 차이는 멀티 다이 GPU라는 점입니다. 엔비디아 A100처럼 하나의 다이 위에 542억개의 트랜지스터를 집적하는 대신 290억개의 트랜지스터를 지닌 두 개의 다이(CDNA2 기반의 GCD 다이)를 연결해 하나의 GPU를 구성하고 있다는 점입니다. 크로스파이어나 SLI 같은 멀티 GPU 기술과 다른 점은 다이와 다이 사이에 2.5D 브릿지 연결로 하나의 큰 다이처럼 작동할 수 있어 성능 손실이 거의 없다는 점입니다.
각각의 다이는 TSMC의 6N 공정으로 제조했으며 4개의 HBM2E 메모리와 역시 2.5D 브릿지로 연결됩니다. 4스택 HBM2E 메모리는 각각 16GB x 4의 용량을 지니고 있으며 두 개의 다이를 연결하면 GPU 하나 당 128GB HBM2E 메모리를 지니게 됩니다. 8개의 메모리 컨트롤러와 8개의 HBM2E 메모리를 사용하기 때문에 8192bit 메모리 인터페이스와 3.2TB/s의 대역폭을 지닙니다.
IM200 시리즈는 풀칩의 경우 112개의 컴퓨트 유닛 (CU)를 지니고 있는데 110개를 지닌 IM250X와 104개를 지닌 IM250으로 나뉩니다. IM250X 기준 FP32/64 연산 능력은 47.9TFLOPS이고 인공지능 연산에 중요한 INT 메트릭스 연산은 383TOPS입니다. 일반 연산 능력은 A100보다 두 배 이상 빠르지만, 인공지능 연산 능력은 A100보다 낮은 편인데, 인공 지능 생태계 자체도 엔비디아 중심인 걸 생각하면 이 시장에서 IM 200의 성공 여부는 다소 불투명해 보입니다.
한 가지 더 흥미로운 사실은 OAM이라는 새로운 패키징 방식입니다. GPU 하나에 벽돌처럼 생긴 쿨러를 밀착해서 탑재하는 방식으로 매우 강력한 쿨러가 없다면 공기가 통할까라는 생각이 드는 빽빽한 구성입니다. 이렇게 생긴 패키지외에 IM210 PCIe 가속기 역시 같이 출시한다고 하네요.
최근 상승세를 타고 있는 AMD가 CPU 시장에서처럼 GPU 시장에서도 의미 있는 성과를 거둘 수 있을지 앞으로가 주목됩니다. 그리고 이런 신기술이 소비자용 GPU에도 접목될 수 있을지 궁금합니다.
참고
댓글
댓글 쓰기