(출처: 인텔)
현재 AI 하드웨어 시장에서 엔비디아의 위치는 매우 견고합니다. AI 가속기라는 개념이 생기기도 전에 이미 CUDA를 통한 병렬 연산 시장에 도전해서 입지를 다져온 점이 AI 시대에 와서 결실을 맺어 AI 연산 하드웨어의 핵심 장비로 거듭난 것입니다. 이렇게 AI 생태계 자체가 엔비디아 중심으로 구축되다보니 AMD나 인텔 같은 경쟁자가 끼어들기 힘든 것이 현실입니다. 성능은 둘째치고 개발 생태계가 엔비디아를 중심으로 돌아가기 때문입니다.
하지만 AMD는 물론이고 인텔 역시 AI 가속기 시장에 계속 도전하고 있습니다. 인텔의 입지는 솔직히 AMD보다도 좁지만, 그래도 AI 전용 가속기인 가우디 (Gaudi)를 포기하지 않고 3세대까지 선보였습니다. 인텔 가우디 3는 전 세대와 마찬가지로 인텔 팹이 아닌 TSMC 팹을 이용했는데, 7nm 공정에서 5nm 공정으로 좀 더 진화했습니다.
(가우디 스펙 비교. 출처: 아난드텍)
일단 스펙상으로 보면 가우디 3는 거의 쓰이지 않은 가우디 1이나 역시 잘 쓰이는 편이 아니었던 가우디 2보다 더 진보한 아키텍처와 성능을 지니고 있습니다. 텐서 코어를 24개에서 64개로 늘려서 FP8 기준으로 전 세대보다 두 배 이상 늘어난 1835 TFLOPS의 연산능력을 지니고 있습니다. 다만 트랜지스터 집적도라든지 기타 하드웨어 부분에 대한 내용은 자세히 공개되지 않았는데, 엔비디아의 블랙웰 B200보다 더 많지는 않을 것으로 보입니다. 메모리도 상대적으로 구형인 HBM2e를 사용하고 있습니다.
그럼에도 가우디 3의 전력 소모는 블랙웰 B200의 1000W와 비슷한 900W나 된다는 점이 흥미롭습니다. B200의 FP8 연산 능력이 4.5페타플롭스라고 밝혔기 때문에 전성비에서 가우디 3는 블랙웰보다 떨어질 것으로 예상됩니다. 더구나 FP4나 FP6처럼 정밀도를 떨어뜨리더라도 연산 속도를 높일 수 있는 트릭도 존재하지 않아 실제 성능면에서 블랙웰의 상대는 되지 않을 것 같다는 느낌입니다.
블랙웰 GPU: https://blog.naver.com/jjy0501/223388364475
인텔이 발표한 슬라이드에서는 가우디 3가 현재 시장에 나와 있는 H100보다 라마나 GPT3 같은 일부 AI 연산 및 대규모 언어모델에서 성능이 더 앞서는 것으로 나와 있습니다. 이 주장이 사실이라고 해도 가우디 3가 나올 시점에서는 블랙웰 역시 출시를 준비할 것이기 때문에 시장에 비집고 들어갈 틈은 많지 않아 보입니다.
현 시점에서 가우디의 미래는 밝아보이지 않지만, AI 하드웨어 시장을 그냥 포기할 순 없는 일이기 때문에 인텔이 가우디 AI 가속기나 자체 GPU를 쉽게 접지는 않을 것으로 보입니다. 과연 인텔의 AI 굴기가 성공할 수 있을지 주목됩니다.
참고
댓글
댓글 쓰기