(출처: 구글)
2025년 핫칩 (Hot Chips) 컨퍼런스에서 구글 이 차새대 TPU 플랫폼인 아이언우드 (Ironwood)에 대해 공개했습니다. 구글의 7세대 TPU인 이이언우드는 4614 TFLOPs라는 엄청난 컴퓨팅 파워를 지니고 있다고 합니다.
구글은 2022년 TPU v4를 공개했는데, 칩 당 275 TFLOPs의 연산 능력을 지니고 있었고 구글의 시스템 단위인 팟 (pod) 하나에 4096개의 칩과 32GB HBM 메모리를 지니고 있었습니다. 1년 후 등장한 후계자인 TPU v5p는 459 TFLOPs의 연산 능력과 8960개의 칩, 그리고 95GB의 HBM 메모리를 갖췄습니다.
그리고 2년만에 다시 연산 능력이 대폭 확대된 아이언우드를 공개했는데, 팟 당 9216개의 칩과 192 GB (7.4 TB/s) HBM 메모리를 지닌 시스템으로 발전했습니다. 불과 3년 만에 연산 능력이 16배가 커진 셈인데, 그만큼 전력 소모도 늘어났을 것으로 보입니다.
각각의 아이언우드 칩은 네 개씩 짝을 이뤄 하나의 Ironwood PCBA 메인보드 위에 위치하며 이런 PCBA 16개가 하나의 랙 (rack)을 구성하고 있습니다. 그리고 43개의 랙 블록이 ICI (InterChip Interconnect) 네트워크로 연결되어 시스템을 구성하게 됩니다. 당연히 수냉식 시스템으로 한 번 돌리는데 100kW 이상의 전력이 필요합니다. 구글은 144개의 랙을 연결한 아이언우드 슈퍼팟 Ironwood Superpod 시스템도 같이 개발하고 있습니다.
TPU는 주로 텐서플로 중심 AI 모델의 추론 및 훈련에 최적화된 프로세서로 좀 더 범용으로 사용되는 GPU와는 다소 쓰임새가 다른 걸로 알고 있긴 하지만, 구글 자체 TPU가 엔비디아 GPU와 비교해서 어느 정도 성능을 보여주는지 궁금해지는 대목이기도 합니다. 좀 더 구체적인 결과가 공개되기를 희망해 봅니다.
참고





댓글
댓글 쓰기