(Google's Tensor Processing Unit is a printed-circuit card, which inserts into existing servers and acts as a co-processor, one tailored for neural-network calculations. Credit: Google)
구글이 머신 러닝을 더 빠르게 하는 칩인 텐서 프로세싱 유닛 (Tensor Processing Unit, TPU)을 공개했습니다. 텐서 프로세싱 유닛의 개발은 지난 2년간 진행된 것으로 이를 통해서 CPU/GPU보다 더 빠르게 머신 러닝에 필요한 연산을 처리할 수 있다고 하네요. 다만 이 칩은 CPU나 GPU를 대체하는 것이 아니라 기계 학습에 최적화된 코프로세서라고 할 수 있습니다.
이런 특수 목적 프로세서는 application-specific integrated circuits (ASICs)라고 불리며 사실 그래픽 처리를 위한 GPU가 그런 대표적인 프로세서라고 할 수 있습니다. 다만 최근의 GPU는 매우 크고 복잡해졌으며 기계 학습을 포함한 다양한 연산에 사용되고 있다는 점이 아이러니죠. 그런 만큼 인공 지능에 특화된 다른 코프로세서가 필요해졌습니다.
TPU 디자인의 핵심은 정밀 연산도를 8bit 까지 낮추는 대신 상당히 많은 연산을 효과적으로 처리하는 데 있습니다. 구글에 의하면 이를 통해서 TPU 한 개당 하루 1억개의 사진을 처리할 수 있다고 합니다. TPU는 GPU와 비교해서 41-83배 정도 전성비가 우수하며 14-16배 정도 성능이 우수하다고 합니다. 하지만 종종 32bit 이상의 고정밀도 연산이 필요한 부분이 있기 때문에 TPU 혼자서만 작업 하기는 어려우며 현재까지는 기계 학습 가속기라고 할 수 있습니다.
구글의 TPU는 PCIe 3.0 슬롯을 이용한 카드 형식으로 제작되며 28nm 공정을 사용한 것이라고 합니다. 다이 사이즈는 662㎟라고 하는데 메모리 및 PCIe 슬롯으로 보이는 부분과 비교하면 상당히 큰 프로세서임을 알 수 있습니다. 그러나 클럭이 700MHz 정도로 낮아서 전력 소모는 28-40W 수준이라고 하네요. 메모리는 28 MiB 입니다.
인공 지능에 특화된 하드웨어가 개발된다는 것은 그만큼 인공 지능에 대한 수요가 증가했다는 이야기일 것입니다. 이 제품이 시중에 나오게 될지는 아직 판단이 이르지만, 만약 등장한다면 비슷한 목적으로 사용되는 GPU와 경쟁이 불가피하지 않을까 생각되네요. 결과가 궁금합니다.
참고
댓글
댓글 쓰기