파스칼 GP100과 테슬라 P100을 공개한 엔비디아

(출처: 엔비디아)

엔비디아가 GP100과 이를 이용한 테슬라 P100을 공식적으로 발표했습니다. 다만 현재까지 샘플이 협력사에 제공된 상태이고 실제 이를 탑재한 제품 (슈퍼 컴퓨터를 이야기 하는 듯)이 출하되는 것은 2017년 1분기 정도가 될 것이라고 합니다. 다시 말해 GP100을 시장에서 볼 수 있는 것은 아마도 내년이 될 가능성이 높아 보입니다.

GP100은 이전에 알려진 것보다 더 적은 수의 트랜지스터를 가지고 있으나 그럼에도 단일 프로세서로써는 최고 수준인 153억개의 트랜지스터를 집적했습니다. 16nm FF 공정에서도 그 크기는 610㎟에 달합니다. 따라서 실제 제품은 모든 유닛이 다 활성화된 제품이 아니라 일부가 잘려나갈 수밖에 없습니다. 이렇게 큰 프로세서를 에러 없이 제조하는 것은 매우 어려운 일이니까요.

GP100은 3840개의 CUDA 유닛, 240개의 텍스처 유닛, 그리고 4096bit 메모리 인터페이스를 갖추고 있으나 P100은 이보다 적은 3584 CUDA 유닛과 224개의 텍스처 유닛을 가지고 있습니다. 일부 에러가 난 부분을 제외한 것을 알 수 있습니다.

GP100은 6개의 Graphics Processing Clusters (GPC)를 가지고 있으며 GPC는 각각 10개의 Pascal Streaming Multiprocessors를 가지고 있습니다. 각각의 파스칼 스트리밍 멀티프로세서는 64개의 쿠다 코어를 지니는 구조입니다.

(테슬라 스펙 비교. 출처 : wccftech)

P100의 연산 능력은 배정밀도 5.3 TFLOPS, 단정밀도 10.6 TFLOPS로 이전 세대 제품 대비 3배에는 미치지 못하지만 2배는 넘는 다는 것을 알 수 있습니다. 다만 클럭이 증가하고 전력 소모도 같이 증가한 점을 감안할 때 실제 와트 당 성능비는 2배 수준에 향상에 머무르는 것 같습니다.

한 가지 흥미로운 사실은 거대한 다이 사이즈와 엄청난 트랜지스터 집적도에도 불구하고 동작 클럭이 매우 빠르다는 것입니다. 베이스 클럭만 1328MHz이고 부스터 클럭은 1480MHz인데, 나중에 등장할 일반 소비자용 제품은 1.5 GHz 이상의 클럭을 지닐 가능성도 있어 보입니다. 덕분에 전력 소모가 큰 것이겠지만, 아무튼 크기를 감안하면 정말 예외적인 수준의 클럭 같습니다.

GP100은 예상대로 HBM2 16GB를 탑재하고 등장했으며 처음에는 HPC 제품군을 노리는 테슬라 제품으로 출시될 것으로 보입니다. 이렇게 큰 프로세서를 대량으로 양산하는 것은 아마도 시간이 좀 걸릴 것이기 때문에 그전에 더 작은 크기의 GPU가 시장에 등장할 것이라는 예상이 타당할 것입니다.

같이 공개되진 않았지만, 분명 올해 하반기를 노리고 이보다 하위 모델 - 예를 들어 GP104가 - 등장할 것으로 예상됩니다. 예상 성능은 아마도 GP100과 GTX 980Ti의 중간 정도가 되지 않을까 예상합니다. 차세대 GPU의 실성능이 어느 정도일지 궁금합니다.

참고

http://www.anandtech.com/show/10222/nvidia-announces-tesla-p100-accelerator-pascal-power-for-hpc

http://wccftech.com/nvidia-pascal-gpu-gtc-2016/

고든의 블로그 구글 분점

이 블로그 검색

파스칼 GP100과 테슬라 P100을 공개한 엔비디아

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

통계 공부는 어떻게 하는 것이 좋을까?

9000년 전 소녀의 모습을 복원하다.

근육 떨림을 막는 전자 임플란트