엔비디아가 SIGGRAPH 2018를 통해서 튜링 (Turing) GPU를 공개했습니다. 세부 스펙 및 아키텍처를 포함한 모든 내용이 공개된 것은 아니지만, 16TFLOPS 연산 능력과 RT Core를 이용한 10 Giga Rays/sec의 레이 트레이싱 연산 능력, 그리고 텐서코어를 이용한 125TFLOPS의 인공지능 연산 능력을 지니고 있다는 점은 공개했습니다. 여기에 Native HDR, 8K displayport, VR을 위한 virtual link 및 HEVC 8K 실시간 인코딩 능력을 지니고 있습니다. 흥미로운 점은 GPU간 연결을 위해서 NVLINK를 이용한다는 점으로 앞으로 SLI를 대체할 것인지 궁금합니다.
튜링 GPU는 쿼드로로 먼저 선보이게 될 것이라고 합니다. NVIDIA Quadro RTX 8000 및 NVIDIA Quadro RTX 6000/5000이 그것으로 모두 GDDR6를 사용합니다. 비디오램 용량은 최대 48GB로 역대 최대급입니다. GDDR6를 사용해서 HBM2보다 현실적으로 더 큰 메모리 용량을 확보한 것으로 보입니다.
NVIDIA Quadro Specification Comparison | ||||||
RTX 8000 | GV100 | P6000 | M6000 | |||
CUDA Cores | 4608 | 5120 | 3840 | 3072 | ||
Tensor Cores | 576 | 640 | N/A | N/A | ||
ROPs | 96? | 128 | 96 | 96 | ||
Boost Clock | ~1730MHz? | ~1450MHz | ~1560MHz | ~1140MHz | ||
Memory Clock | 14Gbps GDDR6 | 1.7Gbps HBM2 | 9Gbps GDDR5X | 6.6Gbps GDDR5 | ||
Memory Bus Width | 384-bit | 4096-bit | 384-bit | 384-bit | ||
VRAM | 48GB | 32GB | 24GB | 24GB | ||
ECC | ? | Full | Partial | Partial | ||
Half Precision | 32 TFLOPs? | 29.6 TFLOPs? | N/A | N/A | ||
Single Precision | 16 TFLOPs | 14.8 TFLOPs | 12 TFLOPs | 7 TFLOPs | ||
Double Precision | ? | 7.4 TFLOPs | 0.38 TFLOPs | 0.22 TFLOPs | ||
Tensor Performance | 500 TOPs (INT4) | 119 TFLOPs (FP16) | N/A | N/A | ||
TDP | ? | 250W | 250W | 250W | ||
GPU | Unnamed Turing | GV100 | GP102 | GM200 | ||
Die Size | 754mm2 | 815mm2 | 471mm2 | 601mm2 | ||
Transistor Count | 18.6B | 21.1B | 11.8B | 8B | ||
Architecture | Turing | Volta | Pascal | Maxwell 2 | ||
Manufacturing Process | TSMC 12nm FFN? | TSMC 12nm FFN | TSMC 16nm | TSMC 28nm | ||
Launch Date | Q4 2018 | March 2018 | October 2016 | March 2016 |
엔비디아가 선보인 튜링 기반 쿼드로는 186억개의 트랜지스터와 754㎟의 다이 면적을 지니고 있는데, 스펙으로 볼 때 볼타와 유사한 12nm 공정을 사용한 것으로 보입니다. 기존 쿼드로 시리즈와 가장 큰 차이점은 레이 트레이싱 성능이 대폭 강화된 것으로 파스칼 대비 25배에 달한다는 것이 엔비디아의 주장입니다.
보다 상세한 스펙은 물건이 나와봐야 알 수 있지만, 사실 이보다 더 신경이 쓰이는 부분은 아마도 같은 아키텍처에 기반한 게이밍 GPU일 것입니다. 새로운 레이트레이싱 기술을 강조하기 위해 RTX로 명칭을 바꿀 계획이라고 하며 8월 20일 공개될 것이라는 것이 루머의 요지입니다. 물론 실제 뭐가 나올지는 두고봐야 알 수 있습니다.
(동영상)
아무래도 차세대 아키텍처를 사용한 GPU가 나올 때가 되었고 GDDR6 및 12nm 공정을 이용해서 이전보다 성능이 향상되었을 가능성이 가장 높다고 할 수 있습니다. 과연 어떤 물건이 나올지 궁금합니다.
참고
댓글
댓글 쓰기