정식 출시된 케플러 K20 시리즈

엔비디아가 마침내 소문의 K20 테슬라 제품군을 출시했습니다. GK 110 칩으로 제작된 K20X 와 K20 은 엔비디아의 HPC (High Performance Computing) 제품군의 최상위 모델로 상당히 3000 달러 이상의 고가로 등장했습니다. 가장 상위 모델 Tesla K20X 는 2688 개 코어에 732 MHz 클럭, 6 GB GDDR5 메모리에 235 W 라는 비교적 적은 TDP 를 가지고 있으며 K20 은 하나 더 블록된 SMX (모든 SMX 유닛이 사용 가능하면 2880 개의 쿠다 유닛을 가짐. K20X 는 14개 K20 은 13 개의 SMX 를 지니는 것으로 추정) 와 706 MHz 의 클럭으로 225W 의 TDP 를 가지고 있습니다. (아래 표 참조)

(테슬라 제품군 비교)

기존 세대의 페르미 제품군에 비해 케플러 기반의 K20X 와 K20 은 엔비디아 제품으로는 처음으로 단일 제품으로 더블 프리시전 (배 정밀도) 연산에서 테라플롭스 연산을 구현했으며 싱글 프리시전 (단 정밀도) 로는 3 TFLOPS 연산을 구현했습니다. GK110 칩은 지금까지 만들어진 GPU 중에서는 가장 거대한 것으로 71 억개의 트랜지스터를 집적했으며 (현재까지 다이 사이즈는 알려져 있지 않음) 15개의 SMX (Streaming Multiprocessor eXtreme) 와 6개의 ROP/L2/memory controller block 을 가지고 있습니다.

단순히 생각하면 8 개의 SMX 와 4 개의 ROP/L2/memory controller block 을 지닌 GK104 의 87% 의 컴퓨팅 능력과 50% 의 메모리 대역폭을 가질 것 같지만 GK 110 의 SMX 는 GK 104 와 약간 구조가 다릅니다.

(이전 엔비디아가 공개한 GK 110 의 다이샷)

(GK 110 의 SMX 의 블록 다이어 그램)

GK 104 에 비해서 GK 110 의 SMX 는 64 개의 DP (더블 프리시전) 연산 유닛을 추가로 가지고 있으며 이것이 GK 104 에 비해서 배 정밀도 연산 능력이 대폭 강화된 이유입니다. 이 부분에 대해서는 이전 포스트에서도 언급한 바 있습니다. ( http://blog.naver.com/jjy0501/100158477707 )

한편 이전 포스터에서 언급했듯이 케플러 기반 GPU 들은 새로운 CUDA 5 기반의 연산이 가능해졌습니다. Hyper - Q, Dynamic Parallelism, Reduced ECC overhead 등으로 보다 효율적인 연산이 가능해진 것이 전세대 페르미에 비해서 실제 배 정밀도 연산이 3 배 정도 증가된 이유라고 합니다.

(다아나믹 패레렐리즘을 통해서 GPU 가 처리할 수 있는 일은 가능하면 GPU 가 처리하게 만들어 실제 연산 능력을 더 끌어 올릴 수 있음)

(테슬라는 93% 의 아키텍처 효율을 지녀 페르미의 65% 보다 실제 성능을 거의 다 끌어낼 수 있다는 것이 엔비디아의 주장. 이로써 3배 높은 연산 능력이 가능하게 됨)

엔비디아의 테슬라 K20 제품군은 이전에 소개드린 타이탄 슈퍼컴퓨터 ( http://blog.naver.com/jjy0501/100170438771 ) 에 사용되었는데 여기에는 새로운 옵테론 프로세서와 케플러가 서로 조합되게 됩니다. 아래와 같은 하나의 블레이드에 4 개의 16 코어 옵테론과 4 개의 K20 이 장착되고 쿨링 시스템은 별도로 존재합니다.

(보기만 해도 엄청난 열이 날 것 같은 타이탄의 기판. 쿨러는 별도로 존재)

엔비디아의 케플러는 확실히 이제는 슈퍼 컴퓨터 영역이나 HPC 영역에서 독자적인 위치에 올라섰습니다. 하지만 인텔은 제온 파이를 들고 이 시장에 뛰어들고 있으며 CUDA 와 같은 새로운 프로그래밍 없이 기존의 코드를 그대로 사용할 수 있다는 것을 자사의 제온 파이의 강점으로 강조하고 있습니다. 물론 실제 연산 능력 역시 제온 파이가 K20 에 비해 많이 뒤지는 것도 아니기 때문에 강력한 경쟁 상대라고 할 수 있습니다. 인텔과 엔비디아의 싸움에서 과연 누가 유리할 것인지는 시간이 입증할 과제입니다.

(인텔의 병렬 연산 코프로세서인 제온 파이 (Xeon Phi)

물론 일반 사용자 입장에서 또 궁근한 부분은 GK110 이 게이밍 시장에 투입되는지 여부겠죠. 이 GPU 들이 사실 GPGPU 에 필요없는 그래픽 연산 부분을 가지고 있다는 것은 본래는 그럴 목적으로 제작되었다는 것을 의미합니다. 하지만 경쟁자인 라데온 HD 7000 시리즈가 기대 보다 낮은 성능을 보였기 때문에 엔비디아는 그냥 GK 104 칩과 그 리프레쉬 칩을 플래그쉽으로 투입해도 되는 상황입니다. HD 8000 시리즈가 생각보다 강력하게 등장할 경우 결국 엔비디아가 GK 110 투입이라는 수를 쓸 것인지는 현재로써는 알 수 없는 일이고 시간이 입증할 문제라고 생각합니다.

참고

http://www.anandtech.com/show/6446/nvidia-launches-tesla-k20-k20x-gk110-arrives-at-last

http://www.nvidia.com/object/tesla-supercomputing-solutions.html

http://en.wikipedia.org/wiki/Nvidia_Tesla

고든의 블로그 구글 분점

이 블로그 검색

정식 출시된 케플러 K20 시리즈

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

통계 공부는 어떻게 하는 것이 좋을까?

9000년 전 소녀의 모습을 복원하다.

150년 만에 다시 울린 희귀 곤충의 울음 소리