Translate

2014년 11월 18일 화요일

300 페타플롭스 슈퍼 컴퓨팅을 계획하는 엔비디아


 엔비디아는 슈퍼 컴퓨터 개발에서 IBM 과 협력 관계를 유지하고 있습니다. 2012 년 10월 29일 공개된 오크릿지 국립 연구소의 타이탄 슈퍼컴퓨터는 Tesla K20X GPU 18,688 개와 Opteron 6274 CPU 18,688 개를 이용한 것으로 당시 세계 최강의 슈퍼컴퓨터였습니다. 하지만 이제 세월이 흘렀고 새로운 슈퍼 컴퓨터 개발이 필요해지는 시점에 도달했습니다. 최근 엔비디아는 차기 슈퍼컴퓨터인 시에라와 서밋에 대한 백서를 내놓았는데 그 성능은 100 - 300 페타 플롭스를 목표로 하고 있습니다.






(출처 : nvidia) ​
 2017 년 등장할 차기 슈퍼 컴퓨터는 로렌스 리버모어 국립 연구소 (Lawrence Livermore National Laboratory) 시에라 (Sierra, 이전의 세콰이어 대체) 와 오크 릿지 국립 연구소 (Oak Ridge National Laboratory) 의 서밋 (Summit, 이전의 타이탄 대체) 입니다. 이 슈퍼 컴퓨터들은 IBM 의 차기 CPU 인 Power9 과 엔비디아의 차기 GPU 인 볼타 (Volta) 를 사용해서 이와 같은 성능 목표를 달성할 예정입니다.
 엔비디아의 새 백서에 의하면 이를 달성하기 위해서 GPU 와 그 주변 기기들에는 몇 가지 큰 변화가 있을 예정입니다. 첫번째는 이전에도 공개한 바 있는 NVLink 입니다. NVLink 는 파스칼 (Pascal) 을 공개할 때 언급한 바 있습니다. ( http://jjy0501.blogspot.kr/2014/03/Nvidia-Pascal-unveiled.html  참조)
 NVLink 의 목적은 PCIe 인터페이스로 인한 병목 현상을 줄이고 충분한 대역폭을 확보하는 것입니다. PCIe 가 16 GB/s 정도 대역폭을 지녔다면 NVLink 는 80 GB/s 의 대역폭으로 데이터를 전송할 수 있습니다. 아무리 고속으로 연산이 가능한 GPU 나 CPU 가 있다고 해도 서로 데이터를 주고 받는 속도가 느리다면 결국 속도는 느려지게 마련입니다. NVLink 는 이와 같은 문제를 극복할 수 있다는 것이 엔비디아의 설명입니다.
 또 다른 기술은 이미 AMD 도 도입을 서두르고 있는 적층 메모리 (Stacked Memory) 입니다. 이미 HMC (Hybrid Memory Cube,  http://jjy0501.blogspot.kr/2013/10/first-sample-of-MHMC.html  참조) 나 HBM ( High Bandwidth Memory, http://jjy0501.blogspot.kr/2013/12/High-Bandwidth-Memory.html참조) 같은 고속 적층 메모리들이 양산 직전 단계까지 왔기 때문에 2016 년까지 실제 이를 적용한 GPU 가 나오는 것은 그다지 놀랄 일은 아닙니다. 적층 메모리는 기존의 메모리에 비해서 매우 큰 대역폭을 제공하므로 역시 메모리 병목 현상을 줄이고 고속 연산을 가능하게 만듭니다. 용량이 커지는 것 역시 이점입니다.  
 과거 엔비디아가 볼타 이전에 파스칼 GPU 를 로드맵에 표시하므로써 다소 로드맵에 혼동이 있었지만 새로운 백서에 의하면 파스칼은 맥스웰 후속으로 NVLink 와 적층 메모리를 적용할 첫번째 GPU 이며 2016 년까지 등장할 예정입니다. 볼타는 2018 년 등장 예정으로 알려졌으나 이 백서에서 2017 년으로 출시 연도가 수정되었습니다. 
 볼타 GPU 에 대해서 공개된 것은 매우 적지만 파스칼 GPU 의 후속인 만큼 더 향상된 아키텍처와 공정을 사용하면서 NVLink 와 적층 메모리를 사용할 것은 분명합니다. 공정에 있어서는 적어도 16 nm 공정 이후 공정이 사용될 가능성이 높습니다. Power9 CPU 역시 자세한 내용은 공개되지 않았지만 글로벌 파운드리로 반도체 시설을 매각한 후 글로벌 파운드리의 차기 미세 공정을 사용하게 될 것으로 보입니다.


(출처 : Nvidia)  
 시에라와 서밋에 사용되는 컴퓨터 노드 (compute nodes) 는 복수의 CPU 와 GPU 로 구성될 것이며 적어도 한개당 40 TFLOPS 의 성능을 목표로 하고 있습니다. 서밋에 사용될 컴퓨터 노드는 512 GB DDR4 가 시스템 메모리로 사용될 것이며 GPU 메모리는 800 GB 에 이르게 될 것이라고 합니다. 또 1 TB/s 의 입출력 대역폭과 120 PB 의 저장 장치를 지니게 될 것이라고 하네요.
 볼타는 엑사스케일 컴퓨터 이전 세대의 컴퓨터를 위한 것입니다. 볼타 다음 세대나 혹은 다다음 세대의 GPU 가 아마도 이 목표를 달성하게 될 것입니다. (  http://jjy0501.blogspot.kr/2012/05/blog-post_8675.html 참조)
 일반 사용자 입장에서는 이런 슈퍼 컴퓨터는 꽤 동떨어진 이야기 처럼 들립니다. 하지만 타이탄의 예에서 보듯이 슈퍼 컴퓨팅을 위해서 태어난 기술이라도 그 혜택은 일반 사용자에게까지 미치게 되는 법입니다. 사실 컴퓨터 자체의 탄생부터가 그렇죠. 초창기 에니악 처럼 탄도 계산을 위한 거대한 컴퓨터가 없었다면 지금의 스마트폰 역시 없었을 것입니다.
 볼타 역시 결국은 일반 사용자를 위한 버전들이 등장하게 될 가능성이 매우 높습니다. 이는 미래에 일반 유저들이 더 강력한 성능의 컴퓨터를 가질 수 있다는 이야기겠죠. 언제나 그렇듯이 기술 혁신은 모든 분야로 파급되게 마련입니다.
 참고

댓글 없음:

댓글 쓰기