Translate

2013년 8월 31일 토요일

크고 아름다운 CPU - IBM power8 processor 공개




 IBM 이 2013 년 핫칩 컨퍼런스 (Hot Chip 2013) 에서 차기 CPU 인 power8 프로세서를 공개했습니다. 이전 power7 를 압도하는 퍼포먼스를 가졌다고 주장되는 power8 프로세서는 22 nm SOI 공정으로 제조될 예정이며 다이 사이즈가 무려 650 ㎟ 가 달한다고 합니다. 구체적인 트랜지스터 수는 공개하지 않았지만 엄청난 수의 트랜지스터가 집적되었을 것임은 분명해 보입니다. 


 power8 프로세서는 12 코어 프로세서인데 하나의 코어는 전세대의 power7 이 동시에 4 개의 쓰레드를 가졌던 것에 비해 8 개로 늘어난 쓰레드를 가집니다. 따라서 한개의 CPU 가 96 개 (12 X 8) 의 쓰레드를 가지는 셈입니다. 여기에 코어당 512 KB 의 L2 캐쉬 (즉 6 MB L2 캐쉬) 96 MB 의 eDRM shared L3 캐쉬, 그리고 마지막으로 켄타우르 (Centaur) 로 불리는 메모리 컨트롤러 + eDRAM (128 MB, L4 캐쉬) 가 제공됩니다. 코어 클럭은 4 GHz 에 달합니다. 



 (한눈에 보는 Power8 프로세서      Credit : IBM ) 


 2014 년 양산 계획인 Power8 프로세서에 대한 정보는 2013 년 8월 25일에서 27 일 사이 핫칩 컨퍼런스에서 공개되었습니다. 어차피 모바일 버전이나 일반 사용자를 위한 데스크탑 버전은 생각하지 않고 서버 및 HPC 영역을 타겟으로 만들어지는 칩이니 만큼 IBM 은 아예 CPU 를 아주 크고 아름답게 만들었습니다. 이는 특징은 코어 하나를 봐도 나타나고 있습니다. 


  

(Power8 코어    Credit : IBM) 


 한개의 Power8 코어는 8 디스패치, 10 이슈, 16 개의 실행 유닛 (16 execution units; 2× integer units, 2× load store units, 2× LU, 4× floating point units, 2× VMX units, 1× crypto engine, 1× decimal floating point unit, 1x condition register unit, 1× branch register unit) 를 가지고 있습니다. IBM 은 새 power8 코어가 power7 코어 대비 싱글 쓰레드에서 최대 1.6 배의 성능을 지니고 있으며 SMT (Simultaneous Multithreading) 역시 4 way 에서 8 way 로 두배로 증가해 코어당 성능이 이론적으로 3 배 수준으로 커졌다고 언급했습니다.


 인텔의 CPU 가 아직도 SMT 갯수에 있어서 2 개로 인색한 편이고 AMD 는 아예 코어당 싱글 쓰레드 (1 모듈당 2 코어라는 구조지만) 만 지원하는데 비해 IBM 나 오라클은 아주 넉넉하게 SMT 의 수를 키워나가고 있습니다. 오라클의 SPARC T5 역시 이런 컨셉으로 16 개의 코어에 코어당 8 개의 쓰레드를 지원 한개의 프로세서당 128 개의 쓰레드를 지원할 수 있습니다. ( http://jjy0501.blogspot.kr/2013/03/sparc-t5.html 참고 ) 서버나 HPC 영역에서는 개인 사용자 용에 비해서 멀티 쓰레드의 이점이 두드러지게 나타나기 때문이겠죠. 


 하지만 하나의 프로세서에 막대한 수의 코어와 쓰레드를 구현하게 되므로써 메모리 대역폭의 문제가 생길 수 밖에 없습니다. IBM는 거대한 eDRAM 을 바탕으로 이 문제를 해결하고 있습니다. 코어당 512 KB 의 L2 캐쉬의 경우 4TB/sec,  L3 캐쉬 역할을 하는 96 MB eDRAM 는 (코어당 8 MB ) 3 TB/sec (모두 4GHz 동작시) 의 대역폭을 제공하고 있습니다.



(power8 프로세서의 온칩 캐쉬      Credit : IBM )


 여기에 덧붙여 power8 의 독특한 부분은 별도의 메모리 버퍼 칩을 사용하고 있다는 점입니다. 이 칩은 메모리컨트롤러를 겸하면서 16 MB 의 eDRAM 을 동시에 가지고 있는 독특한 구조를 택하고 있습니다. 이 eDRAM 은 L4 캐쉬 역할을 하기 때문에 메모리 컨트롤러 + L4 캐쉬가 같이 있는 구조라고 하겠습니다. 이 칩의 명칭은 Centaur 이며 총 8 개가 탑재됩니다.


 각각 메모리 대역폭은 9.6 GB/s X 8 개 채널이며 최대 메모리 대역폭은 410 GB/s 지속 메모리 대역폭은 230 GB/s 라고 합니다. (아래 사진 참조) 다만 메모리 레이턴시는 40 ns  수준으로 썩 좋은 편은 아니라고 합니다. 프로세서 하나가 최대 관리할 수 있는 메모리 용량은 1 TB 입니다.     






 
(메모리 버퍼 + 컨트롤러     Credit : IBM)


 아무튼 이를 모두 갖춘 power8 프로세서는 정말 크고 아름답다는 표현이 아주 잘 어울리는 모습입니다. 



(power8 프로세서 + 메모리 버퍼/컨트롤러    Credit : IBM)


 이외에도 새 power8 프로세서는 전압 레귤레이터 모듈 (VRM) 을 통한 코어 단위 전압 제어가 가능해졌으며 내장 PCI Express 3.0, 캐쉬 일관성을 관리할 수 있는 CAPI (Coherent Accelerator Processor ​​Interface) 등이 도입되었다고 합니다. 출시 예상 시점은 2014 년 중반이며 IBM 은 적어도 전 세대 대비 2 배의 성능을 구현하겠다고 장담하고 있습니다. 


 전통적인 x86 CPU 부분은 모바일 영역의 거센 도전을 받으면서 성능이 아니라 모바일에 적응하기 위해 전력 절감과 효율성에 몸부림을 치고 있는 동안 서버 시장을 노리는 비 x86 계열 CPU 들은 매우 덩치가 커지는 모습입니다. x86 CPU 의 성능 향상이 느려져서 그런지 이런 모습이 뜬금없이 부럽기도 하네요.   
     


 참고 





댓글 없음:

댓글 쓰기