엔비디아가 지난 수년간 개발해온 ARMv8 기반의 자체 CPU 코어인 덴버 (Denver) 를 공개했습니다. 향후 테그라 K1 64 비트 버전에 탑재될 이 새로운 ARMv8 코어는 이미 나와 있는 애플의 64 비트 ARM 프로세서 및 향후 등장할 ARM Cortex A5x 기반 프로세서들과 경쟁을 하게 될 것입니다. 그런데 엔비디아의 주장에 의하면 이 덴버 프로세서가 기존의 ARM 프로세서는 물론 심지어 인텔의 아톰 및 저가형 하스웰 프로세서와도 경쟁할 수 있는 능력을 지니고 있다고 합니다. 진실인지는 실물이 나와보면 판단이 가능하겠죠.
(엔비디아의 테그라 K1 은 32 bit ARM 프로세서 4 + 1 개를 사용한 버전과 64 bit Denver 프로세서 2 개를 사용한 두가지 버전으로 64 비트 버전은 연말까지 출시할 예정이라고 함. Credit : Nvidia )
테그라 프로세서는 과거 테구라 라는 별명으로도 불리긴 했지만 테그라 4 이후엔 이와 같은 오명은 어느 정도 희석된 상태입니다. 테그라 K1 에 이르러서는 케플러 아키텍처를 도입해 그래픽 성능이 매우 강력해진 탓에 ARM 진영에서도 무시할 수 없는 다크호스로 떠오르고 있다고 해도 과언은 아니겠죠. 과연 64 비트 버전이 나오면 성능이 어느 정도 차이가 있을 지도 궁금한 부분 중에 하나입니다.
엔비디아는 GPU 설계로는 유명하지만 자체적인 CPU 설계는 이번이 처음이기 때문에 많은 이들이 그 성능에 대해서 궁금증을 가지고 있는데 핫칩 컨퍼런스에서 슬라이드를 통해서 대략적인 성능을 가늠하게 하는 차트를 공개했습니다.
(엔비디아 테그라 K1 (32 비트) 버전을 1.00 으로 본 다른 프로세서들의 성능. 클릭하면 원본. Credit : Nvidia )
위의 차트가 잘 보이지 않는 관계로 이를 누가 정리했는데 이걸 보면
DMIPS
Baytrail (Celeron N2910): 0.45x
S800 (Krait 400 8974AA): 0.95x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 1.30x
Haswell (Celeron 2955U): 1.00x
Tegra K1 (Denver): 1.80x
SPECInt 2K
Baytrail (Celeron N2910): 0.70x
S800 (Krait 400 8974AA): 0.60x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.90x
Haswell (Celeron 2955U): 1.30x
Tegra K1 (Denver): 1.45x
SPECFP 2K
Baytrail (Celeron N2910): 0.85x
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): N/A
Haswell (Celeron 2955U): 1.95x
Tegra K1 (Denver): 1.75x
AnTuTu 4
Baytrail (Celeron N2910): N/A
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.70x
Haswell (Celeron 2955U): N/A
Tegra K1 (Denver): 1.00x
Geekbench 3 Single-Core
Baytrail (Celeron N2910): 0.65x
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 1.20x
Haswell (Celeron 2955U): 1.20x
Tegra K1 (Denver): 1.65x
Google Octane v2.0
Baytrail (Celeron N2910): 0.70x
S800 (Krait 400 8974AA): 0.65x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.70x
Haswell (Celeron 2955U): 1.45x
Tegra K1 (Denver): 1.30x
16MB Memcpy (GB/s)
Baytrail (Celeron N2910): 0.85x
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 1.15x
Haswell (Celeron 2955U): 1.55x
Tegra K1 (Denver): 1.40x
16MB Memset (GB/s)
Baytrail (Celeron N2910): 0.40x
S800 (Krait 400 8974AA): 0.75x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.80x
Haswell (Celeron 2955U): 0.65x
Tegra K1 (Denver): 1.05x
Baytrail (Celeron N2910): 0.45x
S800 (Krait 400 8974AA): 0.95x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 1.30x
Haswell (Celeron 2955U): 1.00x
Tegra K1 (Denver): 1.80x
SPECInt 2K
Baytrail (Celeron N2910): 0.70x
S800 (Krait 400 8974AA): 0.60x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.90x
Haswell (Celeron 2955U): 1.30x
Tegra K1 (Denver): 1.45x
SPECFP 2K
Baytrail (Celeron N2910): 0.85x
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): N/A
Haswell (Celeron 2955U): 1.95x
Tegra K1 (Denver): 1.75x
AnTuTu 4
Baytrail (Celeron N2910): N/A
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.70x
Haswell (Celeron 2955U): N/A
Tegra K1 (Denver): 1.00x
Geekbench 3 Single-Core
Baytrail (Celeron N2910): 0.65x
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 1.20x
Haswell (Celeron 2955U): 1.20x
Tegra K1 (Denver): 1.65x
Google Octane v2.0
Baytrail (Celeron N2910): 0.70x
S800 (Krait 400 8974AA): 0.65x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.70x
Haswell (Celeron 2955U): 1.45x
Tegra K1 (Denver): 1.30x
16MB Memcpy (GB/s)
Baytrail (Celeron N2910): 0.85x
S800 (Krait 400 8974AA): 0.80x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 1.15x
Haswell (Celeron 2955U): 1.55x
Tegra K1 (Denver): 1.40x
16MB Memset (GB/s)
Baytrail (Celeron N2910): 0.40x
S800 (Krait 400 8974AA): 0.75x
Tegra K1 (R3 Cortex A15): 1.00x
A7 (Cyclone): 0.80x
Haswell (Celeron 2955U): 0.65x
Tegra K1 (Denver): 1.05x
로 되어 있습니다. 이 이야기 대로라면 2.5 GHz 덴버 CPU 의 성능은 베이트레일 기반 아톰 1.6 GHz (캐쉬 2 MB, 쿼드코어) 보다 우월한 것은 물론 1.4 GHz 하스웰 기반 셀러론 (캐쉬 2 MB, 듀얼 코어) 와도 견줄만 하다는 것인데 (특히 후자는 TDP 가 15 W 로 테그라 K1 보다 훨씬 높음) 진실인지는 나중에 뚜껑을 따보면 (= 벤치를 돌려보면) 알게 될 것 같습니다. (만약에 구라로 밝혀지면 과거 별명을 다시 획득하게 될 텐데 말이죠... 그냥 매직 차트를 내놓지는 않았을 것 같고 과연... )
(덴버 CPU 의 다이어그램 Credit : Nvidia)
덴버는 7-Way Superscalar micorarchitecture 를 사용하고 있습니다. 그리고 자신만의 명령어셋을 갖추고 저전력 설계에 최적화 되어 있다고 합니다. 실제로 엔비디아의 CPU 설계 능력이 어느 정도인지를 가늠할 수 있는 순간은 아마도 2014 년 연말 쯤 이 프로세서가 실제 등장한 이후가 될 것 같습니다. 과연 첫술부터 배부를지 궁금하네요.
참고
댓글
댓글 쓰기