AMD가 국제고체회로소자회의(ISSCC) 2015에서 자신들이 차기 APU인 카리조(Carrizo)에 대한 디테일한 부분을 공개했습니다. 이전에 공개되었던 내용의 일직선상에 있지만 몇 가지 재미있는 부분이 추가되었습니다.
재미없는 부분은 여전히 데스크탑 버전의 카리조에 대한 언급이 없었으며, 이 제품이 여전히 28nm 공정을 사용함에도 아직도 실제 시중에 판매가 시작조차 되지 않았다는 것입니다. 이미 인텔이 일정보다 지연되었지만 14nm 공정의 브로드웰 CPU 탑재 노트북을 이미 대거 출시한 것과는 대조적입니다.
(AMD 카리조. 출처 : AMD)
카리조는 두 가지 버전으로 나눌 수 있습니다. 정식 버전의 카리조는 메인스트림 노트북을 타겟으로 한 것으로 엑스카베이터(Excavator) 코어를 사용하며 3세대 GCN인 볼카닉 아일랜드(Volcanic Islands) GPU가 들어갑니다. 반면 저전력/저가 시장을 노리고 나온 카리조 - L 은 퓨마+(PUMA+) 코어와 2세대 GCN 인 씨 아일랜드(Sea Islands) GPU가 들어갑니다. 흥미로운 것은 두 버전 모두 FCH를 통합해서 SoC 디자인으로 나온다는 것입니다.
(AMD APU 비교표 )
카리조가 지니는 가장 큰 핸디캡은 앞서 언급한 것 처럼 여전히 28nm 공정을 사용한다는 것입니다. 아무리 노드가 실제 공정의 크기를 의미하는 것이 아니라도 인텔과의 격차는 매우 큰 상태입니다. 이를 극복하기 위해서 AMD는 카리조의 다이를 매우 조밀하게 만들었습니다. 새로온 고밀도 라이브러리 디자인(High Density Library Design)이 엑스카베이터 코어에 사용되었는데, 덕분에 엑스카베이터 코어는 전세대 대비 23%나 다이 사이즈가 감소했으며 40% 정도 더 적은 전력을 소모할 수 있다고 합니다. 그러면서도 IPC에서 5% 향상을 달성했다는 것이 AMD의 주장입니다.
(다이 사이즈를 획기적으로 줄인 엑스카베이터 코어)
AMD는 새로운 공정을 사용할 수 없는 어쩔 수 없는 상황에서 공정 대신 트랜지스터를 더 조밀하게 밀어넣는 방식을 택했습니다. 그 결과 새로운 카리조 APU는 31억개라는 상당히 많은 트랜지스터를 집적했음에도 불구하고 24.1 억개의 트랜지스터를 가진 카베리와 다이 사이즈는 큰 차이는 없다고 합니다. 카리조의 다이 사이즈는 244.62㎟ 이고 카베리는 245㎟ 입니다. 이 말은 곧 카리조가 카베리 대비 29%나 높은 트랜지스터 밀도를 가지고 있다는 것을 의미합니다.
카리조의 GPU는 8 GCN compute units (512 stream processors)을 가지고 있는데 전력 효율을 개선시켜 전력 소모를 전세대 대비 20%나 개선했다는 것이 AMD의 주장입니다. 사실인지는 두고봐야 알겠지만 AMD 역시 시간이 지난만큼 경쟁자를 따라잡기 위해서 그정도 노력은 했을 것으로 보입니다.
카리조에서 중요한 부분은 CPU와 GPU가 아니라 사우스 브릿지/FCH(Southbridge/FCH) 가 이제 하나의 다이안에서 통합되었다는 것입니다. CPU와 GPU에서 거의 트랜지스터 수의 증가가 없었는데도 트랜지스터 갯수가 31억개가 된 이유는 이제 칩셋을 다 집어먹어서 하나의 SoC가 되었기 때문입니다. 이와 같은 변화는 저전력, 모바일로 나가기 위해서는 결국 필요한 변화로 카리조는 이런 변화를 이룩했다는 점에서 의의가 있습니다. 아직 경쟁사 대비 모자란 부분이 많지만 방향성은 올바로 잡았다는 것입니다.
이렇게 하나의 칩으로 모이게 되면 사이즈 감소와 경량화는 물론 전력을 효율적으로 사용하기도 더 좋아집니다. 카리조는 S0i3 상태에서 50mW 미만의 전력으로 대기할 수도 있으며 평소 아이들 상태에서 1.5W 이하에서 전력을 억제할 수도 있습니다.
(저전력 스탠바이 모드가 가능한 카리조. 출처: AMD)
물론 이것만으로 전력 효율을 향상시킬 수는 없기 때문에 카리조는 여러 가지 저전력 기술을 도입했습니다. AVFS(Adaptive Voltage-Frequency Scaling) 모듈은 CPU의 전력과 주파수를 매우 정밀하게 조절해서 전력 소모량을 크게 줄일 수 있다고 합니다. GPU 부분에서는 이미 카베리에서 등장한 바 있는 Voltage Adaptive Operation를 더 정교하게 가다듬어 낭비되는 전력을 줄였다고 합니다. 이외에도 여러 전력 절감 기술이 사용되어 전성비를 향상시켰습니다. AMD는 공정 미세화를 할 수 없었지만 대신 자신이 할 수 있는 범위에서 전력대 성능비를 향상시키기 위해 최대한 노력한 것입니다.
(출처 : AMD)
이외에도 HSA 1.0 지원, AVX2, BMI2, MOVBE, RDRAND 지원, DX 12 및 맨틀의 듀얼 그래픽 지원, H.265 지원으로 transcode 능력 3.5배 향상 등을 이뤄냈다는 것이 AMD 의 설명입니다.
실제 성능 향상보다는 저전력화 및 SoC화가 더 큰 변화라고 할 수 있는데 속절없이 밀리는 모바일 시장에 다시 진입하기 위한 AMD의 처절한 노력이 담겨있다고 하겠습니다. 그러나 어차피 같은 28nm 공정을 사용할 것이라면 빨리라도 나와야 하는데 계속 출시가 지연되는 모습들은 안타깝습니다.
AMD가 빠른 시일내에 신제품을 출시하고 시장에서 좋은 평가를 받기를 기대하지만 미래가 쉽지는 않아 보입니다.
참고
댓글
댓글 쓰기