앞서 2006년 이후 인텔의 프로세서 성능 향상이 정체되었다는 이야기를 했습니다. 그 자체로는 사실이지만, 그 이후로 프로세서의 기술 변화가 중지되었다는 이야기는 사실이 아닐 것입니다. 여기서는 두 가지 이야기를 해보겠습니다.
첫번째로 쿼드코어 기준으로 Q6600(켄츠필드)에서 6700K (스카이레이크) 사이의 성능 변화입니다. 이 둘은 등장 시기에 10년 터울이 있기 때문에 비교가 적절할 것입니다. 문제는 이 두 프로세서 사이의 간격이 커서 둘을 비교한 벤치마크는 찾기 어렵다는 것입니다. 하지만 다행히 없지는 않습니다.
테크스팟에서는 켄츠필드 (Q6600), 샌디브릿지 (2500K), 하스웰 (Intel Pentium G3470 (3.6 GHz)), 스카이레이크 (Intel Core i7-6700K (4.0 - 4.2 GHz)) 의 성능 비교 벤치를 진행했습니다.
이 둘을 보면 CPU보다 그래픽 카드가 중요한 영향을 미치는 게임에서조차 이제 Q6600은 현역으로 쓰기에는 무리가 많다는 점을 알 수 있습니다. 아무리 좋은 그래픽 카드를 써도 게임에서 CPU가 담당해야 하는 부분이 있는데, CPU에서 일을 해주지 않으면 그래픽 카드는 놀 수밖에 없는 상황이 되는 것이죠.
게임 프레임 테스트는 10년 전 CPU로 게임을 구동하면 프레임이 1/6-1/7 수준밖에 나오지 않는다는 것을 보여주고 있습니다. 이는 10년 사이 CPU 성능이 크게 올라가서이기도 하지만, 최신 게임 구동에 필요한 기본적인 연산을 하기에는 켄츠 할배라는 애칭으로 불린 Q6600이 기력이 쇠했다는 것을 보여줍니다.
다만 실제 성능 차이가 6-7배라는 점은 우리의 직관과는 크게 다른 부분이기도 합니다. 그 정도로 급격한 성능 향상은 인텔과 AMD가 치열하게 경쟁하던 시절에도 쉽지 않았기 때문이죠. 실제 연산 능력은 클럭 항샹, 아키텍처 개선, SMT (하이퍼쓰레드 같은) 도입 등으로 인해 2-3배 정도라고 보는 것이 옳을 것입니다. UserBenchmark 결과는 이와 근접한 결론을 보여주고 있습니다. 싱글 속도는 271%, 멀티 속도는 364% 향상을 보여주고 있는데, 우리가 생각하는 수준과 비슷한 정도입니다.
아마도 게임에서 차이는 CPU 병목 현상이 극심하게 발생한 탓으로 생각됩니다. 아무튼 10년이면 강산이 변하는 시간인만큼 CPU에서도 변화는 분명 있었지만, 뒤집어서 생각하면 생각보다 발전 속도가 매우 느렸다는 점을 알 수 있습니다. 앞서 포스팅에서 설명했듯이 GPU 부분에서는 10년 정도 동안 20배에 달하는 연산 능력의 상승이 있었습니다.
이런 극명한 차이는 CPU보다 GPU가 병렬화에 따른 이점을 쉽게 가져가기 때문이기도 하지만, 데스크탑 CPU 부분에서 경쟁이 별로 없었기 때문에 생긴 일이기도 합니다. 공교롭게도 데스크탑 메인스트림 CPU (대략 400달러 이하 가격의 CPU)에서 발전이 크게 정체된 시점은 AMD가 불도저를 내놓고 거대한 삽질을 하던 시기와 비슷합니다.
하지만 엄밀하게 말해 성능 향상이 정지된 것은 사실이 아닙니다. 2006년 이후에도 조금씩 성능 향상은 있어왔습니다. 벤치 마크 결과를 보면 모두가 납득할 수밖에 없는 사실입니다. 다만 2006년 보다는 2011년 이후 데스크탑 CPU의 성능 향상이 더 두드러지지 않았다고 할 수 있는데, 물론 이는 소비자가 더 좋은 CPU를 원하지 않아서는 아닙니다.
여기에는 물론 여러 가지 이유가 있었지만, 인텔이 기술적 한계로 CPU코어를 더 늘릴 수 없기 때문에 발생한 일 역시 아니라고 단언할 수 있습니다. 이유는 2010년 이후 인텔이 서버 부분의 CPU 코어를 급격하게 늘리며 계속해서 거대한 빅칩을 양산했기 때문입니다. 두 번째 이슈는 인텔의 제온 CPU의 발전입니다.
인텔은 초창기 자사의 소비자용 CPU를 조금 손봐서 서버용인 제온을 만들어왔습니다. 예를 들어 싱글코어 펜티엄 II/III/IV에 캐쉬 등을 더 넣어서 서버용으로 판매했던 것이죠. 듀얼코어나 쿼드코어가 나왔던 시점에도 서버용 CPU가 특별히 코어가 더 많지는 않았습니다.
그러다가 2010년에 8코어의 Nehalem-EX (EXpandable server market)이 등장했습니다. 그리고 그 다음해에 10코어 Westmere-EX가 등장했는데, 이는 서버용 CPU의 코어 숫자가 크게 늘어날 것임을 예고하는 변화였습니다. 이런 CPU가 등장하게 된 것은 코어수를 12개까지 늘린 AMD의 옵테론에 대응하기 위한 것은 물론 IBM이나 썬 (지금은 오라클에 인수)과도 경쟁하기 위한 것이었습니다.
이후 인텔은 Sandy Bridge-EN에서는 8코어로 넘어갔으나 22nm공정으로 이전한 Ivy Bridge-EX에서 15코어 제품을 선보이게 됩니다. ( 이전 포스트: https://blog.naver.com/jjy0501/100201809770) 그리고 Haswell-EP/EX에서는 18코어 제품이 나왔습니다. 2014년 출시된 18코어 하스웰 EP/EX는 662㎟ 다이 면적을 지닌 빅칩으로 56.9억개의 트랜지스터를 집적했습니다. 공정은 22nm입니다.
브로드웰 EP/EX는 14nm 공정으로 이전하면서 코어수를 최대 24개로 늘렸습니다. 트랜지스터 숫자도 72억개로 증가했습니다. 그럼에도 불구하고 최신 공정 덕분에 다이 사이즈는 오히려 감소해 456㎟ 로 줄어들었습니다. 트랜지스터 집적도 증가는 서버 부분에서는 계속되서 최근에 등장한 스카이레이크 SP에서는 28코어 제품이 나왔습니다. 다만 정확한 트랜지스터 집적도는 아직 공개하지 않았습니다.
아무튼 서버 영역에서는 2010년 네할렘 EX의 23억개에서 2016년 브로드웰 EP/EX의 72억개까지 비교적 꾸준한 트랜지스터 집적도 증가가 이어졌습니다. 코어의 숫자도 8->24개로 3배 증가했습니다.물론 무어의 법칙은 더 이상 통하지 않지만, 그렇다고 발전이 없는 것은 아니라는 이야기입니다. 45nm 공정의 네할렘 EX가 684㎟ 였던 반면 14nm 공정의 브로드웰 EP/EX는 그보다 줄어든 다이에도 24코어를 집적했으니 트랜지스터 밀도도 네 배 이상 증가했음을 알 수 있습니다.
따라서 트랜지스터 밀도 증가가 멈춰서 데스크탑 프로세서의 변화가 없다는 이야기는 사실이 아닙니다. 동시에 여러 가지 기술적 문제로 코어를 더 넣어도 성능 향상이 없다는 이야기도 사실이 아닙니다. 지금 나와있는 빅칩들이 아니라는 점을 몸으로 증명하고 있기 때문이죠.
2011년 등장한 샌디브릿지와 2017년 등장한 카비레이크 사이에는 엄청난 변화가 없었습니다. 트랜지스터 집적도 증가는 대부분 내장 GPU 때문이고 CPU 부분은 별반 차이가 없었던 것입니다. 다음에는 이 부분에 대한 이야기를 해보고 공정 미세화에 따른 이점을 소비자가 아닌 제조사가 누렸다는 점을 설명해보겠습니다.
댓글
댓글 쓰기