2012 년 말 인텔은 오랜 세월 연구의 결정체인 x86 기반의 MIC (Many Integrated Core) 를 시장에 내놓습니다. x86 코어 다수를 병렬로 연결해 연산 작업에 특화시킨 이 제품은 제온 파이 코프로세서 (Xeon Phi Coprocessor) 라는 명칭으로 출시되었습니다. 코드네임 Knights Corner 는 사실 2 세대 MIC 제품으로 50 개 이상의 x86 코어를 내장해 단일 프로세서로는 처음으로 배정밀도 연산에서 1 TFLOPS 를 달성했습니다. (자세한 내용은 이전 포스트 참조 http://blog.naver.com/jjy0501/100171610222 )
인텔은 1 세대 제온 파이인 나이츠 코너 이후 차세대 제품을 준비하고 있는데 최근 Supercomputing Conference 13 에서 그 구체적인 내용을 공개했습니다. 나이츠 랜딩 (Knights Landing) 은 14 nm 공정에서 제작될 차기 제온 파이 코프로세서로 제온 파이 제품으로써는 처음으로 스탠드 얼론 CPU 로도 사용이 가능할 것이라고 합니다. 즉 PCIe 타입 외에도 소켓형으로 등장할 것이며 CPU 처럼 모든 프로그램을 구동할 수 있을 것이라고 하네요. 이전 나이츠 코너의 경우에는 순수한 코프로세서로 모든 x86 프로그램을 구동하지 못했고 반드시 CPU 가 필요했습니다.
나이츠 랜딩은 CPU 패키지 내부에 버퍼 메모리를 옵션으로 포함할 수 있다고 합니다. 따라서 훨씬 높은 메모리 대역폭을 제공할 수 있는데 (위의 다이어그램 참조) 일종의 캐쉬 역할을 할 수 있는 것으로 보입니다. 물론 전통적인 DDR3/4 메모리 역시 지원할 수 있습니다. 사실 고속 메모리를 CPU 와 같이 패키징 하는 것은 고성능을 추구하는 HPC 시장에서는 드문 일이 아니라 특별히 의외라고 할 수는 없는 현상입니다. 한가지 궁금한 것은 eDRAM 인지 여부인데 아직 자세한 내용은 공개되지 않은 것 같습니다.
나이츠 랜딩은 CPU 소켓 형태는 물론 코프로세서 형태의 PCIe 카드 형식으로도 등장합니다. 이 PCIe 카드에는 built-in-DDR4 controller 와 더불어 인 패키지 메모리 버퍼가 제공될 것이라고 합니다. 또 PCIe 3.0 이 지원될 것이라고 하네요. 더불어 모든 나이츠 랜딩 프로세서에는 AVX 3.1 이 지원될 것입니다.
이전 로드맵 공개에서 새 나이츠 랜딩 프로세서가 최대 3 TFLOPS 의 배정밀도 연산과 14 - 16 GFLOPS/W 의 전력대 성능비를 구현할 것이라고 언급한 바 있습니다. 이는 전세대인 나이츠 코너와 비교시 거의 세배 수준인 셈이죠. 22 nm 공정에서 14 nm 공정으로의 이전은 물론이고 아키텍처 개선, 새로운 버퍼 메모리의 탑재로 이런 성능 향상을 이뤄낸다는 것인데 실제로 가능하지는 내년 말에는 윤곽이 드러날 것으로 보입니다. 나이트 랜딩의 출시 예상시기는 2014 년 말에서 2015 년 초가 될 것이라고 하네요.
소켓 방식의 스탠드 얼론 프로세서라면 사실상 현재의 CPU 와 동일한 방식인데 이 방식은 교체와 조립이 쉽다는 장점외에도 현재의 서버 랙에 쉽게 집어 넣을 수 있습니다. 이것으로 모자란 사용자를 위해서는 별도의 PCIe 코프로세서가 준비되어 있죠. 따라서 보다 유연한 시스템 구현이 가능할 것입니다. 서버 시장과 HPC/슈퍼 컴퓨팅 시장에서 이는 더 강력한 경쟁력이 될 것이며 IBM/엔비디아/AMD/오라클 등 경쟁자들을 제압할 무기가 될 가능성이 있습니다.
한가지 궁금한 점은 미래에는 수많은 x86 코어를 집적한 제온 파이 프로세서들이 일반 유저들을 위해 사용되는 날도 있는지 하는 부분입니다. 이제 x86 프로그램을 제온 파이에서도 돌릴 수 있다면 연산용 이외에도 사용범위가 더 넓어지긴 할 텐데 말이죠. 물론 50 개 이상의 멀티 코어가 당장 일반 사용자에게 큰 이점을 가져다 주지 않을 것이기 때문에 일반 사용자용의 MIC 가 나온다고 해도 먼 미래의 일이 될 듯 합니다.
참고
댓글
댓글 쓰기