(출처: 인텔)
인텔이 아키텍처 데이 2021 행사를 통해 인텔 아크 (Arc) 게이밍 그래픽 카드에 대한 정보를 일부 공개했습니다. 특히 1세대 제품인 알케미스트의 아키텍처를 좀 더 상세히 공개하면서 여러 가지 의문점에 대해 답했습니다. 구체적인 성능은 공개되지 않았지만, 이날 공개 행사를 분석한 해외 사이트에서는 예상보다 더 강력한 성능으로 등장하지 않겠느냐는 추측이 나오고 있습니다.
알케미스트 GPU의 기본 컴퓨팅 블록은 Xe-Core로 16개의 벡터 엔진과 16개의 매트릭스 엔진으로 구성되어 있습니다. 벡터 엔진은 과거 실행 뉴닛으로 불린 부분이고 매트릭스 엔진은 텐서 엔진으로 AI 연산을 담당합니다. 벡터 엔진 하나는 8개의 FP32 ALU를 지녀 256비트 연산을 하고 매트릭스 엔진은 Xe Matrix eXtensions (XMX) 구조를 통해 1024비트 연산을 할 수 있습니다. 앞서 소개한 것처럼 인텔은 엔비디아의 DLSS처럼 인공지능을 통한 이미지 품질 개선 기술인 Xe Super Sampling (XeSS) 적용할 계획으로 매트릭스 엔진이 관련 연산을 담당하는 것으로 보입니다.
각각의 Xe 코어는 하드웨어 레이 트레이싱 유닛과 함께 짝을 이뤄 4개씩 렌더 슬라이스 (Render Slice)라는 단위에 탑재됩니다. 그리고 알케미스트 GPU의 최상위 칩에는 렌더 슬라이스 8개가 탑재됩니다. 이는 따라서 32개의 Xe 코어, 512개의 벡터 엔진/매트릭스 엔진이 탑재되는 셈입니다. (ALU는 4096개) 이는 DG1의 5배 수준입니다.
하지만 가장 놀라운 소식은 TSMC의 N6 공정을 이용해서 제조된다는 사실입니다. 외부 팹을 사용하리라는 소식은 이전부터 들렸지만, AMD가 7nm 공정을 이용하고 엔비디아가 8nm 공정을 이용하는 데 비해 인텔은 가장 앞선 N6 공정을 이용하겠다는 이야기로 아키텍처 이외에 미세 공정에서는 인텔의 근소한 우세가 예상됩니다. TSMC가 인텔이라는 큰 고객을 잡기 위해 최신 공정을 제공한 것으로 해석되는 부분입니다.
인텔은 알케미스트의 동작 클럭이 Xe LP (DG1)보다 1.5배 빠르다고 소개했습니다. 진보된 미세 공정 덕분일텐데, 그렇다면 연산 유닛 5배 x 클럭 1.5배를 생각하면 7-8배 정도 더 빠르다는 이야기가 나옵니다. 예상 성능은 10TFLOPS가 아니라 16-18TFLOPS라면 엔비디아나 AMD가 긴장할만한 소식입니다.
과연 실물이 어떻게 등장할지 기대됩니다.
참고
https://www.anandtech.com/show/16895/a-sneak-peek-at-intels-xe-hpg-gpu-architecture
댓글
댓글 쓰기