(출처: AMD)
AMD가 RDNA4 아키텍처와 이 아키텍처를 사용한 라데온 RX9070 시리즈를 공개했습니다. 성능은 상대의 중상급기인 RTX 5070 Ti보다 약간 낮은 수준이지만, 가격이 599달러로 현저하게 저렴하고 물량 역시 페이퍼 런칭이라는 이야기를 듣는 RTX 50 시리즈보다 많을 것이라는 이야기가 들리면서 소비자들의 관심을 집중시키고 있습니다. 물론 실제 잘 팔릴지는 두고봐야 알겠지만, 지포스 RTX 50 시리즈는 가격은 물론이고 사실 물량이 없어서 구매하기도 힘든 것이 현실인 상황에서 AMD가 이제는 현실적인 대안이 된 것이 사실입니다.
(라데온 RX 9000 시리즈 스펙 비교. 출처: 탐스 하드웨어)
AMD에 의하면 RDNA4는 메모리 서브 시스템, 스칼라 유닛을 개선학 다이나믹 레지스터 할당, CU (컴퓨트 유닛) 효율 및 클록을 높여 전 세대보다 CU의 속도가 40% 정도 더 빠르다고 합니다. 또 3세대 레이트레이싱 가속기와 2세대 AI 가속기를 탑재해 레이트레이싱 및 AI 성능을 높였습니다.
라데온 RX 9070 시리즈에 사용된 Navi 48은 TSMC의 N4P 공정으로 제조됐습니다. 엔비디아의 RTX 50 시리즈와 제조 공정은 비슷한 점을 생각하면 면적당 트랜지스터 집적도 역시 비슷할 것으로 생각됩니다. 다이 사이즈는 356.5㎟ 인데 RTX 5080/RTX 5070Ti에 사용된 GB203의 378㎟보다 약간 작은 수준입니다. 트랜지스터 집적도는 539억개라고 합니다.
다만 풀 칩에 가까운 RX 9070XT (CU 64개)도 컷칩인 RTX 5070Ti보다 기본 성능은 2% 정도 낮습니다. 그래도 가격을 감안하면 달러 당 성능은 23% 높다는 것이 AMD의 주장입니다. 그리고 RTX 50 시리즈의 가격이 천정부지로 치솟은 점을 생각하면 사실 가성비는 더 높을 수 있습니다.
참고로 기본 성능에서 RX 9070XT는 48.7 TFLOPS (FP32)이고 9070은 36.1 TFLOPS (FP32) 인데 RTX 5070 Ti는 그 중간인 43.9 TFLOPS입니다. 다만 AI에서 중요한 FP 16에서는 389TFLOPS와 238TFLOPS로 RTX 5070 Ti의 703TFLOPS 대비 낮은 편이어서 아마도 AI 가속 성능은 상대적으로 낮을 것으로 보입니다.
엔비디아는 INT8 기준으로 RTX 5070 Ti의 성능을 1406TFLOPS 로 표기했고 AMD는 INT4 기준으로 RX 9070XT의 성능을 1557TFLOPS 로 표기했기 때문에 실제 AI 성능은 RTX 5070 Ti 쪽이 훨씬 높습니다. 물론 자세한 건 실제 벤치마크 결과가 공개되어야 알 수 있지만, 현재 공개한 슬라이드에서도 엔비디아 GPU와의 AI 성능 비교가 없는 것은 이 때문으로 풀이됩니다.
하지만 바로 이런 점 때문에 RTX 50 시리즈의 가격은 계속 고공행진을 할 수 있습니다. 인공지능 목적의 수요가 계속 발생할 것이기 때문입니다. 기본적으로 AI 생태계 자체가 엔비디아 중심이기 때문에 무리하게 여기서 승부를 보려고 하는 대신 차라리 게이밍 쪽으로 목적을 분명히 해서 시장 점유율을 늘리는 것이 현재 상태에서 더 현명한 접근일 수 있습니다.
다만 그렇다고 해서 라데온 RX 9070 시리즈가 AI 가속을 포기한 건 아닙니다. RX 7900GRE 같은 이전 모델 대비 AI 성능이 대폭 향상되었으며 이에 따라 AI 기반 업스케일링 및 프레임 생성 성능도 높아졌습니다. FSR4부터는 소프트웨어 알고리즘 기반이 아닌 하드웨어 가속을 이용한 업스케일링으로 이미지 품질을 높이는데 주력했습니다. 예시로 든 게임은 스페이스 마린 II으로 3.4배의 프레임 향상을 보였습니다. DLSS4에 도전장을 내밀 수 있을지 주목됩니다.
만약 시장에서 라데온 RX 9070 시리즈가 큰 인기를 끌게 되면 엔비디아도 뭔가 대응책을 내놓을 가능성이 높습니다. 라데온 RX 9070 시리즈가 시장을 바꾸는 촉매가 될 수 있을 것으로 기대합니다.
참고
https://bbs.ruliweb.com/news/529/read/207926
댓글
댓글 쓰기