(출처: 엔비디아)
블랙웰 RTX 50 시리즈는 인공지능을 제외한 다른 성능은 사실 전 세대와 큰 차이가 나지 않아 논란이 일고 있습니다. 이는 동일한 4nm 공정을 사용한 탓으로 보여집니다. RTX 5090에 사용된 GB202 칩은 다이 면적이 744㎟에 트랜지스터 집적도는 922억개인데 반해 RTX 4090에 사용된 AD102 칩은 다이 면적 608㎟에 트랜지스터 집적도가 760억 개입니다. 둘 다 엄청난 숫자이긴 하지만 8nm 공정에서 4nm 공정으로 옮기면서 트랜지스터 집적도가 RTX 3090 Ti의 283억 개에서 760억 개로 두 배 넘게 늘어난 것과 비교하면 미미한 수준입니다.
결국 미세 공정 기술에 발목이 잡히면서 트랜지스터 집적도를 크게 높이기 힘들어졌고, 이에 따라 기본 성능보다 AI에 집중한 것이 RTX 50 시리즈의 특징이라고 하겠습니다. FP32 기준 RTX 5090의 성능은 RTX 4090보다 27% 높아진 104.8TFLOPS이고 하위 모델들은 그보다 성능 향상 폭이 적은 것으로 나타나고 있습니다. 사실 RTX 4080과 RTX 5080은 트랜지스터 집적도에서 거의 차이가 나지 않습니다.
그럼에도 엔비디아가 제시한 AI 기능은 상당히 눈길을 끄는 것이 사실인데다 앞으로 GPU의 발전 방향에 대해 제시하고 있다는 점에서 흥미롭습니다. DLSS4를 이용한 3개의 추가 프레임 생성 기능 이외에도 이미지 퀄러티를 높이고 더 사실적인 그래픽을 위한 AI 기술이 광범위하게 제시된 것이 블랙웰 아키텍처의 특징입니다. 앞서 소개한 것처럼 프레임 생성 이외에도 아예 그래픽을 만드는 핵심인 쉐이더에 AI 기능을 통합한 뉴럴 쉐이더를 만든 것이 대표적입니다. 아마도 블랙웰 다음 GPU는 쉐이더에 더 많은 AI 기능을 넣어 성능을 높이려 할 것으로 보입니다.
이전 포스트: https://blog.naver.com/jjy0501/223725605537
(출처: 엔비디아)
블랙웰의 또 다른 특징은 RT 코어에 추가된 메가 지오메트리라고 불리는 폴리곤 생성 능력입니다. 1990년대 초반 게임은 한 화면에 1000-10000개 정도의 폴리곤 (3D 게임에서 사물을 표현하는 데 사용하는 삼각형)을 보여줬고 사이버펑크 2077같은 최신 게임은 최대 5000만 개 정도로 폴리곤 수가 증가했습니다. 엔비디아의 메가 지오메트리 데모인 조라 (Zorah)는 5억 개의 폴리곤을 사용하고 있습니다.
(동영상)
블랙웰의 또 다른 특징은 AI 기술을 그래픽 처리에만 사용하는 게 아니라 게임 내 캐릭터에도 사용할 수 있다는 것입니다. ACE (Avatar Cloud Engine)는 게임 내 등장하는 NPC를 더 사실적으로 반응하거나 혹은 게임 플레이어의 행동에 정해진 스크립트가 아니라 스스로 학습해 반응하도록 할 수 있습니다. 흥미롭게도 국산 게임인 미르 5가 데모 영상으로 공개됐습니다. 여기서는 보스 몬스터가 게이머의 행동을 학습해 매번 같은 패턴이 아니라 다른 방식으로 적절히 대응해 반복 플레이에 따른 지루함이나 획일적인 공략을 배제할 수 있게 했습니다.
(출처: 엔비디아)
현재 미세 공정의 한계와 더불어 최신 미세 공정 웨이퍼의 급격한 가격 상승을 감안하면 엔비디아가 2nm 나 그 이하의 최신 공정을 사용해 고가의 GPU를 만들기보다는 다음에도 3nm 정도에서 만족할 가능성이 높아 보입니다. 덩치가 큰 GPU에 비싼 웨이퍼를 적용하긴 힘들기 때문입니다. 그렇다면 성능을 높일 방법은 다음에도 AI일 가능성이 높아 보입니다. 그리고 아마도 게임 제작사들 역시 이런 변화에 따를 것입니다. 결과적으로는 AI가 게임에서도 대세가 될 것으로 보입니다.
사실 AI는 이미 코드 제작에도 점점 활용 범위가 넓어지고 있습니다. AI가 아예 게임 제작에 깊숙히 관여해 제작 시간과 비용을 절감할 가능성이 높아진 것입니다. 이런 변화를 좋아하든 좋아하지 않든 간에 이것이 시대에 대세라는 점을 부인할 사람은 없을 것입니다.
참고
댓글
댓글 쓰기