(출처: AMD)
AMD가 고르곤 포인트 (Gorgon point)라는 코드 네임으로 알려졌던 AMD 라이젠 AI 400 시리즈를 공개했습니다. 공개된 내용을 보면 사실상 300 시리즈의 재탕으로 동일한 Zen 5/Zen 5c 코어와 라데온 800 GPU, 그리고 XNDA2 기반의 NPU가 사용됩니다. 다만 NPU의 경우 일반적인 8비트 정수(INT8) 연산보다 정밀도가 높으면서도, 16비트 부동소수점(FP16)보다 연산 속도가 빠른 Block Floating Point (BFP16) 속도를 좀 더 끌어올리는 등 나름 성능을 높이기 위해 노력해서 50TOPS의 성능을 60TOPS로 높였습니다. 아마도 가장 차이가 큰 부분일 것입니다.
두 번째로 차이를 둔 부분은 LPDDR5x - 7500에서 8533으로 클럭을 높인 것입니다. 메모리가 중요한 AI나 그래픽 연산 시 성능이 다소 높아졌을 것으로 기대할 순 있으나 최근 메모리 가격 폭등으로 아마 가격은 더 많이 오를 것으로 예상됩니다. 마지막으로 고르곤 포인트는 데스크톱 버전도 나올 것이라고 합니다. G라는 접미사 없이 아마도 같은 이름으로 나올 것으로 보이며 미니 PC나 데스크톱에서도 코파일럿을 사용할 수 있게 될 것으로 보입니다.
아무튼 하드웨어적으로는 사골이라고 할 수 있는데, 그래도 AMD는 소프트웨어적으로라도 어떻게든 개선을 해보려는 의지는 보여줬습니다. 대표적인 것이 ROCm 7.2 지원입니다. 원래 서버용 GPU에서 쓰이던 ROCm 스택을 이번에 라이젠 NPU까지 확장했습니다. 이제 개발자들은 파이토치(PyTorch)나 텐서플로(TensorFlow) 기반 모델을 라이젠 AI 400에서 바로 최적화하여 실행할 수 있습니다. 그리고 LM 스튜디오에서 LLM을 구동할 때 본격적으로 NPU를 지원해 속도가 더 빨라질 수 있다고 합니다. 스테이블 디퓨전도 도움을 받을 순 있으나 노트북 환경에서 내장 그래픽으로 돌리기엔 버거울 것으로 생각합니다.
아무튼 경쟁사인 인텔과 비교하면 상당히 심심한 변화이지만, AI가 갈수록 중요해지는 상황에서 NPU 성능을 높이고 활용도도 높이는 업데이트는 환영할만 합니다. 다만 메모리 가격 폭등으로 인해 소비자들의 지갑이 쉽게 열릴지는 미지수입니다.
참고



댓글
댓글 쓰기