(Credit: AMD)
AMD가 스테이블 디퓨전을 만드는 스태빌러티 AI와 협업해 AMD의 XDNA 2 NPUs에 최적화된 스테이블 디퓨전 3.0 미디엄 AI 모델을 만들었습니다. AMD 라이젠 AI 프로세서를 위해 개발된 이 모델은 Amuse 3.1를 통해 사용할 수 있습니다.
스테이블 디퓨전은 텍스트를 이미지로 만드는 툴로 이미 많은 사용자를 확보하고 있지만, 고성능의 엔비디아 GPU를 사용해야 한다는 제약점이 있었습니다. 적어도 8GB의 메모리를 갖춘 RTX 3060 이상의 그래픽 카드가 권장되는데, 개인적으로 사용해본 결과 RTX 4080에서는 아주 잘 돌어갑니다
하지만 이보다 성능이 낮은 내장 그래픽으로 스테이블 디퓨전을 사용하는데는 상당한 제약이 있었습니다. 라이젠 AI CPU에 최적화된 스테이블 디퓨전 3.0 미디엄 모델은 노트북에서도 BF16 정밀도로 1024x1024 해상도 이미지를 생성하고 2048x2048 이미지로 업스케일링 할 수 있습니다.
다만 이를 위해 24GB 이상의 메모리와 50TOPS NPU를 지닌 모델이 필요합니다. 이미지 생성을 위해서만 9GB의 메모리가 필요한데, 여기에 더해 넉넉한 SSD 여유 공간도 있어야 합니다. 사용해보신 분들은 알겠지만, 50-100GB 용량도 순식간에 잡아 먹을 수 있기 때문입니다.
성능은 하드웨어 자체의 스팩을 감안할 때 당연히 고성능 그래픽키드보디 낮겠지만, 그래도 내장 그래픽으로 스테이블 디퓨전을 좀 더 편하게 돌릴 수 있다는 것 자체로 상당한 메리트가 있어 보입니다. 결과물은 어떨지 실사용 후기가 궁금하네요.
참고

댓글
댓글 쓰기