(With their DMD method, MIT researchers created a one-step AI image generator that achieves image quality comparable to StableDiffusion v1.5 while being 30 times faster. Credit: Illustration by Alex Shipps/MIT CSAIL using six AI-generated images developed by researchers.)
최근 주목받고 있는 이미지 생성형 AI의 문제점은 상당한 컴퓨팅 자원을 소모한다는 것입니다. 현재 사용하고 있는 디퓨전 모델 (diffusion model)은 처음의 노이즈 단계에서 선명한 이미지나 영상을 얻을 때까지 반복적으로 작업을 추가합니다. 따라서 빠른 이미지 생성이 어렵고 자원을 많이 소모하는 것입니다.
MIT 컴퓨터 과학 및 인공지능 연구소 Computer Science and Artificial Intelligence Laboratory (CSAIL)의 티안웨이 잉 Tianwei Yin이 이끄는 연구팀은 디퓨전 모델보다 최대 30배 빠르게 이미지나 영상을 생성할 수 있는 새로운 접근법을 찾아냈습니다.
연구팀이 개발한 distribution matching distillation (DMD) 방식은 디퓨전 모델에서 이미지 생성에 사용되는 여러 단계를 한 단계로 압축해서 현재 사용되는 이미지 생성 AI인 스테이블 디퓨전이나 달리-3 (Stable Diffusion, DALLE-3)보다 30배 빠른 이미지 생성이 가능합니다. 더 중요한 부분은 이미지 퀄러티는 그대로 유지할 수 있다는 것입니다.
구체적인 기술적 내용은 난해하지만, 연구팀은 교사 - 학생 모델 teacher-student model을 사용해 여러 단계를 한 단계로 압축하는데 성공했다고 설명했습니다.
최근 AI의 급속한 발전은 하드웨어의 발전 덕분이기도 하지만, 관련 알고리즘의 진보 덕분이기도 합니다. 생성형 AI가 계속 발전하면 AI가 만든 영화가 가까운 미래에 등장할지도 모르겠다는 생각입니다. 이미 3D 랜더링이 대세인 애니메이션 쪽은 큰 거부감 없이 받아들여질지 모르겠다는 생각입니다.
참고
https://techxplore.com/news/2024-03-ai-generates-high-quality-images.html
Tianwei Yin et al, One-step Diffusion with Distribution Matching Distillation, arXiv (2023). DOI: 10.48550/arxiv.2311.18828
댓글
댓글 쓰기