엔비디아와 구글 딥마인드 협업 디퓨전 젬마 공개

엔비디아와 구글 딥마인드 협업 디퓨전 젬마 공개 - 초당 1000 토큰 이상 가능

(출처: 엔비디아)

구글 딥마인드가 젬마 26B A4B 모델 (Gemma 26B A4B) 기반으로 개발한 디퓨전 젬마 26B A4B를 공개했습니다. 디퓨전 젬마의 특징은 병렬 토큰 생성 (Parallel generation) 기술입니다. 매 단계마다 단 하나의 토큰(텍스트 단위)을 순차적으로 예측하는 기존의 자동회귀(Autoregressive) 모델과 달리, 디퓨전 젬마는 한 단계에 최대 256개의 토큰을 동시에 병렬로 디노이징(denoising)하여 텍스트를 생성합니다. 병렬 처리 방식 덕분에 토큰 생성 속도가 4배 정도 빨라졌다는 게 엔비디아와 딥마인드의 설명입니다.

덕분에 H100 같은 고성능 GPU에서 로컬 AI 모델 토큰 속도가 초당 1000 이상으로 빨라졌으며 DGX 스테이션에서는 초당 800, DGX 스파크에서는 초당 150 정도의 속도를 지원합니다. 과거 텍스트 기반의 LLM이 하나씩 토큰을 순차적으로 생성하는 것과 달리 AI 이미지 생성의 디노이징처럼 여러 개를 동시 생성하는 방식으로 속도를 대폭 높인 것인데, 덕분에 로컬 모델에서 클라우드 서버에 맞먹는 빠른 속도를 경험할 수 있게 됐습니다.

여기서 흥미로운 사실은 디퓨전 젬마가 사실 젬마 4 26B A4B 기반이라는 사실입니다. 총 매개변수 25.2B (약 252억 개), 활성 매개변수 3.8B (약 38억 개), 컨텍스트 길이 최대 256K 토큰, 정밀도 포맷 (Precision format) BF16, NVFP4이라는 점은 동일하다는 뜻으로 속도만 빠른 것이지 기본적인 답변 품질은 기존의 젬마 4와 같을 것으로 예상할 수 있습니다. 또 모델 자체가 엔비디아 GPU에 최적화된 것으로 보입니다.

다만 로컬 컴퓨터에서는 용량 때문에 약간 제약이 따를 수 있는데 구글과 언슬로스(Unsloth)의 공식 개발자 가이드에 따르면, 디퓨전 젬마(26B MoE)를 양자화하여 로컬에서 원활하게 구동하기 위한 최소 권장 VRAM(또는 통합 메모리)은 18GB입니다. 4-bit 양자화 (UD-Q4_K_XL 등)로 압축된 모델 파일을 올리는 데만 순수하게 약 15~17GB의 메모리가 필요해서 VRAM이 부족한 경우에 다소 속도에서 손해를 볼 것으로 예상됩니다.

바로 직전에 공개한 Gemma 4 QAT 최적화 모델의 경우 이보다 크기가 작아 16GB VRAM 거의 다 올릴 수 있어 속도가 무척 빨라졌습니다. 개인적으로는 현존 최강 로컬 LLM이 아닐까 생각하는데, 디퓨전 젬마가 속도면에서 어떤 이점을 가져다줄지 궁금합니다. 제가 쓰는 RTX 4080에서도 QAT보다 속도 더 빨라질지가 가장 궁금합니다.

참고

https://wccftech.com/nvidia-delivers-day-1-support-for-deepminds-diffusiongemma-open-model-across-rtx-dgx-platforms/

이 블로그의 인기 게시물

100 테슬라급 자기장 도달

미국의 로스 알라모스 국립 연구소 (Los Alamos National Laboratory) 에서 과학자들이 지금까지 인간이 개발한 가장 강력한 자기장을 발생시키는 장치 개발에 도전하고 있습니다. 자기장의 세기를 나타내는 방법으로 자기력선의 밀도를 나타내기 위해 단위 면적당 자기력선의 수를 표시하는 단위인 테슬라 (T) 가 있습니다. (1T = 1Wb/㎡ 웨버 (Wb) 는 자속의 단위) 의료용으로 사용되는 초전도체를 이용한 MRI 의 경우 1.5 - 3 테슬라급의 강력한 자기장으로 인체 내부를 볼 수 있게 만들지만 과학 연구용으로 이보다 더 강력한 자기장이 필요할 수 있습니다. 최근에 등장한 90 테슬라급 자기장에 이어 이번에 로스 알라모스 국립 연구소에서는 100 테슬라급인 100.75 T 를 실현 했다고 합니다. 이를 구현한 것은 18000 파운드 (8.16 톤 정도) 의 코일과 여기에 에너지를 공급할 1200 메가줄 (Megajoule) 급 모터 제네레이터등의 설비입니다. ( The 1,200-megajoule motor generator that powers the magnetic pulse. ) 이와 같은 연구를 통해 알아내고자 하는 것은 Quantum Phase transitions and new ultra high field magnetic states Electronic Structure determination Topologically protected states of matter 로 요약할 수 있다고 합니다. 아무튼 수 T 급 MRI 만 해도 자기장의 힘이 엄청난데 100 T 라니 엄청난 자기장이네요. 이는 지구 자기장 세기보다 200만배 강력한 (물론 좁은 범위에서 작용하는 자기장이라 지구 전체...

자세한 내용 보기

고대 양서류 이야기 (2) - 악어를 닮은 거대 양서류들

페름기에는 다양한 양막류가 진화해서 앞서 소개한 육상형 템노스폰딜리는 점차 설 자리를 잃게 됩니다. 하지만 양서류는 본래 자신의 서식지인 물과 습지에서 여전히 번성을 누렸습니다. 당시에는 악어류 같은 대형 양서형 파충류도 없던 시절이었기 때문에 이와 비슷한 생태학적 지위는 여전히 양서류의 몫이었습니다. 이들에 대한 이야기는 제 책인 포식자에서 비교적 간단히 다뤘는데, 오늘은 여기에 대한 보충 설명입니다. 책 정보: http://book.naver.com/bookdb/book_detail.nhn?bid=13347200 Yes 24: http://www.yes24.com/24/goods/58772859 11번가: http://books.11st.co.kr/product/SellerProductDetail.tmall?method=getSellerProductDetail&prdNo=1977867160 알라딘: http://www.aladin.co.kr/shop/wproduct.aspx?ItemId=134877825 교보문고: http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9788970447988&orderClick=LAG&Kc= 인터파크 : http://book.interpark.com/product/BookDisplay.do?_method=detail&sc.prdNo=279593764&sc.saNo=003002003&bid1=search_auto&bid2=detail&bid3=prd_img&bid4=001 영풍문고: http://www.ypbooks.co.kr/book.yp?bookcd=100843205&gubun=NV ...

자세한 내용 보기

이빨이 다시 진화한 개구리

( CT scans of Gastrotheca guentheri skulls revealed what appeared to be identical rows of teeth on both the upper and lower jaws, which researchers later confirmed through dissection. Credit: Florida Museum/Daniel Paluh ) 개구리는 2억년 전 진화 과정에서 이빨을 잃어버리고 큰 턱과 혀를 이용해 곤충 같은 작은 먹이를 잡아 먹는 방향으로 진화했습니다. 파충류나 포유류 같은 다른 사지류와의 경쟁에서 밀려 양서류가 쇠퇴하고 멸종하던 시기에도 개구리는 여전히 생존할 수 있었던 비결입니다. 이빨이 없는 덕분에 큰 혀를 발사하기 편해졌을지는 모르지만, 이빨이 없으면 종종 불편할 때가 있습니다. 씹는 대신 삼키기 때문에 음식을 씹을 수 없다는 점은 문제되지 않지만, 필사적으로 달아나려는 먹이를 잡기 힘들기 때문입니다. 이런 이유 때문에 일부 개구리는 이빨 같이 보이는 엄니 (fang)을 지니고 있으나 이는 사라진 이빨이 다시 난 것이 아니라 다른 부분이 진화한 것입니다. 이는 돌로의 법칙 ( Dollo's Law )으로 알려져 있습니다. 진화 과정에서 퇴화한 부분이 다시 생겨나지 않으며 대신 필요하면 다른 부분이 진화해 그 역할을 대신한다는 것입니다. 예를 들어 아가미가 사라진 사지 동물은 다시 물에 들어온다고 해도 아가미가 다시 생기진 않습니다. 대신 고래처럼 폐가 커져서 그 기능을 대신하게 됩니다. 하지만 모든 법칙엔 예외가 있기 마련입니다. 남미에서 발견된 멸종 위기 개구리 중 하나인 구엔터 유대류 개구리 ( Gastrotheca guentheri, Guenther's marsupial frog, dentate marsupial frog)는 완전한 형태의 이빨을 지니고 있습니다. 참고로 유대류 개구리라는 명칭은...

자세한 내용 보기

고든의 블로그 구글 분점

이 블로그 검색