기본 콘텐츠로 건너뛰기

블랙웰 GPU를 공개한 엔비디아







 

(출처: 엔비디아)

엔비디아가 GTC를 통해 블랙웰 (Blackwell) 그레이스 블랙웰 GB200 슈퍼칩과 B200 GPU를 공개했습니다. 블랙웰은 TSMC의 최신 3nm 공정 대신 4N 공정을 개선한 4NP 공정을 사용했습니다. 비용 문제도 있었겠지만 , 데이터 센터용 GPU 가격이 엄청나게 비싼 점을 감안하면 충분한 캐파 확보 목적도 있어 보입니다.

아무튼 미세 공정 개선 없이 H100/200보다 성능을 대폭 늘리기는 어려워 보이지만, 엔비디아는 AI 연산 능력을 다섯 배 높여 20페타플롭스를 달성했다고 발표했습니다. 비결은 하나가 아닌 두 개의 다이를 연결해 트랜지스터 집적도를 2.5배인 2080억개로 늘린 것입니다. 이름이 B100이 아닌 GB/B200이 된 이유입니다.

이렇게해도 성능이 같은 공정에서 두 배나 높아진 것으로 해석할 수 있지만, 사실 또 한 번의 트릭이 존재합니다. 바로 FP 8 텐서 연산에 더해 FP 4 텐서 연산을 추가한 것입니다. 따라서 FP 8에서는 연산 능력이 반으로 줄어 H100과의 차이는 1.25배 정도입니다. 트랜지스터 증가를 생각하면 같은 공정에서 비슷한 성능으로 풀이할 수 있습니다.



(블랙웰 GPU 성능 요약. 출처: 탐스하드웨어)

그렇다고 해서 블랙웰의 연산 능력이 낮은 것은 아닙니다. FP 4 연산으로도 충분한 AI 연산에서 B200은 H100보다 5배 빠를 것입니다. 그리고 FP 4보다 더 정밀한 연산이 필요하지만 FP 8까지는 필요 없는 작업에는 그 중간인 FP 6 연산도 추가로 지원해 상황에 맞춰 연산 방법을 선택할 수 있게 됐습니다.

각각의 블랙웰 GPU엔 1TB/s의 대역폭을 지원하는 24GB HBM3e 메모리가 8개 장착되어 192GB의 메모리를 사용합니다. GB200은 그레이스 슈퍼칩을 그대로 사용하는 대신 B200을 두 개 사용해 연산 능력을 두 배로 높였습니다. 대신 TDP는 두 칩다 크게 증가할 것으로 보입니다. B200은 아마도 1000W에 달하고 GB200은 2700W까지 늘어날 가능성이 있습니다.





(GB200. 출처: 엔비디아)

HGX B200의 경우 8개의 B200 GPU를 탑재하기 위해 TDP를 각 프로세서 당 700W로 제한하는 대신 연산 능력을 FP 4 기준 14페타플롭스로 소폭 낮췄습니다. 이보다 더 낮은 전력 소모를 위한 소비자를 위한 B100 및 HGX B100도 마련되어 있습니다.

하지망 최근의 추세는 전기를 좀 더 먹더라도 AI 경쟁에서 우위를 선점하려는 요구가 더 크기 때문에 엔비디아는 수냉 서버 시스템을 선보였습니다. GB200/B200에 이르러서는 더 이상 공냉 방식으로는 감당이 되지 않기 때문입니다.











(출처: 엔비디아)

엔비디아는 GB200 을 두 개씩 서버에 넣어서 18단 서버랙 형태로 만들고 수냉 시스템으로 냉각하는 GB 200 NVL 72 노드를 선보였습니다. 이름처럼 72개의 블랙웰 B200 GPU를 사용해 대규모 AI 연산을 할 수 있습니다. 다만 이 경우 GPU 간 데이터를 주고 받는 과정에서 병목 현상이 일어나 실제 성능은 72개의 B200 GPU보다 낮을 수밖에 없습니다.

이 문제를 극복하기 위해 엔비디아는 GPU와 CPU간 데이터 전달을 돕는 별도의 프로세서인 NVLINK SWITCH를 사용하고 있습니다. 각 두 개의 NVLINK 스위치 프로세서가 하나의 트레이에 들어가 14.4TB/s의 대역폭을 지원하며 총 9개의 트레이를 통해 130TB/s 정도의 대역폭을 지원합니다. 이는 전 세대인 GH/H200, H100보다 대역폭이 크게 늘어난 것으로 대규모 데이터 처리에 더 유리해졌습니다.

전반적으로 보면 미세 공정의 큰 변화가 없는 상황에서 엔비디아는 결국 다이를 연결하는 방식으로 트랜지스터 집적도를 크게 높이고 GPU 간 데이터 병목 현상을 줄여 대규모 데이터 처리에 더 강력한 시스템을 만들었습니다. 따라서 LLM 을 비롯해 갈수록 데이터 규모가 커지는 AI 분야의 발전을 가속할 것으로 생각됩니다. 다만 치솟는 비용과 전력 소모를 어떻게 억제할 수 있는지가 새로운 과제로 떠오르고 있습니다.

그리고 여담이지만, 엔비디아가 거의 AI 하드웨어 회사가 되면서 본업이던 게이밍 GPU 부분은 오히려 소식이 잠잠해진 느낌입니다. 블랙웰 기반의 게이밍 GPU가 나오더라도 결국 가격은 그렇게 저렴하지 않을 것 같다는 불길한 느낌도 여전합니다. 그래도 소비자용 게이밍 GPU 소식을 기다려 봅니다.

참고

https://www.tomshardware.com/pc-components/gpus/nvidias-next-gen-ai-gpu-revealed-blackwell-b200-gpu-delivers-up-to-20-petaflops-of-compute-and-massive-improvements-over-hopper-h100

https://www.anandtech.com/show/21310/nvidia-blackwell-architecture-and-b200b100-accelerators-announced-going-bigger-with-smaller-data

댓글

이 블로그의 인기 게시물

통계 공부는 어떻게 하는 것이 좋을까?

 사실 저도 통계 전문가가 아니기 때문에 이런 주제로 글을 쓰기가 다소 애매하지만, 그래도 누군가에게 도움이 될 수 있다고 생각해서 글을 올려봅니다. 통계학, 특히 수학적인 의미에서의 통계학을 공부하게 되는 계기는 사람마다 다르긴 하겠지만, 아마도 비교적 흔하고 난감한 경우는 논문을 써야 하는 경우일 것입니다. 오늘날의 학문적 연구는 집단간 혹은 방법간의 차이가 있다는 것을 객관적으로 보여줘야 하는데, 그려면 불가피하게 통계적인 방법을 쓸 수 밖에 없게 됩니다. 이런 이유로 분야와 주제에 따라서는 아닌 경우도 있겠지만, 상당수 논문에서는 통계학이 들어가게 됩니다.   문제는 데이터를 처리하고 분석하는 방법을 익히는 데도 상당한 시간과 노력이 필요하다는 점입니다. 물론 대부분의 학과에서 통계 수업이 들어가기는 하지만, 그것만으로는 충분하지 않은 경우가 많습니다. 대학 학부 과정에서는 대부분 논문 제출이 필요없거나 필요하다고 해도 그렇게 높은 수준을 요구하지 않지만, 대학원 이상 과정에서는 SCI/SCIE 급 논문이 필요하게 되어 처음 논문을 작성하는 입장에서는 상당히 부담되는 상황에 놓이게 됩니다.  그리고 이후 논문을 계속해서 쓰게 될 경우 통계 문제는 항상 나를 따라다니면서 괴롭히게 될 것입니다.  사정이 이렇다보니 간혹 통계 공부를 어떻게 하는 것이 좋겠냐는 질문이 들어옵니다. 사실 저는 통계 전문가라고 하기에는 실력은 모자라지만, 대신 앞서서 삽질을 한 경험이 있기 때문에 몇 가지 조언을 해줄 수 있을 것 같습니다.  1. 입문자를 위한 책을 추천해달라  사실 예습을 위해서 미리 공부하는 것은 추천하지 않습니다. 기본적인 통계는 학과별로 다르지 않더라도 주로 쓰는 분석방법은 분야별로 상당한 차이가 있을 수 있어 결국은 자신이 주로 하는 부분을 잘 해야 하기 때문입니다. 그러기 위해서는 학과 커리큘럼에 들어있는 통계 수업을 듣는 것이 더 유리합니다...

9000년 전 소녀의 모습을 복원하다.

( The final reconstruction. Credit: Oscar Nilsson )  그리스 아테나 대학과 스웨덴 연구자들이 1993년 발견된 선사 시대 소녀의 모습을 마치 살아있는 것처럼 복원하는데 성공했습니다. 이 유골은 그리스의 테살리아 지역의 테오페트라 동굴 ( Theopetra Cave )에서 발견된 것으로 연대는 9000년 전으로 추정됩니다. 유골의 주인공은 15-18세 사이의 소녀로 정확한 사인은 알 수 없으나 괴혈병, 빈혈, 관절 질환을 앓고 있었던 것으로 확인되었습니다.   이 소녀가 살았던 시기는 유럽 지역에서 수렵 채집인이 초기 농경으로 이전하는 시기였습니다. 다른 시기와 마찬가지로 이 시기의 사람들도 젊은 시절에 다양한 질환에 시달렸을 것이며 평균 수명 역시 매우 짧았을 것입니다. 비록 젊은 나이에 죽기는 했지만, 당시에는 이런 경우가 드물지 않았을 것이라는 이야기죠.   아무튼 문명의 새벽에 해당하는 시점에 살았기 때문에 이 소녀는 Dawn (그리스어로는  Avgi)라고 이름지어졌다고 합니다. 연구팀은 유골에 대한 상세한 스캔과 3D 프린팅 기술을 적용해서 살아있을 당시의 모습을 매우 현실적으로 복원했습니다. 그리고 그 결과 나타난 모습은.... 당시의 거친 환경을 보여주는 듯 합니다. 긴 턱은 당시를 살았던 사람이 대부분 그랬듯이 질긴 먹이를 오래 씹기 위한 것으로 보입니다.   강하고 억센 10대 소녀(?)의 모습은 당시 살아남기 위해서는 강해야 했다는 점을 말해주는 듯 합니다. 이렇게 억세보이는 주인공이라도 당시에는 전염병이나 혹은 기아에서 자유롭지는 못했기 때문에 결국 평균 수명은 길지 못했겠죠. 외모 만으로 평가해서는 안되겠지만, 당시의 거친 시대상을 보여주는 듯 해 흥미롭습니다.   참고  https://phys.org/news/2018-01-te...

150년 만에 다시 울린 희귀 곤충의 울음 소리

  ( The katydid Prophalangopsis obscura has been lost since it was first collected, with new evidence suggesting cold areas of Northern India and Tibet may be the species' habitat. Credit: Charlie Woodrow, licensed under CC BY 4.0 ) ( The Museum's specimen of P. obscura is the only confirmed member of the species in existence. Image . Credit: The Trustees of the Natural History Museum, London )  과학자들이 1869년 처음 보고된 후 지금까지 소식이 끊긴 오래 전 희귀 곤충의 울음 소리를 재현하는데 성공했습니다. 프로팔랑곱시스 옵스큐라 ( Prophalangopsis obscura)는 이상한 이름만큼이나 이상한 곤충으로 매우 희귀한 메뚜기목 곤충입니다. 친척인 여치나 메뚜기와는 오래전 갈라진 독자 그룹으로 매우 큰 날개를 지니고 있으며 인도와 티벳의 고산 지대에 사는 것으로 보입니다.   유일한 표본은 수컷 성체로 2005년에 암컷으로 생각되는 2마리가 추가로 발견되긴 했으나 정확히 같은 종인지는 다소 미지수인 상태입니다. 현재까지 확실한 표본은 수컷 성체 한 마리가 전부인 미스터리 곤충인 셈입니다.   하지만 과학자들은 그 형태를 볼 때 이들 역시 울음 소리를 통해 짝짓기에서 암컷을 유인했을 것으로 보고 있습니다. 그런데 높은 고산 지대에서 먼 거리를 이동하는 곤충이기 때문에 낮은 피치의 울음 소리를 냈을 것으로 보입니다. 문제는 이런 소리는 암컷 만이 아니라 박쥐도 잘 듣는다는 것입니다. 사실 이들은 중생대 쥐라기 부터 존재했던 그룹으로 당시에는 박쥐가 없어 이런 방식이 잘 통했을 것입니다. 하지만...