(반도체 포토마스크. 출처: 인텔)
엔비디아는 GTC 2023에서 GPU를 이용한 여러 가지 신기술을 공개했습니다. 당연히 인공지능이 이번에도 가장 큰 화두였지만, GPU를 이용해 할 수 있는 연산 가속 기능은 여러 가지가 존재합니다. 사실 본래 HPC 시장을 위해 개발된 고성능 GPU가 인공지능 연산에서 두각을 나타낸 만큼 근본은 고속 병렬 연산에 있다고 해도 무방합니다.
엔비디아가 공개한 cuLitho (아마도 cu는 쿠다 (cuda)의 약자고 Litho는 리소그래피의 약자로 보임) 기술은 GPU의 빠른 병렬 연산 능력을 이용해서 반도체 제작 과정에서 갈수록 많은 연산을 요구하고 있는 전산 리소그래피 (computational lithography) 속도를 빠르게 하는 것입니다.
CPU나 GPU 같이 복잡한 반도체 회로는 포토마스크라는 석영에 그려진 회로를 이용해 웨이퍼 위에 새겨서 만듭니다. 하지만 회로가 복잡해지고 미세 회로를 만들기 위해 파장을 줄이다보면 회절 (diffraction) 현상이 심해져 회로가 제대로 새겨지지 않는 문제가 발생합니다. 이 문제를 극복하기 위해서 반도체 제조사들은 복잡한 연산을 통해 회절 효과를 감안한 회로를 포토마스크에 그리는 전산 리소그래피 기술을 도입했습니다.
문제는 이제 수백 억개의 트랜지스터를 집적한 경우도 드물지 않게 되면서 전산 리소그래피가 점점 더 복잡해지고 있다는 것입니다. 현재도 수천에서 수만 개의 서버를 이용해 길게는 수주까지 연산이 필요한데, 칩의 복잡도와 트랜지스터 집적도가 올라가면 앞으로는 감당하기 힘든 수준으로 연산 작업이 늘어날 수 있습니다.
엔비디아가 공개한 cuLitho는 H100 GPU를 이용한 500대의 DGX H100 시스템으로 전산 리소그래피에 들어가는 시간을 40배 단축하고 에너지 효율은 9배까지 높일 수 있습니다. 500대의 DGX H100 시스템은 4000개의 H100 GPU를 이용해 4만 개의 CPU 기반 서버의 작업을 대신할 수 있다는 것이 엔비디아의 주장입니다. 그리고 포토마스크 제작에 필요한 전산 리소그래피 시간도 수주가 아닌 8시간까지 줄일 수 있습니다.
엔비디아의 주장이 맞다면 DGX H100 시스템은 비싼 가격에도 칩 제조사들에게 상당한 이점을 제공할 것입니다. 그리고 GPU 자체가 가장 크고 복잡한 칩이기 때문에 cuLitho 기술의 도움을 가장 크게 받을 수 있습니다. 그렇게 보면 엔비디아가 이런 기술을 개발한 것은 상품성은 둘째치고 상당히 합리적인 일로 생각됩니다.
참고
https://www.tomshardware.com/news/nvidia-tackles-chipmaking-process-claims-40x-speed-up-with-culitho
댓글
댓글 쓰기