(출처: Cerebras Systems)
미 에너지부의 지원을 받은 신개념 고성능 프로세서인 세레브라스 CS-1 (Cerebras CS-1)의 일부 성능 테스트 결과가 공개되었습니다. 세레브라스 CS-1은 웨이퍼 자체가 하나의 프로세서가 되는 구조로 84개의 가상 칩 위에 4,539 컴퓨팅 코어와 381,276개의 연산용 코어가 존재합니다. 18GB의 SRAM이 웨이퍼에 통합되어 있는 구조로 각각의 코어가 48kB의 메모리를 지니고 고속 인터페이스로 서로 연결되어 있는 구조입니다. TSMC의 16nm 공정으로 만든 300mm 웨이퍼를 기반으로 제조된 프로세서입니다.
이전 포스트; https://blog.naver.com/jjy0501/221654644644
세레브라스 CS-1의 비교 대상은 역시 미 에너지부 산하 연구소 소유인 줄 (Joule) 슈퍼컴퓨터였습니다. 줄은 20코어 제온 프로세서를 사용하고 있으며 총 16,000개의 인텔 코어를 보유하고 있습니다. 연산 목표는 발전소의 연소 프로세스 (powerplant combustion processes)를 시뮬레이션 하는 것으로 줄 슈퍼컴퓨터가 6밀리초 걸린 연산을 세레브라스 CS-1은 28마이크로초에 해냈습니다. 이는 200배나 빠른 것입니다.
물론 특수 연산 목적이며 일반 연산 목표라면 당연히 줄 슈퍼컴퓨터가 앞설 것입니다. 그러나 일부 특수 목적 연산에서 웨이퍼 스케일 프로세서(Wafer-Scale Processor)의 가능성을 보여준 연산 시뮬레이션이었습니다.
웨이퍼 스케일 프로세서는 각각의 코어가 공유 캐쉬 메모리 및 시스템 메모리에 접속할 필요 없이 코어 내장 메모리를 통해 연산을 수행하기 때문에 데이터의 크기가 작은 경우 매우 효과적이고 빠르게 연산을 수행할 수 있습니다. 각각의 프로세서와 메모리의 거리가 매우 짧고 각각의 코어 역시 하나의 웨이퍼상에서 고속 인터페이스로 결합되어 있어 이런 아키텍처를 활용하는 경우 기존의 컴퓨터에서 볼 수 없는 빠른 연산이 가능합니다.
아마도 웨이퍼 스케일 프로세서가 기존의 전통적인 컴퓨터를 대신하기는 어려울 것으로 보이지만, 특수 목적 고속 병렬 연산 프로세서의 가능성은 있어 보입니다.
참고
https://techxplore.com/news/2020-11-trillion-transistor-chip.html
Fast Stencil-Code Computation on a Wafer-Scale Processor, arXiv:2010.03660 [cs.DC] arxiv.org/abs/2010.03660
이러한 형태의 프로세서가 컨슈머용으로 시도될 가능성은 어떨까요? 이를테면 애플 M1같은 프로세서를 웨이퍼 스케일 혹은 그에 준하는 형태의 맥 프로 정도로 만들 경우 수요가 꽤 있을 듯 한데요.
답글삭제아직은 좀 더 기술적으로 검증이 필요한 방식으로 생각됩니다. 가능성은 물론 있겠죠.
삭제