(출처 : 아마존)
아마존 AWS가 그래비톤 5 (Graviton 5) CPU를 공식 출시했습니다. 물론 일반 판매용은 아니고 AWS의 EC2 M9g 및 M9gd 인스턴스에서 사용할 수 있습니다. 아마존 그래비톤 ARM 서버 프로세서는 2018년 첫 공개 이후 꾸준히 업데이트하면서 발전하고 있습니다.
세대별 업데이트 (AI 정리)
🛠️ Graviton 1 (2018): 클라우드 Arm의 신호탄
핵심 요약: 모바일 기기에서 주로 쓰이던 에너지 효율적인 Arm 아키텍처를 최초로 데이터 센터급 서버에 도입한 실험적 성격의 칩입니다.
성능: 16개의 Cortex-A72 코어를 탑재했으며, 대규모 연산보다는 가벼운 웹 서버나 컨테이너 기반의 마이크로서비스 등 저전력·고효율 성능이 필요한 EC2 A1 인스턴스에만 제한적으로 사용되었습니다.
🚀 Graviton 2 (2019): 본격적인 시장 주류 진입
핵심 요약: 전 세대 대비 코어 수가 4배(16 ➡️ 64코어) 늘어나며 단순 효율성 검증을 넘어 x86(Intel/AMD) 프로세서와 본격적인 경쟁 구도를 만들었습니다.
발전 포인트: Arm의 서버 전용 설계인 Neoverse N1 플랫폼을 채택했습니다. 기존 x86 인스턴스 대비 최대 40% 더 나은 가격 대비 성능(가성비)을 보여주며 AWS 내 수많은 서비스(RDS, EKS 등)로 생태계를 확장했습니다.
🧠 Graviton 3 (2022): 고성능 컴퓨팅(HPC)과 AI 추론의 시작
핵심 요약: 연산 유닛 구조를 대폭 개선하여 머신러닝(ML), 부동소수점, 암호화 성능을 강화하는 데 초점을 맞추었습니다.
발전 포인트: 클라우드 업계 최초로 DDR5 메모리(DDR5-4800)를 채택해 메모리 대역폭을 50% 늘렸습니다. 그래비톤 2 대비 일반 연산은 25%, 부동소수점 연산은 2배, 머신러닝 연산은 최대 3배 향상되었으며, 동일 성능 기준 에너지 소비량을 최대 60% 절감했습니다.
⚡ Graviton 4 (2023): 대규모 데이터베이스 및 대역폭 확장
핵심 요약: 코어 수가 64개에서 96개로 50% 증가하였으며, 고용량 고속 처리가 필요한 대기업형 대규모 데이터베이스(DB) 및 대용량 Java 애플리케이션에 최적화되었습니다.
발전 포인트: ARMv9 아키텍처 기반의 Neoverse V2 코어를 사용했으며, 코어당 L2 캐시 메모리를 2MB로 늘렸습니다. 그래비톤 3 대비 데이터베이스 성능은 40%, 웹 애플리케이션 성능은 30% 증가하여 하이엔드 서버 시장에서의 입지를 굳혔습니다.
🤖 Graviton 5 (2025~현재): 192코어와 PCIe Gen6 기반의 AI 특화 칩
핵심 요약: 인공지능 시대에 맞춰 AI 추론 및 대규모 에이전틱 AI(Agentic AI)를 가속하기 위해 목적 기반으로 완전히 새롭게 설계된 최신 칩입니다.
발전 포인트: * 미세 공정 고도화(3nm)를 통해 코어 수를 전 세대 대비 2배인 192코어로 끌어올렸습니다.
클라우드 내 최고 속도인 DDR5-8800 메모리와 최신 고속 인터페이스인 PCIe Gen6 프로토콜을 최초 도입했습니다.
공유 L3 캐시 용량을 5배 늘려 코어 간 통신 지연 시간을 33% 줄임으로써, 데이터 지연 없이 실시간 AI 추론 및 고성능 컴퓨팅을 수행할 수 있게 되었습니다.
아마존 AWS에 따르면 그래빈톤 5는 이전 세대 대비 최대 25% 향상된 성능을 제공합니다. 요즘 중요한 AI/ML 추론은 35% 더 빠르며, 데이터베이스는 30% 더 빠르다고 합니다. 각 CPU는 3nm 공정 기술로 제작된 192개의 코어를 탑재하고 있으며, 코어 간 지연 시간도 33% 더 낮습니다.
그래비톤 5는 최대 8800 속도의 DDR5 메모리 지원하는데 이는 클라우드에서 가장 빠른 DDR5입니다. 그리고 최초로 PCIe Gen6 지원이 포함됩니다. 그래비톤 5는 이전 세대보다 5배 더 큰 캐시를 제공하며, 각 코어는 2.6배 더 많은 캐시에 접근할 수 있어 칩의 AI 추론 및 머신러닝 기능을 확장했습니다. 참고로 캐시 용량은
L1 캐시 총합: 약 24 MB (128\text{ KB} \times 192)
L2 캐시 총합: 384 MB (2\text{ MB} \times 192)
L3 캐시 총합: 192 MB (전체 코어 공유)
이라고 합니다.
또 네트워크 및 스토리지 대역폭 또한 향상되어 인스턴스 크기에 관계없이 평균적으로 네트워크 대역폭은 최대 15%, Amazon Elastic Block Store(EBS) 대역폭은 최대 20% 증가했으며, 가장 큰 인스턴스의 경우 네트워크 대역폭이 최대 두 배까지 증가했습니다. 그 결과 데이터 전송 속도가 빨라지고 백업 속도가 향상되며 분산 애플리케이션의 성능이 개선되었습니다.
개별 인스턴스 간 비교를 해보면, M9g 인스턴스는 이전 세대 대비 25% 향상된 컴퓨팅 성능을 제공하며, M9gd 인스턴스는 최대 11.4TB 용량의 고속 로컬 SSD 스토리지가 필요한 기업을 위해 설계되었고, 이전 세대 대비 30% 향상된 IOPS를 제공합니다.
그래비톤 5의 주요 고객은 최근 협업을 발표한 메타입니다. 메타는 이미 자사의 에이전트 AI 애플리케이션에 수천만 개의 그래비톤 코어를 배포하기로 약속했으며, 우버나 스노우플레이크 같은 다른 고객들도 이 칩을 사용하고 있습니다.
에이전틱 AI에서 CPU의 중요성이 커진 가운데 자체 서버 CPU에 먼저 투자한 아마존의 선견지명이 지금 더 큰 성과를 거두고 있는 것 같아 보입니다.
참고


댓글
댓글 쓰기