AWS全新Graviton5芯片正式推出,驱动M9g和M9gd云实例上线

亚马逊云服务正式推出搭载全新Graviton5处理器的M9g和M9gd云计算实例。Graviton5相较上一代性能提升25%,支持DDR5内存与PCIe,单芯片集成192核心,L3缓存扩大5倍,网络带宽提升15%。该芯片专为智能体AI工作负载设计,可支持实时推理与多任务编排。Meta、Snowflake、Uber等企业已率先部署。M9gd实例还提供高达11.4TB的NVMe本地存储,并搭载全新Nitro隔离引擎以强化安全性。

亚马逊云科技(AWS)旗下新一代定制芯片终于正式向用户开放,随之发布的是全新的弹性计算云M9g与M9gd实例。

这两款实例均由全新Graviton5中央处理器提供算力支撑,旨在为多样化的云计算工作负载提供卓越的计算性能,涵盖人工智能应用场景。

AWS表示,Graviton5专为支持实时AI推理、代码生成、多步骤任务编排以及复杂的持续性工作负载而设计,目标是实现"能够主动采取行动的AI"——即可在最少人工干预下自主执行任务的AI智能体。

AWS在去年12月的年度re:Invent大会上正式发布Graviton5,称其代表着企业级云基础设施"架构层面的重大飞跃"。

这款芯片是Graviton系列迄今为止性能最强的产品,专为智能体AI场景的需求量身打造。智能体AI要求CPU能够同时运行大量并发计算环境,并最大化GPU及其他AI加速器的性能表现。据AWS介绍,与上一代Graviton4相比,Graviton5整体计算性能提升25%,同时能效更高,帮助企业有效降低基础设施成本。

AWS透露,新芯片已赢得众多大客户的青睐。Meta计划部署"数千万个"Graviton5核心以运行其智能体工作负载,云数据仓库公司Snowflake也已加入用户行列,优步(Uber)同样是早期采用者之一,已承诺部署该处理器。

目前,全球已有超过12万家AWS客户在早期版本的Graviton处理器上运行应用程序。新一代芯片是该系列首款支持DDR5内存与PCIe接口的产品,单颗芯片集成高达192个超高密度核心。

Graviton5还配备了容量扩大五倍的三级缓存(L3 Cache)——这是一种高速内存缓冲区,专为将频繁访问的数据保留在更靠近芯片核心的位置而设计。相较于Graviton4,每个Graviton5核心可访问的L3缓存容量提升2.6倍。与此同时,内存性能也得到增强,显著缩短了芯片等待数据的时间,从而加快应用程序响应速度,更高效地处理内存密集型任务。

在网络与存储方面,Graviton5的网络带宽提升15%,亚马逊弹性块存储(EBS)带宽提升20%。对于更大规格的实例,整体带宽最高可提升100%,这意味着更快的数据传输速度、更短的备份时间以及更优的分布式应用性能。

除整体计算性能提升25%外,M9g实例还带来了35%的Web应用及机器学习推理速度提升,以及30%的数据库性能提升。M9gd实例则专为需要高速本地存储的工作负载而设计,提供最高11.4TB的NVMe固态硬盘存储,每秒输入/输出操作次数(IOPS)较上一代提升30%。

AWS表示,新实例与AWS Nitro卡协同工作,将网络、存储和虚拟化功能卸载至专用硬件处理。Nitro是亚马逊面向医疗、金融服务和政府等对隐私有高度要求的行业所设计的安全与性能层。通过这种卸载机制,Nitro能够帮助Graviton5处理器更高效地运行,同时提升数据安全性。

此外,M9g和M9gd是首批支持全新Nitro隔离引擎(Nitro Isolation Engine)的实例。该引擎借助形式化验证技术增强了Nitro的安全能力,以数学方式确保各工作负载之间,以及工作负载与AWS运营人员之间的完全隔离运行。

Q&A

Q1:Graviton5相比上一代Graviton4有哪些主要提升?

A:Graviton5在多个维度实现了显著升级:整体计算性能提升25%,L3缓存容量扩大5倍,每核可访问缓存量提升2.6倍;网络带宽提升15%,EBS存储带宽提升20%,大规格实例整体带宽最高提升100%;同时首次支持DDR5内存和PCIe接口,单芯片集成192个核心。此外,能效也得到提升,有助于降低企业基础设施成本。

Q2:M9g和M9gd实例有什么区别,分别适合哪些场景?

A:M9g实例主要面向通用计算场景,在Web应用、机器学习推理和数据库方面分别实现35%、35%和30%的性能提升,适合AI推理、代码生成和智能体任务编排等工作负载。M9gd实例则专为需要高速本地存储的场景设计,提供最高11.4TB NVMe固态存储,IOPS性能提升30%,适合对本地存储I/O要求较高的应用。

Q3:Nitro隔离引擎是什么?有什么作用?

A:Nitro隔离引擎是AWS随M9g和M9gd实例首次推出的全新安全功能。它通过形式化验证技术,从数学层面确保不同工作负载之间完全隔离运行,同时也与AWS运营人员相互隔离。这对医疗、金融和政府等对数据隐私和安全合规有严格要求的行业用户尤为重要。

来源:SiliconANGLE

0赞

好文章,需要你的鼓励

2026

06/11

15:44

分享

点赞

邮件订阅