亚马逊云科技(AWS)近日正式宣布其搭载Graviton5处理器的Amazon EC2 C9g与C9gd实例全面上线,将最新一代Arm架构处理器引入计算优化型实例,面向AI推理、高性能计算、分布式分析及其他CPU密集型工作负载。
AWS表示,C9g实例相较上一代C8g系列,每个vCPU的性能提升幅度高达25%,同时支持DDR5-8800内存、五倍L3缓存容量、PCIe Gen 6连接以及高达三倍的数据包处理性能。此外,AWS还通过最新一代Nitro平台推出了多项平台级更新,其中包括Nitro隔离引擎——这是一项基于Rust语言开发的安全能力,内置于Nitro Hypervisor中,用于管控对内存、CPU寄存器状态及I/O设备的访问,从而强化虚拟机隔离能力。
对云基础设施运营者的意义
此次发布不仅仅是一次常规的处理器升级迭代。
尽管GPU仍是模型训练和大规模推理的核心引擎,但整个AI技术栈正加速向能够规划任务、调用工具、执行多步骤工作流的智能体系统演进。这一趋势对CPU在编排调度、内存管理、任务调度与并发处理等方面提出了更高要求,运营商需要在算力、内存、网络与存储之间做好平衡,确保昂贵的加速器始终保持高效运转。AWS此次推出C9g/C9gd,正是为了承担这一角色。
CPU设计向AI演进
行业分析师指出,AWS的举措折射出一种更宏观的架构趋势。
Moor Insights & Strategy数据中心技术副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示:"AI赋能已经成为未来每一款CPU的设计基准。尽管GPU占据了大量关注,但CPU的需求将继续以极快的速度增长。"
他指出,Graviton5的设计目标是同时服务于成熟的企业级工作负载与新兴AI应用。更大的缓存容量、更快的内存速度以及更高带宽的I/O接口,不仅有益于数据库、分析和HPC场景,该处理器架构同样适合推理、任务分解、并发处理等CPU密集型AI任务。
此次发布延续了AWS更大范围内推进Graviton在云平台中战略价值的布局。今年早些时候,AWS曾推出搭载Graviton的Amazon Redshift RG实例,旨在提升AI时代数据分析场景的性能与经济性。C9g系列的推出,进一步将这一战略深入到基础设施层,专门针对AI推理周边那些对编排调度和内存消耗要求较高的路径进行CPU优化。
HyperFrame Research半导体与深科技分析师Stephen Sopko表示,这一转变反映的是AI工作负载本身性质的演变,而非加速器地位的下降。
"模型推理或许运行在加速器上,但编排调度、工具调用和多步骤推理本质上仍是CPU密集型的,"Sopko说,"CPU并不是要取代加速器,而是在智能体规划任务、调用工具、维护状态的同时,保证加速器始终有活可干。"
Sopko预计,随着企业部署规模更大的智能体AI系统,这种协同关系将愈发关键。"智能体AI让CPU从配角重新回到联合主角的位置,"他说,"C9g就是亚马逊为这一转变搭建的控制面基础设施。"
竞争格局超越x86范畴
在围绕AI重新设计服务器处理器这条路上,AWS并不孤单。
英伟达的Grace CPU与其AI平台深度集成,Arm在Neoverse路线图中全面强调AI能力,高通也推出了面向编排调度、通用计算及AI头节点功能的服务器CPU产品线。
Kimball认为,Graviton5目前最直接的竞争对手仍是AMD EPYC和英特尔至强系列,而非AI加速器。即便如此,他预计随着市场对优化数据移动、内存管理及GPU协同编排的处理器需求持续增长,各大主要CPU产品线将持续围绕AI工作负载演进。
产品规格与上线区域
C9g/C9gd支持PCIe Gen 6及最新一代Nitro平台,提供从中等规格到48xlarge共11种实例尺寸,并包含裸金属选项。据AWS介绍,最大规格实例可提供高达100 Gbps的网络带宽和最高72 Gbps的Amazon EBS带宽。C9gd实例还配备本地NVMe SSD存储,适用于需要高速缓存或临时存储空间的工作负载。
目前,上述实例已在AWS美国东部(北弗吉尼亚和俄亥俄)、美国西部(俄勒冈)及欧洲(法兰克福)区域上线,更多区域将陆续开放。
Q&A
Q1:AWS Graviton5相比上一代Graviton4有哪些性能提升?
A:Graviton5驱动的C9g实例相较上一代C8g系列,每vCPU性能提升最高达25%,支持DDR5-8800内存,L3缓存容量增至五倍,采用PCIe Gen 6连接,数据包处理性能最高提升三倍。同时引入基于Rust开发的Nitro隔离引擎,进一步强化虚拟机隔离安全性。
Q2:CPU在AI工作负载中扮演什么角色,和GPU如何分工?
A:GPU主要负责模型训练和大规模推理计算,而CPU则承担AI系统中的编排调度、内存管理、工具调用和多步骤任务推理等工作。在智能体AI系统中,CPU负责"控制面",确保GPU等加速器始终高效运转,两者是协同关系而非替代关系。
Q3:EC2 C9g实例目前在哪些地区可以使用?
A:EC2 C9g与C9gd实例目前已在AWS美国东部(北弗吉尼亚和俄亥俄)、美国西部(俄勒冈)以及欧洲(法兰克福)区域正式上线,AWS计划后续在更多区域陆续开放访问。
好文章,需要你的鼓励
在2026年爱迪生电气协会年会上,共和党籍佐治亚州长肯普与民主党籍亚利桑那州长霍布斯罕见达成共识:数据中心带来的电网扩容成本不应转嫁给普通居民。两位州长均支持"增长自付"原则,并倡导多元化能源组合。肯普强调核电与冻结居民电费,霍布斯则推动取消数据中心税收豁免并征收水费。两人跨越党派分歧的一致立场,折射出美国电力行业应对数据中心爆发式增长的主流方向。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
北美电网今夏首次无高风险区域,NERC评估显示58GW新增资源使各地储备充足。然而业内专家普遍警告,这不过是暂时喘息:数据中心并网延迟、太阳能与储能主导新增供应、劳动力短缺、融资困难及气候依赖性上升等问题依然严峻。预计未来两三年内,延迟的数据中心负荷将集中上线,电力系统将面临更大压力,并购整合浪潮也在加速重塑行业格局。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。