AWS将Graviton芯片引入Redshift分析平台

AWS推出基于Graviton处理器的Redshift RG实例,将数据仓库与数据湖分析整合至单一查询引擎。与上一代RA3相比,RG实例数据仓库性能提升2.2倍,每vCPU成本降低30%,Apache Iceberg性能提升2.4倍。新实例内置向量化查询引擎与NVMe本地缓存,消除独立Spectrum扫描架构及按TB计费模式,适用于分析及智能体AI工作负载,现已在美国多个区域上线。

本周,亚马逊云服务(AWS)为Amazon Redshift推出了基于AWS Graviton处理器的全新RG实例。该版本将数据仓库与数据湖分析整合到统一的查询引擎中,反映出云服务商在AI时代背景下,努力降低基础设施成本并减少跨复杂分析环境的数据流转。

AWS表示,Redshift RG实例的数据仓库性能比上一代RA3系统提升最高2.2倍,而每vCPU成本降低30%。集成的数据湖查询引擎相较RA3,Apache Iceberg性能提升最高2.4倍,Apache Parquet性能提升1.5倍。

此次发布延续了AWS将Graviton定制Arm处理器从通用计算扩展至更高层级的分析和AI基础设施服务的战略布局。

AWS指出,集成引擎使Redshift能够通过同一计算层查询数据仓库和数据湖中的数据,无需依赖独立的Redshift Spectrum基础设施,也无需按TB计费的扫描费用。

随着企业越来越多地尝试整合围绕云数据仓库、对象存储以及Apache Iceberg等开放表格式构建的分散分析架构,这一变化显得尤为重要。

AWS将新实例定位为面向"分析和智能体AI工作负载",满足对大数据集低延迟访问的需求。

AWS将定制芯片推向分析层更高位置

Moor Insights & Strategy数据中心技术副总裁兼首席分析师Matt Kimball认为,此次发布远不止是常规的实例升级。

Kimball对Data Center Knowledge表示:"AWS正在应对每家企业都关注的重大挑战——性能、总拥有成本和复杂性。"

他指出,AWS公布的性能与价格优势,使这一平台变革很难被视为渐进式调优。

"看到数据仓库工作负载性能提升2.2倍、Apache Iceberg提升2.4倍,同时每vCPU价格降低30%这样的数据,很难将其视为成本/性能指标上的微小改进。"他说。

他还提到,AWS取消独立的Spectrum扫描基础设施及相关费用,对大型分析部署而言是一项有实际意义的运营改善。

"从更宏观的角度看,AWS似乎正在将其芯片向技术栈上层推进。"Kimball说,"不仅进入EC2这样的基础设施层,还延伸到数据和分析层本身。"

他指出,这一动向预示着一个更长远的架构方向:超大规模云服务商将越来越多地把定制芯片与托管分析服务深度融合。

湖仓架构竞争升温

此次发布也反映出围绕"湖仓"架构日益激烈的竞争,该架构模糊了传统结构化数据仓库与大规模数据湖之间的界限。

AWS表示,RG实例通过内置向量化查询引擎,直接在集群节点上处理Iceberg和Parquet数据,而非将扫描任务路由到独立的资源池。公司还重点介绍了本地NVMe缓存技术,可将常用数据集保留在更靠近计算资源的位置。

Kimball表示,集成的数据湖查询引擎同时解决了运营复杂性和企业数据迁移与复制成本上升的问题。

"作为一名企业IT负责人,我希望尽可能减少数据的复制和迁移,"Kimball说,"也希望避免出现各种零散的数据管道。"

他指出,当企业部署依赖于快速访问结构化和半结构化数据的检索系统和智能体AI工作负载时,这些低效问题带来的影响会更加严重。

"在保持一致治理的前提下,让分析尽可能贴近数据所在位置,正在成为一项核心设计原则。"Kimball说。

他补充说,对于已经标准化使用Amazon S3以及Iceberg、Parquet等开放格式的企业而言,仓库与数据湖之间更紧密的集成降低了整合门槛,简化了分析运营。

AI基础设施经济性扩展至GPU之外

Redshift此次发布也凸显出AI基础设施压力正从GPU集群向周边分析生态蔓延。

随着企业构建检索管道、推理系统和智能体AI环境,对大数据集低延迟访问的需求日益增长。这迫使云服务商必须降低查询开销、压缩分析层级,并减少仓库与数据湖环境之间昂贵的数据传输。

Kimball表示,超大规模云服务商的定制芯片正在成为分析和AI基础设施领域日益重要的竞争差异化因素。

"毫无疑问,是的,"他说,"AWS在这方面一直处于领先——Graviton、Trainium、Inferentia、Nitro。"

他认为,定制芯片正越来越多地推动超出原始基础设施经济性范畴的架构优化。

"对于Graviton而言,这不仅仅关乎成本,"Kimball说,"它使得向量化执行引擎和NVMe缓存成为可能,而这些正是让AWS所宣称的集成数据湖查询能够实现的关键。"

Kimball也警告说,定制芯片与托管云服务之间更紧密的耦合,会让企业客户在长期内形成更深的依赖。

"芯片与平台或服务之间的集成越紧密,在性能、成本和运营上的效率提升就越显著,"他说,"但反过来,这也会带来更深层次的依赖。"

AWS表示,现有RA3集群可通过快照恢复、弹性调整或经典调整方式迁移至RG实例。新实例已率先在美国多个区域提供,包括北弗吉尼亚、俄亥俄、俄勒冈和北加州。

Q&A

Q1:AWS Redshift RG实例相比上一代RA3有哪些性能提升?

A:AWS表示,RG实例的数据仓库性能比RA3提升最高2.2倍,每vCPU成本降低30%。集成数据湖查询引擎相比RA3,Apache Iceberg性能提升最高2.4倍,Apache Parquet性能提升1.5倍。

Q2:Redshift RG实例的集成查询引擎有什么优势?

A:集成引擎让Redshift可以在同一计算层查询数据仓库和数据湖中的数据,无需依赖独立的Redshift Spectrum基础设施,也免去了按TB计费的扫描费用。这降低了企业整合分析架构的门槛,简化了分析运营。

Q3:现有RA3集群如何迁移到RG实例?目前在哪些区域可用?

A:现有RA3集群可通过快照恢复、弹性调整或经典调整方式迁移至RG实例。新实例已率先在美国多个区域提供,包括北弗吉尼亚、俄亥俄、俄勒冈和北加州。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2026

05/18

10:00

分享

点赞

邮件订阅