AWS推出EKS新功能以重塑Kubernetes运维应对AI工作负载激增

亚马逊云科技宣布推出Amazon EKS Capabilities，这是一套完全托管的Kubernetes原生工具套件，将流行的开源工具直接集成到EKS控制平面中。该服务旨在降低企业平台团队的运营复杂性，提升开发者生产力。AWS容器工程总监表示，开发者70%的时间用于管理基础设施，EKS Capabilities将改变这一现状。服务包括Argo CD、AWS Controllers for Kubernetes和Kubernetes Resource Orchestrator三个组件，帮助客户管理可扩展的标准化Kubernetes平台。

亚马逊云服务在人工智能时代重新定义Kubernetes运营的重大举措中，今日宣布推出Amazon EKS Capabilities——一套完全托管的Kubernetes原生工具套件，将流行的开源工具直接集成到EKS控制平面中。这一发布标志着该公司在降低企业平台团队运营复杂性、提升开发者生产力方面迈出的最积极步伐之一。

在西雅图举行的re:Invent大会前独家采访中，AWS容器工程总监Eswar Bala表示，Kubernetes已悄然成为人工智能的默认控制平面，引发了在容器上运行的AI工作负载的前所未有增长。EKS Capabilities正是AWS的回应。

"如今开发者70%的时间都在管理基础设施，"他向媒体表示。"EKS Capabilities颠覆了这一模式。我们承担繁重的工作，让他们专注于构建。"

Bala说，AWS正看到由Kubernetes管理的图形处理单元使用量年增长一倍。"智能体工作负载、多模态推理、GPU批处理作业——客户希望自动化、扩展性和可靠性，这正是此次发布所提供的。"

大规模Kubernetes管理

AWS正在推出三个完全托管的组件，支持大规模Kubernetes使用。Argo CD是一个声明性GitOps系统，据AWS称，已被近一半的Kubernetes团队在生产环境中使用。AWS处理Argo CD的所有基础设施，包括升级、补丁、高可用性和扩展。

AWS Controllers for Kubernetes使组织能够通过Kubernetes应用程序编程接口直接管理AWS云资源。AWS表示它承担部署、运营和故障排除控制平面集成的任务，客户无需自行处理。

Kubernetes Resource Orchestrator让平台团队构建可重用的、有明确观点的资源包，在保持完全原生Kubernetes的同时抽象掉复杂性。

这些服务旨在帮助客户管理可扩展、标准化的Kubernetes平台，而无需构建自己的GitOps管道、资源编排层或控制集成。

"这些工具不再需要您自己安装，它们运行在AWS拥有的服务账户中，"Bala说。"我们处理扩展、补丁、升级。客户只需使用它们。"

容器在AI时代的演进

Bala表示，在过去十年中，容器的作用发生了巨大变化。从最初用于Web服务的轻量级打包，现在已成为高级AI部署的支柱。

"基础模型构建者依赖Kubernetes，"他说。"动态GPU分配、调度、大规模扩展——没有Kubernetes生态系统在过去10年中达到的成熟度，这些都无法实现。"

AWS一直在为这一转变做准备：去年12月宣布的EKS Auto Mode自动化GPU配置和大小调整；去年秋季推出的Karpenter动态扩展GPU和CPU集群工作负载；7月宣布的支持多达100000个节点的EKS Ultra Clusters支持基础模型训练和超大规模推理；引入的Amazon Q集成提供AI驱动的故障排除，AWS称可将运营任务从几天缩短到几分钟。

隐形基础设施管理

AWS表示，其目标是让Kubernetes感觉像原生AWS服务，而不是自管理生态系统。通过新的EKS Capabilities，客户团队不再需要维护Argo CD集群或ACK控制器。AWS自动更新、修补和分析兼容性问题。身份和访问管理以及单点登录集成由AWS身份中心处理。平台团队可以更轻松地模板化和标准化集群资源。开发者以声明性方式与Kubernetes交互。

Bala暗示，未来的发展将专注于面向智能体的应用架构，这需要更强的隔离性和超越标准容器的新编排模式。

"您将拥有许多智能体协同工作，"他说。"它们需要沙盒、隔离的环境。容器可能会进一步演进，或者出现全新的边界。"

他指出，生成式AI本身就是一个运行时，容器运行时与AI运行时的融合正在加速。

Amazon EKS Capabilities现已在商用AWS区域提供，无最低费用。客户仅为使用的服务付费。

突破性分析

今天的发布不仅仅是便利性更新；这是AWS对Kubernetes将支撑下一个十年AI基础设施的战略押注。通过在一个伞形结构下运营化GitOps、AWS资源API、AI驱动的故障排除和大规模GPU自动化，AWS正在将EKS从容器编排服务演进为完全托管的AI云平台。

Bala说，这一信息是明确的："下一个十年的AI将运行在高度自动化、容器原生的基础设施上。EKS Capabilities正是我们交付这一未来的方式。"

Q&A

Q1：Amazon EKS Capabilities是什么？它解决了什么问题？

A：Amazon EKS Capabilities是AWS推出的完全托管Kubernetes原生工具套件，将流行开源工具直接集成到EKS控制平面中。它主要解决开发者70%时间都在管理基础设施的问题，让AWS承担繁重工作，使开发者专注于构建应用。

Q2：EKS Capabilities包含哪些核心组件？

A：EKS Capabilities包含三个核心组件：Argo CD（声明性GitOps系统）、AWS Controllers for Kubernetes（通过Kubernetes API管理AWS云资源）、Kubernetes Resource Orchestrator（构建可重用资源包）。AWS负责所有基础设施管理，包括升级、补丁和扩展。

Q3：为什么AWS要在AI时代重新定义Kubernetes运营？

A：因为Kubernetes已成为AI的默认控制平面，AWS看到由Kubernetes管理的GPU使用量年增长一倍。智能体工作负载、多模态推理、GPU批处理作业等AI应用需要自动化、扩展性和可靠性，传统容器编排已无法满足这些需求。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

AWS推出EKS新功能以重塑Kubernetes运维应对AI工作负载激增

来源：SiliconANGLE

2025

12/02

07:43

分享

点赞

波兰小创企如何成为数十亿美元AI语音巨头

阿斯达脱离沃尔玛后SAP系统升级困境拖累财务复苏

HorizonH收购Atempo，押注Miria成为大规模数据迁移引擎

英伟达20亿美元投资新思科技强化芯片设计生态控制力

联想HPC与AI业务盈利之路充满挑战

AWS推出EKS新功能以重塑Kubernetes运维应对AI工作负载激增

HPE升级AI云产品线，集成更多英伟达技术能力

AWS推出生成式AI功能助力亚马逊Connect抢夺市场份额

Akamai收购WebAssembly无服务器计算公司Fermyon

CIO有效管理影子AI的六大策略

英国推出DaRe2THINK平台助力全科医生参与临床试验

macOS XProtect恶意软件检测清单：内置安全系统覆盖25种威胁

HPE升级AI云产品线，集成更多英伟达技术能力

Akamai收购WebAssembly无服务器计算公司Fermyon

阿里云服务器部署速度跟不上AI需求，GPU配给优先大客户

甲骨文在阿布扎比部署中东首个AI超级集群推进主权人工智能

AWS投资500亿美元为美国政府建设AI基础设施

专家建议：云迁移前先验证应用架构和必要性

Oracle巨额AI投资引发华尔街风险担忧

AWS声称其DWDM转发器技术在云服务商中属首创

Lambda获得15亿美元融资建设AI数据中心

微软推出数字标牌模式，15秒后自动隐藏蓝屏死机界面

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: