亚马逊云服务在人工智能时代重新定义Kubernetes运营的重大举措中,今日宣布推出Amazon EKS Capabilities——一套完全托管的Kubernetes原生工具套件,将流行的开源工具直接集成到EKS控制平面中。这一发布标志着该公司在降低企业平台团队运营复杂性、提升开发者生产力方面迈出的最积极步伐之一。
在西雅图举行的re:Invent大会前独家采访中,AWS容器工程总监Eswar Bala表示,Kubernetes已悄然成为人工智能的默认控制平面,引发了在容器上运行的AI工作负载的前所未有增长。EKS Capabilities正是AWS的回应。
"如今开发者70%的时间都在管理基础设施,"他向媒体表示。"EKS Capabilities颠覆了这一模式。我们承担繁重的工作,让他们专注于构建。"
Bala说,AWS正看到由Kubernetes管理的图形处理单元使用量年增长一倍。"智能体工作负载、多模态推理、GPU批处理作业——客户希望自动化、扩展性和可靠性,这正是此次发布所提供的。"
大规模Kubernetes管理
AWS正在推出三个完全托管的组件,支持大规模Kubernetes使用。Argo CD是一个声明性GitOps系统,据AWS称,已被近一半的Kubernetes团队在生产环境中使用。AWS处理Argo CD的所有基础设施,包括升级、补丁、高可用性和扩展。
AWS Controllers for Kubernetes使组织能够通过Kubernetes应用程序编程接口直接管理AWS云资源。AWS表示它承担部署、运营和故障排除控制平面集成的任务,客户无需自行处理。
Kubernetes Resource Orchestrator让平台团队构建可重用的、有明确观点的资源包,在保持完全原生Kubernetes的同时抽象掉复杂性。
这些服务旨在帮助客户管理可扩展、标准化的Kubernetes平台,而无需构建自己的GitOps管道、资源编排层或控制集成。
"这些工具不再需要您自己安装,它们运行在AWS拥有的服务账户中,"Bala说。"我们处理扩展、补丁、升级。客户只需使用它们。"
容器在AI时代的演进
Bala表示,在过去十年中,容器的作用发生了巨大变化。从最初用于Web服务的轻量级打包,现在已成为高级AI部署的支柱。
"基础模型构建者依赖Kubernetes,"他说。"动态GPU分配、调度、大规模扩展——没有Kubernetes生态系统在过去10年中达到的成熟度,这些都无法实现。"
AWS一直在为这一转变做准备:去年12月宣布的EKS Auto Mode自动化GPU配置和大小调整;去年秋季推出的Karpenter动态扩展GPU和CPU集群工作负载;7月宣布的支持多达100000个节点的EKS Ultra Clusters支持基础模型训练和超大规模推理;引入的Amazon Q集成提供AI驱动的故障排除,AWS称可将运营任务从几天缩短到几分钟。
隐形基础设施管理
AWS表示,其目标是让Kubernetes感觉像原生AWS服务,而不是自管理生态系统。通过新的EKS Capabilities,客户团队不再需要维护Argo CD集群或ACK控制器。AWS自动更新、修补和分析兼容性问题。身份和访问管理以及单点登录集成由AWS身份中心处理。平台团队可以更轻松地模板化和标准化集群资源。开发者以声明性方式与Kubernetes交互。
Bala暗示,未来的发展将专注于面向智能体的应用架构,这需要更强的隔离性和超越标准容器的新编排模式。
"您将拥有许多智能体协同工作,"他说。"它们需要沙盒、隔离的环境。容器可能会进一步演进,或者出现全新的边界。"
他指出,生成式AI本身就是一个运行时,容器运行时与AI运行时的融合正在加速。
Amazon EKS Capabilities现已在商用AWS区域提供,无最低费用。客户仅为使用的服务付费。
突破性分析
今天的发布不仅仅是便利性更新;这是AWS对Kubernetes将支撑下一个十年AI基础设施的战略押注。通过在一个伞形结构下运营化GitOps、AWS资源API、AI驱动的故障排除和大规模GPU自动化,AWS正在将EKS从容器编排服务演进为完全托管的AI云平台。
Bala说,这一信息是明确的:"下一个十年的AI将运行在高度自动化、容器原生的基础设施上。EKS Capabilities正是我们交付这一未来的方式。"
Q&A
Q1:Amazon EKS Capabilities是什么?它解决了什么问题?
A:Amazon EKS Capabilities是AWS推出的完全托管Kubernetes原生工具套件,将流行开源工具直接集成到EKS控制平面中。它主要解决开发者70%时间都在管理基础设施的问题,让AWS承担繁重工作,使开发者专注于构建应用。
Q2:EKS Capabilities包含哪些核心组件?
A:EKS Capabilities包含三个核心组件:Argo CD(声明性GitOps系统)、AWS Controllers for Kubernetes(通过Kubernetes API管理AWS云资源)、Kubernetes Resource Orchestrator(构建可重用资源包)。AWS负责所有基础设施管理,包括升级、补丁和扩展。
Q3:为什么AWS要在AI时代重新定义Kubernetes运营?
A:因为Kubernetes已成为AI的默认控制平面,AWS看到由Kubernetes管理的GPU使用量年增长一倍。智能体工作负载、多模态推理、GPU批处理作业等AI应用需要自动化、扩展性和可靠性,传统容器编排已无法满足这些需求。
好文章,需要你的鼓励
微软在年度Build开发者大会上一次性发布7款AI新模型,涵盖推理、编程、图像生成、语音及转录等多个领域。其中首款推理模型MAI-Thinking-1拥有350亿参数,基于商业授权数据训练,在盲测中击败Anthropic Sonnet 4.61;编程模型MAI-Code-1已上线Copilot与VS Code。微软还宣布与梅奥诊所合作,共同开发医疗领域前沿AI模型。
这项研究提出GASP框架,将几何先验直接注入视觉语言模型的变换器层,无需三维问答数据即可大幅提升AI的空间推理能力。
微软在Build 2026大会上宣布,其多模型智能安全扫描系统MDASH已从私有预览升级为扩展预览,并整合进企业级安全控制平台,连接Defender、GitHub Code Security、Agent 365及Purview。MDASH通过100余个专用AI代理协同运作,聚焦可利用漏洞的优先排序,有效降低安全告警噪声。该系统在CyberGym基准测试中得分已达96.55%,标志着AI漏洞发现正式进入企业级生产部署阶段。
阿里Qwen团队发布Qwen-VLA,一套模型同时驾驭机器人抓取、室内导航与视觉理解,通过具身感知提示词统一多平台控制,多项基准超越专科模型。