CoreWeave推出灵活AI云定价模式应对推理需求波动

新泽西AI云服务商CoreWeave推出灵活定价模式，通过"弹性预留"和"竞价实例"解决AI基础设施的核心挑战：不可预测的推理需求。该统一框架针对AI运营的不同模式：可预测的训练需求与不可预测的生产推理峰值。新模式包括预留、弹性预留、竞价和按需四种实例类型，让企业更好地平衡成本与可靠性，避免资源过度配置或流量激增时的延迟问题。

新泽西州AI云服务商CoreWeave正在推出一种灵活的定价模式，旨在解决AI基础设施面临的最大挑战之一：不可预测的推理需求。

这一新产品引入了"弹性预留"和"竞价"实例，超越了传统的预留和按需容量模式。据该公司表示，这一统一框架解决了AI运营中的独特模式：可预测的训练需求与不可预测的生产推理峰值形成对比。

"虽然AI训练周期通常是可预测的，但生产级推理却不是，"该公司在一份声明中说道。团队经常面临资源过度配置或在流量激增期间遇到延迟的困境。CoreWeave表示，新计划为可中断任务提供了成本效益的替代方案和更大的控制权。

HyperFrame Research首席执行官兼首席分析师Steven Dickens表示，CoreWeave的定价策略解决了GPU容量的一个关键问题：成本。"随着CoreWeave从为前沿模型提供商提供训练工作负载扩展到更多推理和企业部署，购买特征发生了变化，"他说。"这一公告涵盖了这种戏剧性的变化。"

AI时代的云经济学

"在生产规模上，基础设施规划与部署一样重要，"CoreWeave产品和工程执行副总裁Chen Goldberg说。"CoreWeave正在通过在关键时刻提供保证容量和在需求变化时提供灵活定价来为AI云设定标准。我们正在将云的原始承诺——规模和效率——带回给推动创新极限的AI先驱者。"

扩展模式包括：

预留：为一致工作负载提供可靠、始终可用的容量。

弹性预留：以降低的24/7持有费用提供保证的容量上限，仅在活跃期间应用完整使用率——非常适合不均匀增长的工作负载。

竞价：成本更低、容忍中断的实例，适用于批处理、分析或回填，具有清晰的抢占信号以实现干净的检查点和恢复。

按需：为增量或突发需求提供即时访问。

据CoreWeave称，这种结构让客户能够预留稳定需求、通过保证确保峰值，并卸载容错任务——更好地将成本和可靠性与实际使用模式保持一致。

云端的移动

CoreWeave的举措正值专业AI GPU云市场激烈竞争之际。AWS、Microsoft Azure和Google Cloud等超大规模云服务商提供具有竞价实例和预留选项的广泛生态系统。

Lambda Labs、RunPod、Crusoe等专业新兴云竞争对手为Nvidia H100/H200 GPU提供类似的按需、预留和竞价定价，通常强调更低的每小时费率、初创公司和研究人员更容易访问以及按秒计费或社区云等功能。

CoreWeave通过其Kubernetes原生平台、用于低延迟分布式训练的InfiniBand网络，以及现在这种将保证峰值容量与经济、可中断容量相结合的混合灵活模式来实现差异化——为可预测性和效率至关重要的大规模企业AI部署定位。

"随着AWS和Google的内部基于硅片的推理选项变得更加广泛可用，[CoreWeave灵活定价模式的]竞争定位将至关重要，"HyperFrame的Dickens说。

弹性预留目前通过CoreWeave客户团队在符合条件的地区和SKU中以预览版形式向选定客户提供，而竞价实例立即全面可用。

这一发布正值CoreWeave继续积极扩张以满足激增的AI需求之际，包括在超大规模AI基础设施领域的主要容量建设和合作伙伴关系。

分析：灵活的优势？

CoreWeave的灵活容量计划代表了竞争激烈的AI云领域的战略演进，在这个领域中，AWS、Azure和Google Cloud等超大规模云服务商主导着广泛的市场份额，但对于纯AI工作负载往往施加更高的成本和较少专业化的GPU优化。

通过引入弹性预留（以降低的持有费用保证峰值）和竞价（具有干净抢占的可中断、低成本容量），CoreWeave旨在通过其Kubernetes原生平台、InfiniBand网络和超大规模云合作伙伴关系来弥合企业级训练/推理的可预测性差距，实现经济灵活性——实现差异化。

这种混合模式可能有助于巩固CoreWeave在AI云市场的关键参与者地位，同时通过解决成本、可扩展性和GPU可用性的关键挑战，使公司能够获得更大的生产工作负载份额——为超大规模云服务商和专业新兴云提供商提供替代方案。

Q&A

Q1：CoreWeave的弹性定价模式是什么？

A：CoreWeave推出的弹性定价模式包括"弹性预留"和"竞价"实例，旨在解决AI基础设施中推理需求不可预测的问题。弹性预留以降低的24/7持有费用提供保证的容量上限，竞价实例则提供成本更低、可中断的容量，适用于批处理等任务。

Q2：这种定价模式解决了什么问题？

A：该模式解决了AI运营中训练需求可预测但生产推理需求不可预测的矛盾。企业经常面临资源过度配置或在流量激增时遇到延迟的困境，新模式让客户能够更好地将成本和可靠性与实际使用模式保持一致。

Q3：CoreWeave与其他云服务商相比有什么优势？

A：CoreWeave通过Kubernetes原生平台、InfiniBand网络进行差异化竞争，专门针对AI工作负载优化。相比AWS、Azure等超大规模云服务商的通用服务，CoreWeave提供更专业的GPU优化和更灵活的定价模式。

来源：DataCenterKnowledge

0赞

好文章，需要你的鼓励

CoreWeave推出灵活AI云定价模式应对推理需求波动

来源：DataCenterKnowledge

2026

03/11

10:48

分享

点赞

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

特斯拉在奥斯汀开始测试无方向盘无踏板Cybercab量产版

图灵奖得主Patterson：摩尔定律的真相，CPU、GPU、TPU的诞生与分工

Omdia报告：Dell PowerProtect助力企业三年期网络弹性TCO最高降低61%

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

AI助力CIO提升风险感知与数据洞察

微软推出Cowork：整合全部M365资产的统一数据存储

AI智能体两小时攻破麦肯锡聊天机器人获完全访问权限

伦敦国王学院研究：三大AI模型在95%模拟核危机中选择核升级

华为提出面向智能体的移动网络架构，构建AgentVerse生态

Render Networks推出同步智能体关键基础设施架构

基于AI的Postman API平台新增Git原生工作流

OpenAI收购Promptfoo以保障AI智能体安全

OpenAI收购Promptfoo 强化AI应用测试与安全评估能力

微软推出Microsoft 365 E7订阅计划，大幅扩展AI功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: