CoreWeave推出灵活AI云定价模式应对推理需求波动

新泽西AI云服务商CoreWeave推出灵活定价模式,通过"弹性预留"和"竞价实例"解决AI基础设施的核心挑战:不可预测的推理需求。该统一框架针对AI运营的不同模式:可预测的训练需求与不可预测的生产推理峰值。新模式包括预留、弹性预留、竞价和按需四种实例类型,让企业更好地平衡成本与可靠性,避免资源过度配置或流量激增时的延迟问题。

新泽西州AI云服务商CoreWeave正在推出一种灵活的定价模式,旨在解决AI基础设施面临的最大挑战之一:不可预测的推理需求。

这一新产品引入了"弹性预留"和"竞价"实例,超越了传统的预留和按需容量模式。据该公司表示,这一统一框架解决了AI运营中的独特模式:可预测的训练需求与不可预测的生产推理峰值形成对比。

"虽然AI训练周期通常是可预测的,但生产级推理却不是,"该公司在一份声明中说道。团队经常面临资源过度配置或在流量激增期间遇到延迟的困境。CoreWeave表示,新计划为可中断任务提供了成本效益的替代方案和更大的控制权。

HyperFrame Research首席执行官兼首席分析师Steven Dickens表示,CoreWeave的定价策略解决了GPU容量的一个关键问题:成本。"随着CoreWeave从为前沿模型提供商提供训练工作负载扩展到更多推理和企业部署,购买特征发生了变化,"他说。"这一公告涵盖了这种戏剧性的变化。"

AI时代的云经济学

"在生产规模上,基础设施规划与部署一样重要,"CoreWeave产品和工程执行副总裁Chen Goldberg说。"CoreWeave正在通过在关键时刻提供保证容量和在需求变化时提供灵活定价来为AI云设定标准。我们正在将云的原始承诺——规模和效率——带回给推动创新极限的AI先驱者。"

扩展模式包括:

预留:为一致工作负载提供可靠、始终可用的容量。

弹性预留:以降低的24/7持有费用提供保证的容量上限,仅在活跃期间应用完整使用率——非常适合不均匀增长的工作负载。

竞价:成本更低、容忍中断的实例,适用于批处理、分析或回填,具有清晰的抢占信号以实现干净的检查点和恢复。

按需:为增量或突发需求提供即时访问。

据CoreWeave称,这种结构让客户能够预留稳定需求、通过保证确保峰值,并卸载容错任务——更好地将成本和可靠性与实际使用模式保持一致。

云端的移动

CoreWeave的举措正值专业AI GPU云市场激烈竞争之际。AWS、Microsoft Azure和Google Cloud等超大规模云服务商提供具有竞价实例和预留选项的广泛生态系统。

Lambda Labs、RunPod、Crusoe等专业新兴云竞争对手为Nvidia H100/H200 GPU提供类似的按需、预留和竞价定价,通常强调更低的每小时费率、初创公司和研究人员更容易访问以及按秒计费或社区云等功能。

CoreWeave通过其Kubernetes原生平台、用于低延迟分布式训练的InfiniBand网络,以及现在这种将保证峰值容量与经济、可中断容量相结合的混合灵活模式来实现差异化——为可预测性和效率至关重要的大规模企业AI部署定位。

"随着AWS和Google的内部基于硅片的推理选项变得更加广泛可用,[CoreWeave灵活定价模式的]竞争定位将至关重要,"HyperFrame的Dickens说。

弹性预留目前通过CoreWeave客户团队在符合条件的地区和SKU中以预览版形式向选定客户提供,而竞价实例立即全面可用。

这一发布正值CoreWeave继续积极扩张以满足激增的AI需求之际,包括在超大规模AI基础设施领域的主要容量建设和合作伙伴关系。

分析:灵活的优势?

CoreWeave的灵活容量计划代表了竞争激烈的AI云领域的战略演进,在这个领域中,AWS、Azure和Google Cloud等超大规模云服务商主导着广泛的市场份额,但对于纯AI工作负载往往施加更高的成本和较少专业化的GPU优化。

通过引入弹性预留(以降低的持有费用保证峰值)和竞价(具有干净抢占的可中断、低成本容量),CoreWeave旨在通过其Kubernetes原生平台、InfiniBand网络和超大规模云合作伙伴关系来弥合企业级训练/推理的可预测性差距,实现经济灵活性——实现差异化。

这种混合模式可能有助于巩固CoreWeave在AI云市场的关键参与者地位,同时通过解决成本、可扩展性和GPU可用性的关键挑战,使公司能够获得更大的生产工作负载份额——为超大规模云服务商和专业新兴云提供商提供替代方案。

Q&A

Q1:CoreWeave的弹性定价模式是什么?

A:CoreWeave推出的弹性定价模式包括"弹性预留"和"竞价"实例,旨在解决AI基础设施中推理需求不可预测的问题。弹性预留以降低的24/7持有费用提供保证的容量上限,竞价实例则提供成本更低、可中断的容量,适用于批处理等任务。

Q2:这种定价模式解决了什么问题?

A:该模式解决了AI运营中训练需求可预测但生产推理需求不可预测的矛盾。企业经常面临资源过度配置或在流量激增时遇到延迟的困境,新模式让客户能够更好地将成本和可靠性与实际使用模式保持一致。

Q3:CoreWeave与其他云服务商相比有什么优势?

A:CoreWeave通过Kubernetes原生平台、InfiniBand网络进行差异化竞争,专门针对AI工作负载优化。相比AWS、Azure等超大规模云服务商的通用服务,CoreWeave提供更专业的GPU优化和更灵活的定价模式。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2026

03/11

10:48

分享

点赞

邮件订阅