新泽西州AI云服务商CoreWeave正在推出一种灵活的定价模式,旨在解决AI基础设施面临的最大挑战之一:不可预测的推理需求。
这一新产品引入了"弹性预留"和"竞价"实例,超越了传统的预留和按需容量模式。据该公司表示,这一统一框架解决了AI运营中的独特模式:可预测的训练需求与不可预测的生产推理峰值形成对比。
"虽然AI训练周期通常是可预测的,但生产级推理却不是,"该公司在一份声明中说道。团队经常面临资源过度配置或在流量激增期间遇到延迟的困境。CoreWeave表示,新计划为可中断任务提供了成本效益的替代方案和更大的控制权。
HyperFrame Research首席执行官兼首席分析师Steven Dickens表示,CoreWeave的定价策略解决了GPU容量的一个关键问题:成本。"随着CoreWeave从为前沿模型提供商提供训练工作负载扩展到更多推理和企业部署,购买特征发生了变化,"他说。"这一公告涵盖了这种戏剧性的变化。"
AI时代的云经济学
"在生产规模上,基础设施规划与部署一样重要,"CoreWeave产品和工程执行副总裁Chen Goldberg说。"CoreWeave正在通过在关键时刻提供保证容量和在需求变化时提供灵活定价来为AI云设定标准。我们正在将云的原始承诺——规模和效率——带回给推动创新极限的AI先驱者。"
扩展模式包括:
预留:为一致工作负载提供可靠、始终可用的容量。
弹性预留:以降低的24/7持有费用提供保证的容量上限,仅在活跃期间应用完整使用率——非常适合不均匀增长的工作负载。
竞价:成本更低、容忍中断的实例,适用于批处理、分析或回填,具有清晰的抢占信号以实现干净的检查点和恢复。
按需:为增量或突发需求提供即时访问。
据CoreWeave称,这种结构让客户能够预留稳定需求、通过保证确保峰值,并卸载容错任务——更好地将成本和可靠性与实际使用模式保持一致。
云端的移动
CoreWeave的举措正值专业AI GPU云市场激烈竞争之际。AWS、Microsoft Azure和Google Cloud等超大规模云服务商提供具有竞价实例和预留选项的广泛生态系统。
Lambda Labs、RunPod、Crusoe等专业新兴云竞争对手为Nvidia H100/H200 GPU提供类似的按需、预留和竞价定价,通常强调更低的每小时费率、初创公司和研究人员更容易访问以及按秒计费或社区云等功能。
CoreWeave通过其Kubernetes原生平台、用于低延迟分布式训练的InfiniBand网络,以及现在这种将保证峰值容量与经济、可中断容量相结合的混合灵活模式来实现差异化——为可预测性和效率至关重要的大规模企业AI部署定位。
"随着AWS和Google的内部基于硅片的推理选项变得更加广泛可用,[CoreWeave灵活定价模式的]竞争定位将至关重要,"HyperFrame的Dickens说。
弹性预留目前通过CoreWeave客户团队在符合条件的地区和SKU中以预览版形式向选定客户提供,而竞价实例立即全面可用。
这一发布正值CoreWeave继续积极扩张以满足激增的AI需求之际,包括在超大规模AI基础设施领域的主要容量建设和合作伙伴关系。
分析:灵活的优势?
CoreWeave的灵活容量计划代表了竞争激烈的AI云领域的战略演进,在这个领域中,AWS、Azure和Google Cloud等超大规模云服务商主导着广泛的市场份额,但对于纯AI工作负载往往施加更高的成本和较少专业化的GPU优化。
通过引入弹性预留(以降低的持有费用保证峰值)和竞价(具有干净抢占的可中断、低成本容量),CoreWeave旨在通过其Kubernetes原生平台、InfiniBand网络和超大规模云合作伙伴关系来弥合企业级训练/推理的可预测性差距,实现经济灵活性——实现差异化。
这种混合模式可能有助于巩固CoreWeave在AI云市场的关键参与者地位,同时通过解决成本、可扩展性和GPU可用性的关键挑战,使公司能够获得更大的生产工作负载份额——为超大规模云服务商和专业新兴云提供商提供替代方案。
Q&A
Q1:CoreWeave的弹性定价模式是什么?
A:CoreWeave推出的弹性定价模式包括"弹性预留"和"竞价"实例,旨在解决AI基础设施中推理需求不可预测的问题。弹性预留以降低的24/7持有费用提供保证的容量上限,竞价实例则提供成本更低、可中断的容量,适用于批处理等任务。
Q2:这种定价模式解决了什么问题?
A:该模式解决了AI运营中训练需求可预测但生产推理需求不可预测的矛盾。企业经常面临资源过度配置或在流量激增时遇到延迟的困境,新模式让客户能够更好地将成本和可靠性与实际使用模式保持一致。
Q3:CoreWeave与其他云服务商相比有什么优势?
A:CoreWeave通过Kubernetes原生平台、InfiniBand网络进行差异化竞争,专门针对AI工作负载优化。相比AWS、Azure等超大规模云服务商的通用服务,CoreWeave提供更专业的GPU优化和更灵活的定价模式。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。