VMware宣布对其旗舰产品Cloud Foundation(VCF)私有云套件进行更新,并通过新增功能帮助用户以更少的硬件资源运行工作负载,以此顺应当前市场需求。
今日发布的VCF 9.1在内存分层技术上进行了改进,该技术可将数据从内存转移至NVMe存储,使服务器能够以更少的内存运行。据悉,新版本优化了对冷内存页的检测能力,从而能够更频繁地将更多数据转移至NVMe存储。VMware此前已将内存分层技术定位为应对硬件价格上涨的解决方案,因为这意味着用户无需投资于大内存服务器。此次分层技术的提升有望进一步强化这一优势。
Broadcom旗下的VMware业务部门还新增了针对AI数据管道的"下一代存储压缩"功能,该功能可帮助用户降低所需存储容量,从而节省相关成本。此外,新版本还提供了一个全新的Kubernetes环境,专为快速启动轻量级测试和开发环境而设计,使企业无需为此类任务专门部署完整集群。
新版本还新增了创建多租户基础架构的功能,可对AI工作负载进行隔离,使其能够安全地运行在共享基础架构上。
VMware一贯致力于最大化硬件利用率,而AI硬件的高昂成本为其提供了展示自身专业能力的契机。VMware借此推广多租户AI方案,彰显其合作伙伴生态的价值,并再度强调在本地部署运行VCF基础架构可有效避免AI相关云端费用激增。
Broadcom VCF部门营销负责人Prashanth Shenoy在接受The Register采访时表示,客户对这一方案反响积极——VCF 9发布一年以来,已累计超过2,000套部署实例。
他表示:"在被收购之前,我们拥有的完整私有云客户不足2,000至3,000家。"VCF 9的采用速度也是VMware有史以来最快的。
然而从更宏观的视角来看,被收购前VMware拥有超过35万名客户。VMware的vSphere服务器虚拟化产品虽仍在售,但据客户向The Register反映,Broadcom除VCF之外不再提供其他产品的许可证续订服务。因此,尽管VCF销量可观,目前完成迁移的被收购前客户仍不足1%。
Shenoy认为,AI将推动更多企业采用VCF。
"随着客户从试点阶段迈向生产阶段,他们希望将计算资源向数据靠拢,"他表示,这意味着需要在本地运行大语言模型。"他们这样做是出于成本、合规性以及安全和知识产权方面的考量。"
对于尚未在任何环境中运行AI的用户,VCF 9.1新增了更多自动化配置工具,可将虚拟机和容器推送至边缘位置,同时支持更多主机的实时补丁、本地灾难恢复和勒索软件恢复工具,以及更强的可观测性工具——包括监控AI工作负载以衡量Token消耗量、追踪活跃智能体清单及其所使用模型的能力。
VMware还新增了对AMD Instinct MI350 GPU的支持,并改进了vMotion技术——该技术可无中断地将工作负载迁移至不同硬件——使AI工作负载能够在不同GPU之间实现零停机迁移。
Shenoy透露,获得VCF 9.1早期访问权限的客户认为其质量足以达到完整VCF 10.0版本的发布标准。
这一反馈颇具意义,因为VMware的竞争对手常指称Broadcom意图将客户锁定,再通过放缓创新来实现利润最大化。Shenoy认为VCF 9.1的表现有力回应了这一质疑。
但他同时也承认,许多VMware客户尚未转向VCF。"我们要求客户做出的,是一次重大的思维转变,"他说道。
Q&A
Q1:VCF 9.1在内存分层技术上有哪些改进?
A:VCF 9.1优化了对冷内存页的检测能力,使系统能够更频繁地将更多数据从内存转移至NVMe存储。这一改进意味着服务器可以用更少的内存运行,从而帮助企业降低硬件采购成本,无需投资于配置大量内存的高端服务器。
Q2:VCF 9.1新增了哪些AI相关功能?
A:VCF 9.1新增了多项AI相关功能,包括:针对AI数据管道的下一代存储压缩技术、支持多租户AI工作负载隔离、监控AI工作负载的Token消耗量、追踪活跃智能体及其使用的模型,以及支持AMD Instinct MI350 GPU。同时,改进后的vMotion技术还可实现AI工作负载在不同GPU之间的零停机迁移。
Q3:目前有多少客户在使用VCF 9?
A:自VCF 9发布一年以来,已累计超过2,000套部署实例,这是VMware历史上最快的采用速度。不过相比Broadcom收购前VMware拥有的逾35万名客户,目前完成迁移的客户比例仍不足1%,说明大多数存量客户尚未完成向VCF的转型。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
牛津、MIT等机构联合发布GauntletBench,测试显示最强AI智能体完成率仅19%,而普通人类完成率超80%,揭示AI在时间感知、图形理解和三维推理上的真实短板。