微软CEO萨蒂亚·纳德拉周四在推特上发布了一段视频,展示了公司首个部署的大规模AI系统——英伟达喜欢称之为AI"工厂"。他承诺这是将在微软Azure全球数据中心部署的"众多"英伟达AI工厂中的"第一个",用于运行OpenAI工作负载。
每个系统都是一个由超过4600台英伟达GB300机架计算机组成的集群,搭载备受追捧的Blackwell Ultra GPU芯片,并通过英伟达名为InfiniBand的超高速网络技术连接。(除了AI芯片,英伟达CEO黄仁勋还具有前瞻性地在2019年以69亿美元收购Mellanox时垄断了InfiniBand市场。)
微软承诺,随着在全球范围内推出这些系统,将部署"数十万颗Blackwell Ultra GPU"。虽然这些系统的规模令人瞩目(公司还分享了更多技术细节供硬件爱好者研究),但这一公告的时机也值得注意。
这一消息发布正值OpenAI——微软的合作伙伴兼众所周知的亦敌亦友——与英伟达和AMD签署两项备受瞩目的数据中心协议之后。据估计,OpenAI在2025年已经获得了1万亿美元的承诺来建设自己的数据中心。CEO萨姆·奥特曼本周表示,还有更多协议即将到来。
微软显然希望让世界知道,它已经拥有数据中心——在34个国家拥有超过300个数据中心——并且在"满足当今前沿AI需求"方面具有"独特优势"。公司表示,这些巨型AI系统还能够运行拥有"数百万亿参数"的下一代模型。
我们预计本月晚些时候将听到更多关于微软如何加速服务AI工作负载的消息。微软首席技术官凯文·斯科特将在TechCrunch Disrupt大会上发言,该大会将于10月27日至29日在旧金山举行。
Q&A
Q1:微软部署的AI工厂具体配置是什么?
A:每个AI工厂系统都是由超过4600台英伟达GB300机架计算机组成的集群,搭载Blackwell Ultra GPU芯片,通过英伟达InfiniBand超高速网络技术连接,微软承诺将部署数十万颗Blackwell Ultra GPU。
Q2:微软为什么在这个时候宣布AI数据中心建设?
A:这一公告正值OpenAI与英伟达和AMD签署大型数据中心协议,并获得1万亿美元承诺建设自己数据中心之后。微软希望强调自己已经在34个国家拥有超过300个数据中心的优势地位。
Q3:这些AI系统能处理多大规模的模型?
A:微软表示这些巨型AI系统能够运行拥有"数百万亿参数"的下一代模型,并且在满足当今前沿AI需求方面具有独特优势,可以有效服务OpenAI等AI工作负载。
好文章,需要你的鼓励
戴尔第三季度营收270亿美元,同比增长11%,创历史新高,主要受AI服务器需求爆发式增长推动。AI服务器订单达123亿美元,全年订单总额300亿美元。基础设施解决方案集团营收141亿美元,增长24%,其中服务器和网络业务表现强劲。存储业务营收39.8亿美元,同比下降1%,但全闪存阵列产品实现双位数增长。公司预计第四季度营收315亿美元,全年AI服务器出货量约250亿美元。
阿里巴巴达摩院联合浙江大学、香港科技大学发布Inferix,这是专为世界模拟打造的下一代推理引擎。它采用块扩散技术,像搭积木般分段生成视频,既保证高质量又支持任意长度,克服了传统方法的局限。配套LV-Bench评测基准包含1000个长视频样本,建立了分钟级视频生成的评估标准,为游戏、教育、娱乐等领域的内容创作带来革命性突破。
数据分析提供商Mixpanel遭遇安全漏洞,导致OpenAI部分API用户账户信息泄露。黑客通过短信钓鱼攻击入侵Mixpanel内部系统,获取了用户姓名、邮箱地址、位置信息及技术数据。OpenAI表示支付详情和API提示内容未受影响,用户无需重置密码,但需警惕钓鱼攻击。作为应对措施,OpenAI已移除Mixpanel服务并计划对供应商实施更严格的网络安全要求。
Luma AI推出的终端速度匹配(TVM)是一种革命性的图像生成技术,能够在单次计算中生成高质量图像,突破了传统方法需要数十步采样的限制。该技术通过关注生成路径的"终点"而非"起点",实现了从噪声到图像的直接跳跃,在保证数学理论基础的同时大幅提升了生成效率,为实时AI应用开辟了新路径。