微软CEO萨蒂亚·纳德拉周四在推特上发布了一段视频,展示了公司首个部署的大规模AI系统——英伟达喜欢称之为AI"工厂"。他承诺这是将在微软Azure全球数据中心部署的"众多"英伟达AI工厂中的"第一个",用于运行OpenAI工作负载。
每个系统都是一个由超过4600台英伟达GB300机架计算机组成的集群,搭载备受追捧的Blackwell Ultra GPU芯片,并通过英伟达名为InfiniBand的超高速网络技术连接。(除了AI芯片,英伟达CEO黄仁勋还具有前瞻性地在2019年以69亿美元收购Mellanox时垄断了InfiniBand市场。)
微软承诺,随着在全球范围内推出这些系统,将部署"数十万颗Blackwell Ultra GPU"。虽然这些系统的规模令人瞩目(公司还分享了更多技术细节供硬件爱好者研究),但这一公告的时机也值得注意。
这一消息发布正值OpenAI——微软的合作伙伴兼众所周知的亦敌亦友——与英伟达和AMD签署两项备受瞩目的数据中心协议之后。据估计,OpenAI在2025年已经获得了1万亿美元的承诺来建设自己的数据中心。CEO萨姆·奥特曼本周表示,还有更多协议即将到来。
微软显然希望让世界知道,它已经拥有数据中心——在34个国家拥有超过300个数据中心——并且在"满足当今前沿AI需求"方面具有"独特优势"。公司表示,这些巨型AI系统还能够运行拥有"数百万亿参数"的下一代模型。
我们预计本月晚些时候将听到更多关于微软如何加速服务AI工作负载的消息。微软首席技术官凯文·斯科特将在TechCrunch Disrupt大会上发言,该大会将于10月27日至29日在旧金山举行。
Q&A
Q1:微软部署的AI工厂具体配置是什么?
A:每个AI工厂系统都是由超过4600台英伟达GB300机架计算机组成的集群,搭载Blackwell Ultra GPU芯片,通过英伟达InfiniBand超高速网络技术连接,微软承诺将部署数十万颗Blackwell Ultra GPU。
Q2:微软为什么在这个时候宣布AI数据中心建设?
A:这一公告正值OpenAI与英伟达和AMD签署大型数据中心协议,并获得1万亿美元承诺建设自己数据中心之后。微软希望强调自己已经在34个国家拥有超过300个数据中心的优势地位。
Q3:这些AI系统能处理多大规模的模型?
A:微软表示这些巨型AI系统能够运行拥有"数百万亿参数"的下一代模型,并且在满足当今前沿AI需求方面具有独特优势,可以有效服务OpenAI等AI工作负载。
好文章,需要你的鼓励
谷歌Agent Development Kit(ADK)革新了AI应用开发模式,采用事件驱动的运行时架构,将代理、工具和持久化状态整合为统一应用。ADK以Runner为核心,通过事件循环处理用户请求、模型调用和外部工具执行。执行逻辑层管理LLM调用和工具回调,服务层提供会话、文件存储等持久化能力。这种架构支持多步推理、实时反馈和状态管理,为构建超越简单聊天界面的生产级AI应用提供了完整框架。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
苹果在iOS 26中推出全新游戏应用,为iPhone、iPad和Mac用户提供个性化的游戏中心。该应用包含五个主要版块:主页展示最近游戏和推荐内容,Arcade专区提供超过200款无广告游戏,好友功能显示Game Center动态并支持游戏挑战,资料库可浏览已安装游戏并提供筛选选项,搜索功能支持按类别浏览。iOS 26.2版本还增加了游戏手柄导航支持,为游戏玩家提供更便捷的操作体验。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。