据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
亚马逊宣布重大人事调整,实用计算高级副总裁Peter DeSantis将接管AGI组织,直接向CEO Andy Jassy汇报。DeSantis将带领Annapurna Labs芯片业务和量子计算团队加入该组织。此举旨在将AI相关业务整合为全公司战略,而非仅限于AWS。亚马逊押注垂直整合策略,通过控制芯片和模型实现端到端优化。著名AI研究员Pieter Abbeel被任命为前沿模型研究团队负责人,结合亚马逊庞大的仓储机器人部署优势,有望在具身智能领域取得突破。
AI聊天机器人虽然便捷,但存在诸多安全隐患。用户与聊天机器人分享的个人信息不受隐私保护,对话记录可能被搜索引擎索引。专家建议:将聊天机器人视为公共环境,避免透露敏感个人信息;不要过度分享心理状态和健康问题;关闭记忆功能并定期导出数据;对AI生成内容保持怀疑并核实信息;警惕冒充客服的钓鱼诈骗;启用双因素认证;重要问题应向真人倾诉而非AI;避免过度依赖AI以防思维能力退化。
普渡大学宣布从2026年秋季起,要求新入学本科生必须达到"AI工作能力"标准才能毕业。该要求是学校AI战略的一部分,旨在确保毕业生具备充足就业机会。学校已与微软等科技公司合作提供AI工具,并举办AI学院培训教师。教师们对此反应不一,既认可培养学生AI素养的必要性,但也担心具体实施细节不明确,可能成为官僚障碍而非教育资产。
谷歌发布基于Gemini 3的快速低成本模型Flash,并将其设为Gemini应用和AI搜索的默认模型。新模型在多项基准测试中表现优异,在MMMU-Pro多模态推理测试中得分81.2%超越所有竞品。该模型已向全球用户开放,并通过Vertex AI和API向企业及开发者提供服务。定价为每百万输入token 0.5美元,输出token 3美元,速度比2.5 Pro快三倍且更节省token用量。
2025年,GPU短缺、电网连接延迟及AI计算需求激增使电力成为云计算发展的限制因素。超大规模云厂商加速建设的同时重写了能源、网络和风险策略。预计到2030年,超大规模云厂商将控制全球60%的数据中心容量。AI工厂园区规模达吉瓦级,机架密度超200千瓦,电力供应成为首要瓶颈。云巨头通过大规模太阳能采购、次级市场建设和海底光缆投资来应对。电力可用性成为塑造所有决策的核心摩擦点。
英伟达凭借其利润丰厚的硬件业务,成为唯一能够免费提供AI模型的公司。在OpenAI、谷歌等竞争对手纷纷转向闭源模型之际,英伟达加大了对开源Nemotron模型的投入。最新发布的Nemotron 3采用混合Mamba-Transformer架构和专家混合模型,推出Nano、Super和Ultra三个版本,参数规模从30亿到500亿不等,在推理速度和准确性上均有显著提升,展现了英伟达从芯片到软件栈的全栈整合战略。
AI语音平台Retell AI发布质检解决方案Retell Assure,可监控通话、识别问题并减少人工抽检需求。该系统使用多模型分析每通电话的延迟、中断、幻觉和客户情绪等指标,自动标记故障并提供改进建议。目前企业仍依赖人工审核AI表现,难以应对大规模通话量。Retell认为多数AI故障源于配置不当而非模型限制,其质检系统可形成持续训练循环。加拿大电动汽车充电公司Switch Energy使用该平台后,月处理8000通电话的成本降低50%,响应时间从数分钟缩短至5秒。
法国AI初创公司Bioptomus推出新一代临床生物AI模型H-Optimus-1和全球首个通用多模态生物医学研究基础模型M-Optimus。H-Optimus-1在组织分析领域取得突破,可辅助疾病识别。M-Optimus整合全球最大专有数据集,涵盖数百万患者、50多种器官类型数据,能够创建数字孪生体预测疾病进展和治疗反应,加速药物设计并大幅降低临床试验成本和时间。该模型现已在AWS SageMaker平台开放使用。
2025年成为可穿戴技术的转折之年。过去十年,该领域主要聚焦健康健身,但今年科技公司纷纷将可穿戴设备定位为AI载体。智能眼镜被重新命名为"AI眼镜",Meta、谷歌等巨头强调AI交互才是核心卖点。市场还涌现出AI吊坠、AI别针等随身监听设备。三星、苹果、Garmin等品牌也在智能手表中加入AI功能。业界认为可穿戴设备是唯一能保证全天候贴身存在的计算设备,成为AI助手的理想载体。
甲骨文、微软、Meta等云计算巨头未来将投入5000亿美元租赁数据中心,反映行业对人工智能的巨额押注。甲骨文承诺最高达2480亿美元,其中仅去年11月单季就签约1500亿美元,主要用于支撑OpenAI模型训练部署。与亚马逊、微软相比,甲骨文云业务规模较小但单一客户风险集中。Meta承诺租赁支出达580亿美元,是一年前的三倍。这些租赁成本独立于资本支出统计,六家公司过去四季度资本开支达3720亿美元。
YouTube Gaming宣布推出Playables Builder开放测试版,允许特定创作者使用基于Gemini 3的原型网页应用制作小型游戏,无需编程知识。该工具类似于Google Labs的Disco和GenTabs项目,通过自然语言输入生成交互式内容。尽管AI助手能帮助用户无需技术知识即可创作,但优秀游戏需要技巧、迭代和专业知识才能打造真正有趣的体验。
英伟达凭借其庞大的硬件业务利润,成为唯一能够承担免费提供AI模型成本的公司。随着OpenAI、Anthropic等专有模型制造商竞争加剧,Meta考虑转向封闭模型,英伟达却加倍投入开源Nemotron模型。公司可以成本价获得任何规模的AI集群进行训练,其AI Enterprise软件栈年费仅4500美元。新发布的Nemotron 3采用混合专家架构,结合Mamba-Transformer技术,显著提升推理效率和内存使用率。
OpenAI推出全新旗舰图像生成模型GPT Image 1.5,具备更强的指令理解能力、精准图片编辑功能,生成速度提升四倍。新模型在修改现有照片方面表现出色,支持实用的照片编辑、逼真的服装发型试穿效果,以及保持原图精髓的风格滤镜和概念转换。ChatGPT侧边栏新增专用图像标签页,提供预设滤镜和热门提示。OpenAI将此定位为企业级实用工具,从新奇图像生成转向实用高保真视觉创作。
普渡大学和佐治亚理工学院研究人员提出采用脑启发算法构建AI计算机架构的新方法。研究显示,传统冯·诺依曼架构中处理器与内存分离造成数据传输瓶颈,随着AI模型规模四年内增长5000倍,能耗问题日益严重。研究团队建议采用脉冲神经网络和存内计算技术,将处理和存储功能集成,突破"内存墙"限制,显著降低AI模型能耗,使AI设备更适用于医疗、交通和无人机等实际应用场景。
OpenAI推出ChatGPT Images新版本GPT Image 1.5,承诺更好的指令遵循、更精确的编辑功能和高达4倍的图像生成速度。该模型面向所有ChatGPT用户和API开放。这是OpenAI在CEO奥特曼宣布"红色警报"后与谷歌Gemini竞争的最新升级。新模型提供后期制作功能,支持更精细的编辑控制,能在编辑过程中保持面部相似度、光照、构图和色调的视觉一致性,解决了传统AI图像工具迭代编辑时缺乏一致性的问题。
Zoom推出AI Companion 3.0,采用联邦AI架构结合自研模型与OpenAI、Anthropic等第三方大语言模型。新版本具备智能工作流、对话式工作界面等功能,可将会议对话转化为洞察、进度跟踪和文档内容。系统支持加密传输,不使用客户内容训练模型。用户可通过ai.zoom.us访问,或以每月10美元独立购买。
根据Cloudflare 2025年度报告,ChatGPT的爬虫GPTBot是互联网上被阻止最多的机器人,而其最大竞争对手谷歌则是最被允许的爬虫。报告显示,非人类机器人现占互联网流量的56.5%,其中AI服务爬虫增长最快。不同网站对爬虫态度各异,一些希望获得流量,另一些则认为机器人在未给予充分补偿的情况下获取价值。在爬取与推荐比率方面,Anthropic的表现最差,达到10万比1。
英伟达发布三款全新开源权重模型Nemotron,包括Nano、Super和Ultra三个版本,参数量分别为300亿、1000亿和5000亿。这些模型采用混合潜在专家架构,结合Mamba-2和Transformer技术,支持百万token上下文窗口,可在企业硬件上高效运行。英伟达还将开源训练数据和强化学习环境,帮助企业定制化模型。
Meta发布新款SAM Audio模型,能够通过文本、时间段标记和视频视觉选择等多种提示方式分离和编辑音频。该模型可从歌曲中提取特定乐器声音,或从录音中去除背景噪音,大幅减少传统音频编辑的手工操作。Meta声称这是首个统一的多模态音频分离模型,已在Segment Anything平台上线并开放下载。