英国气象局庆祝其与微软合作的"超算即服务"模式运行满一周年。
这一里程碑为这家天气预报和气候预测机构提供了一个机会,阐述为何人工智能在其科学建模核心活动中处于辅助地位,以及为何云计算适合提供超级计算服务。
英国气象局的微软云超算能力于一年前启动,提供约180万个处理核心,峰值性能达到每秒约60千万亿次计算。
据报告,该系统在过去一年中关键工作负载的可用性达到100%,超算部分的可用性为99.77%。
微软通过云端远程提供类似超算的性能。但是,与现场硬件相比,延迟可能是一个问题,那么云计算为何适合提供此类服务?
根据英国气象局和微软的说法,云延迟与英国气象局总部和其以前超级计算机所在位置之间的延迟相当。
此外,他们指出,延迟只是决定是否采用云计算时考虑的一个因素。其他因素包括成本、可靠性、灵活性以及利用创新的能力,而这些在气象局设施中安装数吨重、价值数百万英镑的超级计算机时可能会受到限制。
英国气象局的工作仍然主要是基于物理学的数值天气预报和建模。因此,AI并不是看待事物的视角,而是众多工具之一,气象局首席信息官查尔斯·尤恩表示。
"人们正在挣扎,因为他们目前只通过AI这个狭窄的视角来看问题,"尤恩说。"在此之前,是云计算。AI的发展确实更快。我们不是要贬低AI及其重要性,但我们必须将AI更多地视为更广泛创新的催化剂和加速器。"
那么,如果它只是通过云提供的计算,为什么称其为超级计算机?尤恩将超级计算定义为通常用于进行科学模拟的计算,这是天气预报和气候预测生产的核心。
"我们今天使用的服务实际上是用于科学超级计算的企业级云计算。它肯定是世界上前五大CPU(中央处理器)集群之一。至少在我看来,这是唯一真正与云集成的科学超级计算机。"
虽然AI目前在科学建模中处于辅助地位,但微软Copilot和生成式AI在气象局组织中得到了更广泛的应用,并正在考虑用于科学工作,尤恩说。
"AI方法正在发展,我们正在做的工作的好处之一是,我们已经在深入规划AI方法、数据驱动方法如何与物理驱动方法或更传统的数值天气预报方法并存,以最佳组合提供两者的最佳效果。"
关于数据主权,据了解,所有气象局运营数据中心都位于英国,微软可以提供从完全连接到云到完全断开连接的主权云能力。
微软支持的云能力是气象局第14代超级计算能力。数值天气预报始于20世纪50年代初,当时首次实验性预报使用了剑桥大学的EDSAC计算机。
到1959年,气象局在其邓斯特布尔站点接收了Ferranti Mercury计算机。1965年,随着English Electric KDF9计算机抵达布拉克内尔,气象局制作了首个运营计算机预报。
在过去十年左右的时间里,气象局从2014年购买140吨重的Cray XC40系统(当时的第四台超级计算机)转向2024年选择云交付的超级计算,采用当前由微软运营的完全托管"超算即服务"模式。
Q&A
Q1:英国气象局的微软云超算系统性能如何?
A:该系统提供约180万个处理核心,峰值性能达到每秒约60千万亿次计算,是世界上前五大CPU集群之一。过去一年中,关键工作负载的可用性达到100%,超算部分的可用性为99.77%。
Q2:云超算的延迟问题会影响气象预报吗?
A:根据英国气象局和微软的说法,云延迟与气象局总部和其以前超级计算机所在位置之间的延迟相当。而且延迟只是决策因素之一,成本、可靠性、灵活性和创新能力等因素同样重要。
Q3:人工智能在英国气象局的天气预报中扮演什么角色?
A:目前AI在科学建模中处于辅助地位,气象局的工作仍主要基于物理学的数值天气预报和建模。AI被视为众多工具之一,是更广泛创新的催化剂和加速器。气象局正在规划如何将AI方法与传统物理驱动方法结合,以实现最佳效果。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。