全球最大的云服务提供商亚马逊网络服务(AWS)表示,在一次大规模故障导致包括政府机构、人工智能公司和金融平台在内的众多客户服务受损后,问题仍在持续影响其运营。
在周一表示已从数据库网络问题中基本恢复后几小时,AWS称一些用户仍在努力连接租用的服务器。该公司在其健康状况仪表板上的更新中表示,东海岸地区的多项AWS服务遭遇了网络连接问题。
"我们继续观察到所有AWS服务正在恢复,"该公司在周一下午3点15分表示。
亚马逊公司的服务支撑着互联网的大部分基础设施,约占云市场的三分之一。故障监测网站Downdetector追踪到数百个网站出现中断,包括金融服务公司Venmo和Robinhood Markets Inc.、苹果公司的Apple Music和Apple TV、软件公司如Zoom Communications Inc.、Salesforce Inc.和Snowflake Inc.、餐饮巨头麦当劳公司以及Epic Games Inc.等游戏公司。甚至亚马逊自己的服务,包括Alexa和Ring家庭安全系统,也未能幸免。
AWS表示,一个关键数据库服务的数字目录出现故障,当依赖这个广泛使用数据库的软件无法检索信息时,可能引发了连锁故障。该公司已修复了影响其美国东海岸运营的问题,这里是AWS最大的数据中心集群。亚马逊表示,一些用户在恢复过程中可能会遇到响应速度较慢或错误率增加的情况。
AWS在2021年12月曾遭遇另一次重大故障,影响了从迪士尼游乐园和Netflix视频到扫地机器人和阿黛尔演唱会门票销售的各种服务。事件发生几天后,亚马逊表示,一个旨在提高网络可靠性的自动化计算机程序导致其"大量"系统出现意外异常行为。这反过来在AWS网络上产生了大量活动,最终阻止用户访问其某些服务。当月晚些时候,这家云服务提供商又遭遇了一次较小规模的故障。
大多数主要技术系统的故障都能很快修复。然而,相互连接的技术系统意味着一家公司的问题可能对全球经济造成灾难性影响。去年,网络安全公司CrowdStrike Holdings Inc.的软件更新故障导致航班停飞并使全球系统崩溃,造成数十亿美元的损失。
Q&A
Q1:AWS这次故障的主要原因是什么?
A:AWS表示是一个关键数据库服务的数字目录出现故障,当依赖这个广泛使用数据库的软件无法检索信息时,引发了连锁故障。问题主要影响了美国东海岸地区,这里是AWS最大的数据中心集群。
Q2:这次AWS故障影响了哪些知名公司和服务?
A:受影响的包括金融服务公司Venmo和Robinhood、苹果的Apple Music和Apple TV、软件公司Zoom和Salesforce、餐饮巨头麦当劳、游戏公司Epic Games,甚至亚马逊自己的Alexa和Ring家庭安全系统也受到影响。
Q3:AWS之前发生过类似的大规模故障吗?
A:是的,AWS在2021年12月曾遭遇重大故障,影响了迪士尼游乐园、Netflix视频、扫地机器人和阿黛尔演唱会门票销售等各种服务。那次故障是由一个自动化程序引起的,该程序本来是为了提高网络可靠性。
好文章,需要你的鼓励
本文探讨了AI发展的未来趋势,详细分析了六条有望实现通用人工智能(AGI)的技术路径。随着生成式AI和大语言模型面临发展瓶颈,业界开始将目光转向其他AI发展方向。这六条路径包括神经符号AI、神经形态AI、具身AI、多智能体AI、以人为中心的AI和量子AI。每种路径都有其独特优势和挑战,可能单独或组合推动AI进入下一个发展阶段,最终实现与人类智能相当的AGI系统。
约翰霍普金斯大学研究团队发现VAR模型的马尔可夫变体本质上是离散扩散模型,提出SRDD方法。通过应用扩散模型技术如分类器自由引导、令牌重采样等,SRDD相比VAR在图像质量上提升15-20%,同时具备更好的零样本性能。这项研究架起了自回归模型与扩散模型的理论桥梁,为视觉生成技术发展开启新方向。
培生公司第三季度销售增长加速,并预示年底表现更强劲,但其AI应用可能是更重要的发展。该公司虚拟学习部门销售额激增17%,学生注册人数攀升。培生运营的在线学校将AI工具嵌入课程材料中,公司表示有越来越多证据显示这些工具帮助学生取得更好成绩。公司推出了AI学习内容组合,包括AI素养模块和融合人工导师与AI学习工具的视频平台。
微软亚洲研究院推出CAD-Tokenizer技术,首次实现AI通过自然语言指令进行3D模型设计和编辑的统一处理。该技术通过专门的CAD分词器和原语级理解机制,让AI能像设计师一样理解设计逻辑,大幅提升了设计精度和效率,有望推动工业设计的民主化进程。