亚马逊云服务(AWS)正在调查其中东(阿联酋)地区发生的重大服务中断事件,起因是"不明物体"撞击了数据中心设施,引发火灾并导致电力系统关闭。
服务中断详情
3月1日的状态更新中,AWS表示:"大约在太平洋标准时间凌晨4:30,我们的一个可用区(mec1-az2)遭到物体撞击,产生火花并引发火灾。消防部门在扑灭火灾的过程中关闭了设施的电力供应和发电机。"
这次中断最初影响了ME-CENTRAL-1地区的单个可用区,导致EC2实例、EBS卷和RDS数据库无法使用,并使其他服务的错误率升高。AWS表示,在多个可用区冗余运行工作负载的客户未受影响。
后续更新确认,局部电力问题还影响了另一个可用区(mec1-az3),而剩余区域(mec1-az1)的客户报告了EC2 API错误增加和实例启动失败的问题。
截至发稿时,AWS表示无法在该地区启动新实例,但未受影响区域中的现有实例仍在正常运行。
受影响的AWS服务
在事件最严重时,AWS列出亚马逊弹性计算云(EC2)服务中断,包括Amazon DynamoDB、Amazon Cognito和Amazon关系数据库服务(RDS)在内的服务出现性能下降。
近60项额外服务被标记为受影响,包括AWS Lambda、Amazon简单存储服务(S3)、Amazon弹性Kubernetes服务(EKS)、Amazon Redshift和Amazon CloudWatch。
AWS建议客户尽可能使用备用可用区或故障转移到其他地区。公司表示电力恢复和完全修复需要数小时时间。
另外,AWS还报告了ME-SOUTH-1(巴林)地区的连接和API错误率问题,单个可用区的局部电力问题导致包括EC2和RDS在内的50多项服务出现错误增加。AWS表示正在将流量从受影响区域重新路由。
原因调查中
AWS尚未提供关于其状态更新中提及的"物体"的更多详细信息,也未将此次事件归因于任何外部行为者。公司将此次中断描述为物体撞击设施引发火灾后导致的局部电力问题。
这似乎是AWS自2025年10月以来最严重的服务中断,当时该公司位于北弗吉尼亚州的US-EAST-1地区发生运营问题,导致全球服务中断数小时。
这是一个正在发展的事件,数据中心知识网将在获得更多信息时更新此文章。
Q&A
Q1:AWS中东数据中心发生了什么事故?
A:AWS中东(阿联酋)地区的数据中心遭到不明物体撞击,引发火灾。消防部门为扑灭火灾关闭了设施的电力供应和发电机,导致大规模服务中断。事故发生在太平洋标准时间凌晨4:30左右。
Q2:这次AWS中断影响了哪些服务?
A:主要影响了Amazon EC2服务中断,Amazon DynamoDB、Amazon Cognito、Amazon RDS等服务性能下降。总共近60项服务受到影响,包括AWS Lambda、Amazon S3、Amazon EKS、Amazon Redshift和Amazon CloudWatch等。
Q3:用户如何应对AWS中东地区服务中断?
A:AWS建议客户尽可能使用备用可用区或故障转移到其他地区。在多个可用区冗余运行工作负载的客户未受影响,但无法在该地区启动新实例。AWS表示电力恢复和完全修复需要数小时时间。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。