2025年,云计算巨头们在加速建设的同时,重写了他们的能源、网络和风险策略手册。之所以这样做,是因为GPU短缺、电网接入延迟以及AI对算力日益增长的需求,使电力成为了限制性因素。
因此,超大规模云厂商之间出现了一个定义十年的议程:以前所未有的规模进行建设,清洁可靠地为扩张提供动力,跨洋安全连接,并在产能集中和风险上升的情况下保持弹性运营。以下10个故事追踪了这一议程如何成形,以及为什么电力处于每个决策的核心。
1. 超大规模云厂商到2030年将掌控全球60%数据中心容量
超大规模云厂商正在掌控全球数据中心容量的主导份额。6月,Synergy Research Group预测,到2030年他们将持有约60%的总容量,高于目前的44%,这得益于超大规模自有基础设施至少每年20%的持续两位数增长。
建设策略已明确为两条互补路径:自有园区(尤其在美国)与从专业托管服务商租赁容量(在欧洲、中东、非洲、亚太和中国更常见)相结合。由于电力和土地现在决定可行性和时机,站点决策越来越受到电网接入、当地法规、许可审批时间和上市速度的影响。
关键要点:建设/租赁组合从根本上关乎获取电力的时间,这受到稀缺电力、缓慢的电网连接和许可摩擦的影响。
2. 全球云市场接近1000亿美元,新兴云厂商激增200%
2025年第二季度,企业云基础设施支出达到990亿美元,同比增长25%,反映了倾向于大型集中式平台的AI训练和推理工作负载浪潮。AWS(30%)、Azure(20%)和谷歌云(13%)保持领先;然而,一批"新兴云厂商"激增205%,本季度超过50亿美元。
新兴云厂商——在电力充足的次级市场建设超高密度园区的私人融资专业公司——正在获得动力,因为AI需求超过了三巨头获取电力和加速器的能力。
关键要点:当三巨头遇到电力和GPU限制时,算力会迁移到能同时获得两者的新兴云厂商。
3. AI热潮推动云增长,但三巨头面临容量限制
2024年第四季度,三巨头发布了强劲的云业绩:AWS为288亿美元(同比增长19%),微软智能云为255亿美元(增长19%),谷歌云为119.6亿美元(增长30%)。自ChatGPT推出以来,Synergy估计约一半的新云收入来自生成式AI和GPU密集型服务。这种组合有利于规模化,但也暴露了硬件和电力设定的上限。
为了跟上步伐,服务提供商倾向于架构优化、效率改进和积极的建设。即便如此,芯片、电网互连和许可最终决定了新容量上线的速度。
关键要点:对算力的需求持续攀升,但加速器和兆瓦决定了容量增加的速度。
4. 分析师警告AI数据中心重塑行业带来过度建设风险
穆迪5月的一份报告警告称,AI驱动的数据中心热潮带来了更高的信贷和过度建设风险。报告强调了向千兆瓦级"AI工厂"园区的转变,机架密度激增(AI机架通常超过200千瓦),以及超大规模云厂商在不确定性和快速技术变革中不断修订容量计划。电力供应成为主要瓶颈,促使开发转向偏远的电力丰富地点、与公用事业公司直接合作以及现场发电。为了控制财务风险,开发商依赖预租赁和分阶段建设。
关键要点:如果没有严格的电力采购和风险分担融资,数据中心热潮可能会导致过度建设和信贷压力。
5. 谷歌公布90亿美元弗吉尼亚数据中心投资计划
8月,谷歌承诺投资90亿美元扩展弗吉尼亚州的云和AI基础设施,包括在切斯特菲尔德县建设新数据中心,并在劳登县和威廉王子县扩建。该投资是更广泛的北美计划的一部分,包括未来两年在俄克拉荷马州斯蒂尔沃特投资90亿美元建设园区、在俄勒冈州达尔斯扩建6亿美元,以及在美国各地开展多项低碳电力项目。
关键要点:将园区扩张与低碳供应联系起来,标志着从"找到土地就建设"转向"先确保兆瓦,再建设"的转变。
6. 科技巨头向太阳能投入数十亿美元以应对数据中心电网压力
美国数据中心热潮必须应对更新的联邦清洁能源政策和地方选址障碍,这加剧了对可靠、低成本可再生能源的争夺。包括微软、Meta和亚马逊在内的超大规模云厂商通过创纪录的太阳能采购来锁定长期供应和价格。
关键要点:大规模太阳能交易反映了向直接电力策略的转变,而不仅仅是从电网购买。
7. 数据中心建设热潮:2025年将新增10吉瓦容量
进入2025年,仲量联行预计约10吉瓦新容量将开始建设,7吉瓦将完工,其中北美为3.3吉瓦。AI算力强度的提升正推动新建项目转向成本更低、电力充足的次级市场,那里的互连更快,土地更充裕。
关键要点:AI需求和电力限制正将新建项目引向电力丰富的次级市场。
8. 北弗吉尼亚和北京引领全球超大规模数据中心增长
目前仅20个都市区就拥有全球62%的超大规模容量,其中北弗吉尼亚和大北京地区占近五分之一。在亚马逊、微软、谷歌和Meta的推动下,美国仍占主导地位。北弗吉尼亚展示了这一公式:相对低成本的电力、密集的连接、有针对性的激励措施以及简化的审批流程,这些都缩短了获取电力的时间。
关键要点:容量集中在电力可靠且价格合理、选址政策宽松的地点。
9. AWS宕机暴露对美国云巨头"危险"的过度依赖
10月20日,AWS美国东部-1区(北弗吉尼亚)的一次宕机中断了全球客户数小时的服务,暴露了对少数主导云巨头集中依赖的风险。AWS将事故追溯到EC2网络健康监视器的故障。鉴于AWS的渗透率——超过90%的财富100强公司使用——故障会迅速传播到供应链和第三方服务。
关键要点:这一事件加剧了对弹性架构和供应链多元化的呼吁。
10. 海底光缆市场扩张,AI和地缘政治重塑全球网络
预计海底光缆投资至少将保持强劲到2029年,受AI和云流量以及国家韧性目标的推动。超大规模云厂商正在共同投资专用高容量路由,以服务云工作负载、AI应用和内容交付,同时加固登陆站和关键设备。安全问题现在涵盖物理破坏、意外损坏、网络威胁以及随着量子计算进步可能出现的加密漏洞。
关键要点:随着流量增长和地缘政治风险上升,海底光缆既是战略生命线,也是脆弱点。
纵观2025年,电力供应仍然是影响所有其他决策的摩擦点。在未来一年,预计领导者将锁定可靠的按需电力和现场发电;在次级市场培育新集群以稀释地理集中度;并扩大海底光缆投资,使登陆点多元化并试验量子安全保护。如果说2025年是关于扩大规模,我们可以预期2026年将专注于保障这一规模。
Q&A
Q1:超大规模云厂商为什么要重新思考电力策略?
A:因为GPU短缺、电网接入延迟以及AI对算力日益增长的需求,使电力成为了限制性因素。当AI需求超过云巨头获取电力和加速器的能力时,电力供应成为主要瓶颈,影响了数据中心的建设时机和选址决策,促使他们从根本上改变能源、网络和风险策略。
Q2:新兴云厂商为什么能实现200%的增长?
A:新兴云厂商是在电力充足的次级市场建设超高密度园区的私人融资专业公司。当AWS、Azure和谷歌云三巨头遇到电力和GPU限制时,AI算力需求会迁移到这些能同时获得电力和加速器的新兴云厂商,因此它们在2025年第二季度实现了205%的激增,超过50亿美元。
Q3:AWS宕机事件暴露了什么问题?
A:2025年10月20日,AWS美国东部-1区的宕机事件暴露了对少数主导云巨头过度依赖的风险。由于AWS被超过90%的财富100强公司使用,EC2网络健康监视器的故障导致全球客户服务中断数小时,故障迅速传播到供应链和第三方服务,这一事件加剧了对弹性架构和供应链多元化的呼吁。
好文章,需要你的鼓励
据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
各行业企业存储的数据量持续攀升,5PB以上已成常态,10PB以上也日益普遍。2026年非结构化数据管理的主题是全面增长:更多数据、更多投资、更多痛点以及更多AI安全风险。AI应用加速普及、数字化信息激增以及富媒体和传感器数据大幅增加推动了数据增长。随着AI推理应用的发展,企业将意识到非结构化数据管理对AI投资回报率的关键作用。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。