春节是中国人最看重的传统节日,随着数字经济不断纵深发展,发红包、拜年等春节习俗也逐渐数字化,“数字春节”的保障工作也越来越重要。在春节期间,短视频、直播等社交媒体流量激增,这些应用场景的稳定可靠运行,离不开云服务的运维保障。
华为云自2021年11月5日起开始筹备虎年春节保障,识别了112个重点保障场景,覆盖音视频、社交资讯、出行、文旅、物流、教育等重点行业;预计将拦截外部攻击数亿次,监测平台数据每秒新增超百万条。

华为云工程师实时监测运维设备平稳运行
据预测,今年春节期间流量将出现全域爆发式增长,并且每一个行业的流量高峰点都不一样。面对不确定性的挑战,华为云SRE(站点可用性工程师)及云资源运营团队用“确定性”的运维来支撑业务高可用,通过风险挖掘评估、容量保障、实时监测等措施,构建持续韧性的竞争力,保障华为云稳定运营,让用户体验更好的优质服务。

华为河图机器人自动AI检测数据中心故障及环境信息
在容量保障方面,华为云流量精算师使用资源预测及运营数字化平台,全面对云资源进行在线预测、调度和持续运营。在算法方面,华为云后台建立模型实现多个算法结果融合,通过时序分解的算法模型库,提供面向不同业务场景的预测能力,并以仿真算法结合历史资源消耗的趋势等方面,持续优化模型提升预测结果可靠性。
针对春节的容量保障,华为云流量精算师通过数据建模、AI算法优化、客户资源画像、智能水位线、多种资源组合方案及全域调度等技术应用,提前做好预测和规划,并通过整体容量三位一体的评估,从数据中心到网络,再到算力都做好充足准备,让用户在春节流量洪峰期间也能获得优质的体验和服务。
在风险挖掘方面,一年以来,华为云SRE特战队进行了2000多次实战演练,涉及2000多名技术工程师220多个云服务,覆盖容灾、冗余、过载、数据备份、误操作等多种演练场景,全方位提升了华为云的稳定可靠、安全可信。
以除夕夜重点保障为例,基于在社交平台热搜事件、电商节日、突发情况等节点积累的专业运维保障经验,华为云专业化SRE团队以全面的运维质量管理体系,以及确定性的事件处理和恢复能力,通过风险挖掘评估、容量保障等提前注入保障机制,满足春节庞大而复杂的保障需求,通过7*24小时专业化分工,实时监测华为云的稳定运行。
华为云SRE负责人安宇表示:“整个时代面临各种不确定的挑战,IT行业高度发展且不确定性更加明显。在追求快速迭代的同时,要保障质量和效率的平衡性,SRE在这个过程中起到很大的作用。SRE希望用‘确定性’这个词,去涵盖所有的能力;‘确定性’是我们对客户的承诺,希望能够让客户有确定性的感知和体验。”
好文章,需要你的鼓励
据报道,ServiceNow正与身份管理平台初创公司Veza进行深度收购谈判,交易金额可能超过10亿美元。Veza的平台帮助企业保护员工工作账户安全,识别未使用账户和权限过度的账户,还能检测违反职责分离政策的账户。该平台还可管理机器身份和应用程序集成。此次收购将补强ServiceNow在用户账户和机器身份管理方面的功能短板。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
谷歌云发布PanyaThAI数字化转型计划,旨在帮助泰国企业部署企业级AI智能体应用。该计划首批支持15家机构,包括朱拉隆功大学、泰国证券交易所等。研究显示AI到2030年可为泰国经济贡献7300亿泰铢。计划提供全栈AI基础设施、咨询服务和员工培训,合作伙伴将培训300名本地专家。已有企业展示成果,如SE-Education通过AI语义搜索将转化率从12%提升至27%。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。