12月29日,由开放数据中心委员会(ODCC)主办的数据中心算力大会在北京成功举办,围绕加速释放数据中心算力进行专场研讨。会上,华为云云原生基础设施架构师马达从数据中心级创新的视角,解读基于擎天架构打造“以应用为中心”的云原生基础设施,让算力极致释放。

华为云云原生基础设施架构师马达进行主题演讲
“算力,作为数字经济时代的全新生产力,其需求量、精细度、性能水平等都随着云、AI、5G技术的发展提出更高要求。”马达表示,“华为云擎天架构通过数据中心级创新,让算力与应用负载更好匹配,为企业提供极致成本、极致性能、极致体验的云原生算力。”
数据中心级创新,擎天架构加速算力释放
随着摩尔定律接近极限,通过晶体管密度增加的红利不再,关键技术的工艺正面临着挑战。在这种情况下,无论CPU、内存、存储或是网卡,单个部件的优化将无法满足业务发展诉求。华为云擎天架构作为华为云基础设施技术底座,包含数据面“软硬协同系统”和管控面“瑶光智慧云脑”两部分,为企业提供硬核性能、极致稳定、多样性算力、云边端协同的云基础设施。

擎天架构的数据面针对L0/L1/L2进行垂直优化,打造的极简数据中心让计算密度提升2倍、交付效率提升4倍,并通过液冷实现高功耗CPU散热、降低PUE。通过深度软硬协同,华为云打造了“擎天卡”,实现计算、存储、网络、安全的全卸载与加速能力,提供低至100μs存储时延与10μs网络时延。
擎天架构的管控面瑶光智慧云脑,作为面向“云、AI、5G”时代打造的分布式云操作系统,实现资源全域调度、动态协商与治理、多样性算力智能匹配等能力,让全域资源供给极优,多样性算力使用极简。
基于擎天架构,打造“以应用为中心”的云原生基础设施
基于擎天架构,华为云将原有基础设施全面升级为“以应用为中心”的云原生基础设施,为应用提供更好的性能、更有机的协同,以及更完整的应用生命周期管理。
1.重定义基础设施,让应用性能更好:业界独家实现“容器卸载”的裸金属容器,让资源100%用于业务处理,客户资源成本节约30%,网络性能提升40%,相同规格集群业务处理性能提升2倍;国内首家Serverless容器,能够30s扩容1千容器实例,快速释放算力,帮助企业轻松应对高并发、高流量冲击的业务突发场景;
2.新赋能泛在应用,让应用协同更好:云原生开放、标准的特质使其成为构建企业泛在、统一计算平台的最佳选择。华为云通过业界领先的云原生集群联邦技术、边云协同操作系统,为企业打造高效、高可靠的泛在计算平台,实现应用在公有云、混合云、边缘云等形态下的有机协同。同时,基于擎天架构,以容器为主,构建包括容器、裸机、虚机、函数多种资源的统一计算平台,让传统应用与云原生应用能协同得更好,实现企业业务立而不破;
3.再升级应用架构,让应用生命周期管理更好:对于运行态的应用,华为云原生基础设施向上通过Volcano感知应用SLA,实现高效批量调度,向下通过瑶光智慧云脑为应用匹配最佳算力,实现应用与资源的高效协同。更可通过非侵入式服务网格与完善的云原生监控体系,为企业提供全网应用拓扑视图、调用链追踪及实时故障管理,实现应用的全方位在线治理。
引领云原生2.0时代,赋能“新云原生企业”
作为云原生2.0的基础底座,华为云原生基础设施支撑了四大云原生解决方案:云原生裸金属容器解决方案、云原生高性能计算解决方案、云原生混合云解决方案以及云原生边缘计算解决方案,各方案已广泛服务于泛互联网、金融、汽车、生物等十多个行业。在数字化程度最为领先的互联网行业,云原生裸金属容器解决方案帮助以美图、华为商城VMALL为代表的典型互联网企业,构建了极致性能和灵活弹性的基础设施,帮助华为商城业务性能提升2倍,成本节约30%,且依托秒级扩容1000容器的能力,可更好应对突发流量洪峰。华为提倡以多样性算力,创造互联网的极致体验。多样性算力,一方面指算力的支撑形式既有通用计算也有AI计算,另一方面指算力的获得形式,既包括服务器提供的物理算力也包括以云服务提供的算力。华为将持续为互联网企业提供围绕算力的有竞争力的基础设施,助力构筑丰富的上层应用,为最终用户带来更优的体验。
在金融、汽车等传统行业,云原生混合云解决方案帮助中国一汽、广汽本田、深交所等企业,构建统一的云原生基础设施平台,实现业务的敏捷迭代和创新;在生物行业,云原生高性能计算解决方案为华大基因、未来组、金橡医学等企业,提供极速弹性、智能调度的高性能计算平台 ,提升基因测序、药物检测效率;在交通行业华为云原生边缘计算解决方案,打造了全球首个国家级路网项目——全国高速公路取消省界收费站项目,极大提升了高速公路的通行效率,为出行节能减排。
华为云作为全球增速最快的云服务厂商,将华为30多年在ICT领域的技术积累和产品解决方案开放给客户,致力于提供稳定可靠、安全可信、可持续创新的云服务。未来,华为云将持续通过技术创新,与伙伴一起使能千行百业,助力实现数字化转型和智能化升级。

何宝宏博士为韩磊先生授予聘书。
会议期间,ODCC技术专家组举行了换届选举会议,华为DCN Lab副主任韩磊, 受聘为ODCC技术委员会副主任。 华为一直积极参与ODCC的各领域创新研究,共同探索数据中心领域的前沿技术,推进数据中心产业进步。
好文章,需要你的鼓励
在基于Chiplet的架构中,可观测性正成为系统设计的关键缺失环节。多位半导体行业专家指出,AI可从硅层遥测数据中挖掘价值,但前提是架构须提供一致的检测手段、近传感器数据压缩及可编程采集能力。专家们强调,多供应商Chiplet生态系统需要标准化、安全的遥测模式,以实现跨芯片、封装和互联域的故障定位,同时保护敏感运营数据。目前,AI在遥测分析阶段已展现出显著价值,但可观测性的扩展本质上仍是架构问题。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
生命科学企业在全渠道战略和AI平台上投入巨大,但成效往往不尽如人意。问题根源不在于技术本身,而在于组织架构、数据治理和工作方式未能同步演进。许多转型项目止步于试点阶段,原因是各部门数据孤立、职责不清。要实现从传统CRM向智能互动的真正转型,企业需优先建立统一的数据基础和跨团队协作机制,并将AI能力嵌入日常工作流程,而非将其视为独立模块。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。