6月25日,在华为云TechWave云原生媒体服务专题日上,华为云音视频服务正式升级为媒体服务。升级后的华为云媒体服务,支持媒体生产、媒体分发和媒体应用三大场景。在专题日上,华为云媒体服务产品部云视频总监发表演讲《云原生媒体网络,升级传统,赋能未来》,分享了华为云为什么要重构媒体网络,基于云原生技术构筑的华为云媒体网络能够解决当前什么问题,以及为什么云原生是未来媒体网络的必选项。
挑战与机遇并存:传统网络已不适应流量的激增和新的业务形态
在过去的几年中,随着移动互联网和5G的进步,全球视频流量5年内增加了12倍。不断增长的1080p、4k、8k、VR视频,使得网络的流量和带宽迅速撑爆。

传统的CDN和直播,因为有3~5秒的时延,并不能支撑双向互动,实时交互的视频分发场景。如今电商直播、超低时延的直播、实时音视频、以及视频监控场景等业务的形态对于媒体分发的能力提出了更高的要求。
另外,受限于用不起的成本,在视频接入领域,很多园区只能把视频内容存储在线下,这就面临视频内容资产变现难,查找不方便等问题。
告别传统网络:具备融合节点、分层设计、智能调度的云原生媒体网络应需而生
为了解决传统网络的关键问题,华为云提出了云原生的媒体网络,它具备三大特征:融合节点、分层网络、智能调度。

融合节点:过去CDN、直播RTC、视频监控等业务的节点不能共享,不能弹性,业务的部署会受到很多的限制。华为云把全球2500个节点,统一用云原生的方式进行改造,升级成融合的媒体边缘节点,可达到底层是统一的计算存储资源,在上面用原生的IEF进行统一的改造和纳管,使得CDN、直播、RTC、XR、转码等都运行在云原生能力基础上进行动态部署业务。每个业务可以根据自己的需要,在白天、晚上分别进行调度,使用上行、下行的带宽以及计算存储的资源,这样边缘资产实现了盘活,可以大幅降低业务传输时延和更重要的业务成本。
分层设计:华为云用分层的思想进行网络传输的优化,分为三层,四层和七层优化。在三层也就是IP层,提出了天路,可实时感知网络,使得转发和路由得到优化,来改善报文转发的时延,提高报文的到达率。经过实测,可实现IP网上、IP报文的转发时延降低30%,提高0.5个报文到达率的百分点。
同样在四层也就是传输层,提出了华为自研的hQUIC协议,使上层应用如音视频业务,实时消息传输业务、未来的XR云游戏业务的内容在不同的网络情况下得到分别的加速,提高网络传输的效率。
在七层,各个业务场景中解决音视频业务传输的问题。如是否要先进行一些编解码,再传输,来提高效率?是否要进行一些编解码参数的自适应,在传输中间是否有更好的体验……这些都是在7层完成的。
通过分层,在三、四、七层进行优化,使媒体网络可以对不同的音视频内容在不同的网络上提供非常好的一致性的体验。
AI调度:华为云提出了Mesh化的调度引擎,它有两个关键特征:第一个特征是多业务的统一调度,包括了点播、直播、RTC、监控等,可以将体验和成本做互补调优,实现多业务端到端统一调度能力,不同的业务都由这个调度引擎来统一调度;第二个特征是不同服务 SLA,采取不同的调度策略,来支撑不同客户的商业策略。比如对于直播比较关注回源率、带宽的趋势、卡顿率等成本和体验指标。把这些指标作为一个输入,给调度引擎,在2500个节点中间,总是选择最优的节点进行动态的部署和弹性的伸缩以及最优的服务。
面向RTC实时性更高,互动性更强,体验指标更苛刻的场景,会把用户的首帧时长、卡顿次数、入房成功率、端到端时延等参数组输入到调度引擎当中,使RTC提供更好的用户体验、更低的时延,助力客户的业务。为了实现这样的调度能力,我们在调度系统的实现上进行了Channel级的调度。
对视频的接入阶段、回源阶段及整个网络都是按照一张Mesh的网络进行整体的调度和优化,并且引入了人工智能的方式,来对调度的算法进行自学习,自训练,不断对抗,生成更好的调度策略与算法。通过统一升级的媒体边缘网络、AI调度、以及三、四、七层的网络传输分层的优化,使得云原生媒体网络可以解决“来不及”、“用不起”的问题。
基于华为云云原生媒体网络,把普通直播升级为超低时延直播,可以使直播时延3~秒降低到800毫秒以内,但是其他的业务指标体验,首屏卡顿还和传统的直播持平,以此帮助直播、电商、教育行业进行体验升级;同时华为云还支持直接提供RTC的服务,把客户的传输从TCP变成UDP,带来进一步实现体验的升级和时延的降低。
重磅新品:开放、共享、高效、安全的视频接入服务,基于边缘协同的架构,支持多业务场景
专题日上,华为云还正式发布了视频接入服务VIS(Video Ingestion Service)。该服务基于华为云边云协同架构,构筑开放、共享、高效、安全的视频接入服务;基于开放协议,实现软硬解耦,跨厂商摄像头统一极简接入,四步上云,统一管理;依托华为云丰富的AI算法商城,AI能力一键获取,新功能上线周期从月缩短到天;通过华为云原生媒体网络复用上行带宽,降低客户带宽成本,支持海量并发,单租户支持10万级并发。
基于云原生的媒体网络,华为云视频接入服务VIS(Video Ingestion Service),把网络中的上行流量充分复用,促使用户把摄像头生成的内容放在云上,并且享受更低成本的存储,用户每月的成本只需不到过去的10%。

未来华为云将持续技术创新,拓展服务边界,携手伙伴,为千行百业提供更优质的媒体服务,加速产业智能升级。
好文章,需要你的鼓励
这份由MIT NANDA项目团队完成的研究报告揭示了企业AI应用的真实现状。报告基于对52家企业的深度访谈、300多个公开AI项目的分析以及153位高管的问卷反馈,发现尽管企业在生成式AI上投入了300-400亿美元,但95%的组织没有看到任何投资回报。只有5%的企业成功跨越了"GenAI鸿沟",创造了实际价值。
南京大学团队开发了名为DiP的AI图像生成系统,突破了传统方法在质量与效率间的平衡难题。该系统采用"先整体后局部"策略,通过扩散变换器构建图像整体结构,再用轻量级补丁细节头添加精致细节。在ImageNet测试中,DiP获得1.79的最佳FID分数,同时推理速度比前代像素级方法快10倍以上,为AI绘画技术带来重要突破。
阿里通义实验室的研究团队通过精巧的数学分析,首次揭示了AI快速图像生成技术的真实工作机制。他们发现原本被认为起主导作用的"分布匹配"实际上只是稳定器,而被忽视的"CFG增强"才是核心驱动力。基于这一发现,团队提出了解耦调度策略,为两个机制制定专门的工作计划,显著提升了图像生成质量和速度,该方法已被知名Z-Image项目成功采用。