AI+VR裸眼3D、5G+8K超高清制作、全媒体跨屏联欢……2021年的央视春晚为观众带来了一场突破感官体验的惊艳之旅。阿里云作为央视春晚唯一一家进驻春晚现场服务的云厂商,为春晚的直播提供了窄带高清、智能AI剪辑、高性能分发等一系列视频云服务,成功应对了5.69亿用户直播观看的流量洪峰。
如今,云计算已经成为千行百业转型升级的基础设施,特别是自2020年开始,视频云成为云计算市场的新赛道,疫情让几乎所有行业都意识到视频服务的必要性与重要性,视频云“一夜爆红”。基于更低成本、更低门槛、更强体验的技术普惠理念,视频云已成为在线教育、互联网娱乐、电商平台等行业的必然之选,驱动着下一代技术浪潮。
IDC预测显示,到2024年,中国视频云市场规模将会超过240亿美元,市场空间的想象力巨大。阿里云连续三年占据国内视频云市场份额第一名的位置,除阿里云之外,其他一些玩家也在加速布局,目前国际市场上的AWS、Azure、谷歌云也早就进入视频云领域。无论国内国际,在马太效应加持下,视频云市场也将会更加向头部玩家靠拢。
作为视频云市场的头部玩家之一,阿里云视频云的业务的布局正在变得愈加丰富,与各个行业的场景需求也融合得更加紧密。
正是在这样的大背景下,由视频领域领先的软硬件技术服务商阿里云和英特尔主办,与优酷战略技术合作的 “新内容,新交互”全球视频云大赛隆重启幕,推出旨在面向企业及个人开发者的数据算法及创新应用类赛题,探索视频云技术在文化娱乐、在线教育、公共服务等行业领域的创新应用。
本届大赛包含了“算法挑战赛”和“创新应用挑战赛”两个赛道。

算法挑战赛道聚焦视频人像分割领域。视频物体分割将传统图像分割问题延伸到视频领域,可服务于视频理解处理和编辑等任务。人像分割作为近年来在音视频场景中新兴的技术,可以应用于视频会议背景替换、在线教育虚拟课堂、人像美颜贴纸等诸多场景,本届大赛的算法赛道,复赛阶段将基于第三代英特尔® 至强® 可扩展处理器环境,为选手提供业界领先、经工作负载优化的硬件基础。此外,作为算法大赛的另一重要组成,优酷作为本次大赛的战略技术合作方,为本次大赛提供了目前业内规模最大、质量最高的数据集,不仅涵盖了各类超高清影视版权剧集,还提供了各类体育比赛、UGC内容、音乐舞蹈等丰富内容。

创新应用赛道则要求参赛者应用指定的相关技术,解决视频领域和相关行业的的痛点问题,以技术可行性、前瞻性、落地价值作为重要评审考察点,以求探索视频云与各行业具体应用场景的创新性结合。特别是在新冠疫情期间,电商直播、视频会议、在线课堂等一系列线上视频交互新场景已经成为了大众日常生活的标配,创新应用赛道将鼓励选手基于阿里云的视频云技术,结合英特尔®服务器GPU的高密度、低延迟的视频流转码和编码等技术,充分发挥创新能力,探索创新应用场景。
据悉,本届全球视频云大赛将从即日持续至2021年6月底,面向全球征集优秀音视频开发者参赛,相信通过此次大赛,将为全球视频云技术领域的探索变革提供创新案例,挖掘优秀人才,驱动下一代技术浪潮。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。