如今,看综艺节目已经成为了大众平时最喜欢放松心情的方式,以此前火到出圈的《乘风破浪的姐姐2》(以下简称《姐姐2》)为例,其阵容强大,观众反响热烈,无不让这个综艺节目成为人们茶余饭后的谈资。值得注意的是,观众们通过屏幕能够看到比以往更清晰、更真实的姐姐,这背后是华为云与芒果TV的共同努力的结果——将4K云制播技术首次应用于大型综艺。
(图片来源:芒果TV)
事实上,在音视频领域中,华为云的赋能不止于此。诸如虎牙、斗鱼、B站等众多互联网音视频企业伙伴,它们在华为云的助力下,也取得了突出的成绩。
华为云携手斗鱼虎牙,助力直播行业大放异彩
伴随着5G的出现,看直播成为了人们茶余饭后的高频娱乐方式,喜欢游戏直播就看斗鱼,喜欢娱乐直播就看虎牙。为了进一步提升用户体验,各大直播平台也给出了解决方案。
其中,斗鱼与华为云率先在大数据方面展开合作,基于华为云BigData Pro大数据方案DLI智能数据湖构建的数据分析平台,可帮助平台轻松应对海量数据,提高业务分析效率,同时还大幅降低了该平台的直播运营成本。
在互动体验上,斗鱼借助华为云实时音视频服务(CloudRTC)将操作指令延迟控制在30ms以内,端到端延迟控制在200ms以内,用户在体验的过程中不会出现“卡顿”现象,提升了该平台的用户留存率。
虎牙作为娱乐直播细分领域的佼佼者,同样在华为云的助力下,能够更加规范有序的发展。为了提前识别出违规直播内容,虎牙与华为早在2019年就成立了“联合创新中心”,瞄准AI、5G,云直播新业务场景,通过营建5G技术+业务联合创新的多元直播模式,进行大数据平台、边缘网络、算力平台、音视频处理等方向的技术演进。其中,华为云昇腾AI计算解决方以“端边云”融合的AI架构,助力虎牙研发了AI识别引擎,通过“机审+人审”二合一的方式,全方位筛查违规直播内容,不仅降低了审核成本,同时也为平台自身剔除了诸多隐患。
扛得住海量视频数据,助力视频网站按需升级
2019-2020年的跨年,B站带来的那场跨年晚会让人记忆犹新,这背后同样离不开华为云提供的大带宽全动态BGP网络、高性能弹性计算等能力的加持。而实际上,在B站还拥有超过6000万个UP主的视频投稿,因此需要对视频上传、转码、发布效率进行全流程优化。基于此,华为云向B站提供了IDC+云上弹性转码方案,全面提升了资源利用率和视频调度效率等,充分调动UP主创作与上传的积极性,为平台产出更多优质的内容。对于喜欢看美剧和韩剧的用户来说,人人视频无疑是最佳之选。伴随着业务的快速发展,人人视频选择和华为云合作,实现了架构升级和扩容的双重需求,降低运营维护成本的同时,也给用户带来了极致的体验。
助力在线教育腾云起势,让“云课堂”走进千家万户
2020年,随着“停课不停学”政策的落地,在线教育行业迎来了爆发式增长,也诞生了诸如爱学习这样的优秀平台。面对实时音视频技术与教育融合迸发的新机遇,爱学习牵手华为云实现了业务的创新。得益于华为云实时音视频等技术,爱学习打造了极具沉浸感的在线课堂,并帮助1万多家教育机构实现了“在线小班”“双师课堂”“一对一”“一对N”等形式的互动授课场景。
在智能化时代,华为云凭借5G,云,AI的全栈能力在直播、视频、在线教育、4K节目制作等音视频领域助力合作伙伴快速发展,为音视频行业智能化升级按下了“加速键”。相信在不久的将来,也会有更多企业选择和华为云合作,实现智能化、数字化转型升级。
好文章,需要你的鼓励
美国劳动节前夕,AI与就业话题从猜测转向政策核心。美联储主席鲍威尔在杰克逊霍尔会议上表示,疲软的就业市场与顽固通胀并列成为美联储风险考量因素。市场解读为降息信号并大涨。研究显示AI主要推动就业重新配置而非大规模失业,仅4%岗位高度依赖AI。采用AI的企业内部流动性增加一倍,但员工job安全感并未下降。美联储将密切关注AI生产力提升如何影响工资谈判和就业稳定。
Hugging Face团队发布SmolLM2语言模型研究报告,详细阐述了17亿参数小型模型的创新训练方法。该研究通过多阶段精细化训练策略和三个全新数据集(FineMath、Stack-Edu、SmolTalk)的创建,证明了小模型在数据质量优化下可达到优异性能。模型在多项基准测试中超越同规模竞品,为人工智能技术的普及化和可持续发展提供了新的技术路径。
传统的数字堡垒安全模式已经过时,在云服务和远程办公时代,身份成为网络安全的新前线。Ping Identity首席执行官Andre Durand讨论了从简单密码到复杂验证的演进,去中心化数字凭证如何减少数据泄露影响,以及身份与人工智能的关系。他强调现代安全的核心是"只信任已验证的",AI代理需要具备身份认证和授权机制,所有数字交易都必须基于可验证的身份建立信任。
ByteDance研究团队发布OmniHuman-1,这是一个革命性的AI人物动画生成系统。该技术只需一张照片和音频就能生成逼真的说话视频,支持真人、动漫角色等多种图像类型。核心创新在于"全方位条件训练"策略,通过同时使用文字、音频、动作三种条件,将可用训练数据从10%提升到100%,显著改善了生成质量和多样性,为AI视频制作技术带来重大突破。