7 月 24 日,全球互联网通信云领导厂商融云主办的第三届全球互联网通信云大会(WICC 2021)将在北京柏悦酒店召开。目前报名参会开发者已过千人,他们的最大获益除了聆听主论坛技术领袖的高屋建瓴之外,还有下午技术分论坛,产业中技术领导者分享的先进技术和最佳实践,这些真知灼见将激发出更多产业活力,带动和加速通信云行业的发展。
在场景化赋能与创新的技术分论坛中,中国在线音频平台荔枝(LIZI.US)将由高级音频工程师马朋飞带来《荔枝音频体验优化演进》的技术分享,为开发者现场讲解荔枝录音/直播架构的演进,以及如何增益音频质量等荔枝核心技术,非常值得期待。
揭秘优化高音质的核心技术
场景化赋能与创新的技术分论坛,主要为开发者带来基于场景的最佳技术实践分享。作为本次音频场景的主讲人马朋飞,入职荔枝后,主要负责客户端的音频采集、算法处理、编解码、声音渲染、多种类机型适配等工作,并围绕互动娱乐行业提供相应的音频解决方案,确保直播、录播等场景下的高音质音效,积累了丰富的实战经验。
技术分享是他参会的目的,他直言,“在纯音频领域,真正把技术做精做透的并不多,荔枝的优势在于声音处理技术,我们的初衷是用声音把所有的人都联系在一起。所以在音质上面,要花力气,把工作做精,不断将普通音质优化打造成不同应用场景下的高音质,带给用户最佳体验。”分享中,他将对热门的高音质直播场景进行讲解。其中,如何处理声音播放中的关键数据是主要技术亮点。
除此之外,荔枝还具备独特的声音智能推荐技术,根据音色、语种,能够定向、更精准的向客户推荐相应的主播节目或音乐。比如根据语种,可以推荐英语、韩语、方言类的节目。结合声音智能推荐技术的应用场景,荔枝将揭秘如何打磨高音质的核心技术,通过精细化的音质配置方案,实现当前场景的最优音质。
差异化的竞争思维让荔枝“真香”,也为开发者所借鉴
在线音频市场因 Clubhouse 的年初大火而增量显著,也让荔枝作为“中国在线音频行业第一股”再次受到极大关注。
荔枝从2013年创立以来,就致力于让人们通过其产品组合用声音将人们联系在一起,经过数年的技术打磨和市场深耕,培育出适合不同用户群的产品,包括主打UGC音频社区荔枝App;主打通过大V传播海内外精品播客内容和交流互动的荔枝播客。荔枝用多样化、差异化的应用产品提前卡位,占据了先发优势。
荔枝的成功再次印证了“机遇总是青睐有准备者”。对于开发者而言,重要的不是跟风市场,而是专研技术,一旦瞄准了研发方向,就要心无旁骛地沉下来,不断探索和打磨。任何技术领域,要做到精专,都需要时间和经验的积累。这是马朋飞以切身的职业经验给开发者的建议。
在技术集成实践方面,他给开发者的建议是:适合的就是最好的。技术本身没有好坏,要集成一个好的产品,可能面临很多技术方案,各有优缺点,没有一种方案能够满足所有场景,所以,需要在真实的开发验证中,找到最适合的那一个,成为最好的解决方案。
WICC举办的主旨就是促进交流,不仅体现在WICC的众多技术领袖和开发者之间,还体现在产业界各厂商之间。
未来,荔枝将在车载终端的通话体验、VR场景的优质音频技术方面,进行战略布局。荔枝也希望通过WICC技术盛会,进一步加强与产业界的交流合作,推动整个音频产业向更高质量体验方向发展。
结语
本届WICC大会,围绕实时音视频作为主要技术分享,其中音频相关的技术内容,除了荔枝马朋飞之外,还有中科院声学研究所研究员李晓东的《通信声学新进展》、融云 iOS 高级开发工程师臧其龙的《基于语聊房场景化 SDK,探索新一代 PaaS 服务的演进方向》等。届时大会将如何“把耳朵叫醒”,让我们静待 WICC 2021 的召开。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。