视频云赛道又迎来新玩家。近日,短视频与直播平台快手宣布将于8月10日在北京召开StreamLake品牌发布会,推出面向各行业的音视频+AI产品与解决方案,意味着聚焦C端产品十一年的快手正式进军toB赛道。
据悉,在这场主题为“云启共生·水润万象”的发布会上,快手首席技术官陈定佳,快手高级副总裁、StreamLake负责人于冰,快手技术副总裁、AI技术负责人王仲远等将悉数到场, 首次公开StreamLake品牌及产品矩阵,深入解析音视频和AI技术发展趋势,助力全行业视频化和智能化升级。
长期以来,电商、教育、文娱等领域的公司面临构建视频业务效率低,云服务消耗及自研成本高,画质、音质、流畅性体验差等痛点。在本次发布会的圆桌论坛环节,快手StreamLake产品负责人廉亚男,知乎合伙人兼CTO李大海,联通在线信息科技有限公司副总经理秦吉波,高成资本创始合伙人洪婧,镕铭微电子CEO朱照远,清华大学教授、网络多媒体北京市重点实验室主任孙立峰,将共同探讨视频化趋势下的技术演进和商业变革。
有消息称,快手早在2020年就开始探索toB业务。经过2年多沉淀,快手将会给企业视频化转型带来哪些新产品、新模式,快手又将如何助力全行业视频化和智能化升级,成为本次发布会的两大关注点。
快手短视频和流量架构负责人黄琦、快手直播技术和音视频算法负责人郭亮、快手多模态内容理解技术负责人张富峥、快手智能生产AI技术负责人万鹏飞等多位专家,还将带来StreamLake的全链路音视频行业解决方案,为企业升级体验、降低成本,实现业务增长提供方向建议。
业内人士表示,近两年,各领域的平台级企业和中小公司均在加速布局视频化、智能化,叠加企业自研面临的体验、成本等诸多问题,视频云服务正不断扩展增量空间与场景,快手推出视频云服务处在一个恰当的时间窗口。
快手十多年来积累的音视频和AI领域的技术能力,为其布局视频云服务奠定了强大的技术基础。通过开放技术能力布局toB业务,快手一方面将技术和产品应用于更多样化的业务场景中,另一方面也将拓展业务生态和想象力。

好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。