4月18日,第29届中国国际广播电视信息网络展览会(CCBN 2023)在北京盛大启幕。百度智能云携“云智一体”智慧传媒系列产品和综合解决方案精彩亮相,全面展示了涉及传播全流程的相关智能化硬件、框架、平台和应用,为与会者打造了全场景沉浸式交互体验。
本届展会以“大视听 向未来”为主题,聚焦5G、超高清/HDR、人工智能、云计算、大数据等新一代视听和信息技术,在总面积达5万平米的展区中设置20余个专业展区,涵盖广电5G、媒体融合、互联网电视、VR/AR、电视剧制作技术、云与大数据、智能终端等主题,全景展现了大视听全产业链的科技创新及新型应用成果。
为了让观众切实体会到前沿技术为传媒行业注入的创新基因,百度智能云此次展出的产品和解决方案围绕智能硬件、智慧媒体、创新体验3大主题,从不同角度展示了生成式AI等科技如何赋能媒体行业的数字化转型与智能化升级全流程。
智能硬件部分展示了百度自研的昆仑芯AI芯片、鸿鹄语音芯片、小度智能音箱等;昆仑芯产品已在百度数据中心实现万卡级别的部署上线,为百度搜索引擎业务提供算法通用化支撑。
百度智能云智慧媒体解决方案,从后端到前端涵盖基础设施、能力中台、媒体业务、交互传播四大层级,形成“1+3+4+3”业务架构。它构建了集公有云、私有云、混合云管理、智能运维等于一体的基础设施,以及媒体AI中台、媒体数据中台和用户中台3大中台,支持媒体内容生产、智慧媒资管理、媒体内容安全和媒体运营4大业务板块,覆盖APP/新媒体平台、网站,电视台/广播/IPTV/OTT 3类终端,充分融合了端、边、云、智能力。
同时,百度智能云智慧媒体解决方案充分整合产业链上下游合作伙伴的能力,搭载了如全新的第四代英特尔® 至强® 可扩展处理器等技术领先的硬件产品,支持AMX等指令集,协同平台软硬件方面的深度优化,为具体的传媒场景和关键业务打造了高品质的算力和数据安全水平。
此次百度智能云紧扣传媒行业“策采编审发”业务场景的需求,重点展示了智能创作、智能审核、媒资管理、智感超清4大智能化解决方案。
其中,智能内容生产解决方案借助人工智能、大数据、音视频产品技术,可满足媒体多种类型的内容创作需求,包括在海量数据中敏捷调取出强关联信息,自动生成新闻资讯,大大提高新闻时效性;提供自动创作和辅助创作的编辑功能,做到自动纠错,审核文本,润色用词等;基于图片处理和音视频编辑渲染能力,提供在线H5非编工具,支持视频剪辑、转场特效滤镜、智能字幕等功能。
智能审核内容平台针对图像、文本、音频、视频、直播等多媒体内容,提供全方位的审核能力,实时同步政策法规与监管要求,多维度监测过滤色情、违禁、辱骂、广告等违规内容。同时,平台提供灵活的自定义配置功能,5分钟即可完成规则配置,界面化调整识别维度和松紧度,为业务健康发展高效保驾护航。
百度智能媒资管理平台基于大模型的多媒体结构化管理,利用多维视觉AI技术,实现智能化四级切分,结合语音、语义、图片识别进行智能编目,并支持多模态的智能化检索,实现媒体资源的高效检索、分发和审核,助力媒体行业实现媒资管理的智能化升级,真正盘活海量媒体资源,提升工作效率。
智感超清转码解决方案基于智能编码技术、感官增强技术、超分辨率技术、高清编码技术,实现超高清转码、老片修复、智能抽帧等,助力广电传媒、UGC短视频、直播和安防监控等场景超分辨率提升画面细节和流畅度,节省带宽成本30%,打造极致的播放体验。
创新体验部分则重点展示了AIGC时代传媒行业的典型场景,精心打造了数字人、百度希壤元宇宙平台2大体验区,让观众深度体验AI时代的媒体智能化新模式。
百度智能云曦灵-智能数字人平台,基于领先的AI引擎技术,提供人机可视化语音交互服务和内容生产服务,支持媒体行业低成本快速定制个性化的服务型&演艺型数字人,帮助不断降低数字人应用门槛,有效提升用户体验、服务质量和效率。
作为首个国产元宇宙产品,“希壤”APP采用了莫比乌斯环星球造型,引用大量的中国风元素,为多终端用户打造了一个跨越虚拟与现实、永久续存的多人互动空间,成功推出了首个可以容纳10万人同屏互动的超级会场,支持多人语音交流,可自由听会、逛街、交流、看展。
“这些突破性智能媒体解决方案,离不开高速进化的生成式AI技术的驱动,”百度智能云媒体行业总经理周搏表示,“生成式AI能力并非凭空产生,而是需要涵盖芯片层、框架层、模型层、应用层的完整能力栈支撑。作为AI最坚定的拥抱者和国内首个布局大模型的企业,百度凭借过去10年上千亿的投入规模和超过20%的投入强度,率先推出了产业级知识增强文心大模型。正是在该模型的加持下,生成式AI的‘触角’才得以快速蔓延至各类模态的内容生产领域,为媒体产业注入智能化升级新动能。”
日益迫切的媒体数智化转型需求与互联网巨头在科技研发上一路狂飙的态势不谋而合,共同的目标正在促成一场文化与科技的双向奔赴。
截止目前,百度智能云已与多个媒体达成战略合作,例如,助力人民日报打造集轻应用平台、智慧媒体云、知识社区、开放生态于一身的一站式智能创作平台——“创作大脑”,帮助新华财经打造信息产品智能采编协作生产系统;与央视网共同构建“人工智能编辑部”;为央视新闻打造总台首个 AI 手语主播;以“中华文化探源者”为定位元曦成为中国日报的首位数字员工,在元宇宙中带观众探索源远流长的中华文明。
周搏表示,未来,百度智能云将继续坚持‘云智一体’的战略,以云为底座,以人工智能为抓手,通过压强式研发力度,打造更加适配媒体行业各个细分场景的全链路闭环解决方案,帮助更多媒体伙伴全面拥抱科技创新,实现内容生产和传播生态重构,开拓数智化转型新征程。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。