天津市第十八届人民代表大会第一次会议于11日正式召开,天津市市长张工在会上作政府工作报告。报告中总结过去五年,成功举办世界智能大会等大型国际会议,对外合作不断深化。在今年要扎实做好十个方面工作中,明确提出办好世界智能大会等重大展会,聚焦现代服务业发展能级,着力推动集聚高端资源要素。
第七届世界智能大会拟于今年5月在天津举办,筹备工作已经全面展开,本届大会将重点围绕落实国家战略、推进天津布局做好谋划发力,围绕天津市12条重点产业链,全面展现智能科技领域的“硬核新技术、产业新赛道、未来新场景、治理新议题”,全力打造创新资源聚集、产业发展引领、智能体验更优的行业盛会,为世界智能科技领域搭建一个交流合作、共赢共享的平台。
好文章,需要你的鼓励
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。
清华大学等多家机构研究团队完成了语音分离技术的全面调研,系统梳理了从传统方法到深度学习的技术演进。研究揭示了"鸡尾酒会问题"的核心挑战,分析了各种学习范式和网络架构的优劣,并通过统一实验框架提供了公平的性能基准。调研涵盖了实时处理、轻量化设计、多模态融合等关键技术方向,为学术界和产业界的技术选型提供了重要参考,推动语音分离从实验室走向实际应用。
Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色,支持多轮编辑、照片融合等功能,并已集成到Gemini应用中供付费和免费用户使用。
浙江大学和腾讯微信视觉团队发现AI图片生成训练中"时机胜过强度"的重要规律,开发出TempFlow-GRPO新方法。通过轨迹分支技术精确评估中间步骤,结合噪声感知权重调整优化不同阶段的学习强度,将训练效率提升三倍,在复杂场景理解方面准确率从63%提升至97%,为AI训练方法论带来重要突破。