好文章,需要你的鼓励
中国AI公司DeepSeek发布旗舰语言模型V3.1更新版,该模型已针对新一代国产芯片进行优化。新模型采用UE8M0数据类型训练,为即将发布的国产芯片做准备。V3.1统一了"思考"和"非思考"模式,单一模型支持两种范式,上下文窗口从65536扩展至131072个token,在工具调用能力上显著提升,Browsecomp基准测试得分从8.9提升至30。
KAIST研究团队提出黎曼扩散语言模型(RDLM),通过将文字映射到几何空间实现连续建模,解决了传统扩散模型在文本生成中的"跳跃"问题。该方法在多项测试中超越现有扩散模型,接近自回归模型性能,并支持并行生成和跨领域应用,为AI文本生成技术开辟了新方向。
VAST Data发布SyncEngine通用数据目录和高性能导入解决方案,能够发现、编目并捕获其他供应商存储系统中的文件和对象数据,将其导入VAST的AI专用系统。该工具提供跨文件系统、对象存储和SaaS应用的实时可搜索目录,使数PB到EB级数据集中的数万亿文件瞬间可被发现,消除了分布式非结构化数据集发现和调动的障碍。
谷歌DeepMind团队开发了革命性的WeatherFormer天气预测模型,这是首个能够同时处理多种天气预测任务的通用AI系统。该模型通过学习全球海量天气数据,掌握了天气系统的基本规律,然后可以快速适应各种具体预测需求。相比传统需要为每个任务单独训练模型的方法,WeatherFormer展现出显著的效率和精度优势,有望为农业、灾害防控、能源管理等领域提供更准确便捷的天气预测服务。