李开复零一万物发布大模型Yi-34B ，阿里云魔搭社区开源首发

零一万物创始人及 CEO 李开复博士表示:“零一万物坚定进军全球第一梯队目标，从招的第一个人，写的第一行代码，设计的第一个模型开始，就一直抱着成为‘World's No.1’的初衷和决心。”

11 月 6 日，李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B，模型开放商用申请，已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程，供开发者参考并快速上手。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据 Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单，Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可，成为全球开源大模型“双料冠军”。

Yi-34B 登顶全球英文及中文权威榜单 No.1

在 Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中，Yi-34B以70.72 分位列全球第一，碾压 LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。

李开复零一万物发布大模型Yi-34B ，阿里云魔搭社区开源首发

Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜，Yi-34B高居榜首(2023 年 11 月 5 日)

在 C-Eval中文权威榜单排行榜上, Yi-34B超越了全球所有开源模型。对比GPT-4，在 CMMLU、E-Eval、Gaokao 三个主要的中文指标上，Yi-34B 也具有绝对优势。

李开复零一万物发布大模型Yi-34B ，阿里云魔搭社区开源首发

C-Eval 排行榜:公开访问的模型，Yi-34B 全球第一(2023 年 11 月 5 日)

在全球大模型各项评测中最关键的 MMLU(Massive Multitask Language Understanding 大规模多任务语言理解)、BBH 等反映模型综合能力的评测集上，Yi-34B 同样表现突出，在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

李开复零一万物发布大模型Yi-34B ，阿里云魔搭社区开源首发

各评测集得分:Yi 模型 v.s. 其他开源模型

和 LLaMA2 一样，Yi 系列模型在 GSM8k、MBPP 的数学和代码评测表现略逊 GPT 模型。未来，零一万物的系列开源计划中将推出代码能力和数学能力专项的继续训练模型。

全球最长200K 上下文窗口

Yi-34B模型将发布全球最长、可支持200K超上下文窗口(context window)版本，可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一，对于理解和生成与特定上下文相关的文本至关重要。

受限于计算复杂度、数据完备度等问题，上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战。为此，零一万物技术团队实施了一系列优化，包括计算通信重叠、序列并行、通信压缩等，实现了在大规模模型训练中近100倍的能力提升，也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

AI Infra实测实现 40%训练成本下降

李开复曾经表示，“做过大模型 Infra 的人比做算法的人才更稀缺”。超强的 Infra 能力是大模型研发的核心护城河之一。

AI Infra(AI Infrastructure 人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施，包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等。

零一万物 Yi系列大模型基于阿里云平台打造，阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。零一万物的Infra 技术通过“高精度”系统、弹性训和接力训等全栈式解决方案，确保训练高效、安全地进行。

凭借强大的 AI Infra，Yi-34B模型训练成本实测下降40%，实际训练完成达标时间与预测的时间误差不到一小时，进一步模拟上到千亿规模训练成本可下降多达 50%。目前，零一万物 Infra 能力实现故障预测准确率超过 90%，故障提前发现率达到 99.9%，不需要人工参与的故障自愈率超95%。

零一万物组建了由前 Google 大数据和知识图谱专家领衔的数据团队，建设了高效、自动、可评价、可扩展的智能数据处理管线；还自研出一套“规模化训练实验平台”，用来指导模型的设计和优化。数据处理管线和加大规模预测的训练能力建设，把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

李开复宣布，零一万物已启动下一个千亿参数模型的训练。

接下来，零一万物将基于 Yi系列大模型，打造更多To C超级应用。李开复强调，“AI 2.0 是有史以来最大的科技革命，它带来的改变世界的最大机会一定是平台和技术，正如 PC 时代的微软 Office，移动互联网时代的微信、抖音、美团一样，商业化爆发式增长概率最高的一定是 ToC 应用。零一万物邀请开发者社群跟我们一起搭建 Yi 开源模型的应用生态系，协力打造 AI 2.0 时代的超级应用。”

来源：阿里云

0赞

好文章，需要你的鼓励

李开复零一万物发布大模型Yi-34B ，阿里云魔搭社区开源首发

来源：阿里云

2023

11/06

15:12

分享

点赞

为AI+而生，海辰储能发布全球首款锂钠协同AIDC全时长储能解决方案

长时储能开启智慧未来：海辰储能生态日全球首发三大新品

Arm 借助融合型 AI 数据中心，重塑计算格局

奥运级别的努力：首席信息官为2026年AI颠覆做准备

Spotify推出AI播放列表功能让用户掌控推荐算法

Adobe押注生成式AI获得回报，年度营收创历史新高

OpenAI与迪士尼达成十亿美元合作协议，米老鼠和漫威角色进入Sora

甲骨文150亿美元数据中心投资导致股价下跌

Spoor鸟类监测AI软件需求飞速增长

制药行业AI数据质量危机：垃圾进垃圾出的隐患

Harness获得2.4亿美元融资，估值达55亿美元，专注自动化AI编码后的开发流程

英伟达CEO黄仁勋独家专访：万亿美元押注AI工厂将成为新时代计算机

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

阿里云李飞飞：将大模型，装进数据库里

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

蚂蚁数科提出创新跨域微调框架ScaleOT入选全球AI顶会AAAI 2025

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: