12月17日, GTC China 2020大会上,阿里云异构计算产品负责人潘岳表示,人工智能行业需求发生了明显的变化,云上AI业务的推理需求占比首次超过50%,阿里云GPU云服务器从四年前的gn4到今年新发布的gn7,单实例异构算力提升了100倍。
异构计算是最能发挥AI效率的计算方式。潘岳介绍,阿里云提供了超大规模的云上异构计算集群,每秒可支撑100亿亿次的异构运算,能够在1秒内看懂超过5.3亿张图片;识别3.3亿秒/9.2万小时长的语音,相当于听写了1723本《红楼梦》长篇小说或者26万篇短篇小说;1秒内可以翻译4千万句话,相当于翻译了42本《哈姆雷特》。
4年前,云上80%的AI需求来自训练业务。但在2020年,云上AI推理业务的占比已经超过一半。潘岳表示,这也标志着阿里云异构计算进入新的阶段,即软硬一体的云上异构基础设施。
具体来说,用户不仅需要深度学习框架软件,更需要与之适配的硬件来发挥GPU的算力,例如阿里云神龙AI加速器和FastGPU等极速部署工具,就通过池化算力带来灵活的计算调度,云服务器从特定配置向serverless方向发展。这些可帮助客户在训练场景下提升2倍到10倍的性能,在推理场景下提升2倍到4倍的性能,节省至少50%的成本。
以阿里云IoT的图像分类业务为例。阿里云神龙 AI 加速AIACC团队,和IoT智能业务研发团队紧密合作,将大规模图像分类分布式训练性能提升5倍,让算法研发效率得以显著的提升,成本得以大幅下降。
“AI业务从最早的推理占比不到20%,到今天占比过半;原来只有人工智能初创公司探索,到落地各行各业;云上异构业务从单一深度学习训练场景,到今天的训练推理、云桌面、图形图像设计等多元化场景。阿里云异构计算是企业数字化、智能化转型的见证者,也是实践者。”潘岳表示。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。