12月21日消息,阿里云发布多款基于自研神龙架构的弹性计算新品,包括RDMA增强型实例、800G GPU超算实例、FPGA计算型实例、GPU图形计算型实例等,在性能方面大幅提升,同时增加了多种服务形态,将计算延伸至客户身边,解决企业在数字经济时代的计算痛点。

在此前2021杭州云栖大会上,阿里云就对外展示了全新的自研云计算架构体系——第四代神龙架构,搭载了业内首个大规模弹性RDMA加速网络,让RDMA从HPC类应用走向支持通用类计算场景,网络延迟整体降低80%以上,为Serverless,Service Mesh等云原生技术大爆发提供技术支撑。
本次推出的RDMA增强型实例c7re就基于第四代神龙架构的首款产品,采用软硬一体化设计思路,大幅提升了基础带宽、块存储、IOPS等核心性能指标,延时最低可达5微妙。在AI深度学习场景下,c7re可提升大规模分布式NLP和视觉计算30%的训练性能;在RedisKV数据库中,可提升 Redis混合读写130%的吞吐性能;在Spark大数据场景下,可提升30%性能。

同样搭载RDMA高性能网络的还有800G GPU超算实例,可以提供大带宽、低延时的数据传输支持,更好应对亿级巨量模型的参数训练难题,模型训练效率最大提升900%。
在应对“内存墙”难题上,阿里云深度融合了神龙架构与持久内存技术,推出了性能增强型本地盘实例i4p和持久内存型实例re7p两款实例,突破了大数据处理的内存容量瓶颈。
异购计算方面,阿里云还发布了FPGA计算型实例f5和GPU图形计算型实例gi6s两款新品,前者首发Intel®FPGA实例,性能提升50%,后者基于Intel® Server GPU方案,同时支持超高密度云游戏渲染和视频流处理。
除了丰富的公共云实例,阿里云还提供了“一云多态”的多形态部署方式,包括智能全托管、云盒、本地Region等,增加云计算的覆盖密度。无论企业选择哪种上云方式,都拥有一致的操作体验,开发人员无需担心延迟和性能之间折中的限制。
据国际权威机构Gartner发布的最新评估报告显示,阿里云IaaS基础设施能力排名全球第一,在计算、存储、网络、安全四项核心评比中均获最高分,超越亚马逊、微软、谷歌等国际厂商。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。