12月21日消息,阿里云发布多款基于自研神龙架构的弹性计算新品,包括RDMA增强型实例、800G GPU超算实例、FPGA计算型实例、GPU图形计算型实例等,在性能方面大幅提升,同时增加了多种服务形态,将计算延伸至客户身边,解决企业在数字经济时代的计算痛点。

在此前2021杭州云栖大会上,阿里云就对外展示了全新的自研云计算架构体系——第四代神龙架构,搭载了业内首个大规模弹性RDMA加速网络,让RDMA从HPC类应用走向支持通用类计算场景,网络延迟整体降低80%以上,为Serverless,Service Mesh等云原生技术大爆发提供技术支撑。
本次推出的RDMA增强型实例c7re就基于第四代神龙架构的首款产品,采用软硬一体化设计思路,大幅提升了基础带宽、块存储、IOPS等核心性能指标,延时最低可达5微妙。在AI深度学习场景下,c7re可提升大规模分布式NLP和视觉计算30%的训练性能;在RedisKV数据库中,可提升 Redis混合读写130%的吞吐性能;在Spark大数据场景下,可提升30%性能。

同样搭载RDMA高性能网络的还有800G GPU超算实例,可以提供大带宽、低延时的数据传输支持,更好应对亿级巨量模型的参数训练难题,模型训练效率最大提升900%。
在应对“内存墙”难题上,阿里云深度融合了神龙架构与持久内存技术,推出了性能增强型本地盘实例i4p和持久内存型实例re7p两款实例,突破了大数据处理的内存容量瓶颈。
异购计算方面,阿里云还发布了FPGA计算型实例f5和GPU图形计算型实例gi6s两款新品,前者首发Intel®FPGA实例,性能提升50%,后者基于Intel® Server GPU方案,同时支持超高密度云游戏渲染和视频流处理。
除了丰富的公共云实例,阿里云还提供了“一云多态”的多形态部署方式,包括智能全托管、云盒、本地Region等,增加云计算的覆盖密度。无论企业选择哪种上云方式,都拥有一致的操作体验,开发人员无需担心延迟和性能之间折中的限制。
据国际权威机构Gartner发布的最新评估报告显示,阿里云IaaS基础设施能力排名全球第一,在计算、存储、网络、安全四项核心评比中均获最高分,超越亚马逊、微软、谷歌等国际厂商。
好文章,需要你的鼓励
OpenAI推出全新Sora应用,打造完全由AI生成视频的社交媒体平台。美国、加拿大、日本和韩国用户现可直接下载使用,无需邀请码,但该开放政策仅限时提供。其他地区用户仍需等待更广泛的开放或通过Discord等渠道获取邀请码。用户可使用ChatGPT账户登录,立即开始观看、分享和创建AI视频内容。
泰国SCBX公司研究团队首次针对泰语开发了语义对话结束检测技术,通过分析文字内容而非声音停顿来判断对话是否结束。研究比较了多种AI模型方案,发现微调的小型变压器模型能在110毫秒内做出准确判断,显著优于传统静音检测方法。该技术能识别泰语特有的句尾助词等语言特征,为银行客服、智能家居、教育等场景的语音交互系统提供了更自然流畅的解决方案。
AI搜索初创公司Perplexity与Getty Images达成多年授权协议,获得在其AI搜索工具中展示Getty图片的权限。这一合作标志着该公司战略转变,此前Perplexity因内容抓取和抄袭指控备受争议。协议要求在搜索结果中显示图片时必须包含署名和原始来源链接,强调归属和准确性的重要性。
浙江大学研究团队提出Graph2Eval框架,这是首个基于知识图谱的AI代理自动化评测系统。该框架通过知识图谱持续生成新测试任务,解决传统固定数据集评估的局限性。框架支持文档理解和网页交互两类任务,构建了包含1319个任务的测试集。实验验证显示该方法能有效区分不同AI系统能力,为AI代理评估开辟新路径。