
7月27日,在可信云大会上,中国信息通信研究院发布了《虚拟化云平台性能评估方法》,同时,宣布了阿里云成为首个通过“虚拟化云平台性能测试(大规模)”的云厂商,并获得“2021可信云技术服务大规模最佳实践”的称号。
在本次测试的弹性模块中,在信通院工作人员的见证下,阿里云使用弹性伸缩工具,在1106秒(约18分)内完成了1万台云服务器的扩容。
短时间内创建几千台云服务器,云平台管控系统需要瞬间承受超大压力,持续创建意味着系统持续处于高压,很容易崩溃。“这就类似一个人,15秒跑100米不难,他的身体很快就能恢复过来,但持续处于这种速度,难度很高。”阿里云弹性计算工程师强调,“这只是在一定限制条件下的扩容速度,普通用户在云上扩容更快。”
逛淘宝、火车票查询、浏览微博热点、点外卖和观看在线视频等与我们息息相关的应用,大部分部署在云上。这些互联网服务的运行都需要用到云服务器。访问这些服务的用户越多,需要的云服务器就越多,如网购大促、突发热点等时刻,往往伴随着瞬间的流量剧增,需要短时间内开启大量云服务器来支撑。
云计算的红利之一是弹性,弹性能力主要的衡量方式之一就是云服务器的动态交付能力——即快速的扩缩容能力。这可以帮助企业及时承接瞬时流量,并及时释放,避免闲置,大大节约了企业的计算成本。
根据日常用户使用场景统计,1万台服务器的扩容基本是当前正常业务单次扩容需求量的峰值,可以体现云厂商提供给用户的扩容能力。

本届可信云大会中发布的《虚拟化云平台性能评估方法》规范了虚拟化云平台性能评估机制,提出了包含了虚拟机性能、云平台批量操作性能、典型应用场景性能、性能稳定性等四方面的评估指标,并提规范了性能测试执行规则、测试工具等。
作为数字化应用重要的底层算力,云服务器的性能与稳定性对社会与企业来说,都至关重要。
本次提出的性能评估方案,适用于公有云或私有云部署的虚拟化云平台,为云服务提供商进行虚拟机和相关应用场景的性能、稳定性、可扩展性等评估测试提供了统一标准,也为用户的云服务器选型提供可量化的重要参考依据。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。