继天猫双11全面上云后,今年,阿里云首度在公共云上为天猫双11提供超100万核CPU资源支撑,弹性规模刷新纪录。记者了解到,依托于不断迭代更新的云计算全栈技术,云基础设施处理器CIPU首次大规模应用于天猫双11,不但保障了用户丝滑体验,还将双11的弹性成本节省了25%以上。
作为全球规模最大的数字工程之一,历年双11是对IT技术的一次综合“大考”。从2009年到2019年,天猫双11订单创建峰值十年翻了近1500倍,通过全面上云和深度用云,阿里云解决了这一业界公认的世界级难题。现在,随着AI应用的广泛落地、直播电商的常态化展开等系列体验更新,如何通过技术优化进一步提升云计算效率、算力性价比,是双11提出的全新技术挑战。
双11爆发的峰值算力需求,日常资源池无法满足,需要提前预购和部署额外的云算力,算力使用时有不饱合,平添成本。今年天猫双11,阿里云通过系列技术创新打破了这一传统模式,无需预购算力,按需即取,首次将云计算的即时弹性提升至百万核级的极限水平。基于公共云底座,阿里云为双11全新打造统一的算力需求与资源匹配调度引擎,可高效调度张北、南通、北京、上海、新加坡、德国等全球多地的公共云算力,用完即释放,经估算可整体节省双11弹性成本的25%到50%左右。新引擎不但能提供算力供需最优解,还可实现算力需求的时域错峰,使得算力闲置成本再降8%。
在这背后,是阿里云系列自研技术的持续演进。阿里云自研云基础设施处理器CIPU,向上接入飞天云操作系统,向下统一调度并优化计算、存储、网络等资源,将全球数百万台服务器连成一台超级计算机,按需调配双11所需的算力资源。基于CIPU架构的第八代ECS弹性计算实例,不仅能够提供稳定且强大的算力输出,还配备了强劲的I/O引擎,整体性价比较第七代提升了超过15%,有力支撑了淘宝推荐、淘宝营销会场、闲鱼推荐、淘特搜索、Lazada推荐等业务场景。第八代ECS实例还广泛采用了PoV(Pangu Over Virtio)技术,进一步提升了DFS存储性能,淘宝业务时延从200ms下降到100ms,Aserver单机业务吞吐实现3倍提升。
不断迭代升级的云计算技术推动了双11的不断发展。2014年,阿里首次采用自研数据库承载电商交易系统;2015年,阿里云实现了全球最大规模的混合云架构支持双11;2019年,双11核心交易系统全部上云;2021年,阿里巴巴业务已经全跑在阿里云上;2022年的双11则开启了全面深度用云的时代。今年,超百万核计算资源支撑双11刷新纪录。阿里云通过技术持续创新,不断释放技术红利,也有力支撑了双11的发展,为消费者和商家提供了更丝滑的体验。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。