9月26日,英特尔至强6性能核处理器在国内正式发布。
作为英特尔面向数据中心又一重量级处理器,此次发布会前,已经在2024云栖大会上进行过展示和预览,我们也曾在云栖大会现场一睹这款产品的真容,彼时一并对外进行了预发布的,还有阿里云ECS第九代企业级计算实例。
实际上,作为英特尔至强系列产品品牌升级后的第一代产品,为了满足不同工作负载的需求,英特尔至强6处理器采用了两种不同的CPU微架构——P-core(性能核)和E-core(能效核)。
英特尔至强6能效核处理器已于今年6月正式对外发布,作为首次采用纯能效核设计的一款处理器,英特尔至强6能效核处理器专门针对高核心密度和规模扩展任务所需的高效能优化,适用于微服务等任务并行、基于标量的工作负载。
这次发布会正式发布的英特尔至强6性能核则是针对高性能计算进行了优化,英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立指出:
“这款处理器单核性能得到了进一步提升,对于通用计算、数据和Web服务、科学计算、AI等,英特尔至强6性能核处理器将是绝佳的产品。”
至强6性能核,强在哪里?
来自调研机构的预测数据显示,到2026年,全球在人工智能领域的支出将超过3000亿美元,50%的边缘部署将涉及到人工智能,超过80%的企业都会使用生成式AI。
在这一进程中,各行各业对于云基础设施的需求也在不断增长。
来自IDC数据预测数据显示,2026年全球云计算支出占全球IT支出的比例将增至53%;来自Gartner的预测数据也显示,2026年全球云计算收入将突破万亿美元大关。
如何为云基础设施提供性能更强劲的处理器,就成了英特尔需要考虑的问题。
陈葆立在发布会上介绍称,“我们在设计处理器时,会分别设计两个单元——计算单元和I/O单元,计算单元中包含了X86内核、内存、控制器、缓存等,I/O单元则包含了我们业界领先的PCIe、CXL、UPI等通用协议和加速技术。”
英特尔至强6性能核处理器6900系列,正是由这样的3个计算单元和2个I/O单元组成的高端产品。
据悉,这款处理器拥有高达128个内核,要知道,目前国内数据中心服务器使用的英特尔至强系列处理器,普遍还只有32个或48个内核,这次英特尔至强6性能核处理器仅仅是在内核数量上,就有了2-3倍的提升。
这样内核数量的提升,意味的是计算性能的全面提升。
不过,英特尔至强6性能核带来的提升远不止此,这款基于Intel 3制程工艺制造的高性能处理器在机架密度、内存带宽、能效、隐私安全等方面得到了全面提升。
就内存带宽而言,英特尔至强6性能核处理器拥有12个内存通道和MRDIMM,尤其采用更快的DDR5内存和多路合并阵列MRDIMM,内存吞吐量得以显著提高。与RDIMM相比,内存带宽提升超过37%,预计数据传输速率高达8800MT/s,为更大的内存敏感型LLM模型提供了更高的性能。
此外,多达64条CXL 2.0通道,每条通道的数据传输速率高达32GT/s,当使用低成本内存(如支持 CXL 2.0的DDR4)时,“Flat”内存模式也可帮助用户扩展系统内存并优化TCO。
就隐私安全而言,英特尔早在第四代至强处理器上就为人工智能加速推出了专属指令集英特尔AMX,如今,通过oneAPI跨不同硬件架构实现标准编程模型通过内置英特尔AMX和英特尔AVX-512,英特尔至强6性能核处理器进一步提高了性能和效率,内置诸如英特尔SGX和英特尔TDX等安全功能,也可以更好地支持机密计算和可信服务。
在发布会上,陈葆立给出了英特尔至强6性能核处理器与上一代产品的对比数据:
“相较于上一代产品而言,英特尔至强6性能核处理器每路内核数多达2倍,平均单核性能提升达1.2倍,平均每瓦特性能提升至1.6倍,同等性能水平平均TCO降低多达30%。”
这样的能力在实际应用过程中带来最直接的表现是,从通用计算、数据库、科学计算到AI在内的14种工作负载,任务处理速度都实现了2倍以上提升。
这其中既有MongoDB、MySQL等主流数据库,也有如今热门的Llama2-7B、Llama3 8B大模型应用。
不难发现,这次英特尔至强6性能核处理器带来的提升的确是一次全方位的提升。
对于英特尔至强6性能核处理器的能力提升,英特尔公司市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉将其总结为四个方面:
计算密度,英特尔至强6性能核处理器在40%的利用率下,每瓦特性能提升至1.9倍;
内存增强,英特尔至强6性能核处理器通过支持MRDIMM和CXL 2.0等技术,解决了CPU核数大幅提升后,内存和性能匹配的问题;
数据处理,通过英特尔TDX、英特尔SDX,英特尔至强6性能核处理器可以支持高速、安全的数据处理;
能效优化,通过CPU自身能效优化和先进的数据中心制冷技术,满足客户算力大幅提升后的能效需求。
英特尔至强6性能核处理器这些方面的性能提升,同样体现在英特尔与合作伙伴联合发布的服务器产品和数据中心解决方案上。
至强6性能核四大特性,助力数据中心再进化
对于服务器,尤其是AI服务器而言,机头CPU是一个独特的存在,它对于释放AI加速系统性能至关重要,其重要作用包括:
数据预处理,为训练模型准备数据;
将数据传输到加速去进行并行处理;
管理检查点,将数据传输至系统内存;
提供内在的灵活性,可在同一基础设施上运行和处理混合工作复杂。
据陈葆立透露,现在所有AI服务器中,大部分机头CPU使用的依然是英特尔的CPU。
之所以如此,是因为在加速系统中,机头CPU既需要出色的I/O性能、很高的单核性能,也需要支持更快更大的内存,这就使得英特尔至强系列芯片依然是服务器中机头CPU的绝佳之选。
而现在,英特尔至强6性能核处理器成了服务器机头CPU的理想型。
在发布会现场,我们看到了浪潮、联想、阿里云、新华三、超聚变等众多厂商,现场发布了基于英特尔至强6性能核处理器的数据中心解决方案。
超聚变CXL 2.0内存池解决方案是英特尔至强6性能核处理器在内存带宽上性能提升很好的体现。
据超聚变数字技术有限公司服务器产品总经理朱勇在发布会上介绍称,“未来内存会如同网络、存储一样成为算力产业的基础服务,超聚变早期率先在行业内为客户提供了CXL 1.1解决方案,这次再次推出全球首个支持CXL 2.0+的内存池解决方案。”
据悉,这一解决方案在全面支持CXL 2.0标准的同时,超聚变团队基于软件能力实现了CXL 3.1才具备的数据共享能力。
那么,这样的内存池拥有怎样的独特性呢?
据朱勇透露,这一解决方案具备内存即服务、内存即网路、共享内存访问时延<300ns、高可用性和一机多用等特性。
通过CXL 2.0内存池与英特尔至强6性能核处理器的结合应用,超聚变将面向行业提供内存池化集群使用模式和1+1超级服务器模式两种模式,以满足客户需求。
新华三与英特尔合作推出的“G-Flow”油类单相浸没液冷方案是能效优化上的创新体现。
据新华三集团计算存储产品线副总裁刘宏程介绍,“随着算力需求高速增长,数据中心带来高热密度和巨额能耗的问题不断凸显,今年7月我们与英特尔合作基于英特尔至强6推出了‘G-Flow’油类单相浸没液冷方案。”
面对当下节能降碳的大环境,数据中心除了需要节能降碳、降低PUE,同样需要保护环境,这就使得传统服务器的浸没式液冷方案需要一并考虑如何处理由此产生的臭氧的问题。
“G-Flow”油类单相浸没液冷方案就是在这样背景下出现的一个解题思路,在这一方案中,为了增强油类液体的对流,新华三团队设计了一个长800mm专门针对CPU的油道,利用重力差加速浸没式液冷的流速。
借助这样独特的设计,新华三可以将服务器中CPU最大可容忍功耗从普通浸没式液冷600W的水平提升到至高1000W的水平。
再搭配英特尔至强6性能核处理器,新华三得以高效地为用户提供零碳算力。
这两个创新方案,只是此次发布会上英特尔合作伙伴发布的众多创新方案的代表。
实际上,在这次发布会上,基于英特尔至强6性能核处理器,还有诸多服务器产品的发布,例如浪潮信息发布了元脑NF3290G8服务器,新华三还发布了H3C UniServer R3900 G7服务器,中兴通讯发布了R2300 G6等多款服务器,联想发布了ThinkSystem SC750 V4服务器……
这些搭载英特尔至强6性能核处理器的服务器,将在接下来逐步导入数据中心,推动数据中心再进化,并将加速全行业数字化、智能化进程。
好文章,需要你的鼓励
自2022年底生成式AI革命爆发以来,服务器支出也存在类似的态势。一旦企业发现自己必须投资购置或者租用搭载GPU加速器的设备,往往会选择扩展现有服务器机群,被用于投资新设备的支出则自然随之下降。英特尔正在加大对其“Sapphire Rapids”至强SP的投入,AMD在其“Genoa”Epyc 9004处理器上也采取了同样的做法。
生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。
从电子商务到非营利组织,利用企业数据资产可能是组织成败的关键。机器学习和生成式AI是其中的一个组成部分,但要成功地应用这些技术则评估AI对业务的实际影响。
在对生成式AI进行了近两年的试验之后,许多IT领导者已经准备好扩大规模了。然而,在此之前,他们需要重新考虑数据管理问题。