近日,戴尔易安信第14代硬件平台在TPCx- Big Bench基准测试中,在10000:1的比例因子上再次取得性能领先。
计算机性能基准测试是通过特定的工作负载,去探索、测量和评估某台系统的相关性能。行业标准的基准测试,允许研究者们将自己系统已经取得的最佳性能,与来自另一个实体或完全不同行业的系统进行比较。然后,借助这一结果来辨别一家组织的性能流程中存在的差距,以便帮助该组织取得竞争优势。此外,基准测试结果还可用于比较行业内各厂商产品的性能。
戴尔易安信通过行业标准的基准测试,向客户提供客观的、可检验的、与硬件平台和解决方案相关的性能数据。客户在设计解决方案和确定其规模时,可以使用该数据为商业用例提供最优的性能,以及按需扩展规模。
随着大数据分析系统的成熟,组织面临着“评估和比较系统性能和性价比”的迫切压力。为了解决这个问题,事务处理性能委员会(TPC)开发了TPCx-Big Bench(TPCx-BB),这是一个用于比较众多BDAS解决方案的性能测试标准。关于TPCx-BB技术规格的详细信息,请参考:http://www.tpc.org/tpcx-bb/default.asp。
今年,戴尔易安信在TPC网站上发表了SF10000 TPCx-BB性能基准测试结果,该结果占据了性能表和性价比表第一名的位置。该结果表明,截止到测试日期,戴尔易安信在10000:1的比例因子上,以及TPCx-BB基准的性能表和性价比表中均取得了性能第一。这是继2017年夏季,戴尔易安信率先取得该结果后,第二次取得这一测试结果。
测试系统组成
此次提交测试的系统由1台戴尔易安信PowerEdge R640服务器(主节点)和18台戴尔易安信PowerEdge R740xd服务器(次节点)组成,系统配置图如下▼:
测试方法
该性能测试基准设计为:使用30个查询项(工作负载)的单流(功率测试)和并发流(吞吐量测试),对大数据集群的CPU和IO系统进行压力测试。
每次测试运行分为三个阶段:载入、功率和吞吐量。为了让测试通过审查,必须执行两次按顺序的性能测试运行。
测试结果
下表总结了戴尔易安信R640/R740xd配置的整体TPCx-BB性能数据▼:
竞争环境
TPCx-BB性能基准测试标准已发表SF1000、3000、10000和30000的结果。戴尔易安信已于2017年5月提交过一次已发表的SF10000结果,该测试基于的是第13代硬件(英特尔至强Broadwell处理器)。截止到2018年4月4日,只有戴尔易安信和一位友商发表了SF10000的结果,这些测试基于搭载英特尔至强Skylake处理器的服务器。另外两位已发表SF3000和1000结果的友商,其服务器分别基于的英特尔Broadwell和Haswell处理器家族。下面,列出唯一一位可与戴尔易安信第14代服务器的性能数据具备现实可比性的友商的SF10000测试结果:
结论
自从2015年12月TPCx-Big Bench性能测试标准发布以来,戴尔易安信已成为TPCx-Big Bench技术委员会的活跃成员之一,并且将继续与业内其他利益相关者合作维护TPCx-BB技术规格。
戴尔易安信使用TPCx-BB工作负载来比较和差异化其数据分析解决方案。另外,还将使用这些解决方案来确定性能特征和优化性能,以便为客户带来益处。
行业标准计算机测试基准不应被视为纯粹学术性的行为,或供应商之间的竞争。研究最高性能系统的设计方式,能为客户带来显著的益处。如今,戴尔易安信围绕TPCx-BB性能基准开展行业合作,可改善面向数据分析的性能工程设计,使之更加先进。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。