服务器,我们将它视为现代数据中心的基石,无论是当下热门的AI/ML/DL还是区块链等,都与计算紧密相连。作为服务器行业的全球领导者,戴尔易安信汇集了全球各地的杰出人才,本篇文章由我们的高级研究员或杰出工程师撰写,从9个角度分析了2019年的计算发展趋势,这些趋势和观察将最大程度地影响2019年的服务器技术和采用。
1从数据时代的转变正在导致芯片复兴
>>>>
Stuart Berke
——Fellow&VP, Server Infrastructure Solutions, Advanced Engineering
>>>>
Joe Vivio
—— Fellow & VP, Server Infrastructure Solutions, Extreme Scale Infrastructure
>>>>
Gary Kotzur
——Senior Distinguished Engineer, Server Infrastructure Solutions, Advanced Engineering
虽然CPU的进步继续提供稳定的年度性能提升,但数据消费时代所需要计算和实时需求,只有创新的处理和系统架构才能满足。目前,应用程序和域特定(domain specific)加速器和卸载引擎正在CPU、附加卡、IO和存储控制器以及专用硬件节点中部署,以提供必要的性能,同时优化总体成本和功耗。
在传统的CPU和片上系统(SOCs)中,指令集架构(ISA)正在扩展,包括优化的矢量和矩阵整数和浮点处理,模式搜索和其他功能。最新的10nm及以下芯片工艺提供了足够的晶体管,允许包含众多专用硅卸载引擎,这些引擎可为加密、压缩、安全性、模式匹配等功能提供数量级的性能提升。
多芯片封装和芯片堆叠的进步允许集成多个处理器、高带宽存储器(HBM)等存储器和其他功能,可以完全有效地处理许多操作,而无需“片外”(off-chip)。
IO和存储控制器也类似地集成大量专用硅引擎和嵌入式或本地存储器,以显著降低CPU的负载。智能网口正在发展,包括多个微控制器,集成FPGA和深度数据包检测处理器。通用GPU正在扩展以紧密互连8个或更多模块,每个模块具有每秒TB的内存带宽和teraflops处理能力,以解决边缘,AI,ML和传统CPU无法满足的其他工作负载。
这些创新架构将新兴的存储级内存(SCM)整合到内存和存储层次结构中,以更低和更确定的延迟,处理数量级更大的数据容量。预计未来几年,SCM的例子包括3D X-point,相变存储器(PCM),磁阻式RAM(MRAM)和碳纳米管(NRAM)。处理器本地SCM将支持数TB的操作数据和持久性,存储系统将利用SCM作为主存储或优化的缓存或分层。
最后,由于传统的制造优势正在结束,随着台积电等开放式制造供应商向所有人提供领先的硅工艺技术,各种已建立和创业公司的创新正在加速。真正的硅复兴正在进行中,以确保今天和明天的计算需求继续以合适的成本,功率和物理包装实现。
2“云回归”正在进行中
>>>>
Stephen Rousset
——Senior Distinguished Engineer, Server Infrastructure Solutions office of CTO
随着云模型的不断成熟,公司正在认识到,围绕公有云的单个云实例面临挑战,并开始将数据和工作负载回送到本地。虽然公有云的兴起为众多公司带来了好处,但是在运营控制,性能问题,安全合规性和云/成本蔓延方面存在诸多挑战。
随着企业和移动优势的增长,混合云模型很快成为大多数企业更合适的解决方案。这项数据/工作负载迁移,称为云回归(cloud repatriation),IDC的调查发现,80%的受调查公司表示将在未来两年内将50%的工作负载从公有云转移到私有或本地位置。
云回归的原因的一个关键驱动因素是数据生成的速度和数量,以及数据的成本,控制和遏制。随着过去两年产生的数据的天文数字增长,当公司需要检索其数据时,即使公有云公司在这两年内降低了数据存储定价,数据检索和访问的实际成本也会随着数据生成CAGR超过了降价幅度。
并且,数据几乎全部被锁定在公有云中,因此有些公司感觉租用他们自己的数据而不是明确拥有它。这一概念在公有云中造成数据严重性,这会给公司带来巨大的意外成本,并加速决定收回对其数据和使用该数据的工作负载的控制权。
戴尔易安信正在与这些客户合作,提供广泛的基础架构解决方案,为他们提供优化的数据放置,保护和分析服务,以维护真正的数据所有权。
3灵动(Kinetic)基础设施之旅继续
>>>>
Bill Dawkins
——Fellow&VP, Server Infrastructure Solutions office of CTO
随着业界在开发能够实现完全可组合的基础设施的技术方面取得了初步进展,“可组合基础设施”和“服务器解耦”这两个术语在2018年进入了许多企业IT部门的思维模式。
随着我们新的模块化平台PowerEdge MX的推出,戴尔易安信在我们的灵动基础设施之旅中迈出了重要一步。 MX平台允许通过其内置的SAS基础架构组成计算和存储资源,它旨在结合新的互连技术,这些技术将实现所有资源的完全可组合性,包括具有亚微秒延迟要求的资源,如存储类内存(SCM)。
MX拥有独特的“无中板”设计,使我们能够考虑采用Gen-Z等高速互连技术(查阅这篇文章了解详细内容 )。它是2019年探索可组合性扩展到存储之外的最佳平台。
灵动基础设施之旅的另一个关键因素是Gen-Z的持续发展。为了实现完全可组合的基础架构的愿景,需要机架级,高速,真正的互联结构,以允许所有组件的组合,包括SCM,NVMe闪存设备,GPU和FPGA。 Gen-Z是互联结构的行业选择。有超过60个Gen-Z联盟成员,2019年将看到更多的技术开发和示范。
虽然Gen-Z对于实现所有组件都可组合的系统至关重要,但2019年也将看到允许组合某些组件的技术的兴起。例如,NVMe over Fabrics将使NVMe SSD池能够动态分配给数据中心内的服务器,同时仍保持足够低的延迟以保持这些设备的性能优势。 2019年将是灵动基础设施之旅加速的一年。
▲▲▲点击图片了解戴尔易安信模块化基础架构
4边缘(The Edge)是真实的
>>>>
Ty Schmitt fello
—— Fellow&VP, Extrem Scale Infrastructure
>>>>
Mark Bailey
——Senior Distinguished Engineer, Extrem Scale Infrastructure
>>>>
Alan Brumley
——Senior Distinguished Engineer, Server Infrastructure Solutions, OEM Engineer
IT硬件,软件和数据中心基础设施的期望将在2019年继续发展。大量数据汲取将需要近乎或实时的处理,这将扩展边缘计算的概念和使用案例。
▓ 有关“边缘计算”的定义仍然没有统一。其中的一个是将“边缘”定义为实现数据聚合和迁移到云的工具。这种情况下,数据流从创建到收集再上流动并最终流入云中, 一系列IT硬件用例正在兴起正在支持这一观点,它们是更小的外形和更坚固的解决方案,非传统的部署和维护方式,并在电源、散热和连接的关键硬件设计考虑因素之间建立新的平衡。
另一种定义“边缘”的观点是将其成为一种手段,通过该手段,传统云架构的计算和存储部署更靠近数据的消费者和创建者,从而减轻云中的负担以及相关的传输机制。这种新模式下,收集的数据可以在本地进行实时分析,只有结果数据被发送到云端。
以上两个观点其实都反映了用户的使用模式,而决定权最终将交给用户。 2019年将迎来边缘端的概念证明(POCs)、客户、边缘托管公司、房地产业主,设备制造商和IT创新者测试业务模式,并积极完善边缘提供的新功能。其中包括传统的托管供应商,新兴创业公司和大型全球基础设施公司,因为他们都在寻求深入了解行业最终的边缘解决方案是什么。
新的IT硬件,软件和数据中心基础架构外形将使客户能够以较小的前期资本支出来测试其解决方案。小型、独立的微型数据中心将使传统IT易于部署和操作,使其更接近数据摄取或供应点。
边缘的演变将为客户和提供商如何使用、分析和分发数据提供巨大潜力。2019年,创建POCs将允许各方审查和测试新技术和相关的成本模型。这些发现将为边缘基础设施和解决方案奠定基础。
5数据科学业务需要AI/ML/DL来颠覆
>>>>
Jimmy Pike
——Fellow&VP, Server Infrastructure Solutions office of CTO
>>>>
Onur Celebioglu
——Senior Distinguished Enginner, Server Infrastructure Solutions, HPC
>>>>
Bhyrav Mutnury
——Senior Distinguished Enginner, Server Infrastructure Solutions, Advanced Engineering
2019年,随着“数据创造IT”转变为“数据消费IT”,信息技术的界限将被拉伸到极限。随着组织需要分析的数据量和种类的呈几何速度增长,(AI)人工智能/(ML)机器学习/(DL)深度学习会帮助我们将数据转换为信息。因此,2019年,下列需求将会增加:
具有应用这些技术解决业务问题的专业知识的人;
AI/ML/DL工具、方法和算法的进展和标准化;,
运行这些工作负载的计算/存储/网络基础设施将是惊人的。
我们已经看到采用GPU和FPGA等加速器来满足日益增长的计算需求,今年,我们将看到更专业的软件解决方案以及加速AI工作负载的“专用”ASIC。在提供更多选择的同时,这将使公司更难以选择他们需要投资的技术以获得持续的成功。
总的来说,HPC(高性能计算)将继续影响主流的批处理导向科学计算以及企业解决方案,并扩展传统的性能极限。向数据消费IT的过渡将带来对HTPC(高吞吐量计算)的大量关注。
2019年,随着数据的持续增长(特别是在边缘),ML-I(机器学习推理)将成为数据源头的第一层“预筛选”。虽然混合云、AI、ML和边缘计算等术语相关的新闻将继续存在,但随着真正的解决方案提供商寻求在正确的地方做正确的事情而不管它的名称,这些概念本身将变得越来越不重要。
戴尔易安信为AI提供了多种解决方案
我们相信,2019年将是训练和推理的“ASIC年”。将会有许多新的解决方案突然出现,并且随着它们的到来,许多解决方案也会消失。与GPU提供商的训练模型相比,许多人已经意识到推理的市场机会要大得多。有几家公司打算占据市场份额,包括像Graphcore这样的公司,他们的训练和推理加速器,AMD的CPU和ATI GPU,以及英特尔的CPU和Nervana ML协处理器。
幸运的是,几乎所有的数据科学工作都发生在Tensorflow或PyTorch等几个流行的框架之上。这允许提供商专注于这些框架的最佳底层资源。最重要的是,我们已经开始看到模型传输和标准化的开始,可以在一个环境中创建完全训练的模型,并在另一个不同的环境中完全执行。2019年,预计在模型标准化方面将取得更多进展。
下一个重大挑战将是模型验证和消除中隐藏在训练集中的偏见,以及最终信任......换句话说,如何去信任它们的描述、衡量、验证以及最后,行业将如何处理赔偿。我们已经看到了ML对语音和图像识别以及各种“推荐系统”的巨大影响。对于2019年的大部分时间,我们可以预期这些应用程序将继续发挥“人工辅助决策支持”的作用。
6区块链可以使企业受益
>>>>
Gaurav Chawla
——Fellow & VP, Server Infrastructure Solutions office of CTO
企业总是在寻求方法和途径,使他们的系统更加安全和透明。区块链可以提供底层技术来构建这样的解决方案。区块链的起源可以追溯到2008年10月,当时第一份白皮书是针对“点对点电子现金系统”发布的,并诞生了数字货币比特币。
十年后的2018年,我们看到了在加密货币领域的大量宣传和活动。和其他曾经或现在初期处于早期的影响技术(例如AI / ML / DL,边缘计算 / IOT,5G)一样,我们既看到了一些技术爱好者认为区块链是分散身份、分散可信计算和下一代互联网的圣杯,也看到了另一些人认为区块链只是一个分布式数据库的怀疑态度。
2019年,我们将看到区块链的活动增加以及解决企业工作流程和用例的能力。实质上,这是关于将分布式账本(它是区块链的基础技术)应用于企业工作流程。我们将看到它转变为真正的PoC,以实现分布式账本(DLT)的这一承诺。
一些初始用例可能侧重于改进企业用例中的审计/合规性实施,或者实现跨多方(竞争对手,供应商/供应商和客户)的信息安全共享。这些实施将推动基于区块链架构的行业协作的增加,并产生专注于特定行业垂直行业的联盟:财务,物流/供应链,医疗保健和零售等等。这些项目将推动棕色地带部署中的DLT集成,并将结合使用离线和链上处理。
大多数数据将被存储在现有计算/存储的外链上,并且信息将被带入链中,其中不变性、安全性/加密和分布式数据库的区块链属性提供了益处。智能合约将发挥关键作用,多区块链架构将开始发展。我们还将看到DLT与IoT和AI/ML/DL中新出现的用例集成的增长势头。
在戴尔科技集团,我们支持基于开源项目Concord的VMware Blockchain和其他开源区块链实现。我们期待将这些区块链项目带入下一级实施和联盟参与。
7安全威胁指数保持不变
>>>>
Mukund Khatri
——Fellow & VP, Server Infrastructure Solutions, Advanced Engineering
在去年我们经历一系列高危漏洞事件之后,人们很难理解“更糟糕”的含义。 2019年将看到安全威胁和事件呈指数增长的又一年。
对企业来说,及时进行补丁管理比以往任何时候都更加重要。人们将更广泛地认识到服务器架构中对网络弹性(cyber resiliency)的迫切需求,如戴尔易安信PowerEdge服务器中现有的那样,可提供系统范围的保护,完整性验证和自动补救。虽然坚不可摧的设计是一个神话,但现代基础设施的计算,管理和结构域将需要有效的信任根和可信赖的启动流。监测和补救技术将得到增强,这些技术必须使用AI和ML来发展,以增强其系统的安全性。
2019年,供应链问题将成为所有IT采购的首要考虑因素。最近看到,供应链中的漏洞可能极难被发现,包括硬件和软件,并且对所有参与者而言可能是灾难性的。今年的主要目标之一将是成功的入侵无害。换句话说,如果有人可以进入平台,确保他们无法获得有意义的信息或造成损害。这将推动创新,基于增强的身份管理提供更强烈的信任策略。
所有级别(用户,设备和平台)的身份都将成为一个重点,需要一个完整的端到端信任链,以便能够在平台上安装可执行文件的任何代理和确保信任的策略工具。这可能包括基于区块链的选项。
对任何静态数据进行加密,无论是在边缘还是在数据中心,以及强大的加密密钥管理将会受到关注。安全飞地(Secure enclaves)以更好地保护秘密是另一个新兴的解决方案空间,这也会更受到关注。类似于欧盟的通用数据保护法规(GDPR),加利福尼亚州的消费者隐私法案(CCPA)和澳大利亚的加密法,保护客户数据的规定也可能会增加,从而推动合规成本并迫使权衡取舍。
最后,存储级存储器(SCM),现场可编程门阵列(FPGA),智能网卡等新技术虽然对数字化转型至关重要,但它们将带来一系列独特的安全挑战。对于2019年和可预见的未来,安全威胁的指数轨迹将保持不变。
8开源“是不断给予的礼物吗?”
>>>>
Stephen Rousset
——Senior Distinguished Engineer, Server Infrastructure Solutions office of CTO
>>>>
Shawn Dube
——Shawn Dube – Senior Distinguished Engineer, Server Infrastructure Solutions, Advanced Engineering
开源软件(OSS)的采用和扩散创造了创造性社区,并在许多不同领域提供了知识杠杆,为IT生态系统提供了大量的产品选择。这种持续扩大的开源选择和公司不屈不挠的减少开支的愿望,加强了“免费”资本支出在C-Suite的开放源代码的吸引力。
但是围绕开源公司的实现表明,开源的“免费”并不像啤酒那样免费,而是像免费领养小狗一样免费。虽然免费的小狗也可以带来不同类型的享受,但它确实需要更多的关注,护理和持续的费用来保持健康。
戴尔易安信一直支持OSS并且仍然非常看好开源社区,但是”就需解决方案“相比DIY模型更能引发构建、交付和工作这三者共鸣。虽然开源最初看起来非常吸引人,但开源DIY模型需要保留公司中正确的(通常很难找到)技能组合,选择正确的零件以集成在一起,当然还有持续的维护所有那些整合的部分。
我们已经看到许多客户不得不重置他们严格的DIY模型,并寻找其他方法来实现高级业务目标。戴尔易安信认识到客户选择的愿望,并提供了一系列选项,从完全支持开源软件包的“就绪解决方案”解决客户工作负载,再到利用开源或合作软件包的高度优化的“工程解决方案”。
9遥测技术将为IT带来更高水平的智能
>>>>
Elie Jreij
——Fellow & VP, Server Infrastructure Solutions, Advanced Engineering
>>>>
Jon Hass
——Senior Distinguished Engineer, Server Infrastructure Solutions office of CTO
优化和提高IT运营效率是每个企业共同的目标。实现此目标的方法之一是在硬件和软件基础架构上集中更多遥测数据,以供管理应用程序和分析使用。
随着用户对获取遥测数据需求的增加,收集方法需要改进和标准化。这已得到戴尔易安信和DMTF标准组织的认可,该组织最近发布了Redfish遥测模式和流媒体和事件规范。这些规范简化并使数据收集任务在基础架构组件中更加一致,并使数据分析应用程序能够专注于数据内容,而无需处理多种收集方法和格式。
IT基础架构组件具有各种不同设备之间的接口机制和协议(例如Modbus,I2C,PWM,PECI,APML ......)。本地管理控制器可以使用设备和组件特定协议收集遥测数据,然后将标准格式的数据流式传输到远程遥测客户端和分析应用程序。本地可管理性控制器的示例包括IT设备的IOT网关、服务处理器或基板管理控制器、或数据中心内部或外部的其他控制器。规划遥测利用时要考虑的因素包括带宽,安全性,一致性,延迟和准确性。
虽然人们最近在关注特定于应用的遥测,例如人脸识别或客户购物模式。但关注IT基础设施遥测将允许更智能地管理计算,存储,网络和相关的软件基础架构。基础架构的流式一致和标准化遥测信息,将使分析应用程序能够优化可管理性,提供预测性故障和网络入侵检测等自动化,并更有效地运行基础架构。随着IT基础架构特性的发展,这些功能变得越来越重要,能源效率、边缘部署和降低总体拥有成本等方面将继续被优先考虑。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。