新栏目上线|我是戴小乐-集美貌与才华于一身~

“截至2025年,90%的应用程序预计将在5年内使用人工智能技术,然而,与此同时,却只有不到15%的组织正在活跃地使用人工智能技术。”

开个新栏目

两分钟脱口秀

《我是戴小乐-集美貌与才华于一身》
服务器打游戏会更爽吗?
关注“戴尔科技集团”视频号,观看视频

戴尔科技集团

「 戴小乐聊IT 」正式和大家见面啦!从今天开始我们每周一期和大家来一场IT TALK SHOW~保你有趣、有料、有收获?今天,我们就来聊个好玩儿的——服务器能不能用来打游戏?点击视频?集美貌与才华于一身的戴小乐为您解答

视频号

如果你喜欢我,下期继续听我唠唠~

正如服务器是因其“用途

而成为了服务器

跑游戏是可以

但就像赶鸭子上轿——到处飞

并不能给游戏性能

带来任何提升

话说回来

即是在服务器里

也有很多门道

如果选错了类型

跑特定企业级应用

依然不到发挥

比如跑AI就得用

专门的服务器

下面我们就来聊聊

跑AI需要怎样的服务器

企业迈向AI的担忧

根据Gartner《全球IT行业2020年预测》:

虽然只有35%的受访者表示他们已经部署了人工智能(比如NLP,ML,图形化技术等),但仍有52%的受访者表示,他们将在接下来的12个月内进行部署。

同时,IDC在2020年10月发布的《新兴技术和趋势的影响:人工智能》白皮书也显示:

“截至2025年,90%的应用程序预计将在5年内使用人工智能技术,然而,与此同时,却只有不到15%的组织正在活跃地使用人工智能技术。”

这种前后不一致的调查数据表明,企业在向AI解决方案的过渡中仍然具有着很大的挑战。

想解决问题,就要抓住关键,那么,企业在迈向AI解决方案时的难点在哪里呢?

关键在于AI人工智能算法对硬件架构有着独特的要求。

深度学习

理想的深度学习解决方案依赖GPU来开展最大化的并行处理,由高性能CPU来管理分发工作,并使用本地存储作为暂存空间。

机器学习

基于CPU的机器学习技术依赖于众多包含大量计算内核和大内存容量的服务器。

流分析

使用Spark内存处理技术来进行流分析,需要最高的CPU性能和大内存容量,以便规避本地存储的瓶颈。

推理

推理功能对CPU、本地存储和吞吐量提出了极致的要求,以便在数据被捕获时,将复杂的预测模型实时应用于大量数据。

其实,系统工作时,AI工作负载的数据处理是一个循环的过程,它包含着数百万个不那么复杂的计算,同时也需要进行组织并行操作和快速移动数据,而数据通过硬件系统及其组件的速度越快,就可以处理得越快。

此外,服务器中的每个组件(CPU、GPU、内存、存储)也必须保持和其它组件相近的速度来执行任务,这样才能消除瓶颈,提升处理的速度。

这就是为什么对于AI工作负载来说,最重要的一个因素是并行I/O吞吐量。因为AI工作负载的速度只能与系统中最慢的组件的速度一样快,所以优化服务器中的组件就显得非常重要,比如,汽车制造就是一个很好的例子

企业想要造一辆汽车,就必须有发动机、底盘、悬架、车身等部件,而这些部件都是需要时间完成的。那么如果想组装完成一辆汽车,除非这些组件全部完成生产,否则是无法进行的。 

所以,其实完成一辆汽车生产的订单时间,主要取决于其中耗时最长的组件生产时间。

戴尔易安信PowerEdge XE8545,通过结合数据处理中的全部组件,最大程度上缩短了“汽车生产中耗时最长组件的时间”,充分提高了系统的工作效率,实现了在数据流和计算可能性方面的突破,从而在竞品中脱颖而出

人工智能基础架构的未来

戴尔科技致力于为客户提供满足各种需求的AIML解决方案。最新推出的PowerEdge XE8545就是一款人工智能工作负载的强大动力引擎

这是一款为优化最新行业技术而打造的2路4U系统,由人工智能和数据分析驱动的、最新的高性能计算就绪解决方案,使用时,它能让用户轻松地在一个系统上运行人工智能、分析和高级计算等工作负载,同时可对企业的计算性能进行大幅加速

PowerEdge XE8545适用于开发、训练和部署先进的机器学习模型,为复杂的高性能计算工作负载加速,或者托管加速的虚拟化服务。

 1   优化的CPU和GPU性能

XE8545使用具备最多核心数量的第3代AMD EPYC™ Milan处理器,以及最高功率的NVIDIA A100,充分满足客户在数据处理过程中对于大容量和高性能的需求。

①XE8545将新一代AMD EPYC处理器的最多核心数量(128)与当今可获取的最高GPU内存和带宽相结合,突破了AI计算的边界。

②XE8545使用一组灵活的虚拟化选项来托管多租户环境:NVIDIA的vGPU软件及新的多实例GPU (MIG) 功能。每个A100 GPU可划分给多达7个实例,从而提供7倍于V100的性能,充分将利用率最大化。
③XE8545可选择强劲的40GB/400W GPU或者具有空前高性能的80GB/500W GPU,同时保持高效风冷的 (35°C/25°C)数据中心环境。

举例来说,尽管XE8545已经将ResNet50图像分类训练到了最高质量的精度但花费的时间却还不到上一代PowerEdge系统的一半。 

▲MXNet Training Performance in Minutes (Time to Train, lower is better)

 2   加快I/O吞吐量
XE8545通过结合其全部组件(包括NVLink、PCIe Gen 4.0和NVMe SSD),实现了在数据流计算可能性方面的突破,因而可以在竞品中脱颖而出。

1.相比当今的加速器,XE8545实现了 6-7倍的机器学习性能 (2倍的HPC性能) :支持PCIe Gen 4 A100 SXM4 GPU,并通过低延迟无交换机设计提供最高的对等带宽 (600GB/秒) 。

2.提升机器学习训练。通过稀疏矩阵的乘法运算,XE8545实现了20倍的性能增进,并提供了比前代产品高出2倍的600GB/秒GPU-GPU通信带宽。

 3   简化管理

XE8545通过提供OpenManage全栈管理功能、标准深度机架以及空气冷却能力,简化了数据中心的运营。
①XE8545全面兼容iDRAC和Open Management Enterprise (OME)。因此,在使用过程中,企业可以通过集成Open Manage来实施、监控和维护数据中心。

②通过标准深度机架和空气冷却 (35°C)机箱,XE8545支持企业随时将创新技术集成到数据中心,避免了高昂成本的产生。

 4   通过集成的安全特性保护企业的数据中心

每台PowerEdge服务器均具备高网络弹性的架构,从而将安全性深入集成到从设计到退役生命周期的每一个阶段

①PowerEdge可以强化安全性,支持AMD Secure Memory Encryption (SME) 和 Secure Encrypted Virtualization (SEV)。

②PowerEdge服务器可以使用户在安全的平台上运行工作负载,支持加密受信任启动和硅信任根

③PowerEdge服务器可以通过数字签名的固件包来保持服务器固件的安全。

④通过偏移侦测和系统锁定,PowerEdge服务器可侦测和纠正未经授权的或恶意的更改。

⑤通过系统擦除功能,PowerEdge服务器可以安全快速地从存储介质擦除所有数据,包括HDD、SSD和系统内存。

结语

XE8545是强大的PowerEdge GPU支持服务器,它可用于机器学习、深度学习、高性能计算和GPU虚拟化。使用时,无需对其数据中心进行重大更改,它为那些寻找最新加速器技术的客户提供了绝佳的解决方案

PowerEdge服务器代表着人工智能基础架构的未来,它充分发挥了硬件组件在所有方面的毫无妥协的潜力。


尊敬的读者

戴尔盲盒专场,盛大开启!

从家用、设计到商务办公

多款产品一应俱全

超值补贴唾手可得

先揭晓,再支付

百抽百中

快来扫描下方二维码

或点击文末阅读原文

速速参与活动

新栏目上线|我是戴小乐-集美貌与才华于一身~

相关内容推荐:戴尔科技云平台 VCF on VxRail 助力公司业务无缝双向热迁移

 

来源:戴尔

0赞

好文章,需要你的鼓励

2021

04/15

15:27

分享

点赞

邮件订阅
白皮书