“德国当地时间2017年6月21日,ISC17世界大学生超级计算机竞赛总决赛在德国法兰克福会展中心落下帷幕,清华大学团队夺得总冠军,并同时获得深度学习验证码识别挑战冠军。其实,清华大学与HPC的渊源并不止于此。清华大学蛋白质中心打造了生物高性能计算平台,对分辨率为3.6个埃米的蛋白质结构体进行深入分析与计算。清华大学HPC项目引入的戴尔融合架构具有戴尔最先进的ESI (ESI- Extreme Scale Infrastructure)特质,在ESI特质的基础上PowerEdge FX2集合了刀片和多节点机架式服务器的技术优势。使HPC平台IT复杂度降低了50%,将IT人员从繁琐的IT维护工作中解放出来。”
作为一年一度的行业盛会,本次ISC17大会吸引了超过3000名工程师、IT专家、系统开发人员、供应商、科学家、研究人员、学生以及高性能计算 (HPC)全球社区的其他成员参会,重点展示了HPC技术开发及其在科学领域和商业环境中的应用,主要议题包括人工智能与HPC、Exascale超算系 统、大型工程与云计算、大数据实验与大数据分析等等。
面对如此巨大的推广与销售机会,以英特尔和NVIDIA为首的HPC解决方案提供商自然不会错过,各家也纷纷拿出了最新、最好、最高端的产品技术加以展示。这不,就在戴尔展台,我们就看到了一款液冷应用的大杀器——全机柜液冷散热解决方案。
如何实现全机柜的散热
熟悉液冷的朋友可能知道,如今随着HPC的能耗比越来越高,随着大家对于性能特别是计算性能的极致追求,能耗问题已经越来越突出的呈现在我们面前。伴随着深 度学习和人工智能的兴起,传统的HPC行业进入了新的发展时代,新兴的互联网行业也开始采纳一些HPC的架构方式,从而使得整个IT行业都面临了能耗系统 的压力。
对于超级计算机来说,在面向百亿亿次的道路上会遇到“能耗墙”的问题,如何解决这些问题就成为迫在眉睫的事情。为此,早在几年前业界就兴起了液冷散热的方式,通过冷却液代替空气散热,以比热的优势换取良好的散热效果。
一般来说,液冷散热只是针对单一的服务器节点或者某几台服务器进行,通过冷板式散热方式实现散热。但是对于装满服务器的全套机柜系统来说,如何实现散热还是一个困难的问题。
类似天河二号、太湖之光的超级计算机已经有了成熟的液冷散热方案,但毕竟这些方案都是定制化的、而且是高端定制化。如何使得全机柜液冷散热平民化、大众化,让所有数据中心都能够用得起、用得到,这才是一众服务器厂商或者HPC解决方案商需要面对的挑战。
为此,戴尔在本次ISC17展会上特别携手著名散热厂商CooLIT推出了全机柜散热方案,这也是双方首次合作。在现场我们看到,戴尔在展台摆放了一台42U高度的整机柜,通过位于机柜底部的压缩机与各个节点上的导热管,配合冷板式液冷部件实现散热。据现场的戴尔工作人员表示,这款产品主要面对HPC应用与高频交易等高负载应用,将会提供超强的散热效果。
目前,这款整机柜产品可以支持戴尔第14代PowerEdge服务器,加之配备相应的CoolIT散热器及多种服务,可以提供完整的数据中心液冷解决方案。 CoolIT设计制造的冷板解决方案采用温水冷却CPU,无需冷冻水,这样也可以帮组合客户更好的降低冷却成本,同时提高计算密度并最大化其服务器性能, 实现出色的竞争优势。
在现场的发布仪式上,CoolIT公司负责人表示:“我们自豪地通过其专利设计的、直接的液体冷却技术实现更环保的数据中心,并预计与戴尔的创新合作将取得更大的成功”。
戴尔在HPC领域的多重优势
其实随着HPC应用的普及,不仅仅是科研、教育、政府这些大型机构需要高性能计算,一些中小公司也需要高性能计算,戴尔也同样为这些公司提供了完善的解决方案。
在大会现场,我们还看到了基于NVIDIA最强大GPU的Tesla P100解决方案。这款产品可以配合戴尔的多款服务器使用,甚至包括刀片形态的M630服务器。众所周知,P100在本次TOP500榜单中出尽风头,TOP10排名中的多款产品都采用了P100进行加速。戴尔服务器能够支持P100,本身就为客户提供了最强大的GPU加速和深度学习硬件基础。
除了强大的硬件解决方案外,作为全面的企业级端到端解决方案和服务提供商,戴尔还拥有强大的软件能力,并拥有众多合作伙伴,可以提供针对各种行业的应用解决方案。在戴尔的展台中,展示了针对生命科学、制造业和科研等不同行业和应用领域的HPC专业解决方案。其中——
适用于生命科学领域的戴尔HPC系统专为满足生命科学组织的需求而设计,可帮助生物信息学中心和遗传学中心根据临床要求的时限交付结果并确定治疗方案,同时确保合规并保护机密数据。
适用于制造领域的戴尔HPC系统可以帮助制造和工程客户运行复杂的设计仿真,包括结构分析和计算流体动力学分析。
适用于研究领域的戴尔HPC系统能够帮助研究中心根据各种工作负载的独特需求快速开发HPC系统,以开展复杂的科学分析。
与此同时,戴尔HPC还在全球各地的科研机构中有着数量众多的用户实践案例,有能力为包括中科院在内的全球顶级研究机构提供强大的动力引擎。例如在悉尼大 学,戴尔通过打造用于埃博拉病毒研究的“阿尔特弥斯”超级计算机,帮助医学专家了解病毒的传播和突变,以开发疫苗。而在中国,无论是尖端科学研究还是在具 体的商用应用领域,也都能看到戴尔HPC的身影。例如戴尔HPC解决方案就曾为中国的“嫦娥三号”奔月之旅保驾护航,担任并完成了史上前所未有的复杂计算任务。
从本次ISC17大会上,我们看到了戴尔针对HPC行业的一次全系列展示,既有帮助中小企业迈向深度学习和人工智能应用的服务器、加速卡等硬件平台,也有面向大型企业的高端液冷散热产品,还有针对行业细化的不同解决方案。可以说,在HPC领域,戴尔已经能够为客户提供完善的一揽子解决方案,对于不同行业及不同规模的客户,戴尔都能够给予全方位的支持,帮助客户业务成长。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。