“空调已经调到16°C了,为什么还会热到宕机?”
凌晨四点,机房值班员小张跟IT主管李平面面相觑,两人都从对方眼中看到了深深的迷茫。
五小时前,刚从一个大项目中解放出来的IT主管李平刚在家中沙发上摆好最舒服的姿势,打算好好欣赏下一直没空看的大片儿,就被机房值班员小张一个电话呼来,5台服务器接连宕机,他前一秒还在引以为傲的大项目,下一秒就啪啪打他的脸。
此时的李平眼底乌青一片,在心里止不住叹息,自己主导的这一批服务器上线后,运行几天都表现正常,项目如期完工让老板很是满意,他正琢磨着借此暗示下升职加薪的事儿呢,结果后院起火了,这么多服务器同时死机,要是影响公司业务,老板不得骂死他。
想到这儿,李平缩缩脖子,摆摆手对小张说道:“我们再好好研究一下吧。”
虽然经过4小时的排查,找到了5台服务器宕机的直接原因,温度过高,设备过热自动关闭——服务器正常工作是有一定的温度范围的,且CPU、内存、硬盘都是发热器件,高速运转会带来更多热量,温度一旦超过理想范围,服务器就罢工了。
但是,机房空调正常运转,而且保持在16°C,在这样的低温环境中,其他设备都好好的,怎么偏偏就这5台服务器宕机了呢?难道有什么特别的原因?
李平走到撂挑子的服务器前仔细观察。
“李工,发现什么问题了吗?”小张凑过来。
“你看看这些服务器,有没有发现什么规律?”
“规律?Emmmm,码得都挺整齐的,横是横,竖是竖的,井井有条……”
“你没看到出问题的这几台都是在机柜顶部放着呢吗?我敢肯定,问题肯定出在机柜顶上。”李平当即吩咐小张拿来测量工具。
果然,测完发现机柜顶部温度过高。一番对比测稳之后,他们这才找到了服务器宕机的元凶——
传统机房采用的是底部送风模式,由冷空气从底部吹向顶部进行冷却,然而当冷空气爬到顶部的时候,冷风已经变成了热风,机架顶部的服务器受着阵阵热风吹拂,再加上自身发热,温度逐渐升高超过可承受阈值,就受不了直接宕机了。看来,机柜底部才是最凉爽的地方啊。
底部送风模式
因此为了业务稳定,服务器就不能放在机柜顶部了,这样势必要多加机柜,可紧跟着又会出现另一个问题:一般机房空间都不大,另加机柜会占用更多的空间,面对当今房价居高不下的形势,如果要扩充机房,花销可就大了。
真是一波不平,一波又起,事故原因找到了,如何解决又是个难题。
李平跟小张再度陷入沉思……
有问题,找戴尔易安信啊!
专为HPC/AI设计的
单排高密度全封闭微模块
戴尔易安信一直在为世界上先进的学术和研究机构提供HPC支持,经验丰富,并在近期推出了一体化端到端的HPC机柜解决方案,该方案融合了IT基础架构和数据中心基础设施平台,可进一步降低HPC系统的实施复杂性。
使用戴尔易安信HPC机柜解决方案,系统上线时间至少可以提前两个月,同时更加节能环保——该方案可以将数据中心的PUE值降到1.4以下(PUE=数据中心总设备能耗/IT设备能耗,PUE是一个比率,基准是2,越接近1表明能效水平越好),为HPC系统保驾护航。
戴尔易安信HPC机柜解决方案专为HPC/AI应用场景设计,可大幅提升HPC/AI计算平台的可用性、适用性和灵活性:
● 支持高密度负载应用,可降低初期投资,减少运营成本,节约占地面积;
● 模块化设计,预制化供应,显著减少现场工作量;
● 高效制冷,绿色节能,PUE<1.4;
● 统一管理,保证HPC/AI计算平台在生命周期内稳定运行。
此外,经过专业的风道设计和温控对比,机柜各个位置方向上的温度都能保持一致,避免温度死角,由此再也不会出现高层或者风尾的机器温度过高而宕机的情况了,这里所有机器都能正常运行。
“确认过眼神,是我想要的缘分”
了解完戴尔易安信模块化数据中心资料,李平当即决定按这个样子建设公司机房,他唰唰起草一份采购方案,来到了CIO的门前……
一点小提示
小暑已过,热浪滚滚的三伏天高能来袭,各位看官要注意防暑降温,为了环保和个人健康,建议空调不要开太低奥~
戴尔易安信服务器、存储火热大促!
多品类服务器钜惠出击
低至二六折!
硬盘换闪存1:1促销,
买普通存储,免费升级全闪,不加价!
优惠多多,赶快行动吧!
长按二维码获取您的服务器专属底价!
获取您的服务器专属底价!
长按二维码立享存储优惠!
相关阅读推荐:没有空调,45°C环境下,你能做什么?
了解更多数字化转型方案查看此链接:
https://www.dellemc-solution.com/home/index.html
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
参数实验室等机构联合发布的Dr.LLM技术,通过为大型语言模型配备智能路由器,让AI能根据问题复杂度动态选择计算路径。该系统仅用4000个训练样本和极少参数,就实现了准确率提升3.4%同时节省计算资源的突破,在多个任务上表现出色且具有强泛化能力,为AI效率优化开辟新方向。