早早收工回家,
赤脚蜷进沙发,
听着喜马拉雅,
赶赴周公夜话。
噫!潇洒!
“莫听穿林打叶声,何妨吟啸且徐行,竹杖芒鞋轻胜马……”一首《定风波》徐徐吹入耳畔,沙发上的老周渐渐没了动静。
“老周,帮我择点菜!”
沙发还是那座沙发。
“爸爸,陪我打游戏吧!”
沙发依旧是那座沙发。
“叮咚!”
沙发活了!
睁眼——起身——看手机——拿包——穿鞋出门,这套动作行云流水,是老周一气呵成的佳作:“老婆,刚收到一封邮件,说公司有点急事儿,晚饭我就不跟你们一起吃了。”
“别的事儿叫不醒你,公司来点消息跑的比火箭都快……”周太太在厨房气得直翻白眼。
同样是存储,差别为何辣么大!
这边老周打车朝公司飞奔而去,一路上火急火燎:存储磁盘突发故障,可是个棘手的问题啊,希望不会造成太大影响。
作为一家知名银行的存储管理员,老周每天的工作就是维护银行数据中心的存储系统正常运转,保障银行业务的持续运行。
这家银行历史悠久,规模宏大,服务网点遍布全国各地,IT系统一直是重要的业务支撑手段,世界上有名的、没名的各种牌子的存储设备济济一堂,塞满了一间屋子,行走在这些存储设备之间,就跟逛万国博览会一样。
对这些设备,老周像照顾自己孩子那样认真细心,尽管每天操碎了心,但这些孩子还给老周带来了无比的骄傲与自豪。
20分钟后,老周到达现场,原来是一台戴尔易安信SC存储的硬盘报故障了,这台存储已经运行N年,如今还是头一次报错。
按照操作手册的提示,老周将坏盘标识,并启动了RAID重构进程。
这边还没处理完,那边X家的一台存储坐不住了:一块磁盘报故障。
虽然对老周这位经验丰富的系统管理员而言,磁盘故障处理实在是小菜一碟,但一天内两个厂家的存储都出现坏盘的情况还真是不多见,没办法,X家的存储也需要启动RAID重构进程了。
看着两台存储上不停闪动的小红灯,老周忧心如焚:这两块坏盘都是大容量磁盘,得恢复到啥时候啊?老天保佑,千万不要在磁盘恢复的时候再发生坏盘情况了,数据一丢,可是要命的节奏呀。
▓ 一天之后,SC存储的RAID重构完成,谢天谢地!
“咦,怎么X家的还没完?”老周泛起嘀咕,“难道是存储太老了,性能有点差?”
又等了几天,X家存储的重构才结束。
“奇怪,时间怎么差这么多,按理说就算X家的性能差点,也不至于有辣么大的差别吧!不行,我得研究研究。”结束故障处理后,学习模范老周立马捧上两家厂商的白皮书看起来。
原来,相比于X家,戴尔易安信的SC存储并未采用传统的“热备盘”手段,而是使用了“热备空间”(Distributed Spares Space)的技术。
热备盘弊端凸显
任何基于阵列的磁盘系统,都是使用RAID来保护数据,RAID技术发展至今已有三十多年的历史,在保护数据免受磁盘故障影响方面颇具成效。
当磁盘发生故障时,RAID会使用镜像或基于奇偶校验的算法提供对数据的访问,以实现数据冗余和提高性能,不过在某些情况下,如果磁盘发生故障,就必须先更换磁盘才能再次实现完全冗余。
为了加快磁盘更换进程,磁盘阵列可以包含专用的热备盘驱动器。不过在重建操作期间,使用专用热备盘的传统磁盘阵列会将所有重建写入都转到单个磁盘,进而把重建速率限制为写入此单个磁盘的速度,严重影响了磁盘的重构速度。
另外,随着磁盘容量增加,故障磁盘恢复重建的时间也越来越长。与摩尔增加晶体管密度的定律类似,随着时间推移,磁盘驱动器的容量也在迅速增加,更大的硬盘驱动器则需要更长的重建时间,而在驱动器重建过程中,如果同一个磁盘组又有一块磁盘变得不可用,就会导致数据永久丢失。
戴尔易安信热备空间技术
在失效的磁盘重建操作中,最主要的瓶颈是正在写入数据的单个热备磁盘驱动器,在单个磁盘,数据只能写这么快。
提高驱动器写入速度的典型解决方案是分散工作负载到更多的驱动器,从而可以在更多磁盘发生故障之前完成RAID组的重构。
为此,戴尔易安信SC存储做出了重大改变——采用分布式热备空间,替换专用热备盘,在每个其他磁盘驱动器上保留重建空间,主要目的正是要解决由较大的硬盘引起的日益增长的重建时间窗口问题。
▲点击图片,了解更多戴尔易安信SC存储信息
分布式热备空间技术下,驱动器总数和可用数量数组中的空间不会改变,唯一的变化发生在备用容量或备用空间的布局中,备用容量不是将所有的备用容量都放在专用热备盘,而是分散在所有磁盘上,进而可显著提高磁盘组RAID重建的效率,并成倍地缩短重构时间。
使用热备空间技术,可以获得如下优势:
1
缩短磁盘重建时间
戴尔易安信SC系列存储的RAID分布式备用空间功能,在多个磁盘并行写入和读取重建工作负载,可显著加快重建操作速度,在更短的时间内实现全面的数据保护和冗余重构,与传统热备磁盘的单块盘读写相比,效率提升了好几倍。
2
提高整体RAID性能
在具有热备盘的传统RAID配置中,并非所有磁盘都存储用户数据。热备盘只有在磁盘发生故障时,才参与RAID重建的读写操作,因此不会对整体阵列性能做出贡献。例如,在具有12个磁盘的系统中,其中1个是热备用磁盘,就只有11个磁盘参与贡献系统的I/O。
但是,使用分布式备用空间就不一样了,以前的热备盘合并到用于用户数据的磁盘集之中,磁盘阵列里每个磁盘都存储用户数据,从每个磁盘中留出一小部分作为分布式备用容量,由此在磁盘总数保持不变的情况下,增加了贡献用户数据I/O的磁盘数量。比如上例中,12个磁盘都执行用户数据的I/O操作,随机工作负载有效增长了8%。
3
延长磁盘的使用寿命
最后,分布式备用磁盘将每个磁盘的一部分留作备用容量,相较于传统的专用热备盘系统,这种配置减少了热备盘驱动器的工作量,可有效延长旋转硬盘和固态硬盘的使用寿命。
“啧啧,热备空间技术真不错,这次存储磁盘故障,要给戴尔易安信SC存储点个大大的赞,重建快,又没有任何数据丢失,以后得建议领导多采买些SC存储了,靠谱儿!”老周抚摸着SC存储,脸上露出慈父般的笑容。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。