实测,当3大突发故障来袭…… 原创

在上一篇E企研究院构建的数据中心级存储系统架构测试中,SC7020和FS8600在块数据存储和文件数据存储方面的基础性能令人拍手叫绝:SC7020获得了40万和28万随机读写IOPS,FS8600在4K小文件读写方面达到近4万OPS和1.8万OPS...

多巴胺是一种神经传导物质,用来帮助细胞传送脉冲的化学物质。简单讲,它传递兴奋及开心的信息。

比如女性,吃了甜食,买了新衣服都可以分泌多巴胺。对于男性,引发分泌多巴胺的刺激也有很多。

今天,单就男IT而言,多巴胺就是牛掰的数据中心和跑出一个强悍的测试数据。

以下这个测试,让我们的IT钢铁直男hin兴奋!!

基础性能强悍

关键业务支持令人期待 

在上一篇E企研究院构建的数据中心级存储系统架构测试中,SC7020和FS8600在块数据存储和文件数据存储方面的基础性能令人拍手叫绝:SC7020获得了40万和28万随机读写IOPS,FS8600在4K小文件读写方面达到近4万OPS和1.8万OPS,同时读写吞吐方面达到了3.2GB/s和1.3GB/s,基础性能如此强大,让E企研究院后续测试得以拓展更多发挥空间。

在E企研究院构建的企业关键业务应用测试中,SC7020与VPLEX的组合解决方案,不仅为关键业务提供了满足其所需的性能,同时为业务持续运行提供了保障:

1 在支撑以Oracle为代表的数据库应用方面,SC7020提供了接近115万的TPM(即每分钟事务处理数),平均每秒事务处理数接近2万笔,平均响应时间仅为3毫秒;

2 在业务连续性测试方面,当生产中心存储(SC7020)不可用,Oracle和VPLEX均自动将业务与数据切换到同城灾备中心,仅17秒的短暂业务停顿,无需人工干预。

实测,当3大突发故障来袭…… Dell EMC SC7020

实测,当3大突发故障来袭…… Dell EMC VPLEX

于是,E企研究院针对这套存储进行了如何支撑企业关键业务应用的性能测试,并以各种 "强悍直男级"问题与故障挑战这套存储系统,实力“直男”的表现又怎样呢?

精致内核

保障关键业务应用

对于绝大多数企业而言,数据库绝对是最核心的应用之一,对于核心数据库数据的保护基本都是最高等级,E企研究院首先对这套存储系统在支撑核心数据库应用方面的性能表现进行了测试。其测试架构如下:

实测,当3大突发故障来袭……

E企研究院利用Oracle公司推出的12c数据库作为本次测试的关键业务应用,承载平台为具有RAS特点的Dell EMC PowerEdge R840四路服务器,每个数据中心部署一台R840服务器,其中生产中心与同城灾备中心部署Oracle RAC集群,使用主备模式,当生产中心出现故障后,可以自动切换到同城灾备中心继续提供数据库服务。

生产中心存储使用SC7020全闪存存储系统,配备12片800GB的写密集型SSD和6片480GB读密集型SSD;同城灾备中心使用SCv3020全闪存存储系统,配置与SC7020相同。SC7020与SCv3020通过各放置数据中心内的VPLEX实现数据同步。同时,在生产中心与远程灾备中心通过RecoverPoint设备将数据异步复制到VNX7600存储系统中。

PowerEdge R840各使用两条16Gb/s FC链路作为数据网络,使用两条10GbE作为心跳网络和服务网络。额外的一台PowerEdge R730作为压力客户端对Oracle数据库下发压力,以测试Oracle数据库性能:

实测,当3大突发故障来袭……

在E企研究院针对SC7020存储的Oracle数据库性能测试中,获得了平均114万TPM,即每分钟可处理114万笔事务,每秒事务处理量接近2万笔(19139),每笔事务处理的平均响应时间约为3ms左右,单笔事务处理的突发最大响应时间仅为21ms,上图中显示实时响应时间为8ms。在获得如此高的数据库性能时,R840四路服务器的CPU占用率仅为48%,仍有余力处理更多事务。

在这一测试环节,E企研究院验证了基于PowerEdge R840四路服务器+ SC7020全闪存储系统为Oracle数据库应用提供较高的计算性能与存储性能,能够满足大多数企业的业务需求。但仅有性能还不够,作为企业IT系统中的核心应用,其数据必须得到完善的保护。

 "强悍直男级"

测试挑战

为了验证这套数据中心级存储系统是否能够如预期那样提升企业的业务连续性水平,E企研究院设计了3种突发故障情况,其主要分为两大类:

非人为故障导致的生产中心停机

如数据中心掉电、自然灾害以及其他因素导致的生产中心故障。主要验证生产中心Oracle数据库应用及其数据是否能够顺利切换到同城灾备中心继续提供服务;同时在生产中心故障修复并重新上线之后,Oracle数据库应用及其数据是否能够顺利回切到生产中心。

人为因素导致的生产中心数据不可用

人为因素可以分为两类:

●  一是由于误操作或者其他因素导致得Oracle数据库文件被删除,无法正常提供服务,需要从同城灾备中心进行数据恢复。

●  二是由于非法入侵导致的数据库数据被篡改,同时生产中心与同城灾备中心网络故障,需要从远程灾备中心恢复指定时间点数据。

生产存储突发故障

VPLEX 17秒自动切换

在第一个测试环节中,启动Oracle数据库,并使用额外的一台服务器作为压力客户端,利用Swingbench数据库测试软件对Oracle数据库下发压力,在稳定运行10分钟后,人为切断站点A中PowerEdge R840(Oracle数据库)与SC7020存储之间的数据映射,模拟SC7020存储突发故障,无法提供数据服务。

实测,当3大突发故障来袭……

在DSM中(Dell EMC Storage Manager,存储管理)中删除SC7020到R840服务器的映射,以模拟SC7020存储突发故障,无法提供数据服务。

实测,当3大突发故障来袭……

当模拟SC7020存储突发故障后,VPLEX成功将Oracle应用从站点A切换至站点B,由SCv3020接替SC7020提供数据服务,整个过程历时约17秒左右。如上图所示,在切换过程中,Oracle数据库经历短暂的等待时间,切换完成后,数据库性能恢复正常。

同时,VPLEX发出报警,在管理界面中,展现SC7020出现故障,无法提供正常服务:

实测,当3大突发故障来袭……

在VPLEX管理界面拓扑中,集群1(即主站点A)中的SC7020存储出现故障,无法访问。一致性组RAC_SC的状态为”OK”, 即在位于站点A的vplex cluster-1和位于站点B的cluster-2上均可以访问这个一致性组,能够为Oracle数据库应用提供正常的数据服务。

与此同时,Recoverpoint对站点C的数据复制暂停,Recoverpoint可以恢复数据复制暂停之前时间点的数据。其需要等站点A的后端存储恢复访问后,VPLEX将站点B的数据同步到站点A后,Recoverpoint再自动恢复站点C的数据复制。

测试证明,在站点A与站点B组成的双活/主备站点架构下,主生产站点A存储在突发故障下,VPLEX能够顺利实现存储切换,Oracle数据库集群(Oracle RAC)也能实现自动切换,切换完成后,Oracle数据库应用能够继续运行,没有出现数据丢失情况。

本次性能测试和非人为故障模拟考验,证明戴尔易安信业务连续性方案能够保障企业核心业务在任何情况下可以稳定、高效、可靠的运行。

未来测试基于Dell EMC公司VPLEX以及SC系列存储构建的数据中心双活/主备方案的还会放出哪些大招挑战“直男”系解决方案,敬请期待。

来源:戴尔易安信

0赞

好文章,需要你的鼓励

2018

08/10

15:54

分享

点赞