我们财务系统坏了!
我们ERP数据库废了!
我们交易信息系统宕了!
我们邮件系统又Down了!
老板说,核心业务系统再Down机,就把我Down到一线去!
总监说,再解决不了客户访问系统不定时中断问题,就让我打包回家!
财务发通知,生产系统宕机给公司造成的损失,会从我年终奖里扣!
公司自建机房老出各种问题,我还会怎样……
心情down down down↓
大脑duang duang duang↑
而且公司的内网还中病毒了,员工系统都进不去了,新项目的设计稿和方案书全在电脑里,如果不能快速恢复系统和数据,项目就不能如期交付了,把我们公司赔进去都不够违约金啊。
即便只是普通应用服务上的一个宕机事件,或者是一个小小的防范疏忽,都可能引发一场大灾难。换位思考,如果上述情况Dàng的是我们呢?
今天,你Dàng了么?
美国Gartner公司在其发表的一项调查结果中指出:
“多数中小企业疏于制订防范灾难对策。一旦发生灾害,5家公司里有2家将在5年内关门”。40%的中小企业因灾难防范不足而关门,可见除了开展新业务外,业务的持续性也是同等重要。
在如今的数字经济时代,IT系统为企业生产力带来的促进和水平提升,也是非常显著。特别是随着我国“互联网+”和《中国制造2025》计划的发布,中国企业向数字化全面转型。建设智能化平台,利用大数据、云计算、物联网、移动互联和人工智能等科技手段,提升数字化和信息化水平,提升业务效率。随之而来的,对于IT平台的业务连续性需求与挑战也变得越来越紧迫。
如何做好数据、应用、设备、数据中心的容灾,是需要从规划、部署到运维进行全方位的防护,并通过标准的流程及管理机制配合执行。如今确保IT系统高可用性并确保业务恢复的高效性,直接决定着业务的安全性和持续性。
那么现有IT平台保护是否完备,制度流程是否可靠,容灾等级如何,该怎样自我审查呢?
十问麦赛尔夫
我们先来了解一下,国家在这方面制定的标准规范。以2007年11月《信息安全技术信息系统灾难恢复规范》(GB/T 20988-2007)的内容来看,灾难恢复能力等级以RTO(复原时间目标)和RPO(复原点目标)定义了下表的6个等级。
GB/T 20988-2007 RTO/RPO与灾难恢复能力等级的对应表(GB代表的是国家标准)
RTO简单理解就是服务中断多长时间,这个是关系到中断期间数据丢失和业务停滞而带来损失的指标;RPO简单理解就是多长时间恢复业务和数据,是个业务恢复的时间参数。这两个指标是在成本和风险中进行选择或进行平衡,成本、风险和时间的关系可以通过下图进行理解。
可能很多人有了较好的基础,可以进行自我评估。对于这方面没有太多经验或没时间学习的用户,也可以简单的方法进行评估。我们可以通过下面的10个问题进行自我检查,这些问题中从现状、潜在隐患、问题重视度、规划、恢复、执行、演练、验证、监管以及风险管控策略等多维度进行评估,甚至也考虑到企业自身情况等客户因素。我们可以看看是否有待解决或需要完善的部分,然后对应自己公司的现状和级别要求,进行相应改进以降低风险。
十问麦赛尔夫
一,在过去的1年,是否有过业务停机的经历?
二,在过去的1年,业务停机使你的组织提出灾难恢复计划的可能性是多少百分比?
三,在过去的1年,评估你的关键应用的计划内的宕机时间。
四,在过去的1年,评估你的关键应用的非计划内的宕机时间。
五,在你最近的宕机期间,你的策略和相应的结果是怎样的?
六,你的要求和业务政策要求你多长时间测试并验证你的容灾能力?
七,当我们的关键系统维护,公司将数据上传到什么应用和平台?
八,对于一个业务适合的容灾项目的建立和执行,面临最大的挑战是预算?技术 ?业务优化?
九,你的业务连续策略是否和风险管理/事件响应/执行管理一致?
十,对于你大多数关键应用的所有恢复目标,你的容灾恢复能力信心如何?
通过自我检查和分析,再结合国标定义的等级衡量图表,我们会发现多数结果为2-4等级。那么在数字化转型的今天,这样的等级,特别是对智能化、数字化转型的企业客户来说,信息安全和业务的持续性显然是有很大风险的,此风险性可能会给企业带来不可估量的损失。
部分用户测试后对于是这10个问题也许已经了想好了答案,觉得已经很全面了,其实还不全面!
打铁还需自身体硬
我们来看看Gartner公司的另一调查数据:
关键性应用(Mission-Critical Applications)的中断,80%的起因都是人为失误及操作故障,而由于技术欠缺、环境障碍或灾害造成的只有20%。
所以人为失误及操作故障的防护也是业务连续保障的重要一环。
在我们工作中常常会有这样的情况:
? 电脑因更新重启数据没保存而丢失;
? 员工安装非法软件或使用自用U盘使局域网内因大面积中病毒而影响工作;
? 系统管理员误操作或有意改了核心数据库;
? 新上线的软件系统未能经完整测试上线后使主要业务系统服务停止等等。
这些例子就是常见的人为失误或误操作引起的业务停止问题。此类业务问题包含像备份机制不建全、病毒入侵、非法操作、恶意篡改、数据盗取、重要信息丢失等数据类信息安全方面,也包含像测试或风险评估不足而引起的对内和对外的关键业务中断。对于这些方面,越来越多的企业已经引起重视,并在寻求像戴尔易安信这样的端到端解决方案厂商帮忙。
如果你通过上面的10个测试问题,或上面讨论的人为失误或操作故障引起的业务风险问题内容,恰好帮到你发现了自己公司可能存在的风险或恰好是正待解决改进的问题,或者是想提升你公司的IT业务持续性和数据保障,你可以联系你的专属戴尔易安信解决方案团队,和你一起探讨改进计划和策略,完善IT业务连续性体系架构,为企业的快速和健康发展保驾护航。
戴尔易安信为用户提供业务连续性咨询服务,以及端到端的业务连续性方案。戴尔易安信凭借自身成功的经验和在全球得以验证的最佳实践,以全面的端到端解决方案和咨询服务能力,为客户提供规划、部署和平台支持。戴尔易安信能够根据你的需求,在数据、应用、设备、平台、数据中心方面提供业务连续性方案,消除中断业务的隐患;基于标准化、开放的业务架构技术,让用户可以提高已有业务的连续性,给客户带来更多的投资保护。同时,持续满足不断发展的业务需求和实现业务连续性升级,提高IT长期投资保护,并满足用户容灾RTO/RPO和业务战略需求。
通过调研评估现有IT环境,为用户制定容灾建设规划及培训,并提供容灾方案规划,如从网络架构、数据库双活架构、存储架构、备份架构,到虚拟化等全方面技术指标建议和技术审核指标。在系统集成与服务、连续性评估、恢复演练等管理方法下,为项目完整落地和用户已有业务的评估提供保障。
初心不改
戴尔易安信秉承“在中国,为中国”的4.0战略,深刻理解“互联网+”和《中国制造2025》战略规划,致力于提供具有戴尔易安信特色的解决方案和服务,帮助中国企业通过数字化转型,实现解决面临的挑战和IT需求,为不同的企业提供个性化的方案。
好了,要和大家分享的内容这么多了,如果有相应的问题需要探讨,就找到对应你的专属戴尔易安信解决方案团队沟通吧!!
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。