首页 > 编程知识 正文

硬件系统管理为什么需要避免单点故障,单一故障点

时间:2023-05-03 05:10:47 阅读:182402 作者:2725

当今社会各行各业对信息系统的依赖与日俱增,尤其是金融等行业,信息系统已无法真正离婚。 在这样的大企业中,信息系统的重要性使得对可靠性、安全性的要求达到了前所未有的高度。 作为提高可靠性、安全性的重要措施之一,投资建设庞大的容灾中心已成为行业的硬性规定,而不是满足一个企业的自身安全要求。 但影响信息系统可靠性、安全性的因素是多方面的,因素非常多,建立容灾中心并不是一次就能彻底解决问题。 本论文希望从多个角度探讨通过减少单点故障来提高信息系统的安全性。

当今信息系统的复杂性要求长信息系统链的每一个部分都要有保障才能完成看似简单的业务操作。 如果这个链条的某个地方出现问题,就会导致业务操作的失败。 金融业信息系统一般是以数据中心、广域网、局域网、应用终端为基础,构建在其上的应用系统,以及维护基础平台和应用平台的组织组成。 因此,无单点故障是指保证上述所有环节均无单点故障。

本文讨论的无单点故障问题不包括个人APP或几个人以下的小团队的无单点故障问题。 实现无单点故障需要巨大的成本,可靠性的提高意味着投资的增加。 因此,无单点故障的设计必须考虑到可能会影响全球或相对较大地区的信息系统,才能进行无单点故障的设计。

http://www.Sina.com/http://www.Sina.com /

1、服务器无单点故障设计

今天,典型的数据中心服务器采用双机服务器或群集设计,以确保如果一台服务器发生故障,关键业务不会中断。 但是,随着计算机APP应用深入到企业的各个方面,企业中许多系统都在各个领域运行,需要数量巨大的服务器来支持这些APP应用。 在相当大的企业中,很难保证所有服务器都能支持双机或集群。 但是随着信息系统在企业中应用集成度的提高各应用系统之间的关系越来越紧密看似无关紧要的系统可能与核心系统密切相关一般系统的故障可能直接导致重要系统的正常运行因此,在服务器配置上,不仅关键系统无单点故障,对大量非关键APP系统也同样考虑双机或集群,实现了无单点故障的设计,使企业APP应用不会因非核心系统故障而成为核心系统

非核心业务的APP应用不一定需要实现双机或集群。 利用已经十分成熟的虚拟化技术,您可以将一台服务器划分为多台服务器,将许多非关键的APP应用系统交叉部署到不同的物理服务器上,以实现相互准备。 基于各系统的重要性和相互关联性,并考虑到整体经济性,非核心服务器不一定是热备盘,有些服务器可以是冷备用的,只要能在短时间内启动,满足APP需求。

2、磁盘阵列无单点故障设计

dding-top:0px; padding-bottom:0px; bord d-color:rgb(201,243,233)">  磁盘阵列本身就是一个相对高可靠性的设备,单个磁盘的故障并不会影响其上存储数据的安全性。先进的磁盘阵列可以通过配置双控制器实现控制器的无单点故障,但背板如果出现故障也将使整个磁盘阵列失效,尽管这个概率很低,风险也还是存在的。因此,如果条件允许,磁盘阵列也应该采用双机互备模式。

3、  数据中心网络系统的无单点故障设计

 一般的数据中心都已经采用双核心交换机模式实现无单点故障。但主交换机之外,防火墙、路由器是否存在双机互备,交换机与非核心服务器是否实现了双线接入都对整个系统的可靠性有重要影响。因此,在网络接入、防火墙、路由器、DMZ区设计等多个方面都需要考虑无单点故障设计。

4、  灾备系统

 灾备系统是确保系统可行性的最后一道屏障。但由于灾备系统投入使用的概率很低,相当一部分灾备系统并未达到理想的随时可以投入使用的状态。灾备中心除了服务器、网络平台要能承担得起主数据中心的关键任务外,不仅要实现与主数据中心各应用系统数据的一致性,应用程序更新版本的一致性,更重要的是灾备中心也需要建立与主数据中心同样能与各机构相连的网络,而不能只与主数据中心有顺畅的网络,因为一旦发生需要启用灾备中心的故障,与主数据中心的网络也会中断。

 为保证灾备系统能够在主数据中心出现灾难性故障时正常启用,一般的点对点方式的SDH专线很难做到各节点在灾备中心启动后,把应用自动切换到灾备中心。就是各节点都向两个数据中心铺设了专线,对于一个有大量节点的企业而言,切换也不是一个简单的问题。建立MPLS网络是解决快速切换的最佳方案,它可以在主数据中心出现故障时,自动切换到灾备中心,真正实现业务的不间断运行。

 二、网络系统的无单点故障设计

1、  广域网的无单点故障设计

 今天建立广域网已经不存在任何技术障碍,可以通过SDH专线实现点对点互联,也可以建立MPLS VPN专网,还可以通过互连网VPN技术建立机构内部专网。尽管今天专线在技术上已经具备了相对较高的可靠性,但施工造成的断网是最常见的专线故障。因此,每个信息节点通过电信、联通两家公司分别建立专线是提高可靠性的有效方式。还可以通过SDH专线与互联网VPN互备实现无单点故障。

 为了防止两条专线被施工时同时挖断,条件允许时,应尽可能采用相隔较远的不同通道汇聚到机房。

2、  节点内无单点故障设计

 所谓节点就是一个与广域网相联的内部局域网系统。由于这些节点可能是几十人,也可能是由成百,甚至上千人的团队组成,还有些节点担负着承上启下的信息传输作用中,因此,为了将故障影响控制在最小范围内,节点内也应考虑无单点故障设计。

 节点实现无单点故障设计的要点一是要实现双线,或三线通过双路由器、双网关接入,配备两个三层交换机,即可实现节点的无单点故障设计,把单一设备或线路故障造成的影响降到最低。

 三、组织架构的无单点故障设计

 无单点故障设计不但要考虑硬件和网络,在组织架构上也必须做充分的考虑。现今企业中的计算机平台日益复杂,应用系统五花八门,需要一个强大的技术团队做好维护工作。一旦维护出现问题,必将对业务经营产生重大影响。

 在组织架构上要做到无单点故障,就要求不管软件、硬件,每一个系统的维护都应有至少两个,或两组人员负责。许多企业通过服务外包的方式,将信息系统的维护交由专业的公司来做,但对于大型的企业自身也应有一批专业技术人员能够承担起各软硬件系统最基本的维护工作,只有这样才能保证一旦出现意外情况时,不会由于维护人员,或团队出现问题,造成系统的瘫痪。

 实现信息系统全部各关键环节的无单点故障需要巨大的资金投入,各企业必须根据自身的实力、信息系统在企业的重要性决定在哪些环节需要加强,哪些环节可以暂缓,在安全投入和获得的收益之间找到一个平衡点。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。