首页 > 编程知识 正文

fmea单点故障,单点故障和多点故障

时间:2023-05-03 22:00:49 阅读:182410 作者:3486

单点故障清水大王关注2015.03.30 08:14*字数1253阅读3212评论1喜欢4今天就来谈谈单点故障,综合各方面观点百花齐放。

一.单点障碍

用户现状:核心系统APP应用服务器已采用双机热备。 大多数用户面临的问题是(双机(两台APP应用服务器组成双机群集);单机柜(共享一台服务器) )用户面临的问题。 过于重视服务器保护,而忽略了更重要的存储设备。 APP应用程序服务器采用双机模式,但共享存储设备,如果存储设备出现故障,整个系统将瘫痪。 如果包含数据的存储设备的存储介质损坏,则只有一个数据,这将导致非常严重的损失。

只有一台积分相关设备,例如存储器,在数据损坏时会丢失,同时客户服务业务也停止了。

我们的HA方案是创建高可用性存储集群,其中一个存储器损坏了,有数据碰到另一个存储器,自动切换到好的存储器,没有单点故障。

另一方面,引用了艰难的夜晚,在消除小规模网站单点故障的“Single Point of Failure”中进行了叙述

单点故障(Single Point of Failure,SPOF ) )让人想起电影《2012》中焊枪卡在齿轮上,导致整个舱门无法关闭,整个发动机无法启动。 这是一个有点生动的例子。 如此巨大的系统差点被一个小焊枪破坏。 投入巨大人力物力生产的救生船无法达到高可用性是致命的。

大脑对人来说,一点,大脑坏了,人也完蛋了; 一只手吗? 从即使一只不见了,另一只也能日常生活的观点来说,不是一点。 消除单点的最常用方法:增加冗馀度。 例如,人有两只手。 其次,分层。 当然,分层的目的是便于隔离问题。 电影《2012》中的这个问题,不知道谁是总设计师,隔离看起来不够(: )

某些站点可能会出现单点故障,从基本硬件层到操作系统层、数据库层、APP应用层和网络层。 要有效消除单点故障,最重要的是设计尽量不引入单点,随着体系结构的变化,需要定期审查系统潜在的单点。

增加硬盘,进行镜像。 降低错误概率的网卡和网线的单点问题。 系统中最容易物理损坏的是网线。 NIC bonding是一种非常简单通用的方法。 配置多个NIC。 SSH服务器和Telnet服务器共存。 毕竟SSH和Telnet都不是100%可信的。 IDC房间的一点。 由于中国特色的“南北互通”,在选择IDC机房时必须有冗余。 可靠的DNS分析等单点故障的说明

二.简单的单点故障架构一般APP应用架构如图1所示。 一些云服务通过负载均衡向外提供服务,在另一个云服务上安装MySQL作为APP应用数据库,为了提高性能,在服务器和数据库之间安装Redis缓存服务器。 在这种体系结构中,缓存服务器和数据库存在单一风险,可以考虑设计主从备份。

缓存服务器可以利用对Redis主从的支持特性,设计为将MySQL安装到ECS的主缓存部署。 虽然MySQL可在另一服务器上安装以配置主从架构,但是建议转到RDS,因为可靠性仍然取决于云服务器。 RDS是一种基于AlibabaCloud (阿里巴巴云)关系的数据库产品,具有主从内在支持,用户无需在意数据同步、备用切换等细节,使用方便。 优化的体系结构如图2所示。

Alibaba云单点故障体系结构

三.存储高可用性存储高可用性解决方案采用存储设备和管理设备的冗馀体系结构,所有设备都出现了设备故障。 它不影响整个存储系统的正常运行。

故障切换完全自动化,确保业务系统的连续性。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。