首页 > 编程知识 正文

腾讯数据中心,数据中心

时间:2023-05-03 20:02:47 阅读:10666 作者:2285

稳定运行数据中心需要大量专业技术人员。 通常,负责关键业务的数据中心会有人24小时无人运营。 无人值守的数据中心通常只负责不重要的业务,很少数据中心不完全管理维护。 因此,数据中心的日常维护虽然很麻烦,但很重要。 随着人们的生活完全依赖于数据,托管数据计算和操作的数据中心发挥着越来越重要的作用,维护工作的重要性得到了进一步的强调。

数据中心建成并开始生产后,维护工作将开始并持续到数据中心的生命周期结束。 一般来说,数据中心的维护工作可分为四大类。 一类是日常检查类;二类是APP应用更改、部署类;三、软、硬件升级类; 第四类是突发故障处理类,对这些维护工作进行详细说明,使其能够理解维护工作。

日常检查

“千里之堤,溃于蚁穴”。 的故障可能会在发生之前出现,小风险不会消除,可能会出现重大故障,因此数据中心的日常例行检查工作虽然无聊,但很重要,能够及时发现运行中的风险。 根据数据中心中业务的重要性,必须定期检查数据中心中的所有运行设备。 一些数据中心设备制造商提供网络管理软件、安全软件等检测软件。 使用这些软件,可以检查数据中心网络,查看日志中是否存在异常警告、网络是否在短时间内中断、端口是否出现UP/DOWN等。 用网络检测软件看网络质量。 检查服务器APP应用程序服务是否正常,以及处理器内存等利用率是否正常。 检查APP应用业务,如有检索业务,可以在服务器上进行单词检索,查看检索结果和延迟是否在正常范围内。 这些检查每天反复检查,如有异常及时处理消除,必要时将重要业务切换至备用环境,排除后恢复。

还要检查数据中心机房环境,确定环境温度、湿度、灰尘是否符合要求。 空调、供电系统运行良好,设备运行是否过热,地板、天窗、消防、监控都是检查的部分。 不合理的地方要及时纠正,不能懈怠。 在大多数情况下,当您前往数据中心时,您会发现很多值班维护人员都抱着计算机浏览网页并玩游戏。 应对日常检查,即使不进行任何检查,只要没有故障就玩游戏消耗时间。 这样,数据中心就迟早会出现故障。 一旦发生故障,就会毛手毛脚,甚至不知道在哪个业务中使用的是哪个设备,使用的是哪个端口的哪个网线。 本来小故障就有可能因为不熟悉而导致大故障,所以日常检查绝对无法应对。 虽然需要反复检查,但很重要。 在继续检查的过程中,对数据中心的理解会加深。 那样的话,每次检查都会有新的发现,在检查中学习。

应用更改

数据中心的业务并没有变,随着业务的多样化,经常会调整业务,包括服务器和网络的安装等。 因此,要熟悉服务器和网络设备的操作,主要需要掌握Linux服务器的命令和网络协议。 根据应用的需要,必须进行变更。 此时,对维护人员提出了更高的要求。 不仅熟悉数据中心的原始业务,还可以正确理解新的APP应用程序业务,在不影响原始业务的情况下进行调整。 这些APP应用程序更改可能每月发生几次,是数据中心维护人员的必修课,强调技术人员的基本技能水平。 此时,必须熟悉设备操作命令,懂得如何实现业务,经常与设备制造商的技术人员打交道,通过交流尽快掌握设备操作方法。 另外,设备制造商对应用业务知识不足,需要维护人员在应用业务和设备的具体实现之间协调处理。 以快速、最低的成本完成APP应用程序业务的部署。

硬件和软件升级

数据中心设备的一般运行周期为5年,需要不断地逐渐淘汰和更换设备。 另外,还有一些设备因为存在软件缺陷而需要升级。 因此,硬件和软件升级也是维护工作的一部分,尤其是在硬件和软件出现故障时,必须进行更换。 为了不影响业务,设备制造商往往需要提供软件补丁来解决问题。 数据中心设施成百上千,通常会出现硬件和软件故障,因此需要不断进行硬件和软件升级。 这类工作多在业务量最少的凌晨以后进行,维护人员经常熬夜,维护人员必须有良好的身体素质才能吃。 在硬件和软件升级过程中,必须建立回滚机制,使升级出现问题时无法回滚,业务无法长时间恢复。 接手数据中心的维护,怎么会有那么多升级,几乎每个月都需要升级操作,熬夜升级工作成了维护人员的家常便饭。

突发的麻烦

没有不发生故障的数据中心。 数据中心运行时会出现各种问题。 此时,维护人员表现出了较高的技能水平。 据统计,80%的故障是人为故障,因此维护人员的水平高低往往决定着数据中心的运行稳定性。 另外,对于突发故障,高水平的维护人员可以通过lsdsy冷静分析故障的触发原因,迅速找到解决方法。 如果在短时间内找不到解决方法,也可以通过切换到备用设备恢复业务后再进行分析。 在这种情况下,拥有高水平的维护人员对数据中心至关重要,在关键时刻也很有用。

这些工作看起来很普通,但千万不要轻视。 数据中心的维护实际上非常重要,它关系到整个数据中心业务的正常运营。 目前,这类专家在市场上非常受欢迎,特别是缺乏具有深入排查水平的人才。 只要重视数据中心的维护,就能为数据中心带来安全。 免费发送资料(单击链接下载) ) ) ) )。

历史上最完整的数据中心机房标准和规范(下载)数据中心运输管理|资料汇总(2017.7.2 )版本) )。

  

加入运维管理VIP群(点击链接查看)

《数据中心运维管理》VIP技术交流群会员招募说明

扫描以下二维码加入学习群

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。