首页 > 编程知识 正文

监控系统方案设计,监控系统技术方案

时间:2023-05-04 15:33:37 阅读:124591 作者:4756

监控系统Metis方案设计

一.概述

对于一个业务系统来说,不同的作用所关心的地方有一定的差异。 领导或负责人获取系统服务级别协议,指示系统之间的交互、资源消耗情况; 承运人需要获取基础设施和服务的实时状态信息、各种软硬件错误、性能变化和性能瓶颈; 开发者需要知道系统的主要性能瓶颈、经常出现的错误,着力解决关键问题。 要满足这些需求,需要可扩展、易于使用的监控系统。 它可以对系统监测指标、应用监测指标进行获取、存储和计算,同时也可以根据预置规则进行报警。 在此基础上,结合**大数据平台的监控需求,计划设计一套监控系统Metis。

主要功能:

n能够取得服务器硬件监视指标(磁盘、net、mem、cpuetc.)

可以获取n业务的自定义监视指标(click,upload,dispatchetc.)

n可以获取应用JVM监测指标(ygc、fullgc、permetc.)

n可以获取主机是否存在

可以获取n端口是否存在

可以获取URL是否活着

n可以通过人为干预停止、启动相关APP应用的监视指标的取得

基于grafana完成柔性指标图形表示

n可设定的监视警报功能

集成Nagios、消息传递平台和EDM平台以完成报警功能

整体体系结构设计

元代理:

接收web侧的操作命令,从业务服务器上的日志中获取监视数据,发送到Kafla集群等

Kafka:

负责保存从各业务机器收集的监测数据,并缓冲以供MetisCollector消耗等;

MetisCollector:

消耗Kafka集群中缓冲的监视数据,经过简单的处理发送到后端TSD等;

MetisNginx:

负责MetisCollector的存储put请求,根据负载情况选择合适的TSD等;

OpenTSDBTSD:

将接收到的监视数据持久化为HBase,负责响应客户端的询问请求等

HBaseCluster:

负责作为OpenTSDB的数据存储层等

MetisGrafana:

根据用户的监视表现需求,通过OpenTSDB从HBase获取相关的监视数据

二、详细设计

1 .监测日志

提供的SDK允许您打印标准json格式的监视日志。 日志路径必须在Log4j配置文件中定义名为“元事件应用程序”的应用程序和名为“元事件应用程序”的日志应用程序。

当前支持的监视类型包括:

A:gauge-显示受监视数据在某个时间点的状态值,包括内存消耗和磁盘空间。

B:counter-表示指定时间粒度范围内的累计次数

C:timer-表示某个事件发生需要时间的情况

2 .数据入库

3 .发出指令

通过接口操作,可以控制某台机器上有无收集某个监视日志,同时可以调整收集数据的上报间隔

4 .权限控制

要将公司自己的auth系统集成为权限部分,需要在此进行记录

5 .报警监控

添加和开发定制的工作器,并在累计预设阈值时调用SMS或邮件发送警告消息。

6 .图表显示

使用grafana作为图表显示绘图帧。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。