php发展

首页 » 常识 » 常识 » Zabbix系统监控私有化部署
TUhjnbcbe - 2021/5/19 16:17:00

作者:高晓峰,就职于无锡农商行科技管理部,从事系统运维工作,在存储,操作系统,及中间件等方面有一定运维工作经验。

◆◆◆◆◆

1介绍

1.1背景以下是部署实施基于zabbix监控系统的建设背景,以解决诸多运维实际问题:目前公司系统运维主要采用Tivoli监控+人工巡检的方式,Tivoli功能强大但是比较笨重,维护成本高,由于Tivoli版本限制,导致部分系统和设备无法统一接入,因此需要人工巡检,人工也容易疏忽漏查,导致问题处理不及时,影响信息化系统服务效果,就需要更好保障系统稳定运行。银行IT运维环境复杂,操作系统多如:Centos、Suselinux、Windows、Aix、Sco等,设备种类多:服务器、交换机、存储等,各类信息化平台众多如虚拟化平台、虚拟桌面平台、容器云平台、私有云平台等。如此众多的信息化系统平台,当然需要统一运维界面,实时监测各系统运行状况,为运维工作提供便利。为适应时代的发展,未来是个智能化的时代,运维工作要实现自动化,运维工作者要向开发去转变,开发即运维,或许有一天人工智能将代替运维人员,而今的运维人员希望是人工智能创造者的一份子,了解自动化运维,与时俱进是非常必要的。综上,为了提高运维效率,节约人力资源,对设备、机房环境实时监控,能有效、实时发出告警信息,从而及时发现问题快速响应。急需一套能满足以上需求的监控系统,经考量zabbix监控系统应用广泛,且运行稳定,可实现上述功能。1.2系统简介Zabbix是一个企业级解决方案,支持实时监控数千台服务器,虚拟机和网络设备,采集百万级监控指标。Zabbix完全开源免费。Zabbix的主要特点有:1.指标收集:从任何设备、系统、应用程序上进行指标采集2.问题监测:定义智能阈值3.可视化:单一界面管理平台4.告警和修复:确保及时、有效的告警5.安全和认证:保护您所有层级的数据6.轻松搭建部署:大批模板,开箱即用,节省您宝贵的时间7.自动发现:自动监控大型动态环境8.分布式监控:无限制扩展9.ZABBIXAPI:将Zabbix集成到您IT环境的其他任何部分1.3名词术语Zabbix系统有一些自己定义的专业术语,为更好的熟悉系统名词,下面主要介绍本文以及zabbix常用的术语。?主机(host)一台你想监控的服务器、工作站、交换机等网络设备,用IP或者域名表示。?主机组(hostgroup)多台具有某种相同角色、属性的集合。例如,所有windows服务器放在一个叫“windowsserver”的主机组中。?监控项(item)你想要监控、获取主机或主机组的哪些数据。例如:我想监控所有机器的CPU使用情况,则需要建一个监控项,用于获取所有服务器的CPU使用率。?触发器(trigger)由逻辑表达式组成的按照预先设置好的阀值来评估由监控项采集到的数据。触发器有两种状态,分别为“问题”和“已解决”。例如:在上述通过监控项获取了CPU的使用率,假如我想超过CPU使用超过80%的就预警,则可以创建一个触发器,当监控项获取的值超过80%时就按照预设的情况报警,状态为“问题”;低于80%时认为报警解除,状态恢复为“已解决”。?事件(event)单次发生的需要注意的事情,例如上述触发器状态由问题变成了正常或者由正常变成了问题,均可以称为一个事件。事件包括触发器事件、自动发现事件、自动注册事件和内部事件4个部分。?动作(action)一个对事件做出反应的预定义的操作;例如CPU使用超过80%时,触发器状态变成了问题,即产生了一个事件,我们可以针对此事件预设一个动作(比如执行命令reboot),则系统会自动针对此事件的预设动作执行命令reboot。?媒介(media)发送告警通知的手段或途径。例如:当CPU超过80%报警后,通过媒介(邮件、短信、自定义脚本、
1
查看完整版本: Zabbix系统监控私有化部署