运维监控工具千千万,仅开源的解决方案就有流量监控(MRTG、Cacti、SmokePing、Graphite等)和性能告警(Nagios、Zabbix、ZenossCore、Ganglia、OpenTSDB等)可供选择。
并且每种软件都有自己的特点和功能,各自的侧重点和目标不完全相同,在设计理念和实现方法上也大同小异,但都具有共同特征。例如,采集数据、分析展示、告警以及简单的故障自动处理。最终都能达到对IT系统服务可用性的一个完全展示。
下面我们将针对目前行业内常用的五种监控工具(Cacti、Nagios、Zabbix、Grafana、Prometheus)详细介绍各自的特点。1、Cacti
Cacti(英文含义为仙人掌)是一套基于PHP、MySQL、SNMP和RRDtool开发的网络流量监测图形分析工具。
它通过snmpget来获取数据,使用RRDtool绘图,但使用者无须了解RRDtool复杂的参数。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结构、主机设备以及任何一张图,还可以与LDAP结合进行用户认证,同时也能自定义模板,在历史数据的展示监控方面,其功能相当不错。
Cacti通过添加模板,使不同设备的监控添加具有可复用性,并且具备可自定义绘图的功能,具有强大的运算能力(数据的叠加功能)。
2、Nagios
Nagios是一个企业级的监控系统,可监控服务的运行状态和网络信息等,并能监视所指定的本地或远程主机参数以及服务,同时提供异常告警通知功能等。
Nagios可运行在Linux和UNIX平台上,同时提供一个可选的基于浏览器的Web界面,以方便系统管理人员查看网络状态、各种系统问题,以及日志等。Nagios的功能侧重于监控服务的可用性,能及时根据触发条件告警。
目前,Nagios也占领了一定的市场份额,不过从观察来看,Nagios并没有与时俱进,已经不能满足于多变的监控需求,架构的扩展性和使用的便捷性有待增强,其高级功能集成在商业版NagiosXI中。
3.Zabbix
Zabbix是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的Agent(代理),也可以支持SNMP、IPMI、JMX、Telnet、SSH等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触发告警。
Zabbix拥有良好的扩展性,同时它的功能十分丰富,可以监控CPU负荷、内存使用、磁盘使用、网络状况、端口监视、日志监视等。
但是因为消耗资源较多的缘故,如果监控的主机非常多时,可能会出现监控超时、告警超时等现象。
4、Prometheus
Prometheus作为一个数据监控解决方案,它由一个大型社区支持,有来自多家公司的个贡献者,个代码提交和个拉取请求。
Prometheus具有以下特性:多维的数据模型(基于时间序列的Key、Value键值对)
灵活的查询和聚合语言PromQL
提供本地存储和分布式存储
通过基于HTTP的Pull模型采集时间序列数据
可利用Pushgateway(Prometheus的可选中间件)实现Push模式
可通过动态服务发现或静态配置发现目标机器
支持多种图表和数据大盘
5、Grafana
Grafana是一款采用go语言编写的开源应用,主要用于大规模指标数据的可视化展现。
Grafana支持许多不同的数据源。每个数据源都有一个特定的查询编辑器,该编辑器定制的特性和功能是公开的特定数据来源。官方支持以下数据源:Graphite,Elasticsearch,InfluxDB,Prometheus,Cloudwatch,MySQL和OpenTSDB等。
每个数据源的查询语言和能力都是不同的。你可以把来自多个数据源的数据组合到一个仪表板,但每一个面板被绑定到一个特定的数据源,它就属于一个特定的组织。
最后
每个监控工具的优势和能力都是不同的。你可以根据实际应用需求,选择适合的监控工具。
后台回复“加群”,带你进入高手如云交流群
推荐阅读:
Linux常用监控指标总结
线程、进程、多线程、多进程和多任务一锅端
Kubernetes集群网络从懵圈到熟悉
使用GDB+Qemu调试Linux内核
防火墙双机热备
常见的几种网络故障案例分析与解决
Kubernetes容器之间的通信浅谈
kube-proxy如何与iptables配合使用
完美排查入侵者
Kubernetes万字实战教程(最新版)
Kubernetes常见问题总结
一文详解负载均衡和反向代理的真实区别
经典!Kubernetes几个常见对象概述图
带宽、延时、吞吐率、PPS这些都是啥?
如何定位软中断CPU使用率过高的问题?
TCP协议灵*12问,总会用得到
QUIC也不是万能的
超详干货!Linux环境变量配置全攻略
为什么要选择智能网卡?
60,毫秒内对Linux进行性能诊断
为什么Linux需要Swapping
Linux系统常用命令速查手册
一文读懂容器网络发展
一文搞懂CDN加速原理
8个问题彻底搞透DNS协议
三张图彻底搞懂iptables和netfilter
故障排查:K8s中Pod无法正常解析域名
网络排错大讲解~
OVS和OVS-DPDK对比
微软出品的最新K8S学习指南3.0下载
▼喜欢,就给我一个“在看”10T技术资源大放送!包括但不限于:云计算、虚拟化、微服务、大数据、网络、Linux、Docker、Kubernetes、Python、Go、C/C++、Shell、PPT等。在