Zabbix企业级高级应用

发布于:2025-08-09 ⋅ 阅读:(18) ⋅ 点赞:(0)

网络自动发现

Zabbix 的网络自动发现是一个非常强大的功能,利用该功能可以完成以下工作。

加快部署速度
简化管理
在快速变化的环境中避免过度管理

网络自动发现基于以下信息:

IP 地址范围
可用的外部服务(FTP,SSH,WEB,POP3,IMAP,TCP等)
来自 Zabbix agent 的信息(仅支持未加密模式)
来自 SNMP agent 的信息

在进行网络自动发现的过程中,涉及到的主要工作流程有 Discovery(发现)和 Action(动作)
虽然网络自动发现能够帮助运维人员实现自动化的管理任务,但是网络自动发现无法实现网络拓扑的自动发现。

整个网络发现的流程可以分成4个阶段:
网络发现:网络发现模块每次检测到服务和主机(IP)都会生成一个发现事件。
执行动作:所有动作都是基于发现事件的,基于事件的网络发现动作,可以根据设备类型、IP地址、状态、运行时间等进行配置。
创建主机:我们可以在执行动作过程中选择添加主机操作,包括添加主机至主机组、将主机链接到模板等。
移除主机:从 zabbix 2.4.0开始,如果已发现的实体不在自动发现规则的 IP 范围内,那么由网络发现规则创建的主机将会被自动删除。

1:创建网络发现规则

这里从上一篇文章创建两个主机开始,如果已经创建主机需要删除已经创建的主机然后再创建规则
请添加图片描述
请添加图片描述

注意:自动发现规则的每次扫描都会产生事件,如果配置了1000个IP,那么每次都会产生 1000个事件,需要注意数据库的资源消耗,生产环境中不宜扫描太频繁。该页面共有9项设置,含义如下。
(1)名称:网络发现规则的名称
(2)有 agent 代理程序自动发现:此处有两个选择,如果选择 No proxy,那么这条规则将会由 zabbixserver 发起;如果选择某个 Zabbix proxy,那么此条规则将由指定的这台 Zabbix proxy 执行。
(3)IP 范围:网络探测的扫描范围。可以书写的格式有四种
单个 IP 地址:192.168.207.138
IP 地址范围:192.168.207.1-255
IP 子网掩码范围:192.168.207.0/24
列表:192.168.207.138、192.168.207.139、192.168.4.0/24
(4)更新间隔:定义 Zabbix执行规则的频率。
(5)检查:自动发现的网络扫描方式
请添加图片描述

(6)设备唯一性准则:设备唯一标识,自动发现的清单将会以前面配置的某一项作为唯一性标识,防止重复发现。
(7)主机名称
(8)可见的名称
(9)已启用

2:创建自动发现动作

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

3:验证

请添加图片描述
如果需要显示主机名而不是IP地址则需要配置hosts参数
请添加图片描述
删除主机后重新发现
请添加图片描述

添加自动注册

自动发现是实现自动添加 agent 端的一种办法,大大减轻了运维人员的劳动量,但是,如果我们不知道 agent 端的地址等信息,自动发现就无法实现了,因为要设置一个 IP 地址范围,网络自动发现需要扫描这个 IP 地址段。
自动注册是指 Agent 主动且自动的向 Server 发起注册请求,与自动发现的功能一样,但是自动注册适用于特定的场景,如果某个条件未知(如 agent 的 ip地址段,操作系统版本等,自动发现需要知道这些信息),此时就无法适用自动发现了;但是zabbix server 的地址是已知的,所以可以让 agent 主动发起请求,实现主机自动添加到 zabbix中。
Zabbix 的自动注册对于 agent 是主动模式,Zabbix agent 会主动上报自己的信息,发给 zabbixserver.
但是在 agent2 的版本中,对应的是 agent2的被动模式,缺点是可能因为配置文件配置错误或者网络不通等原因导致 Zabbix agent2 可能找不到 Zabbix server。

1:删除前面创建的自动发现

请添加图片描述
请添加图片描述
请添加图片描述

2:创建自动注册动作

请添加图片描述
请添加图片描述
添加操作和前面的添加自动发现操作一样
请添加图片描述

3:验证

请添加图片描述

监控应用服务

Zabbix 基本上能监控所有的服务,这里我们以nginx 服务为例

Nginx 作为一种高性能的 web 服务器和反向代理服务器,广泛应用于网站的负载均衡、静态资源处理、反向代理等场景。为了确保 Nginx 能够稳定、可靠地运行,及时了解其性能和健康状态非常重要。Zabbix作为一款强大的开源监控工具,能够帮助我们对 Nginx 进行全面的监控。

性能瓶颈排査:通过监控 Nginx 的各种性能指标,如请求数、响应时间等,可以帮助排查服务瓶颈,优化系统性能。
故障预警:及时检测到 Nginx服务故障,防止影响到用户的正常访问
资源利用率:监控Nginx的CPU、内存使用率等,可以防止资源过载
负载均衡效果:Nginx作为负载均衡器时,监控其流量分配情况,帮助发现可能的负载不均问题。

1:部署Nginx

server01节点

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Active connections :Nginx正处理的活动链接数1个。
server :
accepts:Nginx 启动到现在共处理的连接数。
handled:Nginx 启动到现在共成功创建的握手数。
requests:Nginx总共处理的请求数。
Reading :Nginx 读取到客户端的 Header 信息数
Writing :Nginx 返回给客户端的 Header 信息数。
Waiting :Nginx 已经处理完正在等候下一次请求指令的驻留链接,开启。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
备注:
UnsafeUserParameters=1:启用自定义key功能
UserParameter:指定脚本
nginx_status 为 key 值名称。[*]里写脚本参数,没有可以不写。
/etc/zabbix/nginx-status.sh$1 路径为脚本所在路径

在这里插入图片描述

测试
在这里插入图片描述
在这里插入图片描述

2:添加监控

添加模板
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
添加触发器
在这里插入图片描述

在这里插入图片描述

应用模板
在这里插入图片描述
在这里插入图片描述

zabbix实现邮件报警

在日常的 IT 运维过程中,我们时常要关注各个设备和系统的运行情况,但是,我们不希望一直盯着触发器或者事件列表,这样我们就没有空闲时间去处理其他工作。那么能不能让我们摆脱这种束缚,无论我们在什么地方,在发生比较严重的事情的时候能够自动的接收到通知。并且,当发生问题时,我们希望
所有相关人员都能收到通知。也就是说,当配置的监控超过触发器设定的阈值则触发某种动作,而这个动作可以是发送告警信息的动作。那么 zabbix 在监控到异常之后,就能够自动的触发一个告警信息发给我们,或发送给整个运维团队。
自定义的监控项默认不会自动报警,首页也不会提示错误,需要配置触发器与报警动作才可以自动报警。触发器本质就是一个条件判断,对于不同的监控数据来说,我们要给他设置不同的触发器,比如监控内存,当内存小于 580M,就满足判断条件,触发报警,并可以执行报警动作。

1:实现报警所需条件

(1)告警媒介
要想让 Zabbix 把告警信息发送出去,就要有一个接收信息的媒介,目前我们常见的告警媒介有邮箱、钉钉、企业微信等。

(2)触发器(trigger):
触发器实际是一个条件判断表达式,如判断内存不足 308M,用户超过 30 个等;当触发条件发生后会导致一个触发事件,触发事件会执行某个动作。

(3)动作(action):
触发器的条件被触发后的行为;可以是发送邮件、也可以是重启某个服务等。

2:配置告警媒介

设置告警媒介参数
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3:设置用户报警媒介

在这里插入图片描述
在这里插入图片描述
添加完记得更新一下

4:设置动作

创建动作

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
创建图形
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
观察图形变化和邮箱
在这里插入图片描述
在这里插入图片描述


网站公告

今日签到

点亮在社区的每一天
去签到