Ubuntu Zabbix 钉钉报警

发布于:2025-06-03 ⋅ 阅读:(24) ⋅ 点赞:(0)

概要

提示:本教程用于Ubuntu ,zabbix7.0

Zabbix警监控脚本

提示:需要创建一个脚本

#检查是否有 python3 和版本
root@zabbix:~# python3 --version 
Python 3.12.3

在/usr/lib/zabbix/alertscripts/目录中创建一个名称为dingding_alert.py的Python脚本;内容如下;

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import requests
import json
import sys
import os
import datetime

# 钉钉机器人 Webhook 地址
webhook = "这里填写创建的机器人Webhook 地址"

# 日志文件路径
log_file = "/var/log/zabbix/dingding_alert.log"

# 参数检查
if len(sys.argv) < 4:
    print("Usage: dingding_alert.py <phone> <subject> <text>")
    sys.exit(1)

# 读取命令行参数
user = sys.argv[1]
subject = sys.argv[2]
text = sys.argv[3]

# ✅ 修改内容:加上关键词前缀 **这里要与钉钉安全设置的名称一致**
msg = f"【zabbix告警】\n{subject}\n{text}"

# 构造消息内容
payload = {
    "msgtype": "text",
    "text": {
        "content": msg
    },
    "at": {
        "atMobiles": [user],
        "isAtAll": False
    }
}

headers = {'Content-Type': 'application/json'}
now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")

# 确保日志目录存在
os.makedirs(os.path.dirname(log_file), exist_ok=True)

# 发送钉钉消息
try:
    response = requests.post(url=webhook, data=json.dumps(payload), headers=headers, timeout=5)
    result = response.json()

    with open(log_file, "a+") as f:
        f.write("\n" + "=" * 60)
        f.write(f"\n[{now}] 用户: {user}")
        f.write(f"\n请求状态码: {response.status_code}")
        f.write(f"\n返回结果: {result}")
        f.write(f"\n告警内容:\n{msg}")

        if result.get("errcode") == 0:
            f.write("\n发送状态: ✅ 成功\n")
        else:
            f.write("\n发送状态: ❌ 失败\n")

except Exception as e:
    with open(log_file, "a+") as f:
        f.write("\n" + "=" * 60)
        f.write(f"\n[{now}] 用户: {user}")
        f.write(f"\n异常发生: {str(e)}")
        f.write(f"\n告警内容:\n{msg}")
        f.write("\n发送状态: ❌ 失败\n")

技术细节

提示:必须条件
在这里插入图片描述
在这里插入图片描述

提示:创建一个存放dingding_alert存放日志的文件;

root@zabbix:~# touch /var/log/zabbix/dingding_alert.log
root@zabbix:~# chown zabbix:zabbix /var/log/zabbix/dingding_alert.log
#为脚本添加可执行权限;
root@zabbix:~# chmod a+x /usr/lib/zabbix/alertscripts/dingding_alert.py
#测试脚本的准确性;
root@zabbix:~# python3 /usr/lib/zabbix/alertscripts/dingding_alert.py 138000000 subject of testing "This is a test information."

在这里插入图片描述

配置zabbix告警

提示:创建报警媒介类型:
在这里插入图片描述
在这里插入图片描述
提示:脚本参数::

{ALERT.SENDTO}
#对应脚本中的,user=sys.argv[1](发给钉钉群中哪个用户)。

{ALERT.SUBJECT}
#发送的信息的标题,在”报表”的”动作日志”中可以看到。

{ALERT.MESSAGE}
#对应脚本中的,text=sys.argv[3](发送的报警内容)。

创建报警动作:
在这里插入图片描述
在这里插入图片描述
添加触发器动作:
在这里插入图片描述
这里以system name has changed为例,意味着如果设备的名称被修改,就会触发告警。
在这里插入图片描述
参数解读:

“主题”对应”钉钉告警”媒介中的:{ALERT.SUBJECT}
“消息”对应”钉钉告警”媒介中的:{ALERT.MESSAGE}

主题:
故障名称(触发器名称):{EVENT.NAME}

消息:
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息:{TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

恢复操作基本相同,添加细节操作

主题:
故障恢复:{EVENT.NAME}

消息:
恢复主机:{HOSTNAME1}
恢复时间:{EVENT.DATE}{EVENT.RECOVERY.TIME}
主机IP:{HOST.IP}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

给用户添加报警媒介
在这里插入图片描述

在这里插入图片描述

触发告警
登录到交换机POE-S5735S;修改交换机的设备名称;等待几分钟,查看报警情况。
[POE-S5735S]sysname POE-SWITCH-2025

在这里插入图片描述

在这里插入图片描述


网站公告

今日签到

点亮在社区的每一天
去签到