Alertmanager报警

DevOps Prometheus评论2,088字数 2716阅读9分3秒阅读模式

一、介绍

preometheus 报警由 Alertmanager 的独立工具进行管理的,它是一个可以集群化的独立报警管理工具。
我们需要在 Prometheus 上定义报警规则,这些规则将使用收集到的指标并在指定的阈值或标准上可以触发警报,然后将其推送到 Alertmanager 中,警报在 Alertmanager 上的 HTTP 端点上接收。收到警报后,Alertmanager 会处理报警并根据其标签进行路由处理,然后由 Alertmanager 发送到外部目的地通知,如邮件、钉钉、微信、短信等。

二、安装部署

1、二进制包部署

下载地址:https://prometheus.io/download/

Alertmanager报警

[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# tar -xf alertmanager-0.24.0.linux-amd64.tar.gz  -C /usr/local/
[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# ln -s /usr/local/alertmanager-0.24.0.linux-amd64 /usr/local/alertmanager

启动脚本

[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# vim /lib/systemd/system/alertmanager.service
[Unit]
Description=Alertmanager
After=network.target
After=syslog.target

[Service]
ExecStart=/usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml

[Install]
WantedBy=multi-user.target

启动服务

[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# systemctl daemon-reload
[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# systemctl restart  alertmanager
[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# systemctl enable  alertmanager
Created symlink from /etc/systemd/system/multi-user.target.wants/alertmanager.service to /usr/lib/systemd/system/alertmanager.service.
[root@iZ8vb623n6mbyx9d66w0a9Z tmp]# systemctl status  alertmanager
● alertmanager.service - Alertmanager
   Loaded: loaded (/usr/lib/systemd/system/alertmanager.service; enabled; vendor preset: disabled)
   Active: active (running) since Tue 2022-11-22 17:31:58 CST; 12s ago
 Main PID: 12799 (alertmanager)
   CGroup: /system.slice/alertmanager.service
           └─12799 /usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml

Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.637Z caller=main.go:231 level=in...11)"
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.637Z caller=main.go:232 level=in...33)"
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.638Z caller=cluster.go:185 level...9094
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.640Z caller=cluster.go:680 level...l=2s
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.667Z caller=coordinator.go:113 l....yml
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.667Z caller=coordinator.go:126 l....yml
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.670Z caller=main.go:535 level=in...9093
Nov 22 17:31:58 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:31:58.670Z caller=tls_config.go:195 le...alse
Nov 22 17:32:00 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:32:00.641Z caller=cluster.go:705 level...597s
Nov 22 17:32:08 iZ8vb623n6mbyx9d66w0a9Z alertmanager[12799]: ts=2022-11-22T09:32:08.643Z caller=cluster.go:697 level...309s
Hint: Some lines were ellipsized, use -l to show in full.

页面访问地址

IP:9093

 

继续阅读
DevOps
  • 本文由 发表于 2022年11月22日 17:32:42
  • 除非特殊声明,本站文章均为原创,转载请务必保留本文链接
prometheus告警规则 Prometheus

prometheus告警规则

基础监控 主机内存不足 节点内存已满(剩余 < 10%) groups: - name: Node memory is filling up (< 10% left) rul...
评论  0  访客  0

发表评论