一個(gè)監(jiān)控體系的核心,prometheus完成對(duì)實(shí)例數(shù)據(jù)的收集、監(jiān)控,grafana將收集的業(yè)務(wù)數(shù)據(jù)匯總成報(bào)表,最后有alertmanager根據(jù)不同的業(yè)務(wù)告警配置生成不同維度的告警,這可以就算是一個(gè)運(yùn)維監(jiān)控體系的核心功能了
tar xvfz prometheus-*.tar.gz
cd prometheus-*
//后臺(tái)運(yùn)行
./prometheus --web.listen-address=:19090 --config.file=prometheus.yml &
//停止
pkill prometheus
核心配置
#監(jiān)控java服務(wù)
- job_name: "javaDemo"
metrics_path: "/actuator/prometheus"
static_configs:
- targets: ["127.0.0.1:5170"]
#其他服務(wù)
- job_name: "prometheus"
static_configs:
- targets: ["192.168.3.105:19090"]
grafana 圖標(biāo)展示//下載安裝
wget https://packages.grafana.com/enterprise/rpm/grafana-enterprise-8.3.6-1.x86_64.rpm
yum install grafana-enterprise-8.3.6-1.x86_64.rpm
//啟動(dòng)服務(wù)
systemctl start grafana-server
//grafana命令幫助
grafana-cli -h / --help
grafana-cli --pluginsDir "/home/prometheus/grafana/plugins" plugins install plugin-id
alertmanager 告警通知[Unit]
Description=alertmanager
[Service]
ExecStart=/prometheus/alertmanager-0.23/alertmanager \
--config.file=/prometheus/alertmanager-0.23/alertmanager.yml
Restart=on-failure
[Install]
WantedBy=multi-user.target
./alertmanager --config.file=alertmanager.yml --web.listen-address=":19093"
//如果9094端口被占用,需要關(guān)閉集群模式
./alertmanager --web.listen-address=localhost:19093 --cluster.listen-address= \
#修改prometheus配置
alerting:
alertmanagers:
- static_configs:
- targets: ['localhost:9093']
rule_files:
- "/prometheus/alertmanager-0.23/rules/*.yml"
告警模板內(nèi)容
groups:
- name: node-alert
rules:
- alert: 主機(jī)停止運(yùn)行
expr: up{job="node_info"} == 0
for: 15s
labels:
severity: 1
nodename: "{{ $labels.app }}"
annotations:
summary: "{{ $labels.app }}已停止運(yùn)行超過(guò)15s!"
description: ""
- alert: 主機(jī)內(nèi)存使用率過(guò)高
expr: (1 - (node_memory_MemAvailable_bytes / (node_memory_MemTotal_bytes))) * 100 >90
for: 10s # 告警持續(xù)時(shí)間,超過(guò)這個(gè)時(shí)間才會(huì)發(fā)送給alertmanager
labels:
severity: warning
nodename: "{{ $labels.app }}"
annotations:
summary: "服務(wù)器實(shí)例 {{ $labels.app }}內(nèi)存使用率過(guò)高"
description: "{{ $labels.app }}的內(nèi)存使用率超過(guò)90%,當(dāng)前使用率[{{ $value }}]."
- alert: 主機(jī)cpu使用率過(guò)高
expr: 100-avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance)*100 >80
for: 1m
labels:
severity: warning
nodename: "{{ $labels.app }}"
annotations:
summary: "服務(wù)器實(shí)例 {{ $labels.app }} cpu使用率過(guò)高"
description: "{{ $labels.app }}的cpu使用率超過(guò)80%,當(dāng)前使用率[{{ $value }}]."
- alert: 主機(jī)磁盤使用率過(guò)高
expr: 100 - node_filesystem_avail_bytes{fstype=~"ext4|xfs",mountpoint="/"} * 100 / node_filesystem_size_bytes{fstype=~"ext4|xfs",mountpoint="/"} >80
for: 1m
labels:
severity: warning
nodename: "{{ $labels.app }}"
annotations:
summary: "服務(wù)器實(shí)例 {{ $labels.app }} 磁盤使用率過(guò)高"
description: "{{ $labels.app }}的disk使用率超過(guò)80%,當(dāng)前使用率[{{ $value }}]."
你是否還在尋找穩(wěn)定的海外服務(wù)器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機(jī)房具備T級(jí)流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確流量調(diào)度確保服務(wù)器高可用性,企業(yè)級(jí)服務(wù)器適合批量采購(gòu),新人活動(dòng)首月15元起,快前往官網(wǎng)查看詳情吧
網(wǎng)頁(yè)題目:prometheus搭建監(jiān)控實(shí)操-創(chuàng)新互聯(lián)
文章路徑:http://www.rwnh.cn/article32/dgsdpc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、營(yíng)銷型網(wǎng)站建設(shè)、企業(yè)網(wǎng)站制作、外貿(mào)網(wǎng)站建設(shè)、商城網(wǎng)站、微信公眾號(hào)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)