阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

Prometheus:监控系统的部署与指标收集

144次阅读
没有评论

共计 3325 个字符,预计需要花费 9 分钟才能阅读完成。

Prometheus:监控系统的部署与指标收集

在云原生体系中,Prometheus 已成为最主流的监控与报警系统之一。其高可靠性、灵活的数据模型、强大的查询语言 PromQL,以及与 Kubernetes 的天然适配,使其成为现代运维体系的核心组件。本文全面介绍 Prometheus 的架构、部署方法以及指标收集方式,为你搭建高可用监控体系提供参考。


一、Prometheus 架构概述

Prometheus 采用 Pull 模式 采集指标,即由 Prometheus Server 主动从目标端点拉取数据。这种设计带来的优势包括简化数据接入、可控的数据质量以及对高可用的天然支持。

整体架构由以下组件组成:

1. Prometheus Server

核心组件,负责:

  • 定时拉取指标(scrape)

  • 存储时序数据(TSDB)

  • 提供 PromQL 查询

2. Exporter

用于暴露特定系统或服务的监控指标,例如:

  • Node Exporter:主机资源监控

  • Blackbox Exporter:HTTP/TCP/ICMP 探测

  • mysqld_exporter:MySQL 监控

  • windows_exporter:Windows 主机监控

3. Alertmanager

负责接收 Prometheus 发送的告警,进行聚合、抑制、路由,并推送到邮件、Webhook、飞书、钉钉等通知渠道。

4. Pushgateway

允许临时任务(如批处理脚本)主动推送指标。

5. Grafana

可视化工具,用于构建监控看板。通常会与 Prometheus 配套使用。


二、Prometheus 的部署方式

Prometheus 支持多种部署方式,包括二进制安装、Docker、Kubernetes Helm Chart 等。以下分别介绍常见场景。


1. 二进制安装(适用于物理机 / 虚拟机)

Step 1. 下载 Prometheus

访问官方发布页面下载最新版压缩包:

https://prometheus.io/download/

例如 Linux x86_64:

tar xvf prometheus-*.tar.gz
cd prometheus-*

Step 2. 配置 prometheus.yml

默认配置示例:

global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']

Step 3. 启动服务

./prometheus --config.file=prometheus.yml

Prometheus UI 默认开放于:

http://localhost:9090

2. 使用 Docker 部署

结合用户常用的 Docker 场景,直接提供 Docker Compose 方案:

version: '3'
services:
  prometheus:
    image: prom/prometheus
    container_name: prometheus
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
      - ./data:/prometheus
    ports:
      - "9090:9090"

部署:

docker compose up -d

3. Kubernetes 环境使用 Helm 部署(推荐)

helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update
helm install prometheus prometheus-community/prometheus

默认安装内容包括:

  • Prometheus Server

  • Alertmanager

  • Node Exporter

  • kube-state-metrics

这是生产环境最主流的部署方案。


三、指标收集(Scrape)的配置与管理

Prometheus 使用 scrape_configs 配置采集任务。常见数据源包括:


1. Static_configs(静态采集)

适用于固定 IP 的服务:

scrape_configs:
  - job_name: node
    static_configs:
      - targets: ['192.168.1.100:9100']

例如采集 Node Exporter 指标。


2. Kubernetes Service Discovery(自动发现)

在 K8s 中,Prometheus 可自动识别 Pod、Service、Endpoints:

scrape_configs:
  - job_name: 'kubernetes-pods'
    kubernetes_sd_configs:
      - role: pod

无需手动更新配置,支持大规模动态环境。


3. 使用 Exporter 采集主机和服务指标

Node Exporter 部署(主机监控)

docker run -d -p 9100:9100 --name node_exporter quay.io/prometheus/node-exporter

然后在 prometheus.yml 中添加:

- job_name: 'node_exporter'
  static_configs:
    - targets: ['192.168.1.10:9100']

4. Pushgateway 场景(短任务)

适用于临时任务,例如定时脚本:

脚本推送示例:

echo "batch_job_duration_seconds 42" | curl --data-binary @- http://pushgateway:9091/metrics/job/batch_job

Prometheus 中配置:

- job_name: 'pushgateway'
  static_configs:
    - targets: ['pushgateway:9091']

四、PromQL:强大灵活的查询语言

PromQL 是 Prometheus 的核心竞争力,常用示例包括:

查看 CPU 使用率(Node Exporter)

rate(node_cpu_seconds_total{mode!="idle"}[5m])

查看 HTTP 请求 QPS

sum(rate(http_requests_total[1m]))

统计某服务所有实例的延迟 P95

histogram_quantile(0.95, sum(rate(http_request_duration_seconds_bucket[5m])) by (le))

掌握 PromQL,即可快速构建监控视图和告警规则。


五、Alertmanager 告警通知

Prometheus 告警规则示例:

groups:
- name: system_alerts
  rules:
  - alert: HighCPUUsage
    expr: avg(rate(node_cpu_seconds_total{mode!="idle"}[5m])) > 0.8
    for: 2m
    labels:
      severity: warning
    annotations:
      description: "CPU usage is over 80% for the last 5 minutes"

Alertmanager 可推送至:

  • 邮件

  • 飞书 / 钉钉 / 企业微信

  • Webhook

  • PagerDuty


六、Grafana 监控可视化

部署 Grafana 后,在 DataSource 配置中指定 Prometheus 地址:

http://prometheus:9090

常用 Dashboard:

  • Node Exporter Full

  • Kubernetes Cluster Monitoring

  • MySQL Overview

Grafana 是构建企业监控看板的核心工具。


七、总结

Prometheus 作为云原生时代的监控标准,具备以下优势:

  • 架构简单可靠

  • Pull 模式灵活可控

  • 丰富的 Exporter 生态

  • 强大的 PromQL 查询语言

  • 完整的告警体系(Alertmanager)

  • 对 Kubernetes 天然友好

无论是物理机环境的传统监控,还是 Kubernetes 集群中的大规模监控场景,Prometheus 都能提供稳定、可扩展的解决方案。

如果你正在构建现代运维体系,Prometheus 绝对是不可或缺的基础组件。

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2025-12-10发表,共计3325字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19350
评论数
4
阅读量
7897628
文章搜索
热门文章
开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南

开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南

开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南 大家好,我是星哥。之前介绍了腾讯云的 Code...
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见 zabbix!轻量级自建服务器监控神器在 Linux 的完整部署指南 在日常运维中,服务器监控是绕不开的...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
我用AI做了一个1978年至2019年中国大陆企业注册的查询网站

我用AI做了一个1978年至2019年中国大陆企业注册的查询网站

我用 AI 做了一个 1978 年至 2019 年中国大陆企业注册的查询网站 最近星哥在 GitHub 上偶然...
星哥带你玩飞牛NAS-12:开源笔记的进化之路,效率玩家的新选择

星哥带你玩飞牛NAS-12:开源笔记的进化之路,效率玩家的新选择

星哥带你玩飞牛 NAS-12:开源笔记的进化之路,效率玩家的新选择 前言 如何高效管理知识与笔记,已经成为技术...
你的云服务器到底有多强?宝塔跑分告诉你

你的云服务器到底有多强?宝塔跑分告诉你

你的云服务器到底有多强?宝塔跑分告诉你 为什么要用宝塔跑分? 宝塔跑分其实就是对 CPU、内存、磁盘、IO 做...
4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

  4 盘位、4K 输出、J3455、遥控,NAS 硬件入门性价比之王 开篇 在 NAS 市场中,威...
开发者福利:免费 .frii.site 子域名,一分钟申请即用

开发者福利:免费 .frii.site 子域名,一分钟申请即用

  开发者福利:免费 .frii.site 子域名,一分钟申请即用 前言 在学习 Web 开发、部署...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
星哥带你玩飞牛NAS硬件 01:捡垃圾的最爱双盘,暴风二期矿渣为何成不老神话?

星哥带你玩飞牛NAS硬件 01:捡垃圾的最爱双盘,暴风二期矿渣为何成不老神话?

星哥带你玩飞牛 NAS 硬件 01:捡垃圾的最爱双盘,暴风二期矿渣为何成不老神话? 前言 在选择 NAS 用预...
Prometheus:监控系统的部署与指标收集

Prometheus:监控系统的部署与指标收集

Prometheus:监控系统的部署与指标收集 在云原生体系中,Prometheus 已成为最主流的监控与报警...
安装Black群晖DSM7.2系统安装教程(在Vmware虚拟机中、实体机均可)!

安装Black群晖DSM7.2系统安装教程(在Vmware虚拟机中、实体机均可)!

安装 Black 群晖 DSM7.2 系统安装教程(在 Vmware 虚拟机中、实体机均可)! 前言 大家好,...
告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

  告别 Notion 焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁” 引言 在数字笔记工...
仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

还在忍受动辄数百兆的“全家桶”监控软件?后台偷占资源、界面杂乱冗余,想查个 CPU 温度都要层层点选? 今天给...