编程技术分享平台

网站首页 > 技术教程 正文

Zabbix 无代理监控 Linux:完整指南

xnh888 2025-05-21 17:25:55 技术教程 11 ℃ 0 评论

Zabbix 无代理监控 Linux:完整指南

Zabbix 无代理监控 Linux 的逐步指南

在当今的 DevOps 工作流程中,高效监控基础设施至关重要。Zabbix 是一个强大的监控解决方案,提供基于代理和无代理的监控功能。在本文中,我们将重点介绍 Linux 系统的无代理监控,使管理员能够更轻松地跟踪性能并确保系统健康,而无需部署代理。

什么是 Zabbix 无代理监控?

无代理监控允许您在不安装 Zabbix 代理的情况下收集系统指标、日志和性能数据。相反,它使用原生协议,例如:

  • SSH:对于 Linux 系统,这是用于远程监控的主要协议。
  • SNMP:适用于网络设备和某些服务器。
  • IPMI:用于硬件健康监控。
  • HTTP/HTTPS:用于监控 Web 服务和 API。

为什么选择无代理监控?

  • 易于设置:无需安装或配置代理。
  • 轻量级:适用于遗留系统或具有严格合规性要求的环境。
  • 安全性:利用现有的安全通信协议,如 SSH。

Zabbix 无代理监控 Linux 的逐步指南

步骤 -1:在目标系统上启用 SSH

要启用 SSH 监控,请确保 SSH 服务在目标 Linux 主机上运行:

允许 Zabbix 服务器连接,将其公钥添加到目标系统:

sudo mkdir -p /root/.ssh
sudo echo "<zabbix-server-public-key>" >> /root/.ssh/authorized_keys
sudo chmod 600 /root/.ssh/authorized_keys

步骤 0:配置 Zabbix 服务器

  1. 登录 Zabbix Web UI。
  2. 导航到 配置 > 主机 > 创建主机
  3. 填写所需信息:
  • 主机名:目标系统的名称。
  • IP/DNS:Linux 主机的地址。
  • 模板:附加相关模板(例如,“Template OS Linux by SSH”)

步骤 1:创建新模板:

导航到数据收集 → 模板

创建新模板

  • 模板名称:Template Linux by SSH-Agentless
  • 模板组:Template operating system

步骤 2:创建项目

2.1 主项目:

导航到我们创建的模板并创建一个 项目。

  • 名称: SSH Get
  • 类型: SSH 代理
  • 键: ssh.run[ssh.get,{$SSH.IP},{$SSH.PORT},,]
  • 信息类型:文本
  • 认证方法:密码
  • 更新间隔: 根据您的监控需求
  • 执行脚本:
#!/bin/bash
mpstat && uptime && free

Zabbix: 项目- SSH get

步骤 3:创建依赖项目

配置 Zabbix 依赖项目的步骤

  1. 导航到收集 uptime 命令输出的主机/项目。
  2. 创建 主项目(SSH get 作为输出)。
  3. 添加每个 依赖项目 并将其链接到主项目。
  4. 为每个依赖项目使用预处理规则。
  5. 测试配置以确保正确提取值。

使用 SSH get 作为主项目,并使用预处理步骤提取以下依赖项目:

Zabbix: 项目

3.1 系统运行时间

  • :ssh..uptime
  • 主项目:ssh.get
  • 预处理

正则表达式模式:up\s+(.+)?,结果:\1

Zabbix: 项目-系统.uptime

3.2 内核版本

  • :ssh.kernel.version
  • 主项目:ssh.get
  • 预处理:使用正则表达式过滤内核

3.3 架构类型 (aarch)

  • :ssh.arch.type
  • 主项目:ssh.get
  • 预处理:使用正则表达式过滤 aarch

3.4 操作系统类型

  • :ssh.os.type
  • 主项目:ssh.get
  • 预处理:使用正则表达式过滤操作系统

3.5 CPU 数量

  • :ssh.cpu.count
  • 主项目:ssh.get
  • 预处理:使用正则表达式过滤 CPU

3.6 CPU 空闲

  • :ssh.cpu.idle
  • 主项目:ssh.get
  • 预处理

正则表达式模式:all\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+([0–9.]+) 结果:\1

Zabbix 项目:系统.cpu.idle

3.7 其他指标(遵循相同流程):

  • ssh.cpu.user (用户 CPU)
  • ssh.cpu.system (系统 CPU)
  • ssh.cpu.iowait (IO 等待)
  • ssh.cpu.irq (IRQ)

3.8 内存:

总内存

  • :ssh.memory.total
  • 主项目:ssh.get
  • 信息类型:数字(无符号)
  • 预处理

正则表达式: 模式:.*Mem:\s+(\d+).*结果:\1

  • 自定义乘数:1024

其他指标(遵循相同流程):

  • ssh.memory.used (已用内存)
  • ssh.memory.free (空闲内存)
  • ssh.memory.shared (共享内存)
  • ssh.memory.buffcache (缓冲区/缓存)
  • ssh.memory.available (可用内存)

步骤 4:创建图表

4.1 CPU 利用率图表

  1. 创建一个名为 CPU 利用率 的新图表。
  2. 添加项目:
  • ssh.cpu.user
  • ssh.cpu.system
  • ssh.cpu.idle
  • ssh.cpu.iowait

Zabbix: 图表-CPU

4.2 内存利用率图表

  1. 创建一个名为 内存利用率 的新图表。
  2. 添加项目:
  • ssh.memory.used
  • ssh.memory.free
  • ssh.memory.available

Zabbix: 图表

步骤 5:创建触发器

5.1 系统名称更改

  • 名称:系统名称已更改
  • 表达式
{Template Linux By SSH-Agentless:ssh.os.type.diff()}=1
  • 严重性:信息。

5.2 CPU 数量更改

  • 名称:CPU 数量已更改
  • 表达式
{Template Linux By SSH-Agentless:ssh.cpu.count.diff()}=1
  • 严重性:警告。

5.3 内核更改

  • 名称:内核版本已更改
  • 表达式
{Template Linux By SSH-Agentless:ssh.kernel.version.diff()}=1
  • 严重性:警告。

5.4 CPU 使用率触发器

80% 持续 5 分钟

  • 名称:高 CPU 使用率 (80%)
  • 表达式
{Template Linux By SSH-Agentless:ssh.cpu.user.avg(5m)}>80
  • 严重性:高。

5.5 90% 持续 5 分钟

  • 名称:严重 CPU 使用率 (90%)
  • 表达式
{Template Linux By SSH-Agentless:ssh.cpu.user.avg(5m)}>90
  • 严重性:灾难。

内存使用率触发器

5.6 内存 80% 持续 5 分钟

  • 名称:高内存使用率 (80%)
  • 表达式
{Template Linux By SSH-Agentless:ssh.memory.used.avg(5m)} > 0.8 * {Template Linux By SSH-Agentless:ssh.memory.total.last()}
  • 严重性:高。

5.7 内存 90% 持续 5 分钟

  • 名称:严重内存使用率 (90%)
  • 表达式
{Template Linux By SSH-Agentless:ssh.memory.used.avg(5m)} > 0.9 * {Template Linux By SSH-Agentless:ssh.memory.total.last()}
  • 严重性:灾难。

5.8 系统重启

  • 名称:系统已重启
  • 表达式
{Template Linux By SSH-Agentless:ssh.system.uptime.last()}<300
  • 严重性:警告。

5.9 SSH 无法连接

  • 名称:SSH 连接失败
  • 表达式
{Template Linux By SSH-Agentless:ssh.metrics.nodata(300)}=1
  • 严重性:高。

5.10 最后 2 次无数据

  • 名称:2 个间隔无数据
  • 表达式
{Template Linux By SSH-Agentless:ssh.metrics.nodata(600)}=1
  • 严重性:警告。

通过遵循这些步骤,您将拥有一个强大的 SSH 无代理监控模板,用于 Linux,包含详细的指标、图表和主动触发器。

关键词

  • Zabbix 无代理监控
  • 使用 SSH 监控 Linux
  • 基于 SSH 的系统指标
  • CPU 和内存监控
  • Zabbix SSH 监控指南

结论

Zabbix 无代理监控提供了一种强大而灵活的解决方案,用于在不安装额外软件的情况下跟踪 Linux 系统性能。通过利用 SSH,您可以有效地监控 CPU、内存、运行时间和其他关键指标。立即开始使用 Zabbix 无代理监控,简化您的基础设施管理。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表