阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

使用zabbix discovery监控网卡百兆

108次阅读
没有评论

共计 2149 个字符,预计需要花费 6 分钟才能阅读完成。

最近在 review 一些基础监控项,发现有部分基础的监控缺失,比如 disk usage,network card 相关的监控。因为机器的配置不同,不太好配置一个统一的模板,不过在新版本的 zabbix 中有个功能 Low-level discovery,可以根据主机的配置自动生成需要的监控,只需要传入宏变量即可。

比如监控每个网卡的出流量 net.if.out[{#IFNAME}],监控网卡的 speed os.get[NetworkCardSpeed,{#IFNAME}]
有些情况下网卡会从 1000M 变成 100M,因此添加了相关的 trigger:
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}<1000

这里有两个细节的问题:
1)新版本的 network card speed 的 item 是 os.get[NetworkCardSpeed,xxxx], 在网卡的 speed 为 unknown 时,其结果是 0。

zabbix_get -s 127.0.0.1 -k ‘os.get[NetworkCardSpeed,eth2]’
0

为了排除这种情况,更改 trigger 为如下规则:

 {os.get[NetworkCardSpeed,{#IFNAME}].last(0)}<1000 &
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}#0

可以通过如下 sql 查看 speed 为 100M 的机器:

select
distinct(a.host),c.ip,b.name,b.lastvalue from hosts a,items b,
interface c where a.hostid=c.hostid and a.hostid=b.hostid and
b.key_ like ‘os.get[NetworkCardSpeed%’ and b.lastvalue=’1000′;

2)关于 bonding
由于 datanode 的 shuffle 阶段需要大量的网络操作,很容易出现网卡瓶颈,因此 datanode 一般会做网卡的 bonding,常用的模式是 6, 根据原理来看 outgoing 和 incoming 的流量大致应该是相同的,但实际情况下看到,outgoing 的流量一般是比较平均,而 incoming 的流量相差很大, 下面是一个 sar 的结果:

14 时 24 分 28 秒    IFACE  rxpck/s  txpck/s  rxbyt/s  txbyt/s  rxcmp/s  txcmp/s  rxmcst/s
14 时 24 分 29 秒      eth0      6.93  28139.60    473.27 41837599.01      0.00      0.00      6.93
14 时 24 分 29 秒      eth1  29448.51  31732.67 1929669.31 47286517.82      0.00      0.00      6.93
14 时 24 分 29 秒    bond0  29455.45  59872.28 1930142.57 89124116.83      0.00      0.00    13.86

另外,如果一个网卡由 1000M 变为 100M 也不会出现短板效应 (之前一直以为会出现短板效应),而是根据 speed 的情况来做流量分发,speed 大的流量大,speed 小的流量小。
 
另外注意 bonding 配置中 miimon 参数的含义,它是检测的 server 到 switch 的直连链路问题,如果 switch 的上层链路出问题是不会 work 的。交换机链路的 ha 就需要考虑以太通道等技术了。。

一些 Zabbix 相关教程集合

Ubuntu 14.04 下 Zabbix2.4.5 源码编译安装  http://www.linuxidc.com/Linux/2015-05/117657.htm

CentOS 7 LNMP 环境搭建 Zabbix3.0  http://www.linuxidc.com/Linux/2017-02/140134.htm

Ubuntu 16.04 安装部署监控系统 Zabbix2.4  http://www.linuxidc.com/Linux/2017-03/141436.htm

Zabbix 监控安装部署及警报配置  http://www.linuxidc.com/Linux/2017-03/141611.htm

Ubuntu 16.04 下安装部署 Zabbix3.0  http://www.linuxidc.com/Linux/2017-02/140395.htm

CentOS 6.3 下 Zabbix 监控 apache server-status http://www.linuxidc.com/Linux/2013-05/84740.htm

CentOS 7 下 Zabbix 3.0 安装详解 http://www.linuxidc.com/Linux/2017-03/141716.htm

64 位 CentOS 6.2 下安装 Zabbix 2.0.6   http://www.linuxidc.com/Linux/2014-11/109541.htm

ZABBIX 的详细介绍:请点这里
ZABBIX 的下载地址:请点这里

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-03/141923.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计2149字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中