阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

Zabbix企业应用之服务器硬件信息监控

142次阅读
没有评论

共计 5308 个字符,预计需要花费 14 分钟才能阅读完成。

现在介绍一下 Zabbix 监控服务器硬件信息的。由于我公司服务器都是使用 dell(我公司是手游方面,服务器全部是 dell),服务器型号有 r410、r420、r710、r720,系统有 CentOS 5.x、centos 6.x、RedHat 5.x、redhat 6.x、Ubuntu 12.04、ubuntu 12.04.4 等版本,对于硬件监控,我测试过 ipmi、megacli、smart 等,但这些监控软件的监控内容都比较少,没有通用的那种,最后找到了 dell 专门的 omsa,满足了我的需求,下面就介绍一下使用 omsa 来监控 dell 服务器的硬件信息。

目前我监控以下的硬件信息:

1、cpu 处理器状态
2、cpu 省电模式状态(如果开启了省电模式,在压力大的时候,会很卡的)
3、raid 状态(比如做了哪个 raid 模式,raid 状态是否正常)
4、内存状态(可以查看当前服务器最大支持多少内存,当前多少内存,如果内存有问题,可以显示哪个位置内存故障)
5、机器温度状态(监控机器的温度是否超过阀值)
6、物理硬盘状态(监控物理硬盘是否有故障)
7、电源状态(是单电还是双电,是否有故障)
8、系统面板 CMOS 电池(cmos 电池是否有故障)
9、网卡状态(当前的网卡数量,以及网卡是否有问题)
10、风扇(当前的风扇数量,以及是否有故障)
默认是 cpu 省电模式监控关闭报警,其他的监控都是 15 分钟监控一次,如果连续 2 次都有问题则报警通知。

下面是监控图
1、硬件正常的服务器监控截图

Zabbix 企业应用之服务器硬件信息监控

2、部分硬件不正常的监控图

Zabbix 企业应用之服务器硬件信息监控

可以看到此服务器的 cpu 开启了省电模式,并且内存条有问题
经过命令行查看,发现有问题的内存条是第一个插槽

Zabbix 企业应用之服务器硬件信息监控

下面是安装方法:
一、客户端
A. 在 redhat 或者 centos 系统里安装
1、安装 dell 的 yum 源

wget -q -O – http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

2、安装 omsa
yum install srvadmin-all

3、做软连接
ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig

4、关闭 web 模式(仅允许运行 cli)
echo “/usr/bin/omconfig system webserver action=stop” >>/opt/dell/srvadmin/sbin/srvadmin-services.sh

5、启动 omsa
/opt/dell/srvadmin/sbin/srvadmin-services.sh start

6、把 omsa 加入到开机启动里
echo “/opt/dell/srvadmin/sbin/srvadmin-services.sh start”>>/etc/rc.local

以上是在 centos 或者 redhat 系统里安装 omsa。
B. 下面是在 ubuntu 下的安装
1、增加源
echo ‘deb http://linux.dell.com/repo/community/ubuntu precise openmanage’ | sudo tee -a /etc/apt/sources.list.d/linux.dell.com.sources.list

2、检测与增加 key
gpg –keyserver pool.sks-keyservers.net –recv-key 1285491434D8786F
gpg -a –export 1285491434D8786F | sudo apt-key add –

3、更新源
apt-get update -y

4、安装 omsa
apt-get install srvadmin-all -y

5、做软连接
12 ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig

6、启动 cli 模式 omsa
service dataeng start

C.zabbix 客户端的配置
1、下面是在 zabbix_agentd.conf 里配置
#follow is monitor hardware
UserParameter=hardware_battery,omreport chassis batteries|awk’/^Status/{if($NF==”Ok”) {print 1} else {print 0}}’
UserParameter=hardware_cpu_model,awk-vhardware_cpu_crontol=`sudoomreport chassis biossetup|awk’/C State/{if($NF==”Enabled”) {print 0} else {print 1}}’` -vhardware_cpu_c1=`sudoomreport chassis biossetup|awk’/C1[-|E]/{if($NF==”Enabled”) {print 0} else {print 1}}’` ‘BEGIN{if(hardware_cpu_crontol==0 && hardware_cpu_c1==0) {print 0} else {print 1}}’
UserParameter=hardware_fan_health,awk-vhardware_fan_number=`omreport chassis fans|grep-c “^Index”` -vhardware_fan=`omreport chassis fans|awk’/^Status/{if($NF==”Ok”) count+=1}END{print count}’` ‘BEGIN{if(hardware_fan_number==hardware_fan) {print 1} else {print 0}}’
UserParameter=hardware_memory_health,awk-vhardware_memory=`omreport chassis memory|awk’/^Health/{print $NF}’` ‘BEGIN{if(hardware_memory==”Ok”) {print 1} else {print 0}}’
UserParameter=hardware_nic_health,awk-vhardware_nic_number=`omreport chassis nics |grep-c “Interface Name”` -vhardware_nic=`omreport chassis nics |awk’/^Connection Status/{print $NF}’|wc-l` ‘BEGIN{if(hardware_nic_number==hardware_nic) {print 1} else {print 0}}’
UserParameter=hardware_cpu,omreport chassis processors|awk’/^Health/{if($NF==”Ok”) {print 1} else {print 0}}’
UserParameter=hardware_power_health,awk-vhardware_power_number=`omreport chassis pwrsupplies|grep-c “Index”` -vhardware_power=`omreport chassis pwrsupplies|awk’/^Status/{if($NF==”Ok”) count+=1}END{print count}’` ‘BEGIN{if(hardware_power_number==hardware_power) {print 1} else {print 0}}’
UserParameter=hardware_temp,omreport chassis temps|awk’/^Status/{if($NF==”Ok”) {print 1} else {print 0}}’|head-n 1
UserParameter=hardware_physics_health,awk-vhardware_physics_disk_number=`omreport storage pdisk controller=0|grep-c “^ID”` -vhardware_physics_disk=`omreport storage pdisk controller=0|awk’/^Status/{if($NF==”Ok”) count+=1}END{print count}’` ‘BEGIN{if(hardware_physics_disk_number==hardware_physics_disk) {print 1} else {print 0}}’
UserParameter=hardware_virtual_health,awk-vhardware_virtual_disk_number=`omreport storage vdisk controller=0|grep-c “^ID”` -vhardware_virtual_disk=`omreport storage vdisk controller=0|awk’/^Status/{if($NF==”Ok”) count+=1}END{print count}’` ‘BEGIN{if(hardware_virtual_disk_number==hardware_virtual_disk) {print 1} else {print 0}}’

2、重启 zabbix_agentd 服务
ps -ef|grep zabbix|grep -v grep|awk ‘{print $2}’|xargs kill-9
/usr/local/zabbix/sbin/zabbix_agentd-c /usr/local/zabbix/conf/zabbix_agentd.conf

如果需要在其他系统里安装,请参看官方 wiki,地址是 http://linux.dell.com/wiki/index.php/Repository/hardware。

如果是 windows 系统,可以参考 zabbix 企业应用之 Windows 系统安装 omsa 硬件监控(地址为 http://www.linuxidc.com/Linux/2015-05/117340.htm)
二、服务端
1、模板导入
把 Template Hardware Monitor 导入到 zabbix 里(模板在附件),具体操作不介绍。
2、主机关联模板
把需要监控的硬件服务器关联此模板即可

—————————————— 分割线 ——————————————

免费下载地址在 http://linux.linuxidc.com/

用户名与密码都是www.linuxidc.com

具体下载目录在 /2015 年资料 / 5 月 /11 日 /Zabbix 企业应用之服务器硬件信息监控 /

下载方法见 http://www.linuxidc.com/Linux/2013-07/87684.htm

—————————————— 分割线 ——————————————

一些 Zabbix 相关教程集合

安装部署分布式监控系统 Zabbix 2.06 http://www.linuxidc.com/Linux/2013-07/86942.htm

《安装部署分布式监控系统 Zabbix 2.06》http://www.linuxidc.com/Linux/2013-07/86942.htm

CentOS 6.3 下 Zabbix 安装部署 http://www.linuxidc.com/Linux/2013-05/83786.htm

Zabbix 分布式监控系统实践 http://www.linuxidc.com/Linux/2013-06/85758.htm

CentOS 6.3 下 Zabbix 监控 apache server-status http://www.linuxidc.com/Linux/2013-05/84740.htm

CentOS 6.3 下 Zabbix 监控 MySQL 数据库参数 http://www.linuxidc.com/Linux/2013-05/84800.htm

64 位 CentOS 6.2 下安装 Zabbix 2.0.6   http://www.linuxidc.com/Linux/2014-11/109541.htm

ZABBIX 的详细介绍:请点这里
ZABBIX 的下载地址:请点这里

本文永久更新链接地址:http://www.linuxidc.com/Linux/2015-05/117339.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-20发表,共计5308字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中