SNMP/MRTGによるサーバの監視

投稿日:

このサーバ、性能的にちとプア(39,800円で売ってた一番安いショップブランド機にファンを増設しただけで無理矢理サーバ化してるんで無理もない:^^;)で、負荷状況がかなりヤバそうなため以前から負荷状況の監視を行いたかったんですが、何度実験しても

「snmpdにsnmpwalkで呼び掛けるとCPU負荷が100%になって沈黙する」

んで、途方に暮れてました。が、ようやくなんとかかんとか監視グラフを作成させる事に成功したみたいです。

OS>Redhat Linux 7.3
使用パッケージ>
ucd-snmp-4.2.5-7.73.0

このパッケージをインストールすると/etc/snmp/snmpd.confにデフォルトで

# name incl/excl subtree mask(optional)
view systemview included system

↑こう設定されてるんですが、ウチの環境ではどうもコレがマズかったみたい。

いろいろと試行錯誤を繰り返した結果、この部分を

view all included .1

↑こんな風に書き換える事で、ようやく前述の「CPU負荷100%になって沈黙する」症状が出なくなりました。やれやれ。こちらの解説では「view all include .1 80」とマスクの設定が付いてたんですが、コレ付けるとワタシの環境では駄目。

ついでに、/etc/mrtg/mrtg.cfgの設定。

# for UNIX
WorkDir: /var/www/html/mrtg

↑作業ディレクトリの設定。

Target[localhost_2]: 2:private@localhost:
SetEnv[localhost_2]: MRTG_INT_IP="192.168.1.**" MRTG_INT_DESCR="eth0"
MaxBytes[localhost_2]: 1250000
Title[localhost_2]: Traffic Analysis -- crusherfactory.net
PageTop[localhost_2]: <H1>Traffic Analysis -- crusherfactory.net</H1>

↑転送量を記録する設定(cfgmaker作)

Target[cpu]: 1.3.6.1.4.1.2021.10.1.5.2&1.3.6.1.4.1.2021.10.1.5.3:private@localhost
MaxBytes[cpu]: 2000
Title[cpu]: CPU Load Average
PageTop[cpu]: <H1>CPU Load Average</H1>
Options[cpu]: nopercent, integer, gauge, absolute, withzeroes
YLegend[cpu]: CPU Load Average
ShortLegend[cpu]: percent
Legend1[cpu]: 5 min CPU Load Average
Legend2[cpu]: 15 min CPU Load Average
LegendI[cpu]: 5min
LegendO[cpu]: 15min

↑CPU負荷を記録する設定。

以上の設定により記録された転送量CPU負荷。やはりというか、データベースサーバとしての負荷はちょっと重めみたいですね。

それにしても、1度

>1059982200 416 199 475 210

「CPU負荷率475%」という記録が出ちゃったんですが、ありゃ一体なんだったんでしょうかねぇ? 「負荷率」って、最大で100%だと思うんすが…(^^;;

030805a.gif

>1060156200 107 101 122 107
>1060155900 290 139 333 147

↑その後もコンスタントに100%を越えております。どうもそーゆーモンらしいっす。