Zabbixの勉強を進めていますが、マニュアル通りに設定していて、中で何をやっているかをあまり理解していなかったりします。
それだとちょっとまずいのでZabbixでの構築とともに自力での監視スクリプトを作ってみようかと思っています。
参考文献 サーバー/インフラエンジニア養成読本 管理・監視編
監視対象
- ネットワーク状況
- ネットワークサービス状況
- OS/リソース状況
ネットワーク状況監視
ホストが接続できるかどうかはネットワークコマンド(ping,traceroute)をうつのがもっとも簡単ですね。pingとうってレスポンスが正しく帰ってくればOKです。tracerouteでもOKです。
ただし、途中に存在するファイアロールによってさえぎられてしまうこともあるようです。
ネットワークサービス状況監視
webサーバーやメールサーバーが生きているかどうかを見るためにはtelnetで見てあげるのが有効です。
例えばWEBサーバーが生きているかどうかは80番にポートを送り、返信があるかどうかを確認します。
1 2 3 4 5 6 7 8 9 |
telnet www.yahoo.co.jp 80 //ここで以下のようなメッセージが出ます Trying 182.22.121.123... Connected to www.yahoo.co.jp. Escape character is '^]'. //このあと、下記コマンドを入力し、2回改行します。 GET / HTTP/1.0 //ここでyahooのHTMLが図れていればOKです。 |
他のネットワークサービス(例えばSMTPやPOPなども同様にして対処できます。)
監視対象内部状況(OS/リソース)監視
OS/リソースの状況を監視したい場合、外部からではわからないので監視対象にログインをして、状況を確認するためのコマンド(vmstatなど)を入力することになります。
逆引き系に使えるコマンドのリンクなど