システム監視
監視項目と条件定義
監視対象システムの監視項目は、Webインタフェースを使用して容易に設定・変更できます。監視項目は、運用状態の許容範囲を定義します。定義されたしきい値を超える状態を監視サーバが検出した場合、指定した宛先へEメールで通知します。通知レベルは
「緊急」、「障害」、「警告」、「報告」の4つのレベルに分類して定義できます。
(例)
システムのCPU使用率が99%を超えた場合
システムとの通信が不通になった場合 → 「緊急」、、、、
異常通知方法:Eメール通知
警告ランプ、ブザー(警報システムに接続)
監視間隔
システムの監視は、cron設定により15分間隔で行われます。また、サービス形態や運用形態によってはシステム毎に異なることから、ホスト毎に異常通知を行う時間帯を定義できます。
監視対象ホスト間の相関関係
NFSサーバとNFSクライアントのように相関関係を持つホストでも、監視する相関関係を定義することで無意味な異常通知を避けることができます。
クラスタ構成の監視
クラスタ構成のシステムはヘッドノードを経由して監視します。クラスタノードはヘッドノードと相関関係を持つため、ヘッドノードへの通信が正常の場合にのみクラスタノードの監視を実行します。
監視項目詳細
| 監視項目 | 検出内容 |
|---|---|
|
ネットワーク |
監視対象ホストへの通信不能(ネットワークインタフェース毎)、 監視対象ホストへのリモートシェル不能、 |
| CPU |
上限CPU使用率の超過、上限Load Averageの超過、リブート状態の監視 |
|
ディスク |
ローカルディスクの未マウント、 ローカルディスクの上限使用率の超過(ディスク満杯時の監視)、 |
|
プロセス動作状態 |
動作プロセス数の最小値/最大値の超過、動作プロセスの最大CPU時間の超過、動作プロセスの最大滞留時間の超過 |
|
ポート通信応答状態 |
ポート通信先の異常応答 |
|
NISサーバへのバインド状態 |
NISサーバへのバインド不能、 既定NISサーバ以外へのバインド |
|
システムログデータ |
異常ログを特定する検索キーに一致するログ検出(異常と扱わない除外キーも定義可能) |
|
ログインアイドル時間 |
アイドル時間の超過 |
|
ファイル |
ファイル数およびファイルサイズの監視 |
|
実時間誤差 |
実時間誤差の最大値(分)の超過 |
|
CPU時間/データ収集 |
CPU時間データが未収集 |
|
その他 |
附帯設備の故障通知や温度センサー感知など受信メールで通知される異常検知を監視します。 |

