監視対象のサーバー・ポートに対して Telnet で接続し必要最小限のコマンドを送信します。
応答の有無および応答内容によって、正常か異常かを判断します。
異常と検知された場合でも、直ちに障害と判断して異常報告を行うことはしません。
たまたまトラフィックが集中したとか、サーバーの再起動を行ったとか、色々な要因が考えられます。
弊社では1回目の異常を検知した場合、そのサーバーを 重点監視サーバー としてマークします。
重点監視サーバーに対しては、約1分間隔で連続して再調査がなされます。
一定期間内に復旧を確認できれば、重点監視サーバーのマークを外し、通常監視体制に戻ります。
復旧確認がとれないサーバーに対して、異常と判断して連絡メールを送信します。
最初に 異常 と判断して実際に連絡メールをお送りするまでの判定基準は 5分〜60分 の範囲でお客様が設定できます。
お客様の設定された判定基準内に復旧しない場合に異常と判断し連絡メールをお送りします。、
さらにお客様のご指定があれば、障害が復旧していない旨を伝える連絡メールを定期的にお送りします。
以前(〜2006年6月)の監視サービスでは、復旧するまで定期的に異常をお伝えするメールを常にお送りしていましたが、
異常時の連絡先に携帯電話のメールアドレスを指定されるお客様が多いこともあり、
「何度も連絡して来なくてもいい、わかってるから。」
といった御意見を複数頂戴していました。
現在のシステムでは、「障害発生時に1回のみ連絡」を既定とし、
その上でお客様のご指定により、再通知頻度を1時間〜24時間(1時間単位)で設定できるようになりました。
また、障害が復旧したことを検知した場合には、復旧確認が取れた旨を伝えるメールをお送りします。
正常状態が続いている場合の順調メールも、お客様のご指定に応じてこれまで同様お送りできます。
さらに携帯電話のアドレスに対しては、前後の挨拶文など必須性の低い情報を削除し、少ない文字数での案内になってます。
OK → NG | NG → OK | |
---|---|---|
差出人 | server@checkserver.jp | server@checkserver.jp |
件名 | 障害) 219.166.144.19:80 | 復旧) 219.166.144.19:80 |
本文 | いつもお世話になっております。 時刻:2006/06/23 17:03 障害発生時刻:2006/06/23 16:53 |
いつもお世話になっております。 時刻:2006/06/23 18:04 HTTP/1.1 200 OK 障害発生時刻:2006/06/23 16:53 |
携帯電話へは、青色部分は送信しません。
携帯電話等で受信規制している場合には「 server@checkserver.jp 」を受信許可にして下さい。
この「server@checkserver.jp」は送信専用のアドレスとなっていますので、
弊社への問い合わせについては、送信メール末尾に記されているメールアドレスか、左メニューの「問い合わせ」をご利用ください。
細かな文言は予告なく変更される場合があります。