時間とアラートの関連性に着目して通報件数をさらに減らそう

vol.8

今回はパターンマッチングの応用編として、前回のブログにて次回紹介としていた「複合パターン」をご紹介いたします。

複数アラートの関連性に着目!パターンマッチの合わせ技=複合パターン

多様な方法でアラートメールを高精度に仕分けるWebSAM AMCのパターンマッチング。中でも複数のアラートメールを関連付けて、通報したり静観したりする運用を手助けする「複合パターン」という高度なパターンマッチングを標準機能として提供しています。

AMCの多彩なパターンマッチング

今回はこの「複合パターン」についてユースケースを交えて紹介します。

関連する複数のアラートにより通報運用。発生タイミングに着目しよう

ITシステム監視を運用している中で、できるだけ不要な通報を減らし、対応工数を削減したいと考えている運用担当者が多いのではないでしょうか。
不要なアラートの通報削減には、なんといってもAMCによる「静観」(ブログvol.6 で紹介)が非常に有効です。単独のアラートで不要なものは、まずは静観パターンで通報しないようにするのが効果的です。
次に重複する同一アラートの削減については「時間集約」や「件数集約」(ブログvol.4とvol.5で紹介)の活用が有効です。

それでも、システムリソースのパフォーマンス監視などの状態監視では、状態異常が発生して通報した矢先に回復。それが何度も繰り返されて対応に追われることもありますよね。
こうした時間の経過とアラートの関連性に着目して通報を削減できる方法が「複合パターン」になります。

例えば、サーバのCPU使用率が高くなった場合でも、20分以内に回復した場合は通報しない、といった関連性により静観する運用が行えます。

複合パターン関連性により静観するのイメージ  

また、普段の通報は抑えつつ、システム全体の負荷が高くなった場合に警告するという運用も行えます。
例えば、業務アプリケーションを2台のサーバで実行していて、1台の処理量が多くなった場合は静観、10分以内に2台ともに多くなった場合は通報してエスカレーション、といった関連性により通報する運用が行えます。

画面イメージ

この複合パターンは、個々のアラートをキャッチするために複数のパターンを登録して、複合パターンとして組み合わせることで実現できます。
それでは.複合パターンのユースケースを1つ紹介しましょう。

関連性により静観するユースケース

アラート発生後に回復した場合は通報しない運用例として、「サーバのCPU使用率が高くなった場合でも、20分以内に回復した場合は通報しない」ケースについて、AMCの設定方法を紹介します。

【概要】
まず、「CPU使用率が高くなる」と「CPU使用率が回復する」の2つのアラートをキャッチする必要があるので、AMCにてCPU使用率超過が発生したらメール通報する単発パターンと、CPU使用率が回復したら何もしない静観パターンの2つのパターンを登録します。次に、上記2つのパターンを組み合わせて複合パターンとして登録し、20分以内に両方のアラートが順に発生した場合は静観するように設定します。

画面イメージ

【複合パターン用に2つのパターンを登録する】
複合パターンでは、複数のパターンを組み合わせてパターンマッチしてアクションを実行するのですが、組み合わせるパターンは複合パターン専用に用意します。
以下の2つのパターンを登録します。

  1. 発生元サーバを識別するノードとCPU使用率超過を示すキーワード文字列を指定してメール通報する、単発タイプのパターン
  2. 発生元サーバを識別するノードとCPU使用率回復を示すキーワード文字列を指定して通報は行わない、静観タイプのパターン
登録したらパターン優先順を設定しておきます。

【複合パターンを登録する】
複合パターンでのマッチ条件は有効時間内に組み合わせたパターンがマッチするかどうかになります。また今回のユースケースのように、複数パターンの順番を指定してマッチ条件にすることも可能です。
以下は複合パターンの登録例です。

画面イメージ
画面イメージ

複合パターンにマッチすると「20分以内に回復」が成立するので静観することができます。また「CPU高負荷」だけが発生した場合、複合パターンは成立しないので、20分経過の時点で「CPU高負荷」のアラートを単発タイプとして通報することができます。

おわりに

今回のブログはいかがでしたでしょうか?
AMCでは、時間の経過と複数アラートの関連性に着目することにより「複合パターン」を活用した、より高度な通報運用を行うことができます。

本ブログは皆様から頂いた様々なお問合せを参考にして更新しております。今後も皆様のお役に立つ情報を発信して行きたいと考えておりますのでWebSAM Automatic Message Callブログをよろしくお願いいたします。

[参考情報]
https://jpn.nec.com/websam/automaticmessagecall/download.html
 ⇒WebSAM Automatic Message Call 紹介資料

お問い合わせ

当ブログに関するお問い合わせは、WebSAM Automatic Message Callお問い合わせ窓口までお問い合わせください。