アラート件数をカウントする

アラートの中には、何回か発生した場合のみ対応が必要、対応は不要だけど連続して発生したことは把握したい、というものもあると思います。

AMFはこのようなアラートにも対応することができます。


説明するアクションアイテム

① [判定]時間内アクション実行カウント
② [判定]アクション実行カウント
③ [判定]指定時間内&累計アクション実行カウント
④ [判定]インシデント発生ホストカウント

 

ケースステディ

ケース1:
ログアラートが所定の時間内に何回か発生した場合は対応が必要

________1.png

以下のアイテムを使用したアクションを作成し、番号順にアクショングループに設定します。

(1) [判定]時間内アクション実行カウント
(2) [通知]メール通知(差出人:受信アドレス)※推奨
(3) [通知]電話発信

 

ケース2:
同じアラートが何回か発生したことを把握したい

________2.png

以下のアイテムを使用したアクションを作成し、番号順にアクショングループに設定します。

(1) [判定]アクション実行カウント
(2) [通知]メール通知(差出人:受信アドレス)※推奨

 

ケース3:
10分内にHTTP 500番エラーが3回発生した場合に対応が必要、もしくは10分を経過した後でも3回目が発生した場合に対応が必要

________3.png

※3回目が障害発生から1日後でも電話とメールで通知されます。
 カウントをリセットしたい場合は担当者までご連絡ください。

 

以下のアイテムを使用したアクションを作成し、番号順にアクショングループに設定します。

(1) [判定]指定時間内&累計アクション実行カウント
(2) [通知]メール通知(差出人:受信アドレス)※推奨
(3) [通知]電話発信

 

ケース4:
複数のホストでリソースの負荷高騰が発生した場合に対応が必要

________4.png

アラート通知メールの件名にホスト名が記載されている必要があります。

以下のアイテムを使用したアクションを作成し、番号順にアクショングループに設定します。

(1) [判定]インシデント発生ホストカウント
(2) [通知]メール通知(差出人:受信アドレス)※推奨
(3) [通知]電話発信

 

設定方法

いずれのケースも、設定の流れは以下となります。

1. アクションの作成
2. アクショングループの作成
3. フィルタとの紐づけ

メールでアラートを通知する”、“電話でアラートを通知する”を参考に設定してください。

また、例で挙げたのは電話とメール通知のみですが、Slack通知インシデントへのタグ付けなどと組み合わせて使用することもできます。

  

アクションアイテム説明

① [判定]時間内アクション実行カウント

発生メールを受信してから、所定の時間内に同じアラートを複数受信した場合に後続のアクションを実行します。
設定の詳細は、AMFのアクション登録画面をご参照ください。

カテゴリ名(旧顧客名) 特に選択する必要はありません。
※複数カテゴリをご利用の場合、対象のカテゴリ(旧顧客)を選択します。
受信アドレス名 アクションを使用する受信アドレスを選択します。
アクション名 アクショングループ、フィルタ詳細画面に表示する名称
パラメータ情報 期間(分)
  • アクション実行回数をカウントする期間です。
  • 単位は分です。
  • 上記例の期間はここで設定します。
しきい値
  • アクション実行回数のしきい値です。
  • 最初のカウントから”期間(分)”の間にしきい値に達したときに後続のアクションを実行します。
失敗時継続 “継続しない”を選択してください。

 

② [判定]アクション実行カウント

同じアラートを複数受信した場合に後続のアクションを実行します。
設定の詳細は、AMFのアクション登録画面をご参照ください。

カテゴリ名(旧顧客名) 特に選択する必要はありません。
※複数カテゴリをご利用の場合、対象のカテゴリ(旧顧客)を選択します。
受信アドレス名 アクションを使用する受信アドレスを選択します。
アクション名 アクショングループ、フィルタ詳細画面に表示する名称
パラメータ情報 しきい値
  • アクション実行回数のしきい値です。
  • しきい値に達したときに後続のアクションを実行します。
  • 上記例の障害発生回数のしきい値はここで設定します。
失敗時継続 “継続しない”を選択してください。

  

➂ [判定]指定時間内&累計アクション実行カウント

発生メールを受信してから、所定の時間内に同じアラートを複数受信した場合、もしくは所定の時間を経過した後も同じアラートを複数受信した場合に後続のアクションを実行します。
設定の詳細は、AMFのアクション登録画面をご参照ください。

カテゴリ名(旧顧客名) 特に選択する必要はありません。
※複数カテゴリをご利用の場合、対象のカテゴリ(旧顧客)を選択します。
受信アドレス名 アクションを使用する受信アドレスを選択します。
アクション名 アクショングループ、フィルタ詳細画面に表示する名称
パラメータ情報 期間(分)
  • アクション実行回数をカウントする期間です。
  • 単位は分です。
  • 上記例の期間はここで設定します。
期間内しきい値
  • アクション実行回数のしきい値です。
  • 最初のカウントから”期間(分)”の間にしきい値に達したときに後続のアクションを実行します。
累計しきい値
  • アクション実行回数のしきい値です。
  • しきい値に達したときに後続のアクションを実行します。
  • 上記例の10分経過後の障害発生回数のしきい値はここで設定します。
失敗時継続 “継続しない”を選択してください。

 

④ [判定]インシデント発生ホストカウント

複数のホストから同じアラートを受信した場合に後続のアクションを実行します。

使用条件

  • 件名にホスト名、またはホストを特定する文字列が含まれている
  • 件名を”区切り文字”で分割した際に、ホスト名、またはホストを特定する文字列が同じ場所にある

設定の詳細は、AMFのアクション登録画面をご参照ください。

カテゴリ名(旧顧客名) 特に選択する必要はありません。
※複数カテゴリをご利用の場合、対象のカテゴリ(旧顧客)を選択します。
受信アドレス名 アクションを使用する受信アドレスを選択します。
アクション名 アクショングループ、フィルタ詳細画面に表示する名称
パラメータ情報 ホスト名記載位置
  • メール件名のどの位置にホスト名、またはホストを特定する文字列が記載されているかを指定します。
しきい値
  • アラートが発生したホスト数のしきい値を設定します。
  • 最初のカウントから”期間(分)”の間にしきい値に達したときに後続のアクションを実行します。
  • 上記例の障害が発生したホスト数のしきい値はここで設定します。
区切り文字
  • メールの件名を分割する区切り文字です。
  • 区切り文字で分割し”ホスト名記載位置”にあるホスト名を取得します。
  • デフォルトは半角スペースです。
  • 利用可能な区切り文字は以下の通りです。

「半角スペース」、「全角スペース」、「: (半角)」
「; (半角)」、「= (半角)」、「# (半角)」、「. (半角)」
「, (半角)」、「| (半角)」、「( (半角)」、「) (半角)」
「[ (半角)」、「] (半角)」、「「 (全角)」、「」 (全角)」
「【 (全角)」、「】 (全角)」、「: (全角)」、「/ (半角)」
「? (半角)」、「! (半角)」、「& (半角)」、「@ (半角)」
「- (半角)」、「_ (半角)」、「・ (全角)」、「; (全角)」
「= (全角)」、「# (全角)」、「. (全角)」、「, (全角)」
「| (全角)」、「( (全角)」、「) (全角)」、「[ (全角)」
「] (全角)」、「/ (全角)」、「? (全角)」、「! (全角)」
「& (全角)」、「@ (全角)」、「_ (全角)」、「' (半角)」
「" (半角)」、「* (半角)」、「< (半角)」、「> (半角)」
「{ (半角)」、「} (半角)」、「* (全角)」、「< (全角)」
「> (全角)」、「{ (全角)」、「} (全角)」、「『 (全角)」
「』 (全角)」、「〔 (全角)」、「〕 (全角)」、「$ (半角)」
「$ (全角)」、「+ (半角)」、「+ (全角)」、「% (半角)」
「% (全角)」

失敗時継続 “継続しない”を選択してください。

 

 

 

 

 

この記事は役に立ちましたか?
0人中0人がこの記事が役に立ったと言っています