スタートガイド > 3. アラートを受け取って自動対応しよう > 3-3. 同じアラートを5分間に3回受け取ったら、監視メンバーに電話で通知したい

3-3. 同じアラートを5分間に3回受け取ったら、監視メンバーに電話で通知したい

一定時間内に、監視対象サービスから同じアラートを規定回数受け取ったら、該当の担当者(複数名)に順次電話発信するルールを登録するケースの実現例を示します。

1. 要件

1-1. 監視対象サービス

  • アラートが発生したら、件名に ERROR を含むメールをOpsAidへ送信する

1-2. OpsAid

  • 5分間3回、件名に ERROR を含むアラートを受信したら、監視メンバーに電話発信する
  • 監視メンバーユーザー01ユーザー02ユーザー03の3名
    • まずユーザー01に発信し、応答がなければユーザー02ユーザー03の順に発信する。応答があればそこで終了

2. OpsAidの登録内容

以下の内容で、OpsAid側のアラート受信準備を行います。

2-1. プロジェクト作成

1-1. プロジェクトを用意しように従って、アラートを受信するプロジェクトを作成します。 アラートを受信するプロジェクトが既に作成されている場合は、このセクションは飛ばして構いません。

プロジェクトのメールアドレスが発行されたら、メモを取っておきます。

2-2. 担当者ユーザーをプロジェクトに追加

2-1. で用意したプロジェクトに、担当者のユーザー01ユーザー02ユーザー03のユーザーを追加します。
すべてのユーザーに、電話番号を1件以上設定しておきます。

設定方法は

3-1. アラートが発生したら担当者に電話で通知したい
 > 2-2. 担当者ユーザーをプロジェクトに追加

を参照してください。

2-3. ルール登録

アラートを受信するプロジェクトに、ルールを1件登録します。
ルールの条件には以下の内容を設定します。

マッチ条件

「キーワード条件で設定する」のタブを選択します。

  • キーワード条件

    • 「件名」に「ERROR」が「含まれる」

  • 流量条件

    • 「5分間」に「3通以上」受信する

件名に ERROR を含むアラートを受信したら、このルールを適用します。

アクション設定

  • 自動コール
    • 呼び出し秒数: 20秒
    • リトライ回数: 2
    • 連絡先1: ユーザー01の電話番号
    • 連絡先2: ユーザー02の電話番号
    • 連絡先3: ユーザー03の電話番号

このルールが適用されたら、連絡先1のユーザー01の電話番号に電話を発信します。20秒間呼び出しを行い、応答があった場合は、結果[OK]でアクションを終了します。応答がなかった場合は、連絡先02のユーザー02の電話番号に電話を発信します。連絡先リストの最後まで電話発信し、すべて応答がなかった場合は、リトライ回数2回まで再度連絡先1から順次発信します。リトライを含むすべての発信で応答がなかった場合は、結果[NG]でアクションを終了します。

インシデント設定

  • 条件にマッチした場合に作成するインシデントの設定
    • ステータス: 完了
    • 担当者: ユーザー01

その他の項目は任意で設定します。

3. アラート受信時の動き

上記のルールをプロジェクトに登録した状態で、監視対象サービスでアラートが発生すると、以下の流れでアラートの自動対応が行われます。

  1. 監視対象サービスから、プロジェクトのメールアドレスへ向けて、件名にERRORを含むアラートを送信する
  2. OpsAidでプロジェクトがアラートを受信する
  3. プロジェクトに登録されたルールに、アラートがマッチするかチェックする。アラートの件名にERRORが含まれているが、この時点ではまだマッチしない
  4. 監視対象サービスから、プロジェクトのメールアドレスへ向けて、件名にERRORを含むアラートを最初のアラートから5分以内に合計3回以上送信する
  5. OpsAidでプロジェクトがアラートを受信する
  6. プロジェクトに登録されたルールに、アラートがマッチするかチェックする。アラートの件名にERRORが含まれており、流量条件の5分間3回以上受信したので、作成したルールの実行条件にマッチする
  7. ルールの実行条件にマッチしたので、自動でルールのアクションが実行され、まずユーザー01へ電話発信が行われる。ユーザー01が応答しなかった場合、ユーザー02へ電話発信が行われる。ユーザー02も応答しなければユーザー03へ電話発信が行われる
  8. ルールの実行条件にマッチしたので、自動でインシデントが起票される
  9. アクションの結果を受けて、ルールの実行結果が起票したインシデントに記録される
  10. 問題なく終了したら、インシデントのステータスが完了となる

以上で、OpsAidの自動対応が終了します。


以上の設定を行うことで、監視対象サービスでアラートが発生したら、該当の担当者に電話発信するケースの実現が可能です。

次は 3-4. 休日に受け取ったアラートは、自動でBacklogに起票したい に進みます。