こんにちは。Mackerelチーム CRE の三浦(id:missasan)です。
ついに、Mackerelの連続リリース記録も200週を達成いたしました。 これはひとえに日々Mackerelを活用いただき、プルリクエストやフィードバックをいただいているユーザのみなさまのおかげです。いつも本当にありがとうございます!
リリースを記念して、Mackerelのトップページをリニューアルしました。
それでは、今週のアップデート情報です。
アラートグループ機能をリリースしました
これまで、ネットワークやストレージなど広い範囲に影響がある箇所に障害が発生した際などに、大量のアラートが上がって困る、という経験をしたことがある方も多いのではないでしょうか。 大量のアラートに埋もれて重要なアラートを見逃してしまったり、すべての時系列を把握することが難しかったりすることがあります。
今回はそういった、一度に発生した複数のアラートをグループにまとめて、通知を減らしたり、時系列を理解しやすくできるような機能「アラートグループ」をリリースしました。
アラートグループを設定すると、サービス、ロール、監視設定などを指定することで、関連するアラートを一つのグループとしてまとめることができます。
具体的には、ヘルプにある以下の画面をご覧ください。
このケースでは、複数のサーバ(app1.sample.com、app3.sample.com)や複数の監視項目(connectivity、URL外形監視、custom.sample.foobar)についてのアラートが一つの Example-Service
というグループでまとめられています。
アラートグループを作成すると、このように一連の障害が時系列としてどのような順番で発生し、クローズしたかということが一目でわかりやすくなっています。
さらに、通知はアラートグループ単位で行われるため、メールの受信ボックスやチャットツールが通知で埋もれてしまうという問題が解決します。
アラートグループのアラートを1通受信すれば、それをきっかけにアラートグループの状況をウォッチすればよいので、運用がシンプルになります。
どういったものをグループにすればよいか迷った際は、例えばまずは、複数ホストが所属するロール単位でグループを作成してみてください。そういったロールが存在しない場合は、1つのサービスでまとめてアラートグループを設定してみることもおすすめです。
「新規アラートグループ設定を作成」画面にてアラートグループを作成し、通知チャンネルにアラートグループを通知する設定を追加すれば、晴れて上記のような運用が可能になります。
ヘルプを参考に、ぜひこの新しい機能をお試しください!