Mackerel APMにレイテンシーのパーセンタイルグラフが追加、グラフのドラッグによる拡大や、トレーススパン数・利用量表示が確認できるようになりました ほか6件のアップデート

こんにちは!Mackerel チーム CRE の戸谷(id:KGA)です。今回のアップデート内容をお知らせいたします。

APM機能の改善を行っています

5月1日に正式リリースをいたしましたMackerelのAPM機能ですが、引き続き機能改善を行っています。

サマリー画面に、レイテンシーのP90、P95、P99のグラフが表示されるようになりました

サマリー画面に、レイテンシーの90パーセンタイル(P90)、95パーセンタイル(P95)、99パーセンタイル(P99)のグラフが表示されるようになりました。外れ値を除いたレイテンシーの傾向を把握しやすくなります。

サマリーのグラフがドラッグで拡大できるようになりました

APMのサマリー画面のグラフをドラッグすることで、拡大表示できるようになりました。これにより、特定の時間帯の詳細なデータを素早く確認できます。

トレーススパン数の合計や日次の利用量、総利用量の推移が確認できるようになりました

トレーススパン数の合計や日次の利用量、総利用量の推移がグラフで確認できるようになりました。ご利用料金の見込みを立てたり、スパン数の増減を把握しサンプリングの調整を行う際にご活用ください。

データの保持期間が2週間となりました

スパンのデータはベータ時点では3日保存していましたが、正式リリースに伴い、データの保持期間が2週間となりました。

トレース画面のサイドメニューにあった「HTTPサーバー」「データベース」のページをAPM画面のタブに統合しました

トレース画面のサイドメニューにあった「HTTPサーバー」「データベース」のページをAPM画面のタブに統合し、APMで表示しているサービスのHTTPサーバーやデータベースのパフォーマンスをすぐに確認できるようになりました。

AWSインテグレーションがAmazon ElastiCache for Valkeyに対応しました

AWSインテグレーションがAmazon ElastiCache for Valkeyに対応しました。取得できるメトリックやAWSインテグレーションの設定方法については、以下のドキュメントをご覧ください。

PagerDutyへの通知に監視ルール名を追加しました

PagerDutyでEvents API v2を用いるよう設定した通知チャンネルへ送信される通知に、監視ルール名を追加しました。イベントのdetailsの中にmonitor_nameというキーで監視ルール名が含まれます。これにより、PagerDutyの通知を受け取った際に、どの監視ルールからの通知かを確認しやすくなります。

{
  "client": "Mackerel",
  "client_url": "https://mackerel.io/orgs/Hatena-org/alerts/5ryhYHNjTSQ",
  "contexts": null,
  "description": "[Hatena-org] CRITICAL: https://hatena.blog/404 HTTP request failed - status is 404",
  "event_type": "trigger",
  "incident_key": "alert-XXXXXXXXXXXXXXXXXXXXXXXXXX",
  "service_key": "XXXXXXXXXXXXXXXXXXXXXXXXXXXX",
  "details": {
    "alert_created_at": 1744940159,
    "alert_url": "https://mackerel.io/orgs/Hatena-org/alerts/5ryhYHNjTSQ",
    "monitor_name": "hatena.blog/404"
  }
}

「式による監視」において、Mackerel側の不具合を起因とするUNKNOWNアラートを発生しないようにしました

これまでMackerel側の不具合が原因で、式による監視のUNKNOWNアラートが発報するケースがありましたが、これはユーザーのみなさまにとっては対処しようがなく、不必要なアラートが発報されるという状況でした。

そのため、今後はMackerel側の不具合が原因の場合は、式による監視のUNKNOWNアラートが発報されないように調整いたしました。

なお、監視対象にしているメトリックが存在しなくなった場合など、Mackerel側の不具合が原因ではないアラートに関しては、引き続き発報されますのでご留意ください。

また、この調整の都合上、過去に「監視対象の式に誤りがあるか、式による値の取得時にタイムアウトしています」というメッセージを記録していたアラートを参照すると、それが実際にはMackerel側の不具合が原因でUNKNOWNアラートが発生してしまっていたものであっても「監視対象の式に誤りがあります」というメッセージに置き換わって表示されます。ご了承のほど、よろしくお願いいたします。

ロールグラフのカスタムメトリックに単位が表示されるようになりました

ロールグラフのカスタムメトリックはこれまで単位が表示されていませんでしたが、この度、「全画面表示ページのロールグラフ」と「カスタムダッシュボードのロールグラフ」にて単位が表示されるようになりました。これにより、グラフを見た際にメトリックの単位を確認しやすくなります。

status.mackerel.ioで示す機能コンポーネントにAPMおよびTracesを追加しました

Mackerelの障害発生時にはstatus.mackerel.ioにて状況をお知らせしていますが、どの機能に障害が発生しているかを表す機能コンポーネントにAPMおよびTraces(トレース)を追加しました。

コンポーネント名 影響範囲
APM WebコンソールでのAPMの閲覧
Traces OpenTelemetry対応のトレースの投稿・取得、WebコンソールのAPM画面以外でのトレースページの閲覧、トレースの課題機能

これ以外の機能コンポーネントについては以下FAQをご覧ください。

障害情報に関する情報はどこで確認ができますか – Mackerel Support

terraform-provider-mackerelで外形監視でOKとするHTTPステータスコードの指定に対応しました

外形監視ではOKと判定するHTTPステータスコードが選択可能ですが、terraform-provider-mackerelで監視設定を行う場合もexpected_status_codeという設定値で指定が可能になりました。terraform-provider-mackerel v0.5.0からお使いいただけます。

こちらのアップデートはMackerelユーザの@fujiwaraさんにコントリビュートいただきました。ありがとうございます!