トレース - サービスを健全に保つ

サービスの状態を監視し健全な状態を保つことにより、ユーザー体験を向上させることができます

サービスの状態を把握する

SLOの状態を把握することで、ユーザー体験に問題が無いことを確認できます。 SLOはエラーの頻度やリクエスト遅延の閾値など、サービスの特性にあわせて設定することができます。

Dashboard 画面

個別のSLOの推移を見ることもできます

SLO 画面

問題を発見する

エラーや遅いリクエストを自動的に発見し、Issueとして一覧に追加します。 Slackの通知を有効化することで、問題が発生した場合すぐに気づけるようになります。

また、同じIssueはまとめられるので、大量のエラーに煩わせれることはありません。

ssue List 画面

フィルタリング項目を設定することにより、Issueを詳細に検索することもできます。

Issue List 画面 / Filtering