Mackerel ブログ #mackerelio

Mackerelの公式ブログです

8月7日予定のメンテナンス内容の詳細について

Mackerelサブプロデューサーの id:Songmu です。先日告知した、8月上旬のメンテナンスに関し、メンテナンスの内容の詳細をお知らせいたします。

メンテナンス時間: 2017年8月7日(月)14:30~16:30(JST)

システムのオンライン切り替えを実施しますが、その関係で、上記の時間帯の中で1回から2回、Mackerelのメインシステムで以下の状況が発生します。

  • 10分弱の応答停止
  • その後20分程度の不安定な時間帯

応答停止中に発生すること

  • APIアクセスの停止
    • agentやmkrからのリクエストが一律失敗します
  • Web画面へのアクセスも失敗します
  • 死活監視アラートの停止
  • サブシステム(外形監視・AWSインテグレーション・Azureインテグレーション)の停止

不安定な時間帯に発生すること

  • 応答のパフォーマンスの低下
  • アクセスの確率的な失敗

アクセス失敗時の影響について

mackerel-agentやfluentdで投稿しているメトリックに関しては、プロセス内でバッファリングされ、再送されるため、データの欠損は発生しません。cronなどで自前の仕組みで投稿しているメトリックに関しては欠損が発生する可能性があります。

システムの応答の再開直後は、一時的にグラフデータの欠けが観測される状況が発生しますが、mackerel-agent内のバッファの再送が終わり次第、グラフは正常に表示されます。

上記時間帯、アラートに関しては誤報は発生しませんが、アラートが正常に発報されない可能性はあります。

メトリック監視のアラートに関しては、Mackerelのシステムはメトリックの受信を契機にアラートの判定を行っているため、上記の時間中に何か誤報が発生することはありません。

但し、mackerel-agentのバッファの再送時に投稿順番が前後する関係で、平均値監視を設定している場合などに、アラートが発報されなくなる可能性があります。また、チェック監視に関しても、APIリクエストに失敗した場合は、アラートが発報されません。

当日のアナウンスに関して

メンテナンス前後に、ニュースレター及びステータスページ(http://status.mackerel.io)にて告知をおこないます。

状況のアップデートはステータスページにて随時お知らせしていきます。万が一メンテナンスが延長となった場合も、ステータスページにてお知らせします。

また、メンテナンス完了後に実際の停止時間等を含めた詳細をブログに記載します。

メンテナンスの目的

リリース後に新機能が追加されるわけではありませんが、スケーラビリティの向上や、時系列データベースの性能向上、今後の機能拡張を見据えたメンテナンスとなります。特に時系列データベースに関しては、1分粒度のデータの長期保存が可能になるような変更を入れる予定です。

時系列データベースに関する技術的な詳細については、弊社 id:y_uuki の以下のブログエントリを参照下さい。

時系列データベースという概念をクラウドの技で再構築する - ゆううきブログ

本件に関するお問い合わせは support@mackerel.io へメールでお問い合わせ下さい。

今後ともMackerelをご愛顧くださりますよう、よろしくお願いいたします。