Mackerel ブログ #mackerelio

Mackerelの公式ブログです

Amazon Linux 2 正式版に対応しました ほか

こんにちは。Mackerelチーム CRE の三浦(id:missasan)です。

先日、サポートエンジニアNight vol.3 というイベントに同じく CRE の井上(id:a-know)が登壇しました。 サーバー監視サービスならではの技術的に学びの深かった問い合わせケースの紹介もあり、Mackerelのサポートの裏側が垣間見える発表でした。

techplay.jp

それでは、アップデート情報です。

Amazon Linux 2 正式版に対応しました

以下ヘルプページに記載のワンライナーにてインストールいただくことができます。

mackerel.io

正式版への対応に伴い、cookbook-mackerel-agent 3.1.0 をリリースしました。Amazon Linux 2 正式版に Chef 経由で mackerel-agent を導入できます。なお、こちらの cookbook は Chef 14.3.36 以降にてご利用ください。

また、Amazon Linux 2 正式版のリリースに伴い、各種プロビジョニングツールでも Amazon Linux 2 正式版対応のためのアップデートが行われているものがあります。プロビジョニングツール側のアップデート対応なども、必要に応じて行っていただくことをお勧めします。

【8/13(月) 〜 8/15(水)】お盆休みのお知らせ

8/13(月) 〜 8/15(水)の日程で、Mackerelのサポート窓口はお盆休みをいただきます。 この期間中は、サポート窓口の対応(障害の発生など、緊急のものを除きます)をお休みさせていただきます。 どうぞよろしくお願いいたします。

7/18(水) データベースメンテナンス終了のお知らせ

Mackerelチームディレクターのid:daiksy です。

以前からお知らせしていた、本日2018年7月18日(水)に計画していたデータベースメンテナンスが無事終了しましたのでご報告します。

本日15時00分(日本時間)より予定通りメンテナンスを開始し、2度の延長の結果20時00分にメンテナンスを終了しました。長時間に渡るシステム停止を伴うメンテナンスでしたが、ご協力ありがとうございました。また、2度の延長という結果につきましては、ご迷惑をおかけし、申し訳ありません。

mackerel.io

メンテナンス時間について

以下の手順で作業を実施しました。

  • 15:00~16:30 システム停止およびデータベースメンテナンス実施。
  • 16:30~18:00 動作確認実施。mackerel-agentからの再送処理による高負荷状態の制御。
  • 18:00~19:00 メンテナンス1時間の延長。mackerel-agentからの再送処理による高負荷状態の制御を継続。
  • 19:00~20:00 死活監視コンポーネントのみ停止した状態でメンテナンスを1時間延長。mackerel-agentの再送処理の観測と死活監視コンポーネントの復旧作業。

20時00分をもちまして、全機能の稼働再開を確認し、メンテナンスを終了させていただきました。

メンテナンスの報告については以上となります。

Mackerelは今後も安定稼働につとめてまいります。引き続きMackerelをよろしくお願いします

mkr v0.31.1 の Docker Image を公開しました および 7月18日(水) メンテナンスについて(リマインド) ほか

こんにちは。Mackerelチーム CRE の三浦(id:missasan)です。

梅雨が明けた途端にとても暑い日が続いていますが、みなさん熱中症には十分気を付けてお過ごしください。

それでは、アップデート情報です。

mkr v0.31.1 の Docker Image を公開しました

Docker Image はこちら からご利用ください。今後は、mkr コマンドのアップデートごとに新しい Docker イメージを提供予定です。開発環境の構築や、バージョン管理の簡易化・効率化にご活用ください。

8月2日(木) Mackerel Meetup #12 開催!

来たる8月2日(木) に Mackerel Meetup #12 を開催します! 今回は会場にドリコム様のセミナールームをお借りします。

また、ユーザーセッションとして、今回も2名の方にご登壇いただきます。 Mackerelチームからは、最新の開発状況や、近々リリース予定の異常検知についてのセッションを予定しています。

200週連続リリース達成を記念するイベントになります。みなさんぜひご参加ください!

mackerelio.connpass.com

【リマインド】7月18日(水) データベースメンテナンスに伴うシステムの一時停止について

先日、お知らせさせていただきましたデータベースメンテナンスが明日に迫りました。 実施内容や当日の影響に関して、以下より、再度詳細をご確認をいただけますようお願いいたします。

mackerel.io

mkr throw コマンドにリトライオプションを追加しました

こんにちは。Mackerelチーム CRE の三浦(id:missasan)です。

先週、毎週連続リリースにはこだわらないというお知らせを出したばかりではありますが、さっそく新しいアップデート情報です。 このような形で、今後もみなさまにお知らせしたいリリースがあった際は、積極的にニュースレターやブログでご紹介したいと思っております。

それでは、アップデート情報です。

mkr throw コマンドにリトライオプションを追加しました

mkr v0.31.1 にて、 mkr throw コマンドを使ってメトリックを投稿する時に、 --retry N オプションをつけると投稿失敗時に回数を指定してリトライができるようになりました。 偶発的にリクエストが失敗してしまった際や Mackerel のメンテナンス中で、メトリック投稿ができない場合でも、 --retry N を設定しておくことで、データが損失される可能性を下げることができます。 403/404 などのHTTPエラーの際は、リトライは実施されませんのでご注意ください。

mkr コマンドをアップデートしてぜひお試しください!

200週連続機能リリースの達成と、これからのMackerelについて

こんにちは。Mackerelディレクターのid:daiksyです。

今週で、ついにMackerelの連続リリースが200週目に到達しました!!!

200週までの道のり

Mackerelは、2014年9月17日に正式にサービスを開始し、以降毎週必ず新機能リリースを続けてきました。

mackerel.io

Mackerelチームでは毎週火・木曜日を定期リリース日と定めており、それぞれ何かしらの本番リリース作業を行っています。そして毎週月曜日(以前は金曜日)に、その週の定期リリースの内容を皆さんにお知らせするという運用をしています。お知らせする内容については、バグフィックスや軽微な修正は含まず、ユーザーに対して新しい価値を提供する新機能に限定する、ということにこだわっています。つまり、毎週必ず、何かしらの新機能がリリースされている、ということです。

厳密に言えば、ゴールデンウィークや年末年始など、チームの長期休業期間は除いた「毎週」なので、「毎営業週」というのが正しいかもしれません。

2014年9月にリリースされた当時のMackerelは、まだサーバー監視についての最小限の機能しか実装されていませんでした。とても小さなプロダクトとしてスタートしたMackerelにとって、できるだけ速くユーザーに新しい機能を届けることこそが、なによりも大切な我々のミッションであると考えていました。そうして続けた結果、2016年6月に100週連続リリースを達成しました。

mackerel.io

このときには、チームでケーキを作ってお祝いをしたりしていました。

そしてそこからさらに2年が経ち、Mackerelの「毎週機能リリース」はついに200週に到達しました。

関係各者からのコメント

200週連続リリースについて、さまざまな方からコメントをいただいたのでご紹介します。

現はてなCTOで、Mackerel初代ディレクターのid:motemen

もともとはスタートアップ期の勢いを出すために軽い気持ちではじめた毎週リリースでしたが、4年たった今でも続いているのは素直に驚きです。思えば遠くへ来たもんだ!

前はてなCTOで、Mackerel初代プロダクトオーナーのid:stanaka

Mackerel以前からはてなのサービス開発は、期待を越える早さで実装を行うことを強みとしていました。Mackerelでも同様に毎週機能リリースを行い、多くの期待に応えてきたことで今があるのだと思います。ここからはサービスを一段上に成長させるためにも、スピードだけではない、より難度の高い開発に取り組んでいくことでユーザーの方々の期待に応え続けることを期待しています。

現プロダクトオーナーのid:Songmu

正式リリース当初からずっとMackerelに関わり、長らくプロダクトオーナー/マネージャーとして開発に携わってきた身として、200週連続リリースは感慨深いです。 今後も、世の中のインフラ技術の進化に追随し、はてなのミッションにあるように「新しい体験を提供」できるような新機能開発を継続することで、皆様のサービス開発・運用プロセスに貢献し、ビジネス成長の一助となるサービスを提供して参ります。

皆さん、コメントどうもありがとうございます!

また、昨日はチームでお祝いのパーティを開催しました。 写真は記念に作った京都・東京それぞれのケーキです。

これからのMackerelについて

今週、200週連続リリース達成を記念してMackerelのトップページ(https://mackerel.io)をリニューアルしました。

これは、「明日からはじまる新しいMackerel」を皆さんにお届けするための、開発チームの決意の表れでもあります。

ミートアップでもご紹介させていただいたMackerelの開発ロードマップは、今後「異常検知」「コンテナ対応」などの大きなアップデートを控えています。そしてこれらの新しい機能についての開発は、チームにとってこれまでとは違う新しい意味を持っています。

この200週間続いた機能開発の中で、開発チームは2014年9月のサービス開始当初にプロダクトオーナーが思い描いていた機能のひととおりを、ようやくリリースし終えました。現在、わたしたちが取り組んでいる新しい機能の開発は、初期リリース当初には計画に含まれていなかった、次世代の機能群となります。初代のプロダクトオーナーが思い描いてた機能群の開発を終えたわたしたちは今、次世代のMackerelを担う新しい開発ロードマップに取り組んでいるのです。

今後、開発チームはMackerelのさらなる進化のために、これら次世代機能の開発に集中して取り組んでいくことになります。

200週連続リリースを達成したことで、2014年9月にリリースされた当時の、まだ小さかったMackerelを、スピード感をもって大きく育てていく、という最初の段階はいよいよ終わったとわたしたちは思いました。次なる新しいMackerelをユーザーの皆さんに届けるために、わたしたちは一度、「毎週新機能リリース」の取り組みを止めて、次の大きな機能開発にチームの力を注ぎたいと考えています。

毎週火曜・木曜の定期リリースは引き続き継続していきますので、新しい新機能がリリースされたタイミングにはまた皆さんにお知らせする予定ではいますが、今後はそのペースが少し緩やかになるかもしれないことをここでお知らせさせていただきます。

これからも皆さんの声援・ご要望を受けて、手を緩めずに新しいMackerelを全力で作り続けていくことをお約束します。

今後ともMackerelをよろしくお願いします。

200週連続リリース達成! アラートグループ機能をリリースしました

こんにちは。Mackerelチーム CRE の三浦(id:missasan)です。

ついに、Mackerelの連続リリース記録も200週を達成いたしました。 これはひとえに日々Mackerelを活用いただき、プルリクエストやフィードバックをいただいているユーザのみなさまのおかげです。いつも本当にありがとうございます!

リリースを記念して、Mackerelのトップページをリニューアルしました。

それでは、今週のアップデート情報です。

アラートグループ機能をリリースしました

これまで、ネットワークやストレージなど広い範囲に影響がある箇所に障害が発生した際などに、大量のアラートが上がって困る、という経験をしたことがある方も多いのではないでしょうか。 大量のアラートに埋もれて重要なアラートを見逃してしまったり、すべての時系列を把握することが難しかったりすることがあります。

今回はそういった、一度に発生した複数のアラートをグループにまとめて、通知を減らしたり、時系列を理解しやすくできるような機能「アラートグループ」をリリースしました。

アラートグループを設定すると、サービス、ロール、監視設定などを指定することで、関連するアラートを一つのグループとしてまとめることができます。

具体的には、ヘルプにある以下の画面をご覧ください。

https://cdn-ak.f.st-hatena.com/images/fotolife/m/mackerelio/20180627/20180627155026.png

このケースでは、複数のサーバ(app1.sample.com、app3.sample.com)や複数の監視項目(connectivity、URL外形監視、custom.sample.foobar)についてのアラートが一つの Example-Service というグループでまとめられています。 アラートグループを作成すると、このように一連の障害が時系列としてどのような順番で発生し、クローズしたかということが一目でわかりやすくなっています。 さらに、通知はアラートグループ単位で行われるため、メールの受信ボックスやチャットツールが通知で埋もれてしまうという問題が解決します。 アラートグループのアラートを1通受信すれば、それをきっかけにアラートグループの状況をウォッチすればよいので、運用がシンプルになります。

どういったものをグループにすればよいか迷った際は、例えばまずは、複数ホストが所属するロール単位でグループを作成してみてください。そういったロールが存在しない場合は、1つのサービスでまとめてアラートグループを設定してみることもおすすめです。

新規アラートグループ設定を作成」画面にてアラートグループを作成し、通知チャンネルにアラートグループを通知する設定を追加すれば、晴れて上記のような運用が可能になります。

ヘルプを参考に、ぜひこの新しい機能をお試しください!

mackerel.io

6月28日(木) 15:00~15:30ごろの範囲で、ドキュメントの閲覧ができない時間帯があります

いつもMackerelをご利用いただきありがとうございます。

Mackerelディレクターの id:daiksy です。

6月28日(木)に、はてなブログの計画メンテナンスが実施されます。

staff.hatenablog.com

そのため、これの影響を受けて、はてなブログの機能を使って提供している、Mackerelのドキュメントも一時的に閲覧できなくなります。

なお、今回のメンテナンスにおいて、Mackerel本体への影響はありません。

ご迷惑をおかけしますが、サービスの安定提供のためご理解のほどよろしくお願いします。