SRE NEXT 2024 イベントレポート

こんにちは、Mackerel 開発チームの id:onk です。

8/3-8/4 にかけて Abema Towers で開催された SRE NEXT 2024 IN TOKYO に Mackerel チームからも参加してきたので、参加レポートをお届けします。

Mackerel はシルバースポンサーとして協賛させていただきました。

当日集まった はてなスタッフたち

印象に残ったセッション・企画

(id:rood_ni) LTの『FourKeysを導入したが生産性向上には至らなかった理由』が印象に残りました。
〜をしたらうまくいった、という発表が多いなかでの失敗談で興味深かったです。導入した手法がチームの状況に合わなかったものの初めて計測を行えてよかった、という締め括りには希望を感じました。

(id:arthur-1) スタッフの業務があったため、セッション後のAsk the speakerに参加できなかったのが心残りでした。 一方で、懇親会では初めましての皆さんともSREのプラクティスについて議論を交わすことができて満足しています。

(id:taxintt) スタッフ業務の合間で見た2日目の 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 のセッションが印象に残っています。
Mackerelでは、OpenTelemetry 対応SAML連携機能といった大規模開発を進めています。私自身、Embedded SREとして大規模開発を進めている開発チームにおけるSREの実践においてあるべき姿を考えている中で、ビットキーさんにおけるEmbedded SREからEnabling/Platform SREへの転換の歴史と転換を成功させるためのアプローチは一つの事例として参考になりました。私もAsk the speaker参加できなかったので心残りがあります。

(id:onk) 初日の yuuk1 さんの『工学としてのSRE再訪』が良かったです。yuuk1 さんとは最近も はてな卒業生訪問企画で似た会話をした んですが、工学としての SRE の定義 や面白そうな論文紹介から、やれることのイメージがドンドン湧いてきて、「Beyond NEXT」を感じてワクワクしました。

(id:wtatsuru) Steve McGhee さんの1日目の基調講演「Reliable Systems through Platform Engineering」が印象に残っています。信頼性の高い基盤の上に信頼性の低いシステムを構築するのではなく、信頼性の低い基盤の上に信頼性の高いシステムを構築する、と信頼性の三角形が逆転した図など、時代の変化や考え方がよく整理されていていました。

Road to SRE NEXT

本編の前に、全国行脚イベントである Road to SRE NEXT が開催されました。

福岡、仙台、京都、広島と開催されたのですが、フレキシブルワークスタイルを導入した株式会社はてなでは、ちょうど全ての開催地にスタッフがいるので、それぞれ参加してきました。

SRE NEXT 2024 の Chairs Talk でも触れていただいたのですが、すべての回で登壇しています。以下で紹介します。

Road to SRE NEXT@福岡

登壇者: id:cohalz

はてなの SRE 組織の 6 年間の総まとめというべき内容でした (はてなで SRE という職種名を作ったのが 2018 年)。 SRE とは何なのかを組織にインストールしていく流れや、SRE を Platform SRE/Embeded SRE と整理していった話、SRE の横串組織を作って育成や運用改善に取り組んでいる話などがありました。

SRE 研修については最近 Hatena Developer Blog にも書いたのでぜひ一緒にご覧ください。

登壇者: id:cd_sioremon

LT で、技術的に難しくはないけどめんどくさくて放置されている状況に対して手を打った話をしています。 作った仕組みをちゃんと進化しなければならない、継続的にメンテしていくことが不可欠というまとめが非常に良かったです。

Road to SRE NEXT@仙台

登壇者: id:yohfee
登壇タイトル: OpenTelemetryでMackerelのAzureインテグレーションを改善しました

飛び入り LT。API コール時に発生しがちだったエラーについて、API コール数や失敗数を OpenTelemetry でメトリックとして投稿し、「推測するな、計測せよ」を体現しながら改善していく様子をお届けしました。 オブザーバビリティプラットフォームとしてドッグフーディングをしているのが分かりやすい発表だったんじゃないかと思います。

Road to SRE NEXT@京都

登壇者: id:taxintt

こちらも飛び入り LT。社内外のポストモーテムを読む読書会を開いて、自分たちにも影響があるものを事前に潰したり、他チームでやっている良いフローやドキュメントを取り入れたりしているよという話をしました。 障害対応ドキュメントは育ててなんぼですからね。障害時以外にも育てるタイミングが出てくるのは最高です。

Road to SRE NEXT@広島

登壇者: id:ne-sachirou

LT 登壇。素朴に作った転置インデックス DB が数十億行になることが分かったので、データストレージのアーキテクチャを見直している話をしました。 迂闊に作るとアッという間に億単位になるの楽しいですね。

スタッフ参加

id:arthur-1

Track Aの司会・タイムキーパーなどを担当する当日スタッフをしていました。振り返りとして、個人のブログにSRE NEXT 2024で当日スタッフをしました&イベントの信頼性を支えるテクニック - Diary of a Perpetual Studentというエントリを書きましたので、よろしければご覧ください。

id:taxintt

SRE NEXTの運営スタッフとして参加するのは3年連続3回目です。今年は、Road To SRE NEXT (地方イベント) の開催やカンファレンス当日もAsk The Speakerの実施など議論・会話の場が多くあったのが良かったですね。その他の感想は個人のブログ SRE NEXT2024に運営スタッフとして参加しました - taxin's notes も書いたので、こちらもご覧いただけると嬉しいです。

終わりに

今年は SRE NEXT の参加者がオンライン含めて 1000 名になったようですね。Ask the speaker や廊下や懇親会などで密なコミュニケーションができたのが印象的でした。スタッフの皆さん、スピーカー、参加者、スポンサーの皆さん、良いイベントをありがとうございました。来年の開催も楽しみにしています。