MackerelとAIでシステム専任の担当者を作る ―― Mackerel MCPサーバーで始めるアラート対応【前編】

このたびMackerelは、大規模言語モデル(LLM)連携を可能にする「Mackerel MCPサーバー」 の提供を開始しました。本記事の前編では、このMCPサーバーを利用してAIと連携することで、アラート情報の取得から原因分析、詳細な対処手順の提案までをAIが支援し、誰でも迅速・的確にトラブル対応できる具体的な可能性を紹介します。

こんにちは。Mackerelチームでサブディレクターとプロダクトマネジメントを担当している id:RyuGoo と申します。Mackerelチームでは主に、事業計画に基づいた数年先の戦略立案やKPIの管理などを行っています。

システムの開発から監視・運用まで多くの場面でいまやAIは欠かせないものとなっています。Mackerelにおいても、AIを活用したシステムの監視・運用をより便利に行っていただくために、Mackerel MCPサーバーの提供を開始しました。

本記事では、MackerelとAIを組み合わせることで、どのようなことが可能になるのか、そしてMackerelが今後AIにどのように取り組んでいきたいと考えているのかを、前編と後編に分けてご紹介します。

Mackerel × AIでシステムのトラブル対応に立ち向かう!

大規模言語モデル(LLM)を使った自律的なAIの働きは、急速な進化を続けています。AIに外部情報を提供してやり取りするための仕組みである「Model Context Protocol(MCP)」も、Claudeを開発するAnthropicが提唱してから、本記事を公開する時点ではまだ1年も経っていません。

にもかかわらず、多くのサービスやツールがMCPへの対応を進めており、AIと外界とのやり取りにおける事実上の標準となりつつあります。

こうした状況と、ユーザーの皆さまからの高いご期待にお応えすべく、Mackerelも「Mackerel MCP サーバー」を公開し、MackerelとAIを組み合わせて自律的な働きを実現できるようになりました! これにより、まるでシステム専任の担当者がいるかのように、いつでも相談したり、作業を依頼したりできるようになります。

github.com

AIにアラートの対応方法について相談できる相手になってもらおう

担当しているシステムで何らかのアラートが発生したとき、その原因をすぐに特定し、問題を解消するには、システムを深く理解している必要があります。しかし、何らかの理由でシステムに詳しい人が不在で、不慣れな人が対応せざるを得ない場面もあるかもしれません。

このような状況でも、Mackerel MCPサーバーを使えば、AIと一緒に問題に対処できるようになります。

今回はAIモデル「Claude」と、MCPサーバーに対応したクライアント「Claude Desktop」を使った例を紹介します。詳しい設定方法については後編で説明しますので、ここでは「どのような結果が得られるのか?」をご覧ください。

まず、Claude DesktopにMackerel MCPサーバーを設定すると、Mackerelの情報をClaudeと組み合わせて、自然言語で取り扱えるようになります(設定の詳細については後編で説明します)。

Claude DesktopでMackerelの情報を取り扱えるようになる

たとえば「Mackerelで発生しているアラートの一覧をリストアップしてください」というプロンプトを渡すと、Mackerel上で発生しているアラートの一覧をClaudeが取得し、人間にとって読みやすい形で出力してくれます。

AIにアラートの一覧を取得するよう依頼している

得られた結果からアラートIDがわかったので、次に問題の対処方法を尋ねてみましょう。すると、Claude Desktop側で、AIがMCPサーバーに実装されている処理の中から適切なものを判断して呼び出し、情報を取得します。さらにその情報をもとに、AIが対処方法を生成・出力します。

AIに特定のアラートIDに対する問題の対処方法を尋ねる

出力された対処方法の全文は以下のとおりです。ここではMarkdownフォーマットで出力しています。

アラート ID「5pcRUzcQeUm」について詳細分析を行います。まず、アラートの詳細情報とログを取得して問題を調査します。次に、関連するモニター設定と対象ホストの情報を取得します。ホスト ID で直接検索してみます。

## 問題分析結果

### アラート概要

- **アラートタイプ**: Connectivity(接続性監視)
- **ステータス**: CRITICAL
- **対象ホスト**: ik1-217-78862 (IP: <IP ADDRESS>)
- **発生時刻**: 2025 年 9 月 24 日 18:15:25 JST

### 問題の詳細分析

**1. 接続性アラートの意味**

- Mackerel エージェントからの定期的なメトリクス送信が途絶えている
- ホスト自体は存在するが、Mackerel との通信が失われている状態

**2. 対象ホストの状況**

- ホスト名: ik1-217-78862
- OS: Ubuntu 22.04
- Mackerel エージェント: v0.80.0
- 役割: Ubuntu-VPS/LAMP
- 現在のステータス: "working"(パラドックス的状況)

**3. 考えられる原因**

- ネットワーク接続の問題
- Mackerel エージェントの停止または異常終了
- ファイアウォール設定の変更
- システムリソース不足(メモリ不足など)
- DNS 解決の問題

## 推奨する対処方法

### 即座に実施すべき対応

**1. ホストへの接続確認**

# ホストへのpingテスト
ping <IP ADDRESS>

# SSHでの接続確認
ssh user@<IP ADDRESS>

**2. Mackerel エージェントの状態確認**

# エージェントの動作状況確認
sudo systemctl status mackerel-agent

# エージェントログの確認
sudo journalctl -u mackerel-agent -f

**3. ネットワーク接続確認**

# Mackerelへの接続テスト
curl -I https://mackerel.io

# DNS解決確認
nslookup mackerel.io

### 問題解決手順

**1. エージェントの再起動**

sudo systemctl restart mackerel-agent
sudo systemctl enable mackerel-agent

**2. 設定ファイルの確認**

# 設定ファイルの確認
sudo cat /etc/mackerel-agent/mackerel-agent.conf

# APIキーの有効性確認

**3. システムリソースの確認**

# メモリ使用量確認
free -h

# ディスク容量確認
df -h

# システム負荷確認
top

### 予防策

**1. 監視強化**

- エージェント自体の監視設定を追加
- システムリソース監視の閾値見直し

**2. 定期メンテナンス**

- エージェントの定期アップデート
- ログローテーション設定の確認

**3. 冗長化検討**

- 複数のモニタリング手段の導入
- 自動復旧スクリプトの実装

この接続性アラートは、サーバー運用において重要な問題を示している可能性が高いため、迅速な対応が必要です。

「まずは何から始めたらよいか?」とさらに問いを投げかけて、対応を段階的に進めることもできます。

このように、AIとMackerel MCPサーバーを組み合わせれば、まるでシステムに詳しい専任の担当者がいるかのように、メッセージで相談しながら問題に対応できるようになるのです。

MackerelとAIで、もっと簡単にシステムの監視やオブザーバビリティを高めていく

前編では、Claude DesktopとMackerel MCPサーバーを使うことで、問題の対処にまだ不慣れな人でもAIに相談しながら対応できる可能性を示しました。

今回紹介した機能は、もしMackerelのWebコンソール上から直接使えたら、多くの人がより簡単に問題に対応できるようになるでしょう。

一方で、Mackerel MCPサーバーが存在することで、世の中にあるさまざまなMCP対応AIツールと組み合わせやすいというメリットもあります。

今後もMackerelは、より多くの人が簡単にシステムの監視・運用やオブザーバビリティを高める活動に取り組めるよう、AIに注目していきます。 Webコンソール上から使えるAI支援やMackerel MCPサーバーの強化など、より良い体験を追求し続けます。Mackerelが実現するAI時代の監視・運用に、ぜひご期待ください!

後編ではMCPサーバーについての詳しい説明と、セットアップ方法について紹介していきます!

→後編へ