Browser Automation MCP 2026 — Playwright・chrome-devtools・agent-browser

AI エージェントがブラウザを操作するための MCP (Model Context Protocol) サーバーを、トークン効率・認証セッション再利用・成熟度の3軸で比較するノート。

1. なぜ複数の選択肢があるのか

LLM がブラウザを動かす時、画面状態を「文字情報」として LLM に伝える必要がある。伝え方が以下のように分岐する：

| 方式 | コスト | 例 | |---|---|---| | スクリーンショット（vision） | 1枚で 5,000-8,000 tok | Anthropic Computer Use, PageBolt | | HTML 全文 | 数万 tok | 古典的なスクレイピング | | Accessibility Tree（DOMのセマンティック木） | 200-12,000 tok | Playwright MCP, chrome-devtools-mcp | | Accessibility Tree + Compact Refs（最も圧縮） | 200-400 tok | agent-browser |

→ トークン効率は「画面情報の表現方法」次第。後ろの方式ほど効率的だが、表現力は落ちる（ピクセル位置情報が消える等）。

2. Playwright MCP（Microsoft 公式）

正式名: @playwright/mcp

仕組み

Microsoft が Playwright（同社製ブラウザ自動化ライブラリ）に MCP インターフェースを被せた公式実装
accessibility snapshot をデフォルトで使う → スクリーンショット送信より軽量
操作は browser_click browser_type browser_navigate browser_snapshot 等のツールとして公開

トークン消費（実測ベンチマーク）

ツール定義スキーマ初期化: 13,700 tok
1回の accessibility snapshot: 3,800-12,000 tok（ページ複雑度依存）
1テスト合計: 約114,000 tok
複雑なダッシュボードでは1スナップショットだけで 50,000 tok 級になることもある

強み

Microsoft 公式・成熟・ドキュメント豊富
Chromium / Chrome / Firefox / WebKit 対応
セッション分離（テスト用途には◎）

弱み

認証セッションの再利用が困難 — --browser chrome は新規 Chrome プロセスを起動。--user-data-dir で既存プロファイルを渡すとロック競合
長時間セッションで context window が圧迫されパフォーマンス劣化（〜step 12-15 で degradation）
ツール定義の固定オーバーヘッドが重い

起動例（Claude Code `.mcp.json`）

"playwright": {
  "command": "npx",
  "args": ["-y", "@playwright/mcp@latest", "--browser", "chrome"]
}

派生品

@tontoko/fast-playwright-mcp: コミュニティ製の効率化 fork。batch_execute でツール呼び出しをまとめ、最大90%トークン削減

3. chrome-devtools-mcp（Google 公式）

正式名: chrome-devtools-mcp（ChromeDevTools/chrome-devtools-mcp）

仕組み

Google Chrome チームが公式に提供
内部実装は Puppeteer + Chrome DevTools Protocol (CDP)
29ツール（自動化・パフォーマンス計測・ネットワーク監視・Lighthouse監査・コンソール読み取り・DOM スナップショット・JavaScript 実行・スクリーンショット）
Anthropic 公式の Claude プラグインとしても配布

トークン消費

ツール定義スキーマ初期化: 約17,000 tok（Playwright より重い）
per-action は Playwright と同程度
ただし タスク全体の効率では Playwright を上回る（ある分析で78%削減との報告あり）

強み（決定的）

既存 Chrome プロセスに CDP アタッチ可能 — --browserUrl http://localhost:9222 で Niki が手動ログインした Chrome（GビズID・Notion・JFC 等のセッション保持済）にそのまま接続できる
公式メンテで停滞リスクなし
認証必須の業務サイト（行政、銀行、社内ツール）に圧倒的に向く

弱み

ツール定義スキーマがやや重い
Firefox 等は使えない（Chromium 系のみ）
CDP の生プロトコル特性で「ピュアな自動化スピード」は Playwright より若干遅い場合あり

起動例

"chrome-devtools": {
  "command": "npx",
  "args": ["-y", "chrome-devtools-mcp@latest", "--browserUrl", "http://localhost:9222"]
}

事前に Chrome を CDP 有効で起動しておく必要がある：

chrome.exe --remote-debugging-port=9222 --user-data-dir="path\to\profile"

4. agent-browser / agent-browser-mcp（Vercel Labs ベース）

正式名: vercel-labs/agent-browser（CLI 本体） + minhlucvan/agent-browser-mcp（MCP ラッパー）

仕組み

Vercel が「LLM のためだけに最適化」したブラウザ自動化 CLI
Snapshot + Refs 方式: ページ全体のアクセシビリティ木ではなく、操作可能要素のみを安定 ref 付きで返す
例: [ref-1] "ログイン" button, [ref-2] "メールアドレス" textbox のような圧縮された記述

トークン消費（突出して軽量）

1ページあたり 200-400 tok（Playwright MCP の約 1/30）
同じコンテキスト予算で Playwright MCP の 5.7倍の操作が可能
「context window 出血」の根本解決

強み

業界最高クラスのトークン効率
LLM 駆動を前提に設計（不要情報を最初から削る）
Ralph Wiggum Loop（自己検証ループ）のような長時間自律ワークフローに最適

弱み

新しい — 2026年初頭リリース、Production 採用例はまだ少なめ
CLI 由来でフィーチャー数は Playwright/CDP より少なめ
既存 Chrome セッション再利用は弱い（新規 Chromium 起動）
MCP 化したのはコミュニティの minhlucvan、Vercel 公式ではない

起動例

"agent-browser": {
  "command": "npx",
  "args": ["-y", "agent-browser-mcp@latest"]
}

補足: なぜ "CLI が MCP に勝てる"のか

MCP プロトコル自体に「ツール定義スキーマを毎セッション展開」のオーバーヘッドがある（Playwright 13.7K、CDP 17K）
CLI なら shell command として 1 行で呼び出せる → スキーマ展開不要
ただし MCP の方が AI エージェントとの統合は深い

5. 用途別推奨マッピング

| 用途 | 推奨 | |---|---| | HT の日常業務（JFC・港区行政・Notion・CIC ダッシュボード） | chrome-devtools-mcp（既存 Chrome セッション再利用） | | 長時間自律ループ（数百ステップの自動運用） | agent-browser-mcp（トークン極小） | | E2E テスト・CI/CD・SaaS 動作確認 | Playwright MCP（成熟・安定） | | デバッグ・パフォーマンス分析・Lighthouse監査 | chrome-devtools-mcp | | ボット検知回避が必要なサイト | Stagehand / Browserbase | | 画面録画・スクリーンショット重視 | PageBolt（vision系） |

→ 多くの場合、chrome-devtools-mcp + agent-browser-mcp を併設し、用途で使い分けるのがベストプラクティス。

6. 自分用の判断フロー

ブラウザ操作が必要
  ├─ 既にログイン済みのサイトを使う？
  │   YES → chrome-devtools-mcp（CDP 接続）
  │   NO  → 次へ
  ├─ 数百ステップ続く自律ループ？
  │   YES → agent-browser-mcp
  │   NO  → 次へ
  ├─ E2E テストや CI 用途？
  │   YES → Playwright MCP
  │   NO  → 次へ
  └─ デフォルト: chrome-devtools-mcp（公式・安定・認証再利用OK）

参考・引用元

Playwright MCP — 公式ドキュメント, Microsoft
chrome-devtools-mcp — OSS リポジトリ, Chrome DevTools (Google)
chrome-devtools-mcp Anthropic plugin — 公式プラグイン, Anthropic
vercel-labs/agent-browser — OSS リポジトリ, Vercel Labs
agent-browser-mcp — OSS リポジトリ, minhlucvan
Playwright MCP burns 114K tokens per test — 個人記事 (Medium), scrolltest
Why Vercel's agent-browser is winning the token efficiency war — 個人記事 (dev.to), Chen Zhang
Driving vs Debugging the Browser — 個人ブログ, Steve Kinney
Model Context Protocol — 公式サイト, Anthropic

2026-05-20 作成。融資申込セッションで Playwright vs chrome-devtools の最適解を検証する過程でまとめた。