Browser Automation MCP 2026 — Playwright・chrome-devtools・agent-browser
AI エージェントがブラウザを操作するための MCP (Model Context Protocol) サーバーを、トークン効率・認証セッション再利用・成熟度の3軸で比較するノート。
1. なぜ複数の選択肢があるのか
LLM がブラウザを動かす時、画面状態を「文字情報」として LLM に伝える必要がある。伝え方が以下のように分岐する:
| 方式 | コスト | 例 | |---|---|---| | スクリーンショット(vision) | 1枚で 5,000-8,000 tok | Anthropic Computer Use, PageBolt | | HTML 全文 | 数万 tok | 古典的なスクレイピング | | Accessibility Tree(DOMのセマンティック木) | 200-12,000 tok | Playwright MCP, chrome-devtools-mcp | | Accessibility Tree + Compact Refs(最も圧縮) | 200-400 tok | agent-browser |
→ トークン効率は「画面情報の表現方法」次第。後ろの方式ほど効率的だが、表現力は落ちる(ピクセル位置情報が消える等)。
2. Playwright MCP(Microsoft 公式)
正式名: @playwright/mcp
仕組み
- Microsoft が Playwright(同社製ブラウザ自動化ライブラリ)に MCP インターフェースを被せた公式実装
- accessibility snapshot をデフォルトで使う → スクリーンショット送信より軽量
- 操作は
browser_clickbrowser_typebrowser_navigatebrowser_snapshot等のツールとして公開
トークン消費(実測ベンチマーク)
- ツール定義スキーマ初期化: 13,700 tok
- 1回の accessibility snapshot: 3,800-12,000 tok(ページ複雑度依存)
- 1テスト合計: 約114,000 tok
- 複雑なダッシュボードでは1スナップショットだけで 50,000 tok 級になることもある
強み
- Microsoft 公式・成熟・ドキュメント豊富
- Chromium / Chrome / Firefox / WebKit 対応
- セッション分離(テスト用途には◎)
弱み
- 認証セッションの再利用が困難 —
--browser chromeは新規 Chrome プロセスを起動。--user-data-dirで既存プロファイルを渡すとロック競合 - 長時間セッションで context window が圧迫されパフォーマンス劣化(〜step 12-15 で degradation)
- ツール定義の固定オーバーヘッドが重い
起動例(Claude Code .mcp.json)
"playwright": {
"command": "npx",
"args": ["-y", "@playwright/mcp@latest", "--browser", "chrome"]
}
派生品
@tontoko/fast-playwright-mcp: コミュニティ製の効率化 fork。batch_executeでツール呼び出しをまとめ、最大90%トークン削減
3. chrome-devtools-mcp(Google 公式)
正式名: chrome-devtools-mcp(ChromeDevTools/chrome-devtools-mcp)
仕組み
- Google Chrome チームが公式に提供
- 内部実装は Puppeteer + Chrome DevTools Protocol (CDP)
- 29ツール(自動化・パフォーマンス計測・ネットワーク監視・Lighthouse監査・コンソール読み取り・DOM スナップショット・JavaScript 実行・スクリーンショット)
- Anthropic 公式の Claude プラグインとしても配布
トークン消費
- ツール定義スキーマ初期化: 約17,000 tok(Playwright より重い)
- per-action は Playwright と同程度
- ただし タスク全体の効率では Playwright を上回る(ある分析で78%削減との報告あり)
強み(決定的)
- 既存 Chrome プロセスに CDP アタッチ可能 —
--browserUrl http://localhost:9222で Niki が手動ログインした Chrome(GビズID・Notion・JFC 等のセッション保持済)にそのまま接続できる - 公式メンテで停滞リスクなし
- 認証必須の業務サイト(行政、銀行、社内ツール)に圧倒的に向く
弱み
- ツール定義スキーマがやや重い
- Firefox 等は使えない(Chromium 系のみ)
- CDP の生プロトコル特性で「ピュアな自動化スピード」は Playwright より若干遅い場合あり
起動例
"chrome-devtools": {
"command": "npx",
"args": ["-y", "chrome-devtools-mcp@latest", "--browserUrl", "http://localhost:9222"]
}
事前に Chrome を CDP 有効で起動しておく必要がある:
chrome.exe --remote-debugging-port=9222 --user-data-dir="path\to\profile"
4. agent-browser / agent-browser-mcp(Vercel Labs ベース)
正式名: vercel-labs/agent-browser(CLI 本体) + minhlucvan/agent-browser-mcp(MCP ラッパー)
仕組み
- Vercel が「LLM のためだけに最適化」したブラウザ自動化 CLI
- Snapshot + Refs 方式: ページ全体のアクセシビリティ木ではなく、操作可能要素のみを安定 ref 付きで返す
- 例:
[ref-1] "ログイン" button,[ref-2] "メールアドレス" textboxのような圧縮された記述
トークン消費(突出して軽量)
- 1ページあたり 200-400 tok(Playwright MCP の約 1/30)
- 同じコンテキスト予算で Playwright MCP の 5.7倍の操作が可能
- 「context window 出血」の根本解決
強み
- 業界最高クラスのトークン効率
- LLM 駆動を前提に設計(不要情報を最初から削る)
- Ralph Wiggum Loop(自己検証ループ)のような長時間自律ワークフローに最適
弱み
- 新しい — 2026年初頭リリース、Production 採用例はまだ少なめ
- CLI 由来でフィーチャー数は Playwright/CDP より少なめ
- 既存 Chrome セッション再利用は弱い(新規 Chromium 起動)
- MCP 化したのはコミュニティの minhlucvan、Vercel 公式ではない
起動例
"agent-browser": {
"command": "npx",
"args": ["-y", "agent-browser-mcp@latest"]
}
補足: なぜ "CLI が MCP に勝てる"のか
- MCP プロトコル自体に「ツール定義スキーマを毎セッション展開」のオーバーヘッドがある(Playwright 13.7K、CDP 17K)
- CLI なら shell command として 1 行で呼び出せる → スキーマ展開不要
- ただし MCP の方が AI エージェントとの統合は深い
5. 用途別 推奨マッピング
| 用途 | 推奨 | |---|---| | HT の日常業務(JFC・港区行政・Notion・CIC ダッシュボード) | chrome-devtools-mcp(既存 Chrome セッション再利用) | | 長時間自律ループ(数百ステップの自動運用) | agent-browser-mcp(トークン極小) | | E2E テスト・CI/CD・SaaS 動作確認 | Playwright MCP(成熟・安定) | | デバッグ・パフォーマンス分析・Lighthouse監査 | chrome-devtools-mcp | | ボット検知回避が必要なサイト | Stagehand / Browserbase | | 画面録画・スクリーンショット重視 | PageBolt(vision系) |
→ 多くの場合、chrome-devtools-mcp + agent-browser-mcp を併設し、用途で使い分けるのがベストプラクティス。
6. 自分用の判断フロー
ブラウザ操作が必要
├─ 既にログイン済みのサイトを使う?
│ YES → chrome-devtools-mcp(CDP 接続)
│ NO → 次へ
├─ 数百ステップ続く自律ループ?
│ YES → agent-browser-mcp
│ NO → 次へ
├─ E2E テストや CI 用途?
│ YES → Playwright MCP
│ NO → 次へ
└─ デフォルト: chrome-devtools-mcp(公式・安定・認証再利用OK)
参考・引用元
- Playwright MCP — 公式ドキュメント, Microsoft
- chrome-devtools-mcp — OSS リポジトリ, Chrome DevTools (Google)
- chrome-devtools-mcp Anthropic plugin — 公式プラグイン, Anthropic
- vercel-labs/agent-browser — OSS リポジトリ, Vercel Labs
- agent-browser-mcp — OSS リポジトリ, minhlucvan
- Playwright MCP burns 114K tokens per test — 個人記事 (Medium), scrolltest
- Why Vercel's agent-browser is winning the token efficiency war — 個人記事 (dev.to), Chen Zhang
- Driving vs Debugging the Browser — 個人ブログ, Steve Kinney
- Model Context Protocol — 公式サイト, Anthropic
2026-05-20 作成。融資申込 セッションで Playwright vs chrome-devtools の最適解を検証する過程でまとめた。