AIニュース
この記事のポイント
- GoogleとMicrosoftが共同開発したW3C新標準「WebMCP」がChrome 146 Canaryで利用可能に
- Webサイトが構造化ツール(関数)をAIエージェントに直接公開する仕組み
- スクレイピング・スクリーンショット・クリック模倣が不要になる
- MCPがバックエンド接続を担当するのに対し、WebMCPはフロントエンド操作を担当
- 宣言的API(HTMLフォーム)と命令的API(JavaScript)の2層構造
WebMCPとは──「すべてのWebサイトをエージェント対応に」
WebMCP(Web Model Context Protocol)は、GoogleとMicrosoftのエンジニアが共同で開発し、W3Cで標準化が進められている新しいWeb標準だ。2026年2月10日に発表され、現在Chrome 146 Canaryで早期プレビューが利用できる。
WebMCPの核心は、Webサイトが構造化された「ツール(関数)」をAIエージェントに直接公開できるようにすることだ。現在のAIエージェントがWebサイトを操作するには、ページのスクレイピング、スクリーンショットの解析、クリック・キーストロークの模倣といった不安定な手法に頼る必要がある。WebMCPはこれを根本的に解決し、Webサイト側が「何ができるか」を明示的に定義する。
MCPとWebMCPの違い──バックエンド vs フロントエンド
Anthropicが策定したMCP(Model Context Protocol)はAIエージェントとバックエンドサービス(API・データベース・ファイルシステム)を接続するプロトコルだ。一方、WebMCPはブラウザ上のフロントエンド操作を担当する。両者は競合ではなく補完関係にある。
2つのAPI──宣言的APIと命令的API
WebMCPは2層のAPIで構成されている。宣言的API(Declarative API)はHTMLフォーム内のクリック可能な要素を自動識別し、標準的なアクションを定義する。フォーム送信やボタンクリックなど、HTMLの構造から推定できる操作が対象だ。
命令的API(Imperative API)はJavaScriptの実行を必要とする複雑な動的インタラクションを管理する。ドラッグ&ドロップ、リアルタイム検索、動的フォームの値変更など、HTMLだけでは表現できない操作をカバーする。クリックやキーストロークのシミュレーションなしに確実な実行とフィードバックの取得が可能だ。
想定されるユースケース
カスタマーサポート
エージェントがサポートチケットに技術的詳細を自動入力
ECサイト
商品検索→オプション設定→チェックアウトまでをエージェントが構造的に実行
旅行予約
フライト検索・フィルタリング・予約を構造化データで完結
セキュリティ課題と「スコープ外」の設計判断
WebMCPの設計では、セキュリティ上の重要な課題が指摘されている。悪意あるツール定義によるモデルポイズニング(AIの判断を誤らせる攻撃)、クロスオリジン間のセキュリティ検証、ツール実行の権限管理などだ。
また、仕様では明確に「スコープ外」とされている領域がある。ヘッドレスブラウザによるGUI自動化、マルチエージェントプロトコル(A2A)、バックエンドサービス(MCPサーバー)、人間向けインターフェース、エージェントによるWebサイト発見──これらはWebMCPの担当範囲ではない。既存のPlaywright/Puppeteerによるブラウザ操作やMCPサーバーとの棲み分けが明確に設計されている。
まとめ──「エージェント対応Web」時代の幕開け
WebMCPは、AIエージェントがWebサイトを「見て推測して操作する」時代から「サイトが公開するツールを呼び出す」時代への転換点を示している。W3C標準としてGoogle・Microsoftが共同推進する点で、業界標準としての普及が期待できる。
現在はChrome 146 Canaryでのフラグゲート限定だが、安定版への統合はAIエージェントの実用性を大きく変える可能性がある。Web開発者はGitHubの仕様リポジトリで最新の動向を追うことをおすすめする。
よくある質問