Google Chrome lance WebMCP pour intégrer l'IA aux sites web
TL;DR
Google Chrome a récemment lancé le <a href="https://developer.chrome.com/blog/webmcp-epp"><u>WebMCP</u></a> (Web Model Context Protocol) en avant-première dans
Google Chrome a récemment lancé le WebMCP (Web Model Context Protocol) en avant-première dans la version 146 Canary. Cette technologie, développée en collaboration avec Microsoft, permet aux sites web d'exposer des outils structurés et des appels directs aux agents d'IA. Cela transforme l'interaction entre l'IA et le web, prévoyant un accès plus efficace.
L'impact pour les équipes technologiques est notable. Au lieu de maintenir des serveurs MCP (Model Context Protocol) dédiés, les développeurs pourront utiliser la logique JavaScript existante et l'intégrer dans des outils lisibles par les agents. Cela évitera des restructurations complètes des applications web.
Défis actuels des agents d'IA
Les méthodes actuelles d'interaction entre les agents d'IA et les sites web présentent des coûts élevés et des problèmes de fiabilité. Les deux principales méthodes - la capture d'écran visuelle et l'analyse du DOM (Document Object Model) - sont inefficaces, générant des défis budgétaires pour les entreprises.
Lorsqu'un agent utilise des captures d'écran, il doit interpréter des images, ce qui consomme non seulement des tokens (unités de coût de traitement de l'IA), mais nécessite également du temps en raison de la latence. Dans l'analyse du DOM, l'agent traite le HTML et JavaScript, ce qui peut ne pas être pertinent pour le contexte de la tâche, augmentant les coûts et la complexité.
Ces méthodes exigent plusieurs interactions de l'agent pour réaliser des tâches simples, comme une recherche de produits, rendant le processus long et coûteux.
Fonctionnement du WebMCP
Le WebMCP présente deux API complémentaires reliant les sites web et les agents d'IA : l'API Déclarative et l'API Impérative.
L'API Déclarative permet de définir des actions standards dans des formulaires HTML existants. Pour les sites web avec des formulaires structurés, cela nécessite peu de travail supplémentaire. Les développeurs peuvent ajouter des noms et des descriptions d'outils directement dans les formulaires.
De leur côté, l'API Impérative gère des interactions plus complexes nécessitant une exécution en JavaScript. Ici, les développeurs peuvent exposer des fonctions telles que searchProducts(query, filters) à l'aide de la fonction registerTool(). Cela remplace plusieurs interactions par un appel structuré.
La pertinence pour les entreprises
Pour les décideurs IT, le WebMCP aborde trois défis principaux : réduction des coûts, fiabilité et agilité dans le développement.
La réduction des coûts est claire, car elle élimine les appels inutiles et le coût de traitement. La fiabilité est améliorée puisqu'il n'est pas nécessaire pour l'agent de deviner la structure de la page ; les fonctions publiées garantissent des interactions sécurisées. En outre, l'agilité dans le développement augmente, car les équipes peuvent utiliser le JavaScript déjà existant, sans avoir besoin de créer une infrastructure indépendante.
Coopération humain-agent avec un focus
Contrairement à d'autres paradigmes d'agents autonomes, le WebMCP est conçu pour des interactions collaboratives entre humains et IA. Ainsi, les interactions sont supervisées et non totalement autonomes.
Selon Khushal Sagar, ingénieur logiciel de Chrome, le WebMCP repose sur trois piliers : contexte, qui fournit des données pertinentes à l'agent ; capacités, qui détaillent les actions que l'agent peut réaliser ; et coordination, qui régule le transfert entre l'utilisateur et l'agent.
WebMCP : un outil complémentaire
Le WebMCP ne remplace pas l'MCP existant, mais en complète la fonctionnalité. Alors que l'MCP connecte les plateformes d'IA aux services, le WebMCP fonctionne entièrement côté client.
Cette relation permet aux entreprises d'utiliser les deux protocoles, selon leurs interactions : l'MCP pour les automatisations sans interface et le WebMCP pour les interactions en présence de l'utilisateur.
Prochaines étapes pour le WebMCP
Actuellement, le WebMCP est disponible dans Chrome 146 Canary, accessible via une configuration expérimentale. Le programme de prévisualisation de Chrome offre un accès à la documentation.
Bien que d'autres navigateurs n'aient pas encore annoncé de calendriers de mise en œuvre, des annonces officielles devraient intervenir d'ici 2026, lorsque la proposition passera de l'incubation communautaire à un brouillon formel au W3C.
Si la vision de Sagar se concrétise, le WebMCP pourrait devenir l'"USB-C" des interactions entre agents d'IA et le web, standardisant la communication et remplaçant les méthodes anciennes et fragiles.
Contenu selectionne et edite avec assistance IA. Sources originales referencees ci-dessus.


