MCP public de l’État : comment data.gouv.fr ouvre les données publiques à l’IA
Une nouvelle URL est apparue dans l'écosystème numérique français : mcp.data.gouv.fr. Loin d'être un gadget, ce serveur MCP public de l'État français est une brique technique qui change la manière.
Le MCP public de l'État est une expérimentation de la DINUM, via data.gouv.fr, visant à rendre les données publiques accessibles nativement aux agents d'intelligence artificielle. Il s'agit d'un serveur en lecture seule, utilisant le Model Context Protocol pour permettre aux IA d'interroger les vastes catalogues de données en langage naturel, simplifiant ainsi leur exploitation.

Sommaire(7 sections)
Le 13 mai 2024, une URL discrète est venue s'ajouter à l'arsenal numérique de l'État : `mcp.data.gouv.fr`. Derrière cet acronyme technique se cache une expérimentation pilotée par la Direction interministérielle du numérique (DINUM) qui pourrait bien redéfinir l'accès à la richesse des données publiques. Il ne s'agit pas de remplacer les portails ou les API existantes, mais de créer une nouvelle voie d'accès, pensée nativement pour les agents d'intelligence artificielle. L'État ne se contente plus de publier des données ; il commence à les rendre directement conversationnelles.
Cette initiative positionne la France comme l'une des premières administrations à déployer un tel service à l'échelle nationale. Pour les entreprises, les chercheurs et les développeurs, la promesse est celle d'une simplification radicale : interroger les vastes catalogues de données de l'État non plus par des requêtes codées complexes, mais par des instructions en langage naturel via un assistant. Une évolution qui, si elle se confirme, pourrait accélérer l'innovation tout en posant de nouvelles questions de gouvernance et de fiabilité.
Qu’est-ce que le MCP et pourquoi l’État s’y intéresse ?
Le *Model Context Protocol* (MCP) est un standard ouvert, une sorte de langage commun permettant à un modèle d'IA (comme un grand modèle de langage ou LLM) de dialoguer avec des outils et des sources de données externes., selon la Documentation de l'API Recherche d'Entreprises, Plutôt que de devoir développer un connecteur spécifique pour chaque service, le MCP propose un cadre unifié. L'IA peut ainsi "découvrir" les capacités d'un service (quelles actions il peut effectuer, quelles données il peut fournir) et les utiliser de manière autonome pour répondre à une requête utilisateur.
L'intérêt pour l'État est stratégique. Avec plus de 40 000 jeux de données sur data.gouv.fr et des centaines d'API, la richesse informationnelle est immense mais sa complexité peut être un frein. « L'objectif n'est pas de remplacer les API, qui sont le socle de nos services. C'est de proposer un point d'entrée natif pour les agents IA, de parler leur langue », explique une source proche de la DINUM. En adoptant ce protocole, l'administration française cherche à abaisser la barrière technique pour l'exploitation de ses données publiques IA, rendant potentiellement chaque citoyen, journaliste ou entrepreneur capable d'interroger ces ressources sans écrire une seule ligne de code.
Ce que l’État français a réellement lancé
Loin d'une révolution totale, l'initiative est une expérimentation cadrée et prudente. Le serveur MCP de data.gouv.fr est pour l'instant public, open source mais surtout en lecture seule. Il est impossible de modifier ou d'ajouter des données via cette interface, ce qui limite drastiquement la surface d'attaque. Il s'agit d'une première brique, un signal fort envoyé à l'écosystème technologique.
Le périmètre est clairement défini. Ce MCP public de l’État français ne donne pas un accès magique à l'intégralité des systèmes d'information de l'État. Il expose des "outils" spécifiques qui permettent d'interagir avec le catalogue de data.gouv.fr et certains services associés. C'est une porte d'entrée structurée, et non une ouverture béante. Cette approche pragmatique permet de tester les usages, de mesurer la pertinence du protocole et d'identifier les risques avant un déploiement plus large au sein de l'MCP administration.
La rupture d'usage : au-delà de la simple recherche
Le changement fondamental n'est pas technologique, il est dans l'usage. Jusqu'à présent, la recherche de données publiques avec l'IA se heurtait à un mur. Un analyste devait manuellement chercher un dataset sur le portail, en lire la documentation, puis éventuellement utiliser son API. Demain, il pourra formuler une requête complexe à son assistant, comme : "Trouve-moi les données sur les créations d'entreprises dans le secteur de la boulangerie à Rennes sur les 5 dernières années et représente-les sous forme de graphique."
L'agent IA, connecté au MCP data.gouv, décomposera la demande :
Cette fluidité transforme la donnée publique d'un stock d'information à un service dynamique, interrogeable à la volée. C'est un pas significatif vers une interaction plus intuitive avec le patrimoine informationnel public, un peu comme le passage du minitel à un moteur de recherche moderne a changé l'accès à l'information. Cette évolution s'inscrit dans une tendance de fond où les interfaces conversationnelles redéfinissent la visibilité en ligne, un phénomène analysé sous le prisme du GEO (Generative Engine Optimization).
- Protocole Standardisé : Le MCP (Model Context Protocol) est un standard ouvert qui facilite la connexion entre les agents IA et les sources de données externes.
- Expérimentation Contrôlée : Le serveur de data.gouv.fr est public, open source, mais strictement en lecture seule pour des raisons de sécurité.
- Complément aux API : Le MCP ne remplace pas les API publiques françaises, il ajoute une couche d'abstraction conversationnelle par-dessus.
- Rupture d'Usage : Le principal apport est de permettre des requêtes complexes en langage naturel, automatisant des tâches de recherche et de filtrage autrefois manuelles.
- Souveraineté : En déployant son propre serveur, l'État garde la main sur les modalités d'accès à ses données par les IA, un enjeu de souveraineté numérique.
MCP, API, RAG : quelles différences concrètes ?
Le jargon technique peut vite devenir confus. Il est essentiel de distinguer ces trois approches qui, bien que complémentaires, répondent à des besoins différents.
* API (Application Programming Interface) : C'est le socle. Une API est un contrat formel et structuré qui permet à deux applications de communiquer. Elle est robuste, fiable et précise. Un développeur l'utilise pour intégrer une fonctionnalité spécifique (ex : afficher une carte, vérifier un SIREN). C'est la plomberie du numérique, indispensable mais rigide. L'écosystème des API publiques françaises est déjà très riche, à l'image des évolutions de l'Open Banking avec la DSP3.
* RAG (Retrieval-Augmented Generation) : Cette technique consiste à fournir à une IA des documents (PDF, pages web, etc.) pour qu'elle puisse fonder ses réponses sur une base de connaissance spécifique et à jour. L'IA "lit" ces documents pour répondre. C'est très efficace pour les questions-réponses sur des corpus textuels, mais inadapté pour interagir avec des données dynamiques ou des services.
* MCP (Model Context Protocol) : C'est le chef d'orchestre. Le MCP ne contient pas la donnée lui-même. Il décrit les *outils* disponibles (comme les API) pour que l'IA puisse les appeler elle-même. Si l'API est un outil, le MCP est la notice qui explique à l'IA comment s'en servir. Il permet à l'IA d'*agir* et de se connecter à des données vivantes, là où le RAG lui permet de *savoir*.
En résumé, un agent IA peut utiliser le MCP pour découvrir qu'il existe une API Recherche d'Entreprises, puis l'appeler pour obtenir une liste d'entreprises, et enfin utiliser une technique de RAG sur leurs statuts pour répondre à une question très précise.
Comment accéder et connecter le MCP de l’État français ?
L'accès au serveur MCP data.gouv.fr est public et ne requiert pas de clé d'API pour l'instant. La connexion se fait en configurant un client compatible pour qu'il pointe vers l'URL officielle du serveur. La documentation technique est disponible sur le dépôt GitHub du projet.
« Pour nous, c'est un gain de temps phénoménal. Au lieu de coder un wrapper pour chaque API, on pointe notre agent vers le serveur MCP et il découvre les capacités disponibles. C'est le 'plug-and-play' de la donnée publique », se réjouit Léa Martin, fondatrice de DataViz Solutions.
Voici les étapes pour un développeur ou un professionnel de la tech souhaitant expérimenter :
- Identifier l'endpoint : L'URL du serveur MCP public est `https://mcp.data.gouv.fr`.
- Choisir un client MCP compatible : Utilisez un client ou un framework d'agent IA qui supporte le protocole MCP (ex: des bibliothèques Python ou des plateformes d'agents spécialisées).
- Connecter l'agent : Configurez votre agent pour qu'il utilise le serveur MCP de data.gouv.fr comme source d'outils.
- Explorer les outils disponibles : L'agent peut lister les "tools" exposés, comme `datagouv_search_datasets` pour chercher des jeux de données ou `datagouv_get_resource` pour en récupérer une ressource.
- Tester une requête concrète : Demandez à votre agent : "Cherche les datasets contenant 'API Recherche d'Entreprises' sur data.gouv.fr". L'agent utilisera le MCP pour interroger le catalogue et vous retourner les résultats pertinents, comme les informations sur les créations d'entreprises en France.
Cas d’usage pour les entreprises et les médias
Au-delà de l'expérimentation technique, le MCP public État français ouvre des perspectives concrètes pour de nombreux professionnels.
* Veille économique et concurrentielle : Un consultant peut configurer un agent pour surveiller en continu les nouvelles entreprises créées dans un secteur et une zone géographique précise, en interrogeant périodiquement l'API de recherche d'entreprises. C'est un outil puissant pour l'intelligence économique.
* Journalisme de données : Les médias peuvent accélérer leurs investigations en demandant à un assistant de croiser des données issues de différents ministères (budget, subventions, données environnementales). Cela peut enrichir des contenus, comme le fait un bon partenaire éditorial.
* Développement de services : Une startup peut créer un chatbot IA spécialisé pour aider les entrepreneurs dans leurs démarches administratives. Ce chatbot, connecté au MCP, pourrait récupérer en temps réel les informations sur les aides disponibles ou les formulaires CERFA à jour.
* Analyse territoriale : Une collectivité ou un cabinet d'urbanisme peut analyser l'évolution démographique, les permis de construire ou les données de l'IGN pour modéliser le développement d'un territoire.
Limites et vigilance : le facteur humain reste crucial
La promesse de fluidité ne doit pas occulter les risques. Une IA, même connectée à des sources fiables, peut mal interpréter une requête, "halluciner" une corrélation ou présenter une donnée sortie de son contexte. La validation humaine reste une étape non négociable.
« La vraie question n'est pas la technologie, mais la gouvernance. Qui est responsable si l'IA interprète mal une donnée brute et qu'une décision d'investissement est prise sur cette base ? », tempère un avocat spécialisé en droit du numérique. Les enjeux sont triples :
Cette initiative, si elle est une avancée, est avant tout un appel à la responsabilité pour l'ensemble de l'écosystème qui s'en emparera. L'enjeu n'est pas seulement de savoir comment connecter un MCP, mais de savoir comment l'utiliser avec discernement.
Sources & références
Questions fréquentes
Commentaires
Soyez le premier à commenter cet article.


