Données structurées (Schema.org)
Balisage lisible par les machines décrivant le sujet d'une page.
Les données structurées sont un balisage standardisé et lisible par les machines qui décrit explicitement le sujet d'une page — une entreprise, un produit, une FAQ, un jeu de données — afin que les moteurs de recherche et d'IA puissent interpréter les entités et leurs relations sans les déduire du texte brut. Le vocabulaire dominant est Schema.org, lancé le 2 juin 2011 par Bing, Google et Yahoo! (Yandex a rejoint en novembre 2011), et développé via un processus communautaire ouvert.
Schema.org peut être intégré en Microdata, RDFa ou JSON-LD ; Google recommande JSON-LD (un bloc script dans l'en-tête de la page). Un balisage valide rend une page éligible — sans garantie — aux rich results et aux fonctionnalités de knowledge graph. L'adoption est massive : en 2024, plus de 45 millions de domaines publient plus de 450 milliards d'objets Schema.org. Pour la visibilité IA, les données structurées sont un levier fondamental car elles fournissent aux moteurs des faits non ambigus et citables sur une entité.
Sources
- Schema.org (vocabulary & documentation) — Schema.org
- Schema.org: Evolution of Structured Data on the Web — ACM Queue (peer-reviewed)
- Intro to how structured data works — Google Search Central