← Retour au glossaire

llms.txt

Un fichier standard proposé qui indique aux IA le contenu clé d'un site.

llms.txt est une convention proposée — publiée sur llmstxt.org par Jeremy Howard d'Answer.AI le 3 septembre 2024 — pour un fichier markdown servi à la racine d'un site, qui fournit aux grands modèles de langage un index curé et concis des contenus les plus importants du site. Elle répond au fait que les fenêtres de contexte des LLM sont trop petites pour ingérer des pages HTML complètes avec navigation, publicités et scripts. Le format n'exige qu'un H1 (le nom du site), plus un résumé en blockquote et des sections H2 de listes de liens optionnels ; un fichier compagnon llms-full.txt peut porter un contenu étendu.

À noter : llms.txt est une proposition communautaire, pas un standard ratifié, et en 2026 il n'existe aucune preuve publique que les grands moteurs (OpenAI, Google, Anthropic) le consomment comme directive de crawl ou de classement. L'adoption se concentre pour l'instant chez les éditeurs qui publient le fichier (p. ex. Anthropic, Stripe, Cloudflare). Il faut donc le voir comme un signal peu coûteux et tourné vers l'avenir qui complète — sans remplacer — robots.txt, les sitemaps et les données structurées.

Mettez ces concepts en pratique — gratuitement

Référencer mon entreprise