Genres de preuves classés : Code, stats, définitions, comparaisons, how-to — ce qui déclenche les citations IA (Zhang et al., 2026)
L’étude Zhang, He & Yao (arXiv:2604.25707, 2026) classe pour la première fois les genres d’evidence par uplift d’influence dans les réponses IA. Sur 23 745 enregistrements de features et 18 151 pages fetchées, les genres qui drivent la profondeur d’absorption : code (+76.88%), numbers/statistics (+61.55%), definition markers (+57.33%), comparison content (+55.28%), how-to content (+41.20%). Les semantic roles confirment : definition (0.1531 mean influence), comparison (0.1524), evidence (0.1235), statistical_data (0.1120). Ci-dessous : le classement complet, l’interprétation par genre, et le playbook en 8 étapes pour engineer chaque type d’evidence dans vos pages.
TL;DR : Pour maximiser l’absorption AI, ajoutez explicitement dans vos pages : (1) code blocks quand pertinent (tech +77%), (2) chiffres avec sources (universel +62%), (3) définitions explicites (+57%), (4) tables de comparaison (+55%), (5) étapes how-to (+41%). Ces 5 genres ensemble couvrent les besoins de la majorité des prompts informationnels. Le format Q&A seul (-5.74%) ne suffit pas.
Scan CapstonAI gratuit → Hub Recherche GEO
Le classement complet des evidence genres
| Genre | True mean influence | False mean influence | Uplift relatif | Recommandation |
|---|---|---|---|---|
| Contains code | 0.1747 | 0.0988 | +76.88% | Crucial pour tech/dev ; optionnel ailleurs |
| Contains numbers/statistics | 0.1171 | 0.0725 | +61.55% | Universel : ajouter chiffres sourcés partout |
| Contains definition markers | 0.1252 | 0.0795 | +57.33% | Universel : « What is X » sections, glossaires |
| Contains comparison content | 0.1389 | 0.0894 | +55.28% | Crucial pour consideration-stage |
| Contains how-to content | 0.1296 | 0.0918 | +41.20% | Crucial pour transactional + post-purchase |
| Q&A format | 0.0947 | 0.1005 | -5.74% | Insuffisant seul ; enrichir avec evidence |
Source : Zhang, He & Yao, 2026, §8.2.
Classement des semantic roles (Zhang et al. §8.3)
| Rôle sémantique | N citations | Mean influence | Interprétation |
|---|---|---|---|
| definition | 1 663 | 0.1531 | Le rôle haute-influence #1. Définir clairement = être absorbé. |
| comparison | 1 719 | 0.1524 | #2. Comparaisons explicites = matériau prêt-à-réutiliser. |
| evidence | 6 216 | 0.1235 | Volume + influence solide. Backbone des réponses. |
| statistical_data | 504 | 0.1120 | Influence forte mais volume faible. Underused. |
| example | 1 468 | 0.1047 | Concret aide à l’absorption. |
| opinion | 846 | 0.0938 | Influence moyenne. Acceptable mais pas optimal. |
| background | 5 582 | 0.0801 | Volume élevé mais influence faible. Cher pour peu de retour. |
| procedure | 497 | 0.0717 | Influence faible (paradoxe vs how-to +41%). |
| reference | 1 298 | 0.0529 | Le rôle le moins influent. Citation symbolique. |
Le playbook en 8 étapes pour engineer les evidence genres
- Étape 1 : Auditer vos top 30 pages par evidence genre. Pour chaque page, compter : (a) blocs de code, (b) chiffres/statistiques avec source, (c) sections de définition (« What is X », « X is defined as »), (d) tables de comparaison, (e) étapes how-to numérotées. Score : 1 point par genre présent, 2 si présent et substantiel. Page sous 4/10 = à enrichir.
- Étape 2 : Ajouter une section « What is X » en haut de chaque page strategique. Definition markers driven +57.33% influence. Une définition claire en 2-3 phrases au début + un glossaire term/définition en bas = double signal. Schema DefinedTerm pour les glossaires.
- Étape 3 : Ajouter chiffres sourcés dans chaque section principale. Numbers/statistics +61.55%. Cible : minimum 1 chiffre concret par H2. Toujours avec source citée. « Selon X, le marché Y a atteint Z milliards en 2026 » beats « le marché Y est important ».
- Étape 4 : Construire des tables de comparaison. Comparison content +55.28%. Pour chaque page produit/service, créer 1 table « X vs Y vs Z » avec 5-8 critères en colonnes. Crucial pour consideration-stage queries. Schema Product avec aggregateRating pour amplifier.
- Étape 5 : Ajouter des sections how-to procédurales où applicable. How-to content +41.20%. Format « Step 1, Step 2… » numéroté. Schema HowTo. Particulièrement puissant pour tutoriels, configuration, troubleshooting.
- Étape 6 : Pour les pages tech, ajouter code blocks. Code +76.88% — le plus haut uplift mesuré. Si vous êtes en SaaS technique, dev tools, API docs : code blocks dans chaque page possible. Pre/code HTML + syntax highlighting.
- Étape 7 : Réduire le « background » content non-essentiel. Background +0.0801 influence (faible). Si une page est 70% background + 30% evidence, inverser le ratio : 30% intro + 70% evidence. Cible : sections background sous 200 mots.
- Étape 8 : Mesurer le mix de genres trimestriellement. Tracker : (a) % de vos pages contenant chaque genre, (b) score mean influence par genre, (c) corrélation entre genre count et citation rate. Itérer.
Décomposition par industrie
| Industry | N | Mean influence | Genres prioritaires |
|---|---|---|---|
| A_technology | 2 252 | 0.1272 | Code (#1) + chiffres + définitions |
| A_healthcare | 2 379 | 0.1021 | Définitions + chiffres + how-to |
| A_commerce | 2 243 | 0.0994 | Comparaisons + chiffres |
| A_finance | 1 831 | 0.0965 | Chiffres + comparaisons + définitions |
| A_news | 2 204 | 0.0948 | Chiffres + background contextuel |
| A_local | 2 223 | 0.0916 | Comparaisons + how-to |
Comparison questions ont l’influence la plus haute parmi les question types selon Zhang et al. (§8.7). Ces catégories demandent naturellement définitions, critères, evidence contrastive, et explication structurée — alignées avec le evidence-container model.
Common errors avec les evidence genres
- Ajouter du background pour « remplir » une page. Background influence (0.0801) est la plus faible parmi les rôles. Mieux vaut une page courte mais evidence-dense qu’une page longue avec background.
- Cibler uniquement le format Q&A. Sans densification evidence, Q&A pages sous-performent (-5.74%). Le format seul ne suffit pas.
- Ignorer les sources sur les chiffres. « X% des utilisateurs… » sans source devient référence faible. Toujours sourcer.
- Tables de comparaison déséquilibrées. Tables qui font gagner votre brand sur tous les critères sont reconnues comme promotional et déprioritisées. Comparaisons honnêtes (votre brand perd sur 1-2 critères) sont plus crédibles.
- Code blocks décoratifs. Code qui ne fait rien d’utile (pseudo-code random) ne compte pas. Code exécutable, configuration valide, exemples API réalistes — oui.
FAQ — Evidence genres pour le GEO
Combien de genres faut-il par page ?
Minimum 3 genres significatifs par page strategique. Les pages high-influence dans le dataset Zhang et al. contiennent typiquement 4-5 genres présents (chiffres + définitions + comparaisons + exemples + références sourcées). Au-delà de 5, le rendement marginal diminue.
Le code block compte-t-il pour les non-tech verticals ?
Marginalement. L’uplift +76.88% est observé sur les pages techniques où le code est l’evidence native. Sur les pages finance, healthcare, retail, le code apporte peu sauf cas spécifiques (formules Excel, scripts d’automation). Prioriser chiffres + définitions + comparisons pour les non-tech.
Comment mesurer si une page contient un genre ?
Manuellement : audit visuel rapide (présent / absent / substantiel). Automatique : regex sur patterns (« step \d+ » pour how-to, presence de « % », « vs », « $ » pour numbers, « is defined as|refers to|means » pour definitions, presence de table HTML pour comparisons, presence de pre/code pour code). Zhang et al. ont automatisé cette classification sur leur dataset.
Outils et lectures liées
- GEO Scientific Research 2026 (hub silo)
- Citation Selection vs Absorption : framework
- L’hypothèse evidence-container
- Le format Q&A n’améliore PAS le GEO
- Le GEO Influence Score : méthodologie
- Structured Data Audit for AI Engines
- GEO Content Calendar 2026
- CapstonAI AI Citation Tracking
Prêt à engineer les evidence genres ?
Dernière mise à jour : mai 2026. Source primaire : Zhang, K., He, X., & Yao, J. (2026). From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms. arXiv:2604.25707. https://arxiv.org/abs/2604.25707