Genres de preuves classes : Code, stats, definitions, comparaisons, how-to – ce qui declenche les citations IA (Zhang et al., 2026)

Genres de preuves classés : Code, stats, définitions, comparaisons, how-to — ce qui déclenche les citations IA (Zhang et al., 2026)

L’étude Zhang, He & Yao (arXiv:2604.25707, 2026) classe pour la première fois les genres d’evidence par uplift d’influence dans les réponses IA. Sur 23 745 enregistrements de features et 18 151 pages fetchées, les genres qui drivent la profondeur d’absorption : code (+76.88%), numbers/statistics (+61.55%), definition markers (+57.33%), comparison content (+55.28%), how-to content (+41.20%). Les semantic roles confirment : definition (0.1531 mean influence), comparison (0.1524), evidence (0.1235), statistical_data (0.1120). Ci-dessous : le classement complet, l’interprétation par genre, et le playbook en 8 étapes pour engineer chaque type d’evidence dans vos pages.

TL;DR : Pour maximiser l’absorption AI, ajoutez explicitement dans vos pages : (1) code blocks quand pertinent (tech +77%), (2) chiffres avec sources (universel +62%), (3) définitions explicites (+57%), (4) tables de comparaison (+55%), (5) étapes how-to (+41%). Ces 5 genres ensemble couvrent les besoins de la majorité des prompts informationnels. Le format Q&A seul (-5.74%) ne suffit pas.

Scan CapstonAI gratuit →    Hub Recherche GEO

Le classement complet des evidence genres

GenreTrue mean influenceFalse mean influenceUplift relatifRecommandation
Contains code0.17470.0988+76.88%Crucial pour tech/dev ; optionnel ailleurs
Contains numbers/statistics0.11710.0725+61.55%Universel : ajouter chiffres sourcés partout
Contains definition markers0.12520.0795+57.33%Universel : « What is X » sections, glossaires
Contains comparison content0.13890.0894+55.28%Crucial pour consideration-stage
Contains how-to content0.12960.0918+41.20%Crucial pour transactional + post-purchase
Q&A format0.09470.1005-5.74%Insuffisant seul ; enrichir avec evidence

Source : Zhang, He & Yao, 2026, §8.2.

Classement des semantic roles (Zhang et al. §8.3)

Rôle sémantiqueN citationsMean influenceInterprétation
definition1 6630.1531Le rôle haute-influence #1. Définir clairement = être absorbé.
comparison1 7190.1524#2. Comparaisons explicites = matériau prêt-à-réutiliser.
evidence6 2160.1235Volume + influence solide. Backbone des réponses.
statistical_data5040.1120Influence forte mais volume faible. Underused.
example1 4680.1047Concret aide à l’absorption.
opinion8460.0938Influence moyenne. Acceptable mais pas optimal.
background5 5820.0801Volume élevé mais influence faible. Cher pour peu de retour.
procedure4970.0717Influence faible (paradoxe vs how-to +41%).
reference1 2980.0529Le rôle le moins influent. Citation symbolique.

Le playbook en 8 étapes pour engineer les evidence genres

  1. Étape 1 : Auditer vos top 30 pages par evidence genre. Pour chaque page, compter : (a) blocs de code, (b) chiffres/statistiques avec source, (c) sections de définition (« What is X », « X is defined as »), (d) tables de comparaison, (e) étapes how-to numérotées. Score : 1 point par genre présent, 2 si présent et substantiel. Page sous 4/10 = à enrichir.
  2. Étape 2 : Ajouter une section « What is X » en haut de chaque page strategique. Definition markers driven +57.33% influence. Une définition claire en 2-3 phrases au début + un glossaire term/définition en bas = double signal. Schema DefinedTerm pour les glossaires.
  3. Étape 3 : Ajouter chiffres sourcés dans chaque section principale. Numbers/statistics +61.55%. Cible : minimum 1 chiffre concret par H2. Toujours avec source citée. « Selon X, le marché Y a atteint Z milliards en 2026 » beats « le marché Y est important ».
  4. Étape 4 : Construire des tables de comparaison. Comparison content +55.28%. Pour chaque page produit/service, créer 1 table « X vs Y vs Z » avec 5-8 critères en colonnes. Crucial pour consideration-stage queries. Schema Product avec aggregateRating pour amplifier.
  5. Étape 5 : Ajouter des sections how-to procédurales où applicable. How-to content +41.20%. Format « Step 1, Step 2… » numéroté. Schema HowTo. Particulièrement puissant pour tutoriels, configuration, troubleshooting.
  6. Étape 6 : Pour les pages tech, ajouter code blocks. Code +76.88% — le plus haut uplift mesuré. Si vous êtes en SaaS technique, dev tools, API docs : code blocks dans chaque page possible. Pre/code HTML + syntax highlighting.
  7. Étape 7 : Réduire le « background » content non-essentiel. Background +0.0801 influence (faible). Si une page est 70% background + 30% evidence, inverser le ratio : 30% intro + 70% evidence. Cible : sections background sous 200 mots.
  8. Étape 8 : Mesurer le mix de genres trimestriellement. Tracker : (a) % de vos pages contenant chaque genre, (b) score mean influence par genre, (c) corrélation entre genre count et citation rate. Itérer.

Décomposition par industrie

IndustryNMean influenceGenres prioritaires
A_technology2 2520.1272Code (#1) + chiffres + définitions
A_healthcare2 3790.1021Définitions + chiffres + how-to
A_commerce2 2430.0994Comparaisons + chiffres
A_finance1 8310.0965Chiffres + comparaisons + définitions
A_news2 2040.0948Chiffres + background contextuel
A_local2 2230.0916Comparaisons + how-to

Comparison questions ont l’influence la plus haute parmi les question types selon Zhang et al. (§8.7). Ces catégories demandent naturellement définitions, critères, evidence contrastive, et explication structurée — alignées avec le evidence-container model.

Common errors avec les evidence genres

  • Ajouter du background pour « remplir » une page. Background influence (0.0801) est la plus faible parmi les rôles. Mieux vaut une page courte mais evidence-dense qu’une page longue avec background.
  • Cibler uniquement le format Q&A. Sans densification evidence, Q&A pages sous-performent (-5.74%). Le format seul ne suffit pas.
  • Ignorer les sources sur les chiffres. « X% des utilisateurs… » sans source devient référence faible. Toujours sourcer.
  • Tables de comparaison déséquilibrées. Tables qui font gagner votre brand sur tous les critères sont reconnues comme promotional et déprioritisées. Comparaisons honnêtes (votre brand perd sur 1-2 critères) sont plus crédibles.
  • Code blocks décoratifs. Code qui ne fait rien d’utile (pseudo-code random) ne compte pas. Code exécutable, configuration valide, exemples API réalistes — oui.

FAQ — Evidence genres pour le GEO

Combien de genres faut-il par page ?

Minimum 3 genres significatifs par page strategique. Les pages high-influence dans le dataset Zhang et al. contiennent typiquement 4-5 genres présents (chiffres + définitions + comparaisons + exemples + références sourcées). Au-delà de 5, le rendement marginal diminue.

Le code block compte-t-il pour les non-tech verticals ?

Marginalement. L’uplift +76.88% est observé sur les pages techniques où le code est l’evidence native. Sur les pages finance, healthcare, retail, le code apporte peu sauf cas spécifiques (formules Excel, scripts d’automation). Prioriser chiffres + définitions + comparisons pour les non-tech.

Comment mesurer si une page contient un genre ?

Manuellement : audit visuel rapide (présent / absent / substantiel). Automatique : regex sur patterns (« step \d+ » pour how-to, presence de « % », « vs », « $ » pour numbers, « is defined as|refers to|means » pour definitions, presence de table HTML pour comparisons, presence de pre/code pour code). Zhang et al. ont automatisé cette classification sur leur dataset.

Outils et lectures liées

Prêt à engineer les evidence genres ?

Scan CapstonAI gratuit →

Dernière mise à jour : mai 2026. Source primaire : Zhang, K., He, X., & Yao, J. (2026). From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms. arXiv:2604.25707. https://arxiv.org/abs/2604.25707

Connaître les genres est insuffisant — auditez vos pages existantes

Zhang et al. 2026 ont classé 9 evidence genres par impact. Mais avoir la liste ne suffit pas : il faut auditer vos pages pour identifier les manques précis. Le Diagnostic vous donne la grille de scoring + 4 templates prêts à l’emploi.

→ Télécharger le diagnostic gratuit (6 pages)