Genres de preuves classés : Code, stats, définitions, comparaisons, how-to — ce qui déclenche les citations IA (Zhang et al., 2026)

L’étude Zhang, He & Yao (arXiv:2604.25707, 2026) classe pour la première fois les genres d’evidence par uplift d’influence dans les réponses IA. Sur 23 745 enregistrements de features et 18 151 pages fetchées, les genres qui drivent la profondeur d’absorption : code (+76.88%), numbers/statistics (+61.55%), definition markers (+57.33%), comparison content (+55.28%), how-to content (+41.20%). Les semantic roles confirment : definition (0.1531 mean influence), comparison (0.1524), evidence (0.1235), statistical_data (0.1120). Ci-dessous : le classement complet, l’interprétation par genre, et le playbook en 8 étapes pour engineer chaque type d’evidence dans vos pages.

TL;DR : Pour maximiser l’absorption AI, ajoutez explicitement dans vos pages : (1) code blocks quand pertinent (tech +77%), (2) chiffres avec sources (universel +62%), (3) définitions explicites (+57%), (4) tables de comparaison (+55%), (5) étapes how-to (+41%). Ces 5 genres ensemble couvrent les besoins de la majorité des prompts informationnels. Le format Q&A seul (-5.74%) ne suffit pas.

Scan CapstonAI gratuit → Hub Recherche GEO

Le classement complet des evidence genres

Genre	True mean influence	False mean influence	Uplift relatif	Recommandation
Contains code	0.1747	0.0988	+76.88%	Crucial pour tech/dev ; optionnel ailleurs
Contains numbers/statistics	0.1171	0.0725	+61.55%	Universel : ajouter chiffres sourcés partout
Contains definition markers	0.1252	0.0795	+57.33%	Universel : « What is X » sections, glossaires
Contains comparison content	0.1389	0.0894	+55.28%	Crucial pour consideration-stage
Contains how-to content	0.1296	0.0918	+41.20%	Crucial pour transactional + post-purchase
Q&A format	0.0947	0.1005	-5.74%	Insuffisant seul ; enrichir avec evidence

Source : Zhang, He & Yao, 2026, §8.2.

Classement des semantic roles (Zhang et al. §8.3)

Rôle sémantique	N citations	Mean influence	Interprétation
definition	1 663	0.1531	Le rôle haute-influence #1. Définir clairement = être absorbé.
comparison	1 719	0.1524	#2. Comparaisons explicites = matériau prêt-à-réutiliser.
evidence	6 216	0.1235	Volume + influence solide. Backbone des réponses.
statistical_data	504	0.1120	Influence forte mais volume faible. Underused.
example	1 468	0.1047	Concret aide à l’absorption.
opinion	846	0.0938	Influence moyenne. Acceptable mais pas optimal.
background	5 582	0.0801	Volume élevé mais influence faible. Cher pour peu de retour.
procedure	497	0.0717	Influence faible (paradoxe vs how-to +41%).
reference	1 298	0.0529	Le rôle le moins influent. Citation symbolique.

Le playbook en 8 étapes pour engineer les evidence genres

Étape 1 : Auditer vos top 30 pages par evidence genre. Pour chaque page, compter : (a) blocs de code, (b) chiffres/statistiques avec source, (c) sections de définition (« What is X », « X is defined as »), (d) tables de comparaison, (e) étapes how-to numérotées. Score : 1 point par genre présent, 2 si présent et substantiel. Page sous 4/10 = à enrichir.
Étape 2 : Ajouter une section « What is X » en haut de chaque page strategique. Definition markers driven +57.33% influence. Une définition claire en 2-3 phrases au début + un glossaire term/définition en bas = double signal. Schema DefinedTerm pour les glossaires.
Étape 3 : Ajouter chiffres sourcés dans chaque section principale. Numbers/statistics +61.55%. Cible : minimum 1 chiffre concret par H2. Toujours avec source citée. « Selon X, le marché Y a atteint Z milliards en 2026 » beats « le marché Y est important ».
Étape 4 : Construire des tables de comparaison. Comparison content +55.28%. Pour chaque page produit/service, créer 1 table « X vs Y vs Z » avec 5-8 critères en colonnes. Crucial pour consideration-stage queries. Schema Product avec aggregateRating pour amplifier.
Étape 5 : Ajouter des sections how-to procédurales où applicable. How-to content +41.20%. Format « Step 1, Step 2… » numéroté. Schema HowTo. Particulièrement puissant pour tutoriels, configuration, troubleshooting.
Étape 6 : Pour les pages tech, ajouter code blocks. Code +76.88% — le plus haut uplift mesuré. Si vous êtes en SaaS technique, dev tools, API docs : code blocks dans chaque page possible. Pre/code HTML + syntax highlighting.
Étape 7 : Réduire le « background » content non-essentiel. Background +0.0801 influence (faible). Si une page est 70% background + 30% evidence, inverser le ratio : 30% intro + 70% evidence. Cible : sections background sous 200 mots.
Étape 8 : Mesurer le mix de genres trimestriellement. Tracker : (a) % de vos pages contenant chaque genre, (b) score mean influence par genre, (c) corrélation entre genre count et citation rate. Itérer.

Décomposition par industrie

Industry	N	Mean influence	Genres prioritaires
A_technology	2 252	0.1272	Code (#1) + chiffres + définitions
A_healthcare	2 379	0.1021	Définitions + chiffres + how-to
A_commerce	2 243	0.0994	Comparaisons + chiffres
A_finance	1 831	0.0965	Chiffres + comparaisons + définitions
A_news	2 204	0.0948	Chiffres + background contextuel
A_local	2 223	0.0916	Comparaisons + how-to

Comparison questions ont l’influence la plus haute parmi les question types selon Zhang et al. (§8.7). Ces catégories demandent naturellement définitions, critères, evidence contrastive, et explication structurée — alignées avec le evidence-container model.

Common errors avec les evidence genres

Ajouter du background pour « remplir » une page. Background influence (0.0801) est la plus faible parmi les rôles. Mieux vaut une page courte mais evidence-dense qu’une page longue avec background.
Cibler uniquement le format Q&A. Sans densification evidence, Q&A pages sous-performent (-5.74%). Le format seul ne suffit pas.
Ignorer les sources sur les chiffres. « X% des utilisateurs… » sans source devient référence faible. Toujours sourcer.
Tables de comparaison déséquilibrées. Tables qui font gagner votre brand sur tous les critères sont reconnues comme promotional et déprioritisées. Comparaisons honnêtes (votre brand perd sur 1-2 critères) sont plus crédibles.
Code blocks décoratifs. Code qui ne fait rien d’utile (pseudo-code random) ne compte pas. Code exécutable, configuration valide, exemples API réalistes — oui.

FAQ — Evidence genres pour le GEO

Combien de genres faut-il par page ?

Minimum 3 genres significatifs par page strategique. Les pages high-influence dans le dataset Zhang et al. contiennent typiquement 4-5 genres présents (chiffres + définitions + comparaisons + exemples + références sourcées). Au-delà de 5, le rendement marginal diminue.

Le code block compte-t-il pour les non-tech verticals ?

Marginalement. L’uplift +76.88% est observé sur les pages techniques où le code est l’evidence native. Sur les pages finance, healthcare, retail, le code apporte peu sauf cas spécifiques (formules Excel, scripts d’automation). Prioriser chiffres + définitions + comparisons pour les non-tech.

Comment mesurer si une page contient un genre ?

Manuellement : audit visuel rapide (présent / absent / substantiel). Automatique : regex sur patterns (« step \d+ » pour how-to, presence de « % », « vs », « $ » pour numbers, « is defined as|refers to|means » pour definitions, presence de table HTML pour comparisons, presence de pre/code pour code). Zhang et al. ont automatisé cette classification sur leur dataset.

Outils et lectures liées

Prêt à engineer les evidence genres ?

Scan CapstonAI gratuit →

Dernière mise à jour : mai 2026. Source primaire : Zhang, K., He, X., & Yao, J. (2026). From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms. arXiv:2604.25707. https://arxiv.org/abs/2604.25707

Connaître les genres est insuffisant — auditez vos pages existantes

Zhang et al. 2026 ont classé 9 evidence genres par impact. Mais avoir la liste ne suffit pas : il faut auditer vos pages pour identifier les manques précis. Le Diagnostic vous donne la grille de scoring + 4 templates prêts à l’emploi.

→ Télécharger le diagnostic gratuit (6 pages)

Genres de preuves classes : Code, stats, definitions, comparaisons, how-to – ce qui declenche les citations IA (Zhang et al., 2026)