Citation Selection vs Citation Absorption : Le framework GEO en 2 couches (Zhang, He & Yao, 2026)

L’étude de Zhang, He & Yao (arXiv:2604.25707, 2026) propose le framework GEO le plus rigoureux publié à ce jour : séparer la sélection de citation (la plateforme choisit votre source) de l’absorption de citation (la source nourrit réellement la réponse générée). Analyse de 602 prompts contrôlés, 21 143 citations valides, 23 745 enregistrements de features au niveau citation, et 18 151 pages fetchées sur ChatGPT, Google AI Overview/Gemini, et Perplexity. Le résultat principal : citation breadth et citation depth divergent sharply. Ci-dessous : le framework complet, les chiffres exacts du cohort, et le playbook en 8 étapes pour mesurer les deux couches dans votre stack.

TL;DR : Le GEO se décompose en 2 couches mesurables séparément. Couche 1 (Selection) : être choisi comme source candidate — gated par autorité, langue, type de domaine. Couche 2 (Absorption) : façonner réellement la réponse — gated par alignement sémantique, structure modulaire, densité d’evidence. ChatGPT cite peu (6.88 sources/prompt) mais profond (0.2713 influence). Perplexity cite large (16.35) mais peu profond (0.0646). Optimisez les deux couches séparément.

Scan CapstonAI gratuit → Hub Recherche GEO

Les chiffres du dataset geo-citation-lab

Plateforme	Prompts triggered	Trigger rate	Mean citations	Median citations	Mean influence (fetched)
ChatGPT	579 / 587	98.64%	6.88	6	0.2713
Google AI Overview / Gemini	600 / 602	99.67%	12.06	12	0.0584
Perplexity	602 / 602	100.00%	16.35	17	0.0646

Source : Zhang, He & Yao, 2026, §6. Mean influence = score composite combinant ref_count, position, paragraph_coverage, TF-IDF cosine, et n-gram overlap.

Pourquoi la séparation des 2 couches change le GEO

Avant ce framework, le GEO était mesuré comme un événement unique : « ma page est-elle citée ? ». Ce binaire masque l’essentiel. Une page peut être citée comme référence faible (1 ligne en bas, ignorée par l’utilisateur) ou comme socle factuel (utilisée pour 3 paragraphes, déterminante dans la réponse). Le score d’influence composite de Zhang et al. quantifie cette différence.

Conséquence stratégique : la fonction objectif du GEO n’est plus unidimensionnelle. Selon votre objectif business, vous optimisez différemment. Pour l’attribution de trafic référent : maximiser la breadth (Perplexity-like). Pour le pouvoir de façonner la réponse : maximiser la depth (ChatGPT-like). Pour la couverture publicitaire / share-of-voice : maximiser les deux. Un seul KPI « citation rate » perd toute l’information.

Le playbook en 8 étapes pour mesurer les 2 couches

Étape 1 : Construire le panel de prompts de référence. 30-50 prompts représentatifs de votre vertical, équilibrés entre informational, consideration, transactional, et comparison. Inclure des paraphrase variants. Locker le panel pour permettre la comparaison week-over-week.
Étape 2 : Mesurer la couche Selection (Citation breadth). Pour chaque plateforme, compter : (a) trigger rate (% de prompts qui déclenchent une recherche), (b) citations moyennes par prompt, (c) % de prompts où votre brand apparaît au moins une fois, (d) part de citations par type de domaine (Brand/Earned/Social).
Étape 3 : Mesurer la couche Absorption (Citation depth). Pour chaque page citée fetchée avec succès, calculer le score d’influence : 0.20·min(ref_count/3,1) + 0.15·(1-first_position_ratio) + 0.20·paragraph_coverage + 0.25·TF-IDF cosine + 0.20·(bigram + trigram overlap)/2. Moyenner par page, par domaine, par plateforme.
Étape 4 : Séparer les KPI Selection et Absorption dans votre reporting. Le tableau de bord doit montrer 2 colonnes par plateforme : citation rate (Selection) et mean influence (Absorption). Sans cette séparation, les agences et CMO confondent le bruit de la profondeur.
Étape 5 : Optimiser chaque couche avec les bons leviers. Selection : autorité (DR), notoriété de domaine, type de domaine adapté à la plateforme, langue de la page, fraîcheur. Absorption : alignement sémantique avec le prompt, structure modulaire (headings, paragraphes thématiques), densité d’evidence (définitions, chiffres, comparaisons, procédures).
Étape 6 : Choisir la fonction objectif selon votre business. SaaS B2B avec funnel attribution : prioriser Absorption (ChatGPT-style). E-commerce avec attribution trafic référent : prioriser Selection (Perplexity-style). Brand pure-play : maximiser les deux avec différentes pages spécialisées.
Étape 7 : Tracker les domaines high-absorption dans votre vertical. Le dataset Zhang et al. liste les domaines absorbés en profondeur (encyclopedia: 0.2144 mean influence). Identifier les 5-10 domaines high-absorption de votre vertical et y investir prioritairement votre PR.
Étape 8 : Re-baseliner trimestriellement. Les plateformes évoluent. Les chiffres ChatGPT 6.88 / Perplexity 16.35 sont la photographie de fin 2025-début 2026. Re-runner le panel chaque trimestre. Loguer le modèle version, l’UI mode, et la fenêtre de collecte.

Selection vs Absorption : les implications par plateforme

Plateforme	Profil Selection	Profil Absorption	Stratégie recommandée
ChatGPT	Citation-sparse (6.88 moy)	Absorption-heavy (0.2713)	Cibler les 5-10 sources high-influence de votre vertical. Chaque slot compte.
Google AI Overview / Gemini	Citation-broad (12.06 moy)	Absorption-moyenne (0.0584)	Mix breadth + depth. Investir Wikipedia + tier-1 publications.
Perplexity	Citation-rich (16.35 moy)	Absorption-faible/moyenne (0.0646)	Maximiser breadth via YouTube, Reddit, et publications longue-traîne.

Le piège de la métrique unique

Un dashboard qui ne montre que « citation count » total commet une erreur structurelle. Si votre brand passe de 8% à 15% de citation rate sur Perplexity, cela peut signifier : (a) une vraie amélioration de visibilité, ou (b) une dilution — vous êtes ajouté à des listes de 17 sources où chacune est marginalement utilisée. Sans tracker l’influence moyenne en parallèle, vous célébrez à tort.

Inversement, si votre influence moyenne sur ChatGPT passe de 0.18 à 0.28 mais votre citation rate baisse, cela peut signifier : (a) ChatGPT vous cite moins souvent mais quand il le fait, vos pages dominent la réponse — un signal très fort pour les buyers en haut de funnel ; (b) ChatGPT a réduit le nombre de citations global et vous êtes par construction plus représenté. La distinction nécessite les 2 couches.

Common errors avec la mesure 2-couches

Optimiser uniquement la breadth. Maximiser le nombre de citations sans mesurer l’absorption produit des classements vanity. La profondeur est ce qui convertit les buyers.
Ignorer la breadth pour viser uniquement la depth. Un score d’influence élevé sur 0.5% des prompts ne suffit pas. Vous avez besoin du minimum de présence dans le pool de candidats.
Comparer les influence scores entre plateformes sans contexte. L’influence ChatGPT (0.2713) et Perplexity (0.0646) ne sont pas directement comparables : reflètent en partie le nombre de citations par réponse. Comparer dans-plateforme, pas entre plateformes.
Ignorer les composantes du score d’influence dans les régressions. Variables comme ref_count, paragraph_coverage sont des composantes du score lui-même : ne pas les réutiliser comme prédicteurs indépendants (erreur de spécification fréquente).
Ne pas re-baseliner trimestriellement. Les chiffres absolus dérivent. La méthodologie reste, les nombres changent.

FAQ — Citation Selection vs Absorption

Le score d’influence est-il un proxy fiable de l’attention du modèle ?

Zhang et al. sont explicites : c’est un proxy observationnel construit, pas une mesure directe d’attention interne ou de causalité. Il combine 5 features observables (ref_count, position, paragraph coverage, TF-IDF, n-gram overlap) en un score unique. Utile pour comparer pages au sein du même dataset ; pas utile pour réclamer un lien causal entre une intervention de contenu et un changement de score.

Peut-on appliquer ce framework sans accès au geo-citation-lab dataset ?

Oui. Le framework conceptuel (séparer Selection et Absorption, mesurer les 2 couches indépendamment) est applicable avec votre propre panel de prompts et n’importe quel outil de tracking AI citation. La formule d’influence est reproductible : ref_count + first_position_ratio + paragraph_coverage + TF-IDF + n-gram overlap. CapstonAI implémente cette logique nativement.

Quelle est la fréquence recommandée de re-baseline ?

Trimestriellement au minimum. Les plateformes AI évoluent vite : nouveaux modèles, changements d’UI, ajustements de rétrieval. Tracker le model version + UI mode + collection window à chaque baseline pour garder l’audit-trail.

Outils et lectures liées

Prêt à mesurer Selection et Absorption ?

Scan CapstonAI gratuit →

Dernière mise à jour : mai 2026. Source primaire : Zhang, K., He, X., & Yao, J. (2026). From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms. arXiv:2604.25707. https://arxiv.org/abs/2604.25707. Dataset public : github.com/yaojingang/geo-citation-lab

Être cité est insuffisant — vos métriques mesurent-elles vraiment l’absorption ?

Zhang et al. 2026 distinguent citation selection et citation absorption. La plupart des métriques GEO ne mesurent que la sélection. Le Checklist 25-points vous permet de vérifier si vos métriques actuelles sont défendables — et d’identifier celles qui surestiment votre vraie performance.

→ Télécharger le Defensibility Audit (checklist 25 points)