La méthode.Comment on mesure la visibilité dans l’IA.

Une démarche transparente et reproductible, du corpus au contrôle qualité, avec le dossier complet en accès libre.

Le corpus

7128 réponses, 9 modèles, 12 marchés

L’étude repose sur 7128 réponses produites par 9 modèles de 4 fournisseurs (OpenAI, Anthropic, Google, Perplexity), sur 12 marchés sectoriels, collectées en mai 2026. Pour cette première étude, les modèles répondent sans accès au web, ce qui mesure ce qu’ils savent des marchés, indépendamment de la navigation.

Le dictionnaire d’entités gelé recense 2 804 organisations, dont 553 PME québécoises correspondant au profil cible de l’étude. C’est ce répertoire qui sert de référence à toutes les mesures.

La mesure

Le taux de présence (presence rate)

La métrique principale est la proportion de réponses où une entreprise donnée est citée au moins une fois. Les entités sont identifiées via un dictionnaire canonique gelé, construit à partir des réponses puis figé et horodaté par empreinte SHA-256, avec des règles de correspondance strictes.

Chaque taux de présence est rapporté avec son intervalle de confiance à 95 %, de sorte qu’on distingue un écart réel d’une simple variation d’échantillon.

La validation

Deux couches de contrôle

Détection déterministe

Une première couche repère les mentions de façon automatique et reproductible, à partir du dictionnaire gelé.

Jugement calibré

Une seconde couche fait évaluer, pour chaque mention, si l’entreprise relève bien du marché et n’est pas une attribution erronée. Ce juge IA est calibré sur un échantillon codé à la main, avec un accord humain-IA de 0,86 (Gwet AC1), au-dessus du seuil fixé d’avance.

Après le gel du dictionnaire

Typage vérifié et compléments

Le profil des 53 entités les plus citées (PME, groupe, multinationale) a été vérifié par recherche documentaire sourcée en juin 2026. Il en a résulté 12 corrections, par exemple des marques artisanales détenues par des multinationales. Les chiffres principaux de l’étude restent calculés sur le dictionnaire gelé pré-enregistré ; les corrections sont publiées en analyse de sensibilité. L’effet maximal est de 6,6 points (hébergement : de 46,6 % à 40,0 %) et ne change la hiérarchie d’aucun marché.

Les analyses complémentaires pré-enregistrées (indice de citation par secteur SCIAN, contrôle anti-citation, taux d’hallucination, effet de la formulation) sont déposées sur OSF avec l’étude révisée : osf.io/zj5eg.

Ce qui rend l’étude crédible

Des standards de recherche

Pré-enregistrement

Le protocole, les hypothèses et les règles d’analyse ont été déposés avant l’analyse, ce qui empêche d’ajuster les conclusions après coup.

Relecture critique

Le dispositif a été soumis à plusieurs tours de revue adverse, sur la méthode et la littérature, et corrigé en conséquence.

Données ouvertes

Corpus, dictionnaire, scripts et résultats sont déposés publiquement sur OSF. N’importe qui peut reproduire l’analyse.

Limites assumées

Certains résultats sont présentés comme exploratoires, et chaque chiffre est rapporté avec son incertitude. On indique ce qui est solide et ce qui reste à confirmer.

HonnêtetéMesurer la visibilité dans l’IA est nouveau et facile à mal faire. On applique ces standards pour produire des chiffres sur lesquels une décision d’entreprise peut s’appuyer.

Dossier complet et pré-enregistrement : osf.io/zj5eg.

Voir aussi

L’étude (pilier)·Résultats clés

Mesurer votre visibilité

On applique la même rigueur à votre diagnostic Share of Model qu’à notre recherche.

Demander un diagnostic →