La méthode.Comment on mesure la visibilité dans l’IA.
Une démarche transparente et reproductible, du corpus au contrôle qualité, avec le dossier complet en accès libre.
7128 réponses, 9 modèles, 12 marchés
L’étude repose sur 7128 réponses produites par 9 modèles de 4 fournisseurs (OpenAI, Anthropic, Google, Perplexity), sur 12 marchés sectoriels, collectées en mai 2026. Pour cette première étude, les modèles répondent sans accès au web, ce qui mesure ce qu’ils savent des marchés, indépendamment de la navigation.
Le dictionnaire d’entités gelé recense 2 804 organisations, dont 553 PME québécoises correspondant au profil cible de l’étude. C’est ce répertoire qui sert de référence à toutes les mesures.
Le taux de présence (presence rate)
La métrique principale est la proportion de réponses où une entreprise donnée est citée au moins une fois. Les entités sont identifiées via un dictionnaire canonique gelé, construit à partir des réponses puis figé et horodaté par empreinte SHA-256, avec des règles de correspondance strictes.
Chaque taux de présence est rapporté avec son intervalle de confiance à 95 %, de sorte qu’on distingue un écart réel d’une simple variation d’échantillon.
Deux couches de contrôle
Détection déterministe
Une première couche repère les mentions de façon automatique et reproductible, à partir du dictionnaire gelé.
Jugement calibré
Une seconde couche fait évaluer, pour chaque mention, si l’entreprise relève bien du marché et n’est pas une attribution erronée. Ce juge IA est calibré sur un échantillon codé à la main, avec un accord humain-IA de 0,86 (Gwet AC1), au-dessus du seuil fixé d’avance.
Typage vérifié et compléments
Le profil des 53 entités les plus citées (PME, groupe, multinationale) a été vérifié par recherche documentaire sourcée en juin 2026. Il en a résulté 12 corrections, par exemple des marques artisanales détenues par des multinationales. Les chiffres principaux de l’étude restent calculés sur le dictionnaire gelé pré-enregistré ; les corrections sont publiées en analyse de sensibilité. L’effet maximal est de 6,6 points (hébergement : de 46,6 % à 40,0 %) et ne change la hiérarchie d’aucun marché.
Les analyses complémentaires pré-enregistrées (indice de citation par secteur SCIAN, contrôle anti-citation, taux d’hallucination, effet de la formulation) sont déposées sur OSF avec l’étude révisée : osf.io/zj5eg.
Des standards de recherche
Pré-enregistrement
Le protocole, les hypothèses et les règles d’analyse ont été déposés avant l’analyse, ce qui empêche d’ajuster les conclusions après coup.
Relecture critique
Le dispositif a été soumis à plusieurs tours de revue adverse, sur la méthode et la littérature, et corrigé en conséquence.
Données ouvertes
Corpus, dictionnaire, scripts et résultats sont déposés publiquement sur OSF. N’importe qui peut reproduire l’analyse.
Limites assumées
Certains résultats sont présentés comme exploratoires, et chaque chiffre est rapporté avec son incertitude. On indique ce qui est solide et ce qui reste à confirmer.
Dossier complet et pré-enregistrement : osf.io/zj5eg.
On applique la même rigueur à votre diagnostic Share of Model qu’à notre recherche.
Demander un diagnostic →