Les moteurs génératifs brisent l’analyse Web et nuisent à leur avenir
La recherche passe des moteurs de recherche traditionnels aux moteurs génératifs, mais le trafic de bon nombre de ces sites n’est pas suivi correctement en analyse. C’est leur faute, pas la vôtre.
Je regardais notre filtre LLM dans Ahrefs Web Analytics et j’ai remarqué des moteurs génératifs courants manquants dans la liste. Ils sont dans nos filtres, mais nous ne voyons aucune donnée de leur part pour les sites.
Ce problème de trafic invisible provient de ces systèmes dépouillant la valeur de référence. J’ai d’abord remarqué ce problème avec le mode IA dans Google, mais c’est un problème courant pour les moteurs génératifs.
C’est probablement une erreur de leur part, mais dans certains cas, peut être intentionnelle. Certains de ces outils veulent probablement plus de parts de marché et ont juste fait une erreur, tandis que d’autres peuvent ne pas vouloir que vous puissiez mesurer le trafic des systèmes. Google a déclaré que les clics de la recherche sur l’IA étaient de meilleure qualité, mais nous n’avons aucun moyen de le vérifier.
Si vous avez un site Web qui envoie du trafic à d’autres sites, vous devez vouloir qu’il soit suivi correctement. Dans le cas des moteurs génératifs, j’ai averti que ces robots d’IA devaient envoyer ces informations afin de réaliser leur contrat social, où ils fournissent du trafic vers des sites Web, et les sites Web permettent à ces robots de ramper et que leurs données soient utilisées.
Il y a un coût pour les robots qui rampent vos sites Web et il y a un contrat social entre les moteurs de recherche et les propriétaires de sites Web, où les moteurs de recherche ajoutent de la valeur en envoyant du trafic de référence aux sites Web. C’est ce qui empêche la plupart des sites Web de bloquer les moteurs de recherche comme Google, même si Google semble déterminé à prendre plus de ce trafic pour eux-mêmes. Ce contrat social s’étend aux moteurs génératifs.
Je pense que de nombreux propriétaires de sites veulent laisser ces robots se renseigner sur leur marque, leur entreprise et leurs produits et offrandes. Mais alors que de nombreuses personnes parient que ces systèmes sont l’avenir, ils courent actuellement le risque de ne pas ajouter suffisamment de valeur pour les propriétaires de sites Web.
Le premier LLM à ajouter plus de valeur aux utilisateurs en affichant des impressions et des clics sur les propriétaires de sites Web auront probablement un gros avantage. Les entreprises rendront compte des mesures de ce LLM, qui augmentera probablement l’adoption et empêcheront davantage de sites Web de bloquer leur bot.
Le même sentiment est vrai pour l’attribution. Si ces moteurs génératifs souhaitent gagner des parts de marché, elles doivent être présentes dans les rapports aux entreprises. Jusqu’à présent, beaucoup ne font pas un excellent travail.
Je vérifiais la valeur de référence en tapant «Document.Referrer» dans la console Chrome Dev Tools pour voir si le référence a été passé. Si c’est le cas, il offre une valeur disant d’où elle venait, et sinon, elle est vide.
Certains des moteurs génératifs envoient les références, d’autres ne les envoient pas du tout, et certains les envoient pour certaines choses et pas d’autres. J’ai marqué ceux qui ont un avertissement d’indiquer des résultats partiels.


Un lien dans le contenu dans mon compte payant de Chatgpt a un attribut NoreFerrer sur le lien. Cela empêcherait l’envoi de la valeur de référence.


Comme prévu, aucun référence n’est indiqué dans la console Chrome Dev Tools. Il revient vide.
document.referrer
''
Dans AHREFS Web Analytics, cela est enregistré comme inconnu, mais dans Google Analytics, il serait classé comme direct. Google regroupe le trafic provenant de sources inconnues et de trafic interne de site Web ensemble comme directement, tandis que nous les séparons en inconnus et internes.
Ce qui est intéressant, c’est que lorsque j’ai regardé le même type de lien dans un compte gratuit, il n’avait pas l’attribut NoreFerrer. Il est suivi correctement.


Pour les listes de liens, ils ont également été suivis correctement.
Les liens vers des sources dans le contenu et au bas de la réponse sont également suivis correctement, et ils ajoutent également un paramètre URL « ? UTM_SOURCE = chatgpt.com » aux URL.
Recherche sur le Web
La plupart des liens en mode de recherche Web avaient le référent. J’ai rencontré un exemple intéressant lorsqu’il y a plusieurs références. Le haut avait un référer, les 2 autres ne l’ont pas fait.


Recherche en profondeur
Pour le mode DeepResearch, les liaisons à contenu ont été attribuées correctement, mais les sources à la fin ont été marquées de noreferrer.
En-têtes HTTP
Si vous regardez les en-têtes HTTP, vous trouverez parfois un En-tête de politique de références Pour spécifier quoi et combien d’informations sont passées dans le référente. Vous pouvez utiliser la barre d’outils AHREFS SEO pour afficher ces informations en accédant à l’onglet HTTP En-têtes.
Pour Chatgpt, ils ont établi une valeur de politique de référence de «stricte-original-when-cross-original». Dans ce cas, la rétrogradation de HTTPS vers HTTP abandonnerait le référence. Tous les liens vers des pages utilisant HTTP ne seraient pas correctement attribués.
La plupart des liens contextuels et cités au sein des Gémeaux avaient le référent.
Le seul cas qui n’a pas été la section des «sites Web de recherche» en mode de recherche en profondeur. Ceux-ci sont marqués comme NOREFERRER.


Mode AI
Le nouveau mode AI dans la recherche Google est également alimenté par les Gémeaux. Vous avez peut-être vu mon récent article montrant que Le mode AI est marqué de NOREFERRER.


John Mueller de Google a depuis confirmé qu’il s’agissait d’un bogue et qu’ils le corrigeront probablement.


Dans un article précédent, Louise Linehan a mentionné que nous pouvons sous-estimer le trafic d’IA. Elle a spécifiquement mentionné comment Copilot a disparu de notre système de suivi d’analyse. Depuis lors, le trafic est revenu.


Ce que je soupçonne, c’est que ces liens ont été marqués en tant que noreferrer au cours de cette période. Cela montre comment les changements de code peuvent avoir un impact sur votre suivi global.
Tout ici semblait être suivi correctement maintenant.
Ce n’est pas le cas avec Copilot dans Windows. Je n’ai trouvé aucun cas où le référent a été adopté.
Leur site Web semblait envoyer des références sur tout.
Leur application de bureau ne semble envoyer des références sur quoi que ce soit. Je n’ai pas essayé l’application mobile.
Claude semble avoir le référent pour tous les liens dans tous les domaines que j’ai testés.
Grok ne semble pas du tout transmettre le référent. J’ai essayé le Grok autonome et la version sur X.
Les recherches en profondeur et profonde normales n’ont pas réussi le référent.
Pour la recherche sur le Web, les citations individuelles ont passé le référence, mais les liens à la fin ne l’ont pas fait.
Meta Ai a passé le référente pour la version Web. Je n’ai testé cela sur aucune des plateformes de médias sociaux.
Mistral a passé le référent dans tous les cas que j’ai vérifié.
Réflexions finales
Les problèmes d’attribution ne sont pas propres aux moteurs génératifs. Beaucoup de trafic est attribué à inconnu ou direct dans vos analyses. Ce trafic est venu de quelque part.
Il y a une bonne partie du trafic de site Web qui n’est jamais enregistrée dans l’analyse en raison de la blocage des personnes qui bloquent l’analyse ou JavaScript, certains sites attendent l’acceptation des cookies avant de tirer, ou les gens quittent une page avant même que votre balise d’analyse ne tire.
L’attribution devient plus difficile chaque année. Si vous êtes un moteur génératif et que vous souhaitez vous assurer que les gens savent qu’ils tirent du trafic de vous, testez tous vos liens pour vous assurer que les données sont envoyées. Votre survie même peut dépendre de votre réputation dans la communauté marketing et de la visibilité que vous avez dans les rapports marketing.