Les moteurs génératifs brisent l’analyse Web et nuisent à leur avenir


La recherche passe des moteurs de recherche traditionnels aux moteurs génératifs, mais le trafic de bon nombre de ces sites n’est pas suivi correctement en analyse. C’est leur faute, pas la vôtre.

Je regardais notre filtre LLM dans Ahrefs Web Analytics et j’ai remarqué des moteurs génératifs courants manquants dans la liste. Ils sont dans nos filtres, mais nous ne voyons aucune donnée de leur part pour les sites.

Ce problème de trafic invisible provient de ces systèmes dépouillant la valeur de référence. J’ai d’abord remarqué ce problème avec le mode IA dans Google, mais c’est un problème courant pour les moteurs génératifs.

C’est probablement une erreur de leur part, mais dans certains cas, peut être intentionnelle. Certains de ces outils veulent probablement plus de parts de marché et ont juste fait une erreur, tandis que d’autres peuvent ne pas vouloir que vous puissiez mesurer le trafic des systèmes. Google a déclaré que les clics de la recherche sur l’IA étaient de meilleure qualité, mais nous n’avons aucun moyen de le vérifier.

Si vous avez un site Web qui envoie du trafic à d’autres sites, vous devez vouloir qu’il soit suivi correctement. Dans le cas des moteurs génératifs, j’ai averti que ces robots d’IA devaient envoyer ces informations afin de réaliser leur contrat social, où ils fournissent du trafic vers des sites Web, et les sites Web permettent à ces robots de ramper et que leurs données soient utilisées.

Il y a un coût pour les robots qui rampent vos sites Web et il y a un contrat social entre les moteurs de recherche et les propriétaires de sites Web, où les moteurs de recherche ajoutent de la valeur en envoyant du trafic de référence aux sites Web. C’est ce qui empêche la plupart des sites Web de bloquer les moteurs de recherche comme Google, même si Google semble déterminé à prendre plus de ce trafic pour eux-mêmes. Ce contrat social s’étend aux moteurs génératifs.

Je pense que de nombreux propriétaires de sites veulent laisser ces robots se renseigner sur leur marque, leur entreprise et leurs produits et offrandes. Mais alors que de nombreuses personnes parient que ces systèmes sont l’avenir, ils courent actuellement le risque de ne pas ajouter suffisamment de valeur pour les propriétaires de sites Web.

Le premier LLM à ajouter plus de valeur aux utilisateurs en affichant des impressions et des clics sur les propriétaires de sites Web auront probablement un gros avantage. Les entreprises rendront compte des mesures de ce LLM, qui augmentera probablement l’adoption et empêcheront davantage de sites Web de bloquer leur bot.

Le même sentiment est vrai pour l’attribution. Si ces moteurs génératifs souhaitent gagner des parts de marché, elles doivent être présentes dans les rapports aux entreprises. Jusqu’à présent, beaucoup ne font pas un excellent travail.

Je vérifiais la valeur de référence en tapant «Document.Referrer» dans la console Chrome Dev Tools pour voir si le référence a été passé. Si c’est le cas, il offre une valeur disant d’où elle venait, et sinon, elle est vide.

Certains des moteurs génératifs envoient les références, d’autres ne les envoient pas du tout, et certains les envoient pour certaines choses et pas d’autres. J’ai marqué ceux qui ont un avertissement d’indiquer des résultats partiels.

Un lien dans le contenu dans mon compte payant de Chatgpt a un attribut NoreFerrer sur le lien. Cela empêcherait l’envoi de la valeur de référence.

Chatgpt ne transmet pas le référent sur des liens dans le contenuChatgpt ne transmet pas le référent sur des liens dans le contenu

Comme prévu, aucun référence n’est indiqué dans la console Chrome Dev Tools. Il revient vide.

document.referrer
''

Dans AHREFS Web Analytics, cela est enregistré comme inconnu, mais dans Google Analytics, il serait classé comme direct. Google regroupe le trafic provenant de sources inconnues et de trafic interne de site Web ensemble comme directement, tandis que nous les séparons en inconnus et internes.
Le trafic est traité comme inconnuLe trafic est traité comme inconnu

Ce qui est intéressant, c’est que lorsque j’ai regardé le même type de lien dans un compte gratuit, il n’avait pas l’attribut NoreFerrer. Il est suivi correctement.

Le compte gratuit a envoyé le référencierLe compte gratuit a envoyé le référencier

Pour les listes de liens, ils ont également été suivis correctement. Les listes de liens ont été suivis correctementLes listes de liens ont été suivis correctement

Les liens vers des sources dans le contenu et au bas de la réponse sont également suivis correctement, et ils ajoutent également un paramètre URL « ? UTM_SOURCE = chatgpt.com » aux URL. Les sources à la fin sont suivis correctement et ajoutent un paramètreLes sources à la fin sont suivis correctement et ajoutent un paramètre

Recherche sur le Web

La plupart des liens en mode de recherche Web avaient le référent. J’ai rencontré un exemple intéressant lorsqu’il y a plusieurs références. Le haut avait un référer, les 2 autres ne l’ont pas fait.

Références mixtes en mode de recherche WebRéférences mixtes en mode de recherche Web

Recherche en profondeur

Pour le mode DeepResearch, les liaisons à contenu ont été attribuées correctement, mais les sources à la fin ont été marquées de noreferrer.

En-têtes HTTP

Si vous regardez les en-têtes HTTP, vous trouverez parfois un En-tête de politique de références Pour spécifier quoi et combien d’informations sont passées dans le référente. Vous pouvez utiliser la barre d’outils AHREFS SEO pour afficher ces informations en accédant à l’onglet HTTP En-têtes.

La politique de référence peut être vérifiée dans les en-têtes HTTP avec la barre d'outils AHREFS SEOLa politique de référence peut être vérifiée dans les en-têtes HTTP avec la barre d'outils AHREFS SEO
Pour Chatgpt, ils ont établi une valeur de politique de référence de «stricte-original-when-cross-original». Dans ce cas, la rétrogradation de HTTPS vers HTTP abandonnerait le référence. Tous les liens vers des pages utilisant HTTP ne seraient pas correctement attribués.

La plupart des liens contextuels et cités au sein des Gémeaux avaient le référent.

Le seul cas qui n’a pas été la section des «sites Web de recherche» en mode de recherche en profondeur. Ceux-ci sont marqués comme NOREFERRER.

La recherche sur les sites Web dans Gemini Deep Research ne passe pas le référentLa recherche sur les sites Web dans Gemini Deep Research ne passe pas le référent

Mode AI

Le nouveau mode AI dans la recherche Google est également alimenté par les Gémeaux. Vous avez peut-être vu mon récent article montrant que Le mode AI est marqué de NOREFERRER.

Le mode Google AI ne passe pas le référentLe mode Google AI ne passe pas le référent

John Mueller de Google a depuis confirmé qu’il s’agissait d’un bogue et qu’ils le corrigeront probablement.

John Mueller dit que le mode AI ne passant pas le référent est un bugJohn Mueller dit que le mode AI ne passant pas le référent est un bug

Dans un article précédent, Louise Linehan a mentionné que nous pouvons sous-estimer le trafic d’IA. Elle a spécifiquement mentionné comment Copilot a disparu de notre système de suivi d’analyse. Depuis lors, le trafic est revenu.

Les références de copilote ont disparu pendant quelques moisLes références de copilote ont disparu pendant quelques mois

Ce que je soupçonne, c’est que ces liens ont été marqués en tant que noreferrer au cours de cette période. Cela montre comment les changements de code peuvent avoir un impact sur votre suivi global.

Tout ici semblait être suivi correctement maintenant.

Ce n’est pas le cas avec Copilot dans Windows. Je n’ai trouvé aucun cas où le référent a été adopté.

Leur site Web semblait envoyer des références sur tout.

Leur application de bureau ne semble envoyer des références sur quoi que ce soit. Je n’ai pas essayé l’application mobile.

Claude semble avoir le référent pour tous les liens dans tous les domaines que j’ai testés.

Grok ne semble pas du tout transmettre le référent. J’ai essayé le Grok autonome et la version sur X.

Les recherches en profondeur et profonde normales n’ont pas réussi le référent.

Pour la recherche sur le Web, les citations individuelles ont passé le référence, mais les liens à la fin ne l’ont pas fait.

Meta Ai a passé le référente pour la version Web. Je n’ai testé cela sur aucune des plateformes de médias sociaux.

Mistral a passé le référent dans tous les cas que j’ai vérifié.

Réflexions finales

Les problèmes d’attribution ne sont pas propres aux moteurs génératifs. Beaucoup de trafic est attribué à inconnu ou direct dans vos analyses. Ce trafic est venu de quelque part.

Il y a une bonne partie du trafic de site Web qui n’est jamais enregistrée dans l’analyse en raison de la blocage des personnes qui bloquent l’analyse ou JavaScript, certains sites attendent l’acceptation des cookies avant de tirer, ou les gens quittent une page avant même que votre balise d’analyse ne tire.

L’attribution devient plus difficile chaque année. Si vous êtes un moteur génératif et que vous souhaitez vous assurer que les gens savent qu’ils tirent du trafic de vous, testez tous vos liens pour vous assurer que les données sont envoyées. Votre survie même peut dépendre de votre réputation dans la communauté marketing et de la visibilité que vous avez dans les rapports marketing.

Si vous avez des questions, posez-moi sur Liendin ou X.