Recherche Google est souvent considéré comme la porte d’accès à Internet : c’est la première étape du parcours de la plupart des gens vers l’information en ligne. Cependant, Google ne cela n’en dit pas beaucoup sur la manière dont il organise Internet, faisant de la recherche une boîte noire géante qui dicte ce que nous savons et ce que nous faisons. t. Cette semaine, une fuite de 2 500 pages , rapportée pour la première par un vétéran de l’optimisation des moteurs de recherche (SEO) Rand Fishkin, a donné au monde un aperçu du mystère de la recherche Google, vieux de 26 ans.
“Je pense que le plus important à retenir est que ce que disent les représentants publics de Google et ce que fait le moteur de recherche de Google sont deux choses différentes”, a déclaré Fishkin. dans une déclaration envoyée par courrier électronique à Gizmodo.
Ces documents donnent une vue plus détaillée de la comment la recherche Google contrôle les informations que nous consommons. une tâche passive, car des milliers de décisions éditoriales sont prises en votre nom par un groupe secret de Googleurs. Pour le référencement, une industrie qui vit et meurt à cause des algorithmes de Google, les documents divulgués sont un tremblement de terre. C’est comme si les arbitres de la NFL avaient réécrit les règles du football à mi-parcours saison, et vous le découvrez en jouant au Super Bowl.
Plusieurs experts en référencement disent à Gizmodo que la fuite répertorie 14 000 fonctionnalités de classement qui, à tout le moins, établissent un plan de la manière dont Google organise tout. sur le Web. Certains de ces facteurs incluent la détermination par Google de l’autorité d’un site Web sur un sujet donné, la taille du site Web ou le nombre de clics qu’une page Web reçoit. Google a précédemment nié qu’il utilise certaines de ces fonctionnalités de classement dans la recherche, mais l’entreprise a confirmé que ces documents sont réels, bien que, dans leur sens, ils soient imparfaits.
“Nous mettons en garde contre les hypothèses inexactes concernant la recherche basées sur des informations hors contexte, obsolètes ou incomplètes”, a déclaré un porte-parole de Google dans un communiqué. un e-mail à Gizmodo. « Nous avons partagé de nombreuses informations sur le comment la recherche fonctionne et les types de facteurs que nos systèmes pesent, pendant nous travaillons également à protéger l’intégrité de nos résultats contre toute manipulation.
En ce qui concerne la « mise en garde » de Google, la société ne confirmera pas ce qui est ou n’est pas correct dans ces documents. Google déclare que c’est incorrect. supposer qu’il s’agit d’informations complètes sur la recherche et indique à Gizmodo que donner trop d’informations pourrait permettre à de mauvais acteurs. Je ne sais pas ce qui entre dans la détermination de ces facteurs, ni quel poids la recherche Google accorde à chacun, le cas échéant.
“Nous examinons simplement différentes variables qu’ils prennent en compte”, a déclaré Mike King, un expert en référencement qui a été l’un des premiers à analysez la fuite, dans une interview avec Gizmodo.
Cette fuite a été remarquée pour la première fois par Erfan Azimi, un praticien du référencement qui a trouvé la documentation de l’API publiquement sur GitHub. On ne sait pas si ces documents ont été réellement « divulgués » ou publiés d’une manière ou d’une autre par Google dans un coin tranquille du Web, peut-être par accident. Azimi avait pour objectif de faire connaître ces documents. en les amenant à Fishkin la semaine dernière, qui a demandé à King de l’aider à leur donner un sens.
King note qu’une fonction de classement « homepagePagerankNs » suggère que la notoriété de la page d’accueil d’un site pourrait soutenir tout ce qu’il publie. Fishkin écrit que la fuite fait référence à un système appelé NavBoost, d’abord référencé par le vice-président de la recherche de Google, Pandu Nayak, dans son ministère de Justice témoignage — qui semble-t-il mesure les clics pour améliorer les classements dans la recherche GoogleDe nombreux acteurs du secteur du référencement considèrent ces documents comme une confirmation de ce que le secteur soupçonne depuis longtemps : un site Web jugé populaire par Google. peut recevoir un classement de recherche plus élevé pour une requête même même si un site moins connu peut avoir de meilleures informations.
Ces derniers mois, plusieurs petits éditeurs ont vu leur trafic de recherche Google disparaître. Lorsque Nilay Patel de The Verge a interrogé Sundar Pichai, PDG de Google, à ce sujet la semaine dernière, Pichai a dit il il n’était pas clair si c’était une tendance uniforme.« Une fonctionnalité de classement que King fait semble semble catégoriser ces petits sites uniformément.
«Ils ont une fonctionnalité appelée ‘smallPersonalSite’, et nous ne savons pas comment cela est utilisé bien sûr, mais c’est une indication que [Google] cherche à comprendre si ce sont des petits sites », a déclaré King. écrasé en ce moment, cela montre simplement que [Google] ne fait rien pour compenser ce que sont ces signaux de grandes marques.
Notamment, Pichai a mentionné plus tard dans cette interview avec The Verge qu’à d’autres moments, Google a dirigé davantage de trafic vers de petits sites. Les fonctionnalités de classement pourraient indiquer les leviers que Google peut utiliser. Alors que de plus en plus d’organisations médiatiques nationales autorisent leur contenu à apparaître sur ChatGPT, Google La recherche semble également s’orienter vers les éditeurs plus grands. D’une manière générale, ce pourrait avoir un effet d’écrasement, en compressant ce que la plupart des gens entendent dans un juste grand public. organisations médiatiques.
Les effets d’entraînement de ces fuites de documents Google ont été largement ressentis. Kristen Ruby, PDG de Ruby Media Group qui a travaillé dans le public numérique relations et SEO depuis plus de 15 ans, dit Gizmodo qu’elle a reçu un texte menaçant lundi soir : « La merde se passe avec Google demain.”
EXCLUSIVE: pic.twitter.com/rxk4KvRMQ6
— Kristen Ruby (@sparklingruby) May 28, 2024
Ruby a rapidement trouvé la fuite et a noté deux caractéristiques de classement qui lui ont marqué : “isElectionAuthority” et “isCovidLocalAuthority”. être le moyen pour Google de classer la crédibilité d’une page Web pour fournir des informations appropriées sur les élections et le COVID-19, respectivement. En 2019, Ruby a abondamment écrit à propos comment la mesure Google des pages Web dignes de confiance (que Google appelle comme MANGER, pour Expérience, Expertise, Autorité et Confiance) est intrinsèquement politique. Elle note que la mesure de ces facteurs par Google a tendance à être biaisée. lignes politiques.
« Il me semble problématique que Google ne fournisse aucun contexte sur les éléments critiques dans les données, tels que « isElectionAuthority » ou « isCovidLocalAuthority ». Comment Google définit-il une autorité dans ces domaines critiques ? » Ruby a déclaré dans une déclaration par courrier électronique. « Je ne devrais pas avoir à deviner quelle est la réponse. Google devrait être disponible et me dire quelle est la réponse.
Même si Google est une entreprise ayant un droit à l’information privée, Ruby soutient que Google a l’obligation de répondre aux questions à ce sujet. caractéristiques de classement qui façonnent le monde qui nous entoure. King et Fishkin ont également remarqué « isCovidLocalAuthority » et « isElectionAuthority » dans leurs articles sur la fuite. , tous deux soulignant l’importance des moteurs de recherche pour améliorer la qualité de l’information.
«Je pense qu’il est vraiment important qu’ils fassent preuve de ce genre de discernement en matière d’information, car qu’on le veuille ou non, Google est effectivement un public. service”, a déclaré King. “Ils me repoussent probablement en disant cela, mais nous le considérons comme la principale source de la façon dont vous accéder à des informations sur le Web.
La manière dont Google classe les informations dans ces exemples constitue un microcosme de l’ensemble de l’écosystème de recherche. Chaque jour, il y a des millions de questions. sur les informations à amplifier et les informations à faire taire. Alors que Google et plusieurs entreprises technologiques ont depuis longtemps essayé de se présenter comme des acteurs sans opinion. algorithmes, ces fonctionnalités de classement montrent que ce n’est pas tout à fait le cas. Il existe de nombreux autres exemples de fonctionnalités de classement révélées dans la fuite de 2 500 pages. .
Rechercher des réponses parmi l’algorithme de Google
Étant donné que Google ne donnera pas de détails sur ces documents, disant à Gizmodo que donner trop d’informations pourrait permettre aux mauvais acteurs de se retrouver, les experts SEO sont laissés pour compte. pour donner un sens à ce au nom de tous qui utilisent la recherche Google. Plusieurs de ces 14 000 fonctionnalités de classement identifiées au cours de la dernière semaine sont des choses que Google a explicitement affirmé ne pas avoir utilisées au fil des ans.
Dans une vidéo de 2016, un représentant de Google Search a déclaré : « Nousje n’ai pas de score d’autorité de site Web.“ Dans une interview de 2015, un autre Googleur a déclaré : ”Utiliser les clics directement dans le classement serait une erreur.« Il est difficile de donner un sens à ces commentaires maintenant, à la lumière des documents divulgués et de la réponse de Google.
“Cette réponse est un exemple parfait de la raison pour laquelle les gens n’aiment pas ou ne font pas confiance à Google”, a déclaré Fishkin. il ne résout pas la fuite, n’apporte aucune valeur et pourrait bien avoir été écrit par une IA formée sur l’entreprise la plus sans âme de la dernière décennie. messagerie. »
À l’ère des réponses IA, Ruby note que la façon dont Google classe les pages Web est plus importante que jamais. Au lieu d’une série de liens vers diverses perspectives, vous pourrez obtenir une réponse directe grâce à Les nouveaux aperçus de l’IA de Google. Cependant, nous avons vu des posts Reddit vieux de 10 ans obtenir d’étranges nombres d’autorité, demandant à certains utilisateurs de mettre coller leur pizza. La manière dont Google choisit son autorité est de plus en plus importante, car le premier résultat peut être le seul à avoir une voix à l’heure actuelle.
“Nous changeons de vitesse. Nous passons d’un système de recherche à un autre”, a déclaré Ruby. voies profondes.
En fin de compte, il est difficile de dire ce que Google fait réellement avec ces fonctionnalités de classement. Ce qui est clair, c’est que Google a créé ces classificateurs, et possède potentiellement en encore plus pour classer les sites Web sur Internet. Ces classements exigent clairement des appels au jugement, ajoutant plus de preuves que la Recherche Google est Il ne s’agit pas d’une expérience objective, mais plutôt d’une série de choix éditoriaux faits par des personnes au sein de Google.