Google publie un nouvel algorithme de recherche - Arobasenet.com


Google publie un nouvel algorithme de recherche

Google Research vient de publier un document de recherche détaillant un nouvel algorithme qui propose une nouvelle façon de répondre aux requêtes.

Google publie un nouvel algorithme de recherche




Si, à l'avenir, cet algorithme était mis en place, il va modifier davantage l'influence des facteurs de classement traditionnels pour déterminer ce qui doit être classé.

À court terme, cette recherche fournit un aperçu de ce que Google veut dire quand il dit qu'une mise à jour d'algorithme a été faite pour améliorer la pertinence.

Google Research a publié un nouveau document lors de la 6ème Conférence internationale sur l'apprentissage des représentations (Sixth International Conference on Learning Representations), qui a eu lieu du 29 Avril au 3 Mai 2018.

La publication a été annoncée via Twitter. Le document est intitulé “Posez les bonnes questions: reformulation de la question active avec renforcement de l'apprentissage” (PDF).



Le document de recherche traite d'une façon de reformuler les requêtes, puis de présenter ces requêtes à un moteur de classement. Les reformulations des requêtes et les dérivés sont déjà utilisés chez Google. C'est une autre forme de cette approche.

Ce qui est nouveau, c'est qu'il s'agit d'un algorithme d'apprentissage automatique (machine learning) qui utilise l'approche d'apprentissage par renforcement (Reinforcement Learning).

En outre, l'algorithme n'a aucune connaissance de la façon dont le système de classement fonctionne. Il s'agit de poser des questions à partir d’une boîte noire d’un algorithme, pour ensuite apprendre.

Ce nouvel algorithme utilise un système d'apprentissage qui reformule la requête de l'utilisateur, en posant au moteur de classement de nombreuses questions, puis en choisissant les meilleures réponses parmi les multiples ensembles de réponses.


Fonctionnement de cet algorithme


Voici une capture d'écran d'une illustration du document de recherche qui résume comment cet algorithme d'apprentissage automatique (machine learning) fonctionne :

Image via Searchenginejournal.com


L'utilisateur pose la question.



L'algorithme d'apprentissage automatique (étiqueté comme l'Agent) reformule cette question en plusieurs autres questions, puis les soumet à l'algorithme de classement.

L'algorithme de classement renvoie des ensembles de résultats et l'Agent choisit la meilleure réponse.

Voici ce que le document de recherche énonce :

Face aux besoins complexes en matière d'information, les humains surmontent l'incertitude en reformulant des questions, en émettant des recherches multiples et en regroupant les réponses.

Inspiré par la capacité des humains à poser les bonnes questions, nous présentons un Agent qui apprend à réaliser ce processus pour l'utilisateur. L'Agent se trouve entre l'utilisateur et un système de Questions et Réponses en arrière-plan, que nous appelons ”Environnement”.

Nous appelons l'Agent AQA (Agent Questions Answering ou Agent Répondant aux Questions), car il met en œuvre une stratégie de réponse aux questions actives. AQA vise à maximiser les chances d'obtenir la bonne réponse en envoyant une question reformulée à l'Environnement.

L'Agent cherche à trouver la meilleure réponse en posant de nombreuses questions et en regroupant les éléments de preuve retournés. Les internes de l'Environnement ne sont pas disponibles pour l'Agent qui doit donc apprendre à sonder une boîte noire de manière optimale en utilisant uniquement les chaînes de questions.

Pourquoi cet algorithme importe ?


Cet algorithme est une vue dans une méthode d'apprentissage automatique appelée l'apprentissage par renforcement. Les algorithmes d'apprentissage par renforcement ont été utilisés pour apprendre à jouer au jeu de Go et peuvent jouer à des jeux vidéo comme Doom.

Cet algorithme particulier est intéressant pour le SEO, car il montre comment un autre algorithme peut se positionner entre un utilisateur et l'algorithme de classement régulier et prendre les décisions.

Ainsi, au lieu que ce soit à l'algorithme de classement de décider ce qu'il faut afficher dans les pages de résultats des moteurs de recherche pages (SERPs), cet algorithme de machine learning prend lui-même les décisions.

Ce genre de classement est le départ de la façon dont la communauté SEO croit traditionnellement que les moteurs de recherche classent les pages Web.

La compréhension traditionnelle est que les facteurs de classement comme les liens, le texte dans la balise de titre, le texte d'ancrage et d'autres facteurs de classement sont les facteurs décisifs pour ce qui est classé en première position parmi les 10 premiers résultats de recherche.

Les facteurs comme les liens sont un facteur important de classement. Mais avec ce genre d'algorithme, les liens contribuent à ce que les pages Web soient considérées pour le classement, mais ils ne sont pas le facteur décisif.

C'est le travail d'un autre algorithme qui prend ces ensembles de pages et décide quelles pages répondent mieux à la question.

N’avez-vous jamais vu une page Web avec moins de liens de classement au-dessus d'autres pages avec plus de liens ?

Il est probable qu'il existe un algorithme entre l'utilisateur et l'algorithme de classement qui décide qu'un certain type de site est une meilleure réponse.


Que faire au sujet des facteurs de référencement ?


L'algorithme de classement n'est plus le décideur de la manière dont les sites seront classés dans le Top 10.

C'est pourquoi les études sur les facteurs de classement qui rassemblent des millions de résultats de recherche peuvent ne pas être exactes. Les études des facteurs de classement présument que les facteurs de classement sont responsables des 10 premiers résultats.

Mais les facteurs de classement ne décident pas toujours qui se classe dans le Top 10. C'est pourquoi les études sur les facteurs de classement peuvent être peu fiables.

Bien que cet algorithme spécifique peut ne pas être actuellement en cours d'utilisation, il existe, selon Searchenginejournal, d'autres algorithmes déjà en place qui exécutent une fonction similaire en mettant de côté les résultats de l'algorithme de classement pour reclasser les pages de résultats en utilisant des facteurs qui ne sont pas des facteurs de classement.

Par exemple, Google a un brevet sur un moyen de reclasser les résultats de recherche appelé, “Classement des résultats de recherche” qui mentionne l'utilisation d'un moteur de modification :

Le système de recherche 114 comprend également ou peut communiquer avec un moteur de modification de score 140 qui génère des facteurs de modification qui sont appliqués par le système de recherche 114 aux scores initiaux générés par le moteur de recherche 130 pour les ressources qui correspondent à la requête 110.

Le moteur de modification de score 140 peut générer les facteurs de modification basés au moins en partie sur les données de modification qui associent un facteur de modification respectif à chacun d'un certain nombre de plusieurs groupes de ressources.

Les données de modification sont stockées dans un référentiel accessible au système, par exemple une base de données des facteurs de modification 150.




Re-classer des résultats de recherche n'est pas une nouvelle idée. Microsoft a publié un document de recherche sur le reclassement des résultats de recherche aussi loin qu’en 2005, dans un document intitulé, “Améliorer les résultats de recherche Web en utilisant le graphe d'affinité”.

L'objectif de cet algorithme était de servir plus précisément l'intention de l'utilisateur pour les requêtes de recherche vagues.

Comment cela peut affecter le référencement ?


Cela peut affecter le SEO dans l'avenir et le résultat pourrait être un accent plus fort de satisfaire l'intention des utilisateurs.

C'est le genre d'amélioration qui s'appelle améliorer la pertinence.

Ainsi, lorsque Google annonce une mise à jour de la pertinence, les réponses à la question de savoir pourquoi un site a perdu son classement sont mieux trouvées en étudiant les gagnants de la mise à jour.

Pour ces types de mises à jour, vous ne trouverez probablement pas les raisons pour les classements modifiés en regardant uniquement les sites qui ont perdu des positions dans les pages de résultats.