L’algorithme Google RankBrain a été mis en ligne en avril 2015 mais n’a été présenté au monde entier qu’en octobre 2015 par le biais d’un article de Bloomberg. Voici comment RankBrain a été décrit à l’époque dans l’article :

“RankBrain” utilise l’intelligence artificielle pour intégrer de vastes quantités de langage écrit dans des entités mathématiques – appelées vecteurs – que l’ordinateur peut comprendre. Si RankBrain voit un mot ou une phrase qui ne lui est pas familier, la machine peut deviner quels mots ou phrases pourraient avoir une signification similaire et filtrer le résultat en conséquence, ce qui la rend plus efficace pour traiter des requêtes de recherche jamais vues”.

RankBrain est la seule intelligence artificielle (IA) en direct que Google utilise dans ses résultats de recherche. Bien que Google utilise l’apprentissage machine pour enseigner les algorithmes, l’IA n’est pas utilisée dans la nature – et pour de bonnes raisons. Si la recherche échouait, les ingénieurs de Google n’auraient aucune idée de la façon de la réparer.

RankBrain, en revanche, est utilisé pour trier les résultats de recherche en direct afin d’aider les utilisateurs à trouver la meilleure réponse à leur requête.

RankBrain comme signal de classement

RankBrain a été qualifié de troisième signal de classement le plus important de Google (derrière le contenu et les liens).

Mais RankBrain est-il vraiment un “signal de classement” ?

Pas vraiment. Du moins, pas de la manière dont nous pensons aux signaux de classement traditionnels.

RankBrain est une méthode de traitement des requêtes de recherche qui permet de déduire une “meilleure adéquation” pour les requêtes inconnues de Google.

Environ 15 % des requêtes que Google traite chaque jour sont nouvelles, c’est-à-dire que personne n’a jamais effectué de recherche en utilisant ces termes exacts auparavant.

Comment peut-il y avoir autant de requêtes inconnues ? C’est un concept difficile à comprendre.

Mais si vous pensez à toutes les différentes façons dont nous parlons d’une personne, d’un lieu ou d’une chose, vous pouvez rapidement voir comment il pourrait y avoir des millions de façons de poser ne serait-ce qu’une simple question. Ce phénomène va probablement s’étendre de façon exponentielle à mesure que la recherche vocale se développe, que les smartphones s’améliorent avec le Voice to Text et que les appareils domestiques ne prennent que la voix.

Ainsi, en termes simples, RankBrain est un algorithme de traitement qui utilise l’apprentissage automatique pour ramener la meilleure réponse à votre requête quand il n’est pas sûr de ce que cette requête “signifie”.

Au début, RankBrain n’était présent que dans un petit nombre de requêtes Google (environ 15 %). Cependant, au fil du temps, il s’est développé et est présent dans presque toutes les requêtes saisies dans Google.

Cela dit, si Google est sûr de la requête, cela signifie que RankBrain n’a que très peu d’influence. RankBrain n’est là que pour aider lorsque Google n’est pas sûr de la signification de la requête.

Que signifie pour Google le fait de “connaître” un ensemble de requêtes ?

Lorsque Google a lancé Hummingbird et est passé des “chaînes de caractères aux choses”, il est passé de l’inférence d’une correspondance à votre requête de recherche en utilisant des facteurs on-page et off-page à la compréhension des relations entre les personnes, les lieux et les choses en ensemençant l’algorithme avec des relations connues.

Au départ, cette méthode était en partie déterminée à partir d’une base de données appelée Freebase. Ensuite, Google a utilisé WikiData. Aujourd’hui, il utilise principalement l’apprentissage automatique à partir de données.

Comment cela fonctionne-t-il ?

Cela signifie qu’au lieu de déterminer votre article sur les “pommes rouges” à partir de signaux d’optimisation tels que le texte d’ancrage des liens entrants et les balises H1, il savait déjà qu’une pomme rouge était un fruit rond comestible qui se présentait sous la couleur dite rouge.

La base de données a indiqué à Google que cette chaîne était en fait une chose appelée “pomme rouge”. Ensuite, Google peut récupérer tous les meilleurs résultats de correspondance pour le terme “pomme rouge”.

Cependant, vous vouliez peut-être dire “red apple” comme dans “red apple computer”. Si Google n’est pas sûr que vous vouliez dire “apple the fruit” ou “apple the computer”, il peut vous proposer quelques résultats alternatifs dans votre jeu de requêtes.

Ainsi, au lieu de 10 résultats liés aux fruits, vous obtiendrez peut-être 8 résultats liés aux fruits et 2 aux ordinateurs, ou vice versa.

C’est ainsi que Google RankBrain fonctionne de la manière la plus élémentaire.

Quand RankBrain influence-t-il fortement le résultat d’une requête ?

RankBrain a un impact sur les requêtes dans toutes les langues et tous les pays.

Le moment où RankBrain est le plus en “jeu” est celui où la requête est unique et inconnue.

Par exemple, avant l’annonce de RankBrain, j’avais écrit un article sur quelque chose que j’observais dans mes propres recherches sur Google.

Cela a commencé lorsque je cherchais des informations sur les droits d’eau au Nevada pendant la sécheresse en Californie. (Nous partageons une rivière avec eux). Lorsque j’ai cherché les droits sur l’eau dans le comté de Clark ou à Las Vegas, il y avait beaucoup d’informations sur Google liées à ce sujet. Cependant, lorsque j’ai fait une recherche sur les droits d’eau de Mesquite NV (une ville située à 90 miles au nord), j’ai obtenu le nom de l’autorité responsable de l’eau et rien n’avait trait aux droits d’eau. Au lieu de cela, j’ai obtenu des pages sur les arbres de mesquite, le bois de mesquite, les copeaux de barbecue de mesquite, etc.

À l’époque, je ne savais pas comment ça s’appelait, juste que ça existait. Cependant, c’est ce que nous savons maintenant grâce à RankBrain, qui était pleinement opérationnel.

Pourquoi ? Parce que Google ne savait pas quelle était la relation entre le mesquite “chose ou lieu” et le droit à l’eau “chose”, il a renvoyé un “évier de cuisine” de résultats.

L’idée de l’évier de cuisine “best guess” est qu’avec le temps, Google apprendra ce qui correspondrait le mieux à cette requête.

Si vous avez fait une recherche assez longtemps, vous vous souviendrez peut-être du moment où vous avez effectué une recherche et où Google vous a montré les mots qu’il a réellement utilisés dans cette recherche (malgré ce que vous avez tapé). Ce fut le précurseur de RankBrain.

Ce que n’est pas Google RankBrain

Jusqu’à présent, nous avons parlé de RankBrain en termes généraux, non spécifiques et profanes.

Alors, que se passe-t-il vraiment en coulisses ?

RankBrain n’est pas un processeur de langage naturel, autrement connu sous le nom de PNL.

La PNL est le Saint Graal de la recherche, où un ordinateur peut décomposer des phrases complètes et comprendre l’intention de l’utilisateur à partir de la structure des phrases et de la linguistique de l’utilisateur.

Les mots infèrent un sens à d’autres mots et la PNL peut comprendre le langage de la même manière qu’un humain, bien qu’à travers un processus différent.

Bien que RankBrain soit un pas de plus vers ce but ultime, RankBrain ne peut pas déduire un sens à partir de vos recherches basées uniquement sur la langue.

RankBrain a besoin d’une base de données de relations, et de vecteurs de relations connues entre des requêtes similaires, afin de tirer une meilleure estimation. L’inférence se produit lorsque les requêtes ne sont pas comprises, mais que les résultats renvoyés sont toujours basés sur ces données.

Comment fonctionne RankBrain ?

RankBrain a utilisé une série de bases de données basées sur les personnes, les lieux et les choses (autrement appelées entités) pour lancer l’algorithme et ses processus d’apprentissage automatique.

Ces mots (requêtes) sont ensuite décomposés en vecteurs de mots à l’aide d’une formule mathématique pour donner à ces mots une “adresse”. Des mots similaires partagent des “adresses” similaires.

Lorsque Google traite une requête inconnue, il utilise ces relations mathématiques pour déterminer la meilleure adéquation à la requête et renvoie plusieurs résultats connexes.

Au fil du temps, Google affine les résultats en fonction de l’interaction des utilisateurs et de l’apprentissage machine afin d’améliorer la correspondance entre l’intention de recherche des utilisateurs et les résultats de recherche que Google renvoie.

Il est important de noter que les mots que les moteurs de recherche utilisent pour rejeter comme “et” ou “le” ne sont pas dans l’analyse de RankBrain. RankBrain est également destiné à aider à mieux comprendre les requêtes afin de fournir les meilleurs résultats de recherche, en particulier pour les requêtes orientées négativement, telles que les requêtes utilisant des mots comme “sans” ou “pas”.

Aussi, comme expliqué sur The Next Web :

RankBrain convertit le contenu textuel des requêtes de recherche en “vecteurs de mots”, également connus sous le nom de “représentations distribuées”, dont chacun a une adresse de coordonnées unique dans l’espace mathématique. Les vecteurs proches les uns des autres dans cet espace correspondent à une similarité linguistique”.

Au niveau mathématique, le processus est beaucoup plus complexe, mais au niveau de la synthèse du processus, il n’est pas trop complexe.

Les mots entrent en jeu. Les mots se voient attribuer une adresse mathématique. Les mots sont récupérés sur la base de votre requête et des mots qu’elle localise dans le vecteur “best fit”.

Ces mots “interprétations” sont utilisés pour renvoyer des résultats.

En coulisses, les données sont continuellement introduites dans le processus d’apprentissage de la machine, afin de rendre ces résultats plus pertinents la fois suivante.

Simple en surface, mais incroyablement compliqué et difficile au niveau micro.

Pouvez-vous optimiser pour RankBrain ?

Gary Illyes, de Google, nous dit que nous pouvons optimiser pour RankBrain en écrivant simplement de façon naturelle :

“Optimiser pour RankBrain est en fait super facile, et c’est quelque chose que nous disons probablement depuis 15 ans maintenant, c’est – et la recommandation est – d’écrire en langage naturel. Essayez d’écrire un contenu qui sonne humain. Si vous essayez d’écrire comme une machine, RankBrain sera confus et vous repoussera probablement. Mais si vous avez un site de contenu, essayez de lire certains de vos articles ou tout ce que vous avez écrit, et demandez aux gens si cela sonne naturel. Si cela a l’air d’une conversation, si cela ressemble à un langage naturel que nous utiliserions dans votre vie quotidienne, alors bien sûr, vous êtes optimisé pour RankBrain. Si ce n’est pas le cas, vous n’êtes pas optimisé”.

Gary Illyes

Cependant, si vous avez toujours écrit un bon contenu, vous vous demandez probablement ce que vous pouvez faire d’autre. Qu’est-ce qui peut vous donner cet “avantage” ? Comment pouvez-vous optimiser pour ce “signal de classement”.

Cette réponse à cette question n’est pas une réponse, mais une autre question :

Pourquoi voudriez-vous essayer ?

RankBrain pourrait être utile dans certains cas d’utilisation uniques. Cependant, pour la plupart des sites, le temps et l’énergie que vous utiliseriez pour essayer de vous classer pour une requête inconnue de Google (ce qui signifie que personne ne l’utilise) seraient bien mieux dépensés pour d’autres choses.

Car non seulement vous essayez d’optimiser une requête que peu de gens utilisent, mais elle est en constante évolution.

Les résultats de RankBrain sont conçus pour changer et donner de meilleurs résultats. Ainsi, optimiser pour une requête serait comme essayer de toucher une cible en mouvement – tout le temps.

Le meilleur conseil ? Suivez les conseils de la SEOARMY.

Rédigez un bon contenu.

Veillez à ce qu’il soit naturel.

Passez à autre chose.