En 2012, Google a officiellement lancé la “mise à jour de l’algorithme du webspam”, qui vise spécifiquement le spam de liens et les pratiques manipulatrices de création de liens.

L’algorithme du webspam a ensuite été connu (officiellement) sous le nom de mise à jour de l’algorithme du pingouin par le biais d’un tweet de Matt Cutts, qui était alors à la tête de l’équipe webspam de Google. Bien que Google ait officiellement nommé l’algorithme Penguin, il n’existe aucun mot officiel sur l’origine de ce nom.

Le nom de l’algorithme Panda vient de l’un des principaux ingénieurs impliqués, et il est plus que probable que Penguin provienne d’une source similaire. L’une de mes théories préférées sur le nom du Pingouin est qu’il rend hommage au Pingouin, de Batman de DC.

matt cutts qui parle de la mise a jour penguin sur twitter
matt cutts qui parle de la mise a jour penguin sur twitter

Avant l’algorithme du Pingouin, le volume des liens jouait un rôle plus important dans la détermination du score d’une page web lorsqu’elle était explorée, indexée et analysée par Google.

Cela signifie que lorsqu’il s’agissait de classer les sites web en fonction de ces scores pour les pages de résultats de recherche, certains sites web et contenus de mauvaise qualité apparaissaient dans des positions plus importantes dans les résultats de recherche organique qu’ils n’auraient dû.

Pourquoi Google Penguin était-il nécessaire ?

La guerre de Google contre la mauvaise qualité a commencé avec l’algorithme Panda, et Pingouin était une extension et un ajout à l’arsenal pour mener cette guerre.

Pingouin était la réponse de Google à la pratique croissante de manipulation des résultats de recherche (et des classements) par des techniques de construction de liens en chapeau noir. Cutts, s’exprimant lors de la conférence SMX Advanced 2012, a déclaré

Nous le considérons comme quelque chose conçu pour s’attaquer aux contenus de faible qualité. Tout a commencé avec Panda, puis nous avons remarqué qu’il y avait encore beaucoup de spam et Penguin a été conçu pour s’attaquer à ce problème.

L’objectif de l’algorithme était de mieux contrôler et de réduire l’efficacité d’un certain nombre de techniques de spamming “chapeau noir”.

Grâce à une meilleure compréhension et un meilleur traitement des types de liens que les sites web et les webmasters gagnaient, Penguin s’est efforcé de faire en sorte que les liens naturels, faisant autorité et pertinents récompensent les sites web vers lesquels ils pointent, tandis que les liens manipulateurs et spammeurs étaient déclassés.

Penguin ne s’occupe que des liens entrants d’un site. Google ne regarde que les liens pointant vers le site en question et ne regarde pas du tout les liens sortants de ce site.

Lancement initial et impact

Lorsque Pingouin a été lancé pour la première fois en avril 2012, il a touché plus de 3 % des résultats de recherche, selon les propres estimations de Google.

matt cutts qui parle de la mise a jour sur twitter
matt cutts qui parle de la mise a jour sur twitter

Penguin 2.0, la quatrième mise à jour (y compris le lancement initial) de l’algorithme a été publiée en mai 2013, et a affecté environ 2,3 % de toutes les requêtes.

Principales mises à jour et rafraîchissements de Google Penguin

Depuis son lancement en 2012, l’algorithme du Pingouin a fait l’objet d’un certain nombre de mises à jour et de rafraîchissements, ainsi que d’autres ajustements qui sont restés dans l’histoire comme des mises à jour inconnues de l’algorithme.

Google Penguin 1.1 : 26 mars 2012

Ce n’était pas une modification de l’algorithme lui-même, mais le premier rafraîchissement des données qu’il contient

En l’occurrence, les sites web qui avaient été touchés par le lancement et qui avaient pris l’initiative d’actualiser leurs profils de liens ont vu une certaine reprise, tandis que d’autres qui n’avaient pas été pris par Pingouin la première fois ont vu un impact.

Google Penguin 1.2 : 5 octobre 2012

Il s’agissait d’un nouveau rafraîchissement des données. Il a affecté les requêtes en langue anglaise, ainsi que les requêtes internationales.

matt cutts de chez google qui parle la mise a jour
matt cutts de chez google qui parle la mise a jour

Google Penguin 2.0 : 22 mai 2013

Il s’agissait d’une version plus avancée techniquement de l’algorithme du Pingouin et a modifié l’impact de l’algorithme sur les résultats de recherche.

Penguin 2.0 a eu un impact sur environ 2,3 % des requêtes en anglais, ainsi que sur les autres langues, proportionnellement.

Il s’agissait également de la première mise à jour de Penguin à aller au-delà de la page d’accueil des sites web et des pages de catégories de haut niveau pour trouver des preuves de l’existence de liens de spam dirigés vers le site web.

Google Penguin 2.1 : 4 octobre 2013

Le seul rafraîchissement de Penguin 2.0 (2.1) a eu lieu le 4 octobre de la même année. Il a touché environ 1 % des requêtes.

Bien qu’il n’y ait pas eu d’explication officielle de la part de Google, les données suggèrent que le rafraîchissement des données 2.1 a également permis d’avancer sur la profondeur avec laquelle Pingouin a regardé un site web et s’est enfoncé plus profondément et a effectué une analyse plus approfondie pour savoir si des liens spammy étaient contenus.

Google Penguin 3.0 : 17 octobre 2014

Bien que cette mise à jour ait été nommée comme une mise à jour majeure, il s’agissait en fait d’un autre rafraîchissement des données ; permettant à ceux qui avaient été touchés par les mises à jour précédentes d’émerger et de se rétablir, alors que de nombreux autres qui avaient continué à utiliser des pratiques de liens spammy, et avaient échappé au radar des impacts précédents, ont vu un impact.

Le googleur Pierre Far l’a confirmé en publiant un message sur son profil Google+ et en précisant que la mise à jour prendrait “quelques semaines” pour se déployer pleinement.

Far a également déclaré que cette mise à jour touchait moins de 1 % des requêtes de recherche en anglais.

Google Penguin 4.0 : 23 septembre 2016

Près de deux ans après le rafraîchissement de la version 3.0, la dernière mise à jour de l’algorithme de Penguin a été lancée.

Le changement le plus important de cette itération a été l’intégration de Penguin dans l’algorithme de base.

Lorsque l’algorithme se transforme pour devenir une partie du noyau, cela ne signifie pas que les fonctionnalités de l’algorithme ont changé ou pourraient changer de nouveau de façon spectaculaire. Cela signifie que c’est la perception de l’algorithme par Google qui a changé, et non l’algorithme lui-même.

Fonctionnant désormais en parallèle avec le noyau, Penguin évalue les sites web et les liens en temps réel. Cela signifie que vous pouvez voir (raisonnablement) instantanément l’impact de votre travail de création de liens ou de remédiation.

Le nouveau Pingouin ne s’est pas contenté de distribuer des pénalités basées sur les liens, mais a plutôt dévalué les liens eux-mêmes. Cela contraste avec les précédentes itérations de Penguin, où le négatif était puni.

Cela étant dit, les études et, d’après l’expérience personnelle, les sanctions algorithmiques relatives aux liens de retour existent toujours.

Les données publiées par les professionnels du référencement (par exemple, Michael Cottam), ainsi que le fait de voir les dégradations algorithmiques levées par les fichiers de désaveu après Penguin 4.0, renforcent cette croyance.

Les déclassements algorithmiques de Google Penguin

Peu après l’introduction de l’algorithme Penguin, les webmasters et les marques qui avaient utilisé des techniques de création de liens manipulatrices ou qui avaient rempli leur profil de backlink avec une quantité copieuse de liens de mauvaise qualité ont commencé à voir leur trafic et leur classement organique diminuer.

Les déclassements de Pingouin n’ont pas tous touché l’ensemble du site – certains étaient partiels et ne concernaient que certains groupes de mots-clés qui avaient été fortement spammé et trop optimisé, comme les produits clés et dans certains cas même la marque.

17 mois pour une reprise apres PENGUIN
17 mois pour une reprise apres PENGUIN

L’impact du Pingouin peut également passer d’un domaine à l’autre, de sorte que changer de domaine et rediriger l’ancien vers le nouveau peut causer plus de problèmes à long terme.

Des expériences et des recherches montrent que l’utilisation d’une redirection 301 ou 302 ne supprime pas l’effet du Pingouin. Dans le forum des webmasters de Google, John Mueller a confirmé que l’utilisation d’un méta rafraîchissement d’un domaine vers un nouveau domaine pouvait également entraîner des complications.

En général, nous recommandons de ne pas utiliser de redirections de type meta-refresh, car cela peut créer une confusion chez les utilisateurs (et les crawlers des moteurs de recherche, qui pourraient prendre cela pour une tentative de redirection).

La récupération de Google Penguin

L’outil de désaveu a été un atout pour les praticiens de l’OMR, et cela n’a pas changé même maintenant que Pingouin existe en tant que partie de l’algorithme de base.

Comme on pouvait s’y attendre, des études et des théories ont été publiées selon lesquelles le désaveu des liens n’aide en fait en rien les déclassements algorithmiques basés sur les liens et les actions manuelles, mais cette théorie a été rejetée publiquement par les représentants de Google.

Cela étant dit, Google recommande que l’outil de désaveu ne soit utilisé qu’en dernier recours pour traiter le spam de liens, car il est beaucoup plus facile (et plus rapide en termes d’effet) de désavouer un lien que de soumettre des demandes de réexamen de bons liens.

Que faut-il inclure dans un dossier de désaveu

Un fichier disavow est un fichier que vous soumettez à Google et qui leur dit d’ignorer tous les liens inclus dans le fichier afin qu’ils n’aient aucun impact sur votre site. Le résultat est que les liens négatifs n’entraîneront plus de problèmes de classement négatif de votre site, comme dans le cas de Pingouin, mais cela signifie également que si vous avez inclus par erreur des liens de haute qualité dans votre fichier disavow, ces liens ne contribueront plus à votre classement.

Vous ne devez pas inclure de notes dans votre fichier disavow, à moins qu’elles ne soient strictement pour votre référence. Il suffit d’inclure les liens et rien d’autre.

Google ne lit aucune des notes que vous avez faites dans votre fichier disavow, car il le traite automatiquement sans qu’un humain ne le lise jamais. Certains trouvent utile d’ajouter des notations internes, comme la date à laquelle un groupe d’URL a été ajouté au fichier disavow ou des commentaires sur leurs tentatives de contacter le webmaster pour obtenir la suppression d’un lien.

Une fois que vous aurez téléchargé votre fichier disavow, Google vous enverra une confirmation. Mais bien que Google le traite immédiatement, il n’écarte pas immédiatement ces liens. Vous ne vous remettrez donc pas instantanément de la simple soumission du désaveu.

Google doit encore explorer les liens individuels que vous avez inclus dans le fichier de désaveu, mais le fichier de désaveu lui-même n’incitera pas Google à explorer ces pages de manière spécifique.

De plus, il n’y a aucun moyen de déterminer quels liens ont été exclus et lesquels ne l’ont pas été, car Google inclura toujours les deux dans votre rapport de liens dans la console de recherche Google.

Si vous avez déjà soumis un fichier de désaveu à Google, celui-ci le remplacera par votre nouveau fichier, et non par un ajout. Il est donc important de s’assurer que si vous avez déjà désavoué des liens, vous les incluez quand même dans votre nouveau fichier de désaveu. Vous pouvez toujours télécharger une copie du fichier disavow actuel dans la console de recherche Google.

Désavouer les liens individuels par rapport aux domaines

It is recommended that you choose to disavow links on a domain level instead of disavowing the individual links.

There will be some cases where you will want to disavow individually specific links, such as on a major site that has a mix of quality versus paid links.

But for the majority of links, you can do a domain based disavow.

Google only needs to crawl one page on that site for that link to be discounted on your site.

Doing domain based disavows also means that you are do not have to worry about those links being indexed as www or non-www, as the domain based disavow will take this into account.

Trouver vos backlinks

Si vous pensez que votre site a été affecté par Pingouin, vous devez procéder à un audit des liens et supprimer ou désavouer les liens de mauvaise qualité ou les liens non sollicités.

La console de recherche Google comprend une liste de liens de retour pour les propriétaires de sites, mais sachez qu’elle comprend également des liens qui ne sont déjà pas suivis. Si le lien n’est pas suivi, il n’aura pas d’impact sur votre site, mais gardez à l’esprit que le site pourrait supprimer ce nofollow dans le futur sans avertissement.

Il existe également de nombreux outils tiers qui affichent des liens vers votre site, mais comme certains sites web empêchent ces robots tiers d’explorer leur site, ils ne pourront pas vous montrer tous les liens pointant vers votre site. Et si certains des sites bloquant ces robots sont des sites connus de haute qualité qui ne veulent pas gaspiller la bande passante sur ces robots, il est également utilisé par certains sites de spam pour cacher leurs liens de mauvaise qualité afin qu’ils ne soient pas signalés.

La surveillance des liens de retour est également une tâche essentielle, car il arrive que le secteur dans lequel nous travaillons ne soit pas tout à fait honnête et que des attaques SEO négatives puissent se produire. C’est alors qu’un concurrent achète des liens spammy et les dirige vers votre site.

Beaucoup utilisent le “référencement SEO négatif” comme excuse lorsque leur site se fait prendre par Google pour des liens de mauvaise qualité. Cependant, Google a déclaré qu’il était assez doué pour reconnaître ce genre de situation lorsque cela se produit, et ce n’est donc pas une chose dont la plupart des propriétaires de sites web doivent s’inquiéter.

Cela signifie également qu’il est judicieux d’utiliser de manière proactive la fonction de désaveu sans signe clair de pénalité algorithmique ou de notification d’une action manuelle.

Il est toutefois intéressant de noter qu’un sondage mené par le SEJ en septembre a révélé que 38 % des référenceurs ne désavouent jamais les liens retour. Passer en revue un profil de lien retour et examiner chaque domaine de lien pour savoir si c’est un lien que vous voulez ou non, n’est pas une tâche facile.

Sensibilisation à la suppression des liens

Google vous recommande d’essayer d’abord de contacter les sites Web et les webmasters d’où proviennent les mauvais liens et de demander leur suppression avant de commencer à les désavouer.

Certains propriétaires de sites exigent des frais pour la suppression d’un lien. Google recommande de ne jamais payer pour la suppression d’un lien. Il vous suffit d’inclure ces liens dans votre fichier de désaveu et de passer à la suppression suivante.

Si la sensibilisation est un moyen efficace de se remettre d’une sanction fondée sur un lien, elle n’est pas toujours nécessaire. L’algorithme du Pingouin prend également en compte le profil des liens dans son ensemble, ainsi que le volume de liens naturels de haute qualité par rapport au nombre de liens spammy.

Bien que dans les cas d’une pénalité partielle (ayant un impact sur des mots-clés trop optimisés), l’algorithme puisse toujours vous affecter, les éléments essentiels de la maintenance et de la surveillance des liens retour devraient vous permettre de rester couvert.

Évaluer la qualité des liens

Many have trouble when assessing link quality.

Don’t assume that because a link comes from an .edu site that it is high-quality. Plenty of students sell links from their personal websites on those .edu domains which are extremely spammy and should be disavowed. Likewise, there are plenty of hacked sites within .edu domains that have low-quality links.

Do not make judgments strictly based on the type of domain. While you can’t make automatic assumptions on .edu domains, the same applies to all TLDs and ccTLDs.

Google has confirmed that just being on a specific TLD it does not help or hurt the search rankings. But you do need to make individual assessments.

There is a long running joke about how there’s never been a quality page on a .info domain because so many spammers were using them, but in fact, there are some great quality links coming from that TLD, which shows why individual assessment of links is so important.

Méfiez-vous des liens provenant de sites présumés de haute qualité

Ne regardez pas la liste des liens et considérez automatiquement les liens de sites web spécifiques comme étant de grande qualité, sauf si vous savez que le lien très spécifique est de grande qualité. Ce n’est pas parce que vous avez un lien provenant d’un grand site web comme Huffington Post ou la BBC que cela en fait automatiquement un lien de grande qualité aux yeux de Google – si tant est qu’il y en ait un, vous devriez le remettre davantage en question.

Beaucoup de ces sites vendent également des liens, même si certains sont déguisés en publicité ou réalisés par un contributeur malhonnête qui vend des liens dans ses articles. Ces types de liens provenant de sites de haute qualité étant en fait de faible qualité, cela a été confirmé par de nombreux référenceurs qui ont reçu des actions manuelles de liens qui incluent des liens de ces sites dans les exemples de Google. Et oui, il est probable qu’ils contribuent à un problème de pingouin.

À mesure que le contenu publicitaire augmente, nous allons voir de plus en plus de liens comme ceux-ci être signalés comme étant de mauvaise qualité. Il faut toujours enquêter sur les liens, surtout si vous envisagez de n’en supprimer aucun, simplement en fonction du site d’où provient le lien.

Liens promotionnels

Comme pour les publireportages, vous devez réfléchir à tous les liens que les sites ont pu vous indiquer et qui pourraient être considérés comme des liens promotionnels. Les liens payants ne signifient pas toujours que de l’argent est échangé contre les liens.

Les liens promotionnels qui sont techniquement des liens payants aux yeux de Google sont par exemple des liens donnés en échange d’un produit gratuit à évaluer ou d’une remise sur des produits. Si ces types de liens étaient corrects il y a quelques années, ils ne doivent plus être suivis. Vous obtiendrez toujours la valeur du lien, mais au lieu d’aider au classement, ce serait par la notoriété de la marque et le trafic. Il se peut que vous ayez des liens provenant d’une campagne de promotion réalisée il y a des années qui ont maintenant un impact négatif sur un site.

Pour toutes ces raisons, il est d’une importance vitale d’évaluer individuellement chaque lien. Vous voulez supprimer les liens de mauvaise qualité parce qu’ils ont un impact sur Pingouin ou pourraient entraîner une action manuelle future. Mais vous ne voulez pas supprimer les bons liens, parce que ce sont les liens qui vous aident à vous positionner dans les résultats de recherche.

Les liens promotionnels qui ne sont pas suivis peuvent également déclencher l’action manuelle pour les liens sortants sur le site qui a placé ces liens.

Pas de récupération d’une bride pingouins en vue ?

Parfois, après que les webmasters se soient donné beaucoup de mal pour nettoyer leurs profils de liens, ils ne constatent toujours pas d’augmentation du trafic ou des classements.

Il y a plusieurs raisons possibles à cela, notamment :

  • L’augmentation initiale du trafic et du classement observée avant la pénalité algorithmique était injustifiée (et probablement à court terme) et provenait des mauvais liens de retour.
  • Lorsque les liens ont été supprimés, aucun effort n’a été fait pour obtenir de nouveaux liens de plus grande valeur.
  • Tous les liens négatifs n’ont pas été désavoués/une proportion suffisamment élevée de liens négatifs a été supprimée.
  • Le problème n’était pas lié aux liens, pour commencer.

Lorsque vous vous remettrez de Pingouin, ne vous attendez pas à ce que votre classement revienne à ce qu’il était avant Pingouin, ni à ce que le retour soit immédiat. Beaucoup trop de propriétaires de sites ont l’impression qu’ils commenceront immédiatement à se classer en tête pour leurs meilleures requêtes de recherche une fois que Pingouin sera levé.

Tout d’abord, certains des liens que vous avez désavoués ont probablement contribué à un classement artificiellement élevé, vous ne pouvez donc pas vous attendre à ce que ces classements soient aussi élevés qu’avant.

Ensuite, comme de nombreux propriétaires de sites ont du mal à évaluer la qualité des liens, certains liens de haute qualité sont inévitablement désavoués au cours du processus, des liens qui contribuaient aux meilleurs classements.

Ajoutez à cela le fait que Google modifie constamment son algorithme de classement, de sorte que des facteurs qui vous étaient bénéfiques auparavant peuvent ne plus avoir autant d’impact aujourd’hui, et vice versa.

Mythes et idées fausses sur Google Penguin

L’une des grandes qualités de l’industrie du référencement et de ses acteurs est qu’il s’agit d’une communauté très active et dynamique et que de nouvelles théories et expériences sont publiées en ligne chaque jour.

Naturellement, cela a conduit à la naissance d’un certain nombre de mythes et d’idées fausses sur les algorithmes de Google. Le pingouin n’est pas différent.

Voici quelques mythes et idées fausses sur l’algorithme de Penguin que nous avons vus au fil des ans.

Mythe : le pingouin est une pénalité

L’un des plus grands mythes concernant l’algorithme du Pingouin est que les gens l’appellent une pénalité (ou ce que Google appelle une action manuelle).

L’algorithme du Pingouin est de nature strictement algorithmique. Il ne peut pas être levé manuellement par Google.

Malgré le fait qu’un changement d’algorithme et une pénalité peuvent tous deux provoquer une forte baisse du classement des sites web, il existe des différences assez drastiques entre eux.

Une pénalité (ou action manuelle) se produit lorsqu’un membre de l’équipe de Google chargée du spam a répondu à un signalement, a mené une enquête et a ressenti le besoin d’appliquer une pénalité au domaine. Vous recevrez une notification par le biais de la console de recherche Google concernant cette action manuelle.

Lorsque vous êtes touché par une action manuelle, vous devez non seulement revoir vos backlinks et désavouer ceux qui vont à l’encontre des directives de Google, mais aussi soumettre une demande de réexamen à l’équipe Google chargée du spam.

En cas de succès, la sanction sera révoquée, et en cas d’échec, il faudra à nouveau examiner le profil du lien retour.

Un déclassement de Pingouin se fait sans aucune implication d’un membre de l’équipe Google. Tout est fait de manière algorithmique.

Auparavant, vous deviez attendre un rafraîchissement ou une mise à jour de l’algorithme, mais maintenant, Penguin fonctionne en temps réel, ce qui permet de récupérer les données beaucoup plus rapidement (si suffisamment de travail de correction a été effectué).

Mythe : Google vous avertira si Pingouin visite votre site

Un autre mythe concernant l’algorithme de Google Penguin est que vous serez averti s’il a été appliqué.

Malheureusement, ce n’est pas vrai. La console de recherche ne vous avertira pas que votre classement a chuté à cause de l’application du Pingouin.

Encore une fois, cela montre la différence entre un algorithme et une pénalité – vous seriez averti si vous étiez touché par une pénalité. Cependant, le processus de récupération de Pingouin est remarquablement similaire à celui de la récupération d’une pénalité.

Mythe : Désavouer les mauvais liens est la seule façon d’annuler un coup de pingouin
Cette tactique permettra d’éliminer une grande partie des liens de mauvaise qualité, mais elle prend beaucoup de temps et risque de gaspiller des ressources.

Google Penguin examine le pourcentage de liens de bonne qualité par rapport à ceux de nature spammeuse.

Ainsi, plutôt que de se concentrer sur la suppression manuelle de ces liens de mauvaise qualité, il peut être utile de se concentrer sur l’augmentation du nombre de liens de qualité de votre site web. Cela aura un meilleur impact sur le pourcentage pris en compte par Penguin.

Mythe : On ne peut pas se remettre de Penguin

Oui, vous pouvez vous remettre de Pingouin.

C’est possible, mais il faudra une certaine expérience pour faire face à la nature inconstante des algorithmes de Google.

La meilleure façon de se débarrasser des effets négatifs de Pingouin est d’oublier tous les liens existants sur votre site web et de commencer à obtenir des liens originaux donnés par les éditeurs.

Plus vous obtenez de liens de qualité, plus il vous sera facile de libérer votre site de l’emprise de Pingouin.