Non le contenu n’est pas roi, les liens ont fait un régicide

{lang: 'fr'}

Nous allons commencer à approcher le côté obscur du référencement sur ce blog. Pourquoi? Tout simplement parce-que les malhonnêtes ont toujours une tête d’avance sur la police google. Il est donc bon d’étudier leurs techniques afin de voir les leviers sur lesquels on devrait appuyer, même sans avoir les compétences des élites du spam.
Il faut que l’on se comprenne, pour moi il n’existe pas de référenceur whitehat, c’est juste un oxymore, un peu comme un cascadeur qui ne ferait jamais de cascades, faire du référencement c’est par nature jouer sur les failles algorithmiques de google. Ensuite selon moi les utilisateurs des scripts que tout le monde possède ou pourrait acheter ne sont pas des blackhats, ce sont des personnes qui devaient passer 3 heures à rentrer les formules du devoir de physique dans leur Ti-89 au lieu de passer une heure à apprendre le cours.
Des tenants d’une facilité apparente, mais bien peu efficiente sur le long terme, car que recherche-t-on si ce n’est l’efficacité? Non ici je veux parler de ceux qui sont à la source, des développeurs géniaux, des précurseurs, des trouveurs de faille, des requins-tigre qui après s’être repus de leurs bancs de poissons-dollars, répandent leurs restes sous forme de planctons-scripts aux baleines du référencement, I.E les pseudo-blackhats ou mieux parlant, scriptkiddies.

NB : je ne nie pas que Senuke ou Xrumer utilisés intelligemment apportent de vrais résultats hein, seulement c’est juste de l’utilisation de logiciel, exactement comme le fait de télécharger un troyen et de prendre le contrôle de l’ordi d’un noob ne fera pas de moi un hacker.

Pour débuter et pour les rétifs à la langue de Shakespeare je vais vous traduire un article passionnant et riche d’enseignement twitté par RDD (vous devriez le suivre aussi 😉 ) :

Les techniques mises en avant dans cet article sont sans doute illégales, mais je ne suis pas un avocat et je ne peux pas être définitif sur ce point. Elles incluent du hacking sur des sites, en les faisant passer pour des vendeurs de vi@gr@, en baissant largement la valeur de leurs liens sortants, et éventuellement jusqu’à les faire considérer comme indésirables par google, ce qui peut risquer de diminuer un peu leur CTR…

J’ai découvert cette technique via le site d’un client, qui en apparence semblait propre, à part quand j’ai eu l’idée de regarder la version cache du site sur google, un drôle de footer m’est apparu :

Liens pour faire bander

Ce footer n’apparaît pas quand le robot de google crawle le site donc je suppose que c’est un cas de cloaking d’IP. Le plus intéressant étant qu’il semble qu’aucun des sites liés n’ait de rapports avec la vente de pilules bleues. Des sites mainstream avec un large panel de niches différentes, donc ma première pensée a été que c’était un boulot de porc concocté par une agence web peu regardante pour couler les concurrents à peu de frais. Mais quand j’ai commencé à regarder la version en cache de ces sites liés sur google, une tout autre idée a fait jour…

Regardez les différences entre la manière dont le HEADER de ces sites apparaissent quand on surfe dessus et celle dont le robot de google les voit :

Yo Google, ça va l’aveugle?

Je me suis donc demandé si ces sites étaient bien placés pour ces recherches pharmaceutiques. Presque tous l’étaient.
Regardez ces SERPs pour « vi@gr@ price ».

Ouah je me place bien sur viagra avec mon site sur le scrapbooking!

Là vient la partie intéressante, il semblerait que quelqu’un profite d’une faille de sites tournant sous Joomla, mettant des liens dans leurs footers vers d’autres sites hackés, dont le header est également cloaké pour montrer des mots-clé relatifs au vi@gr@. Mais dans quel but? Pourquoi quelqu’un voudrait envoyer des impuissants vers des sites n’ayant aucun rapport avec leurs recherches? Alors j’ai cliqué sur un de ces sites via google et voilà le site que j’ai eu :

Eureka !

Si vous allez sur le site directement en tapant son url dans la barre d’adresse voici ce que vous avez :

Han, sont forts les mecs !

Donc non seulement ils font du cloaking d’IP, mais également du cloaking de referrers et ce exclusivement pour les chers internautes venants de google.
Voici une liste partielle de ces sites, avec les titres originaux, les titres hackés, les mots-clé visés avec les ancres en footer et leurs rankings dans les SERPs :

Ca marche bien…

6 Choses que j’ai apprises des hackers de liens au vi@gr@

(nb : il y en a 10 en fait sur l’article original , j’ai reporté celles qui me semblaient les plus intéressantes 😀 )

1. Le contenu n’est pas roi

Aucun des sites que nous avons vérifié ne proposait du contenu lié au vi@gr@. Bon ok, certains étaient cloakés ce qui signifie qu’un peu de contenu « pharmaceutique » était présent , mais après avoir checké un grand nombre de ces sites hackés, ils n’étaient pas tous cloakés avec une redirection. Donc seulement les liens en footer étaient présents.
Alors comment se fait-il qu’ils étaient si bien positionnés pour ces requêtes?

Les liens. Les liens, les liens, et encore des liens. Quid d’un magnifique contenu? QUEDALLE. Des liens.

Regardons le netlinking de ces sites avec majestic :

2. Les ancres optimisées font tout le boulot

Ancres optimisées inside

Des liens sémantiquement reliés, de la même thématique, etc peuvent tout faire si vous avez accès à un système de manipulation de liens assez large.
On se moque de où ils sont placés, ou d’où ils viennent.

Avec une analyse plus poussée du profil de liens d’un de ces sites, vous pouvez voir combien la manipulation est grossière :

BOURRINAGE ENGAGED

3. Les liens en footer servent toujours

Depuis un petit moment, les référenceurs ont eu tendance à largement dévaluer l’utilité des liens en footer – bhaaa ils semblent toujours marcher…

4. Les liens en blogroll ou sur le côté également

Là encore, beaucoup parlent du peu d’intérêt des liens en blogroll dorénavant. Pas si vous bossez sur du gros volume, comme prouvé ci-dessus.

5. Le cloaking de referrers marche toujours

Le fait que le cloaking fonctionne toujours est prouvé par le fait que les sites hackés se placent bien dans google bien qu’ils proposent un contenu différents aux visiteurs provenant de google. Encore une technique de spam du passé, qui reste d’actualité …

6. Il faut mettre en place un système d’alerte

Ce qui m’a vraiment choqué est que les propriétaires des sites hackés n’avaient pas remarqué qu’ils sortaient dans google sur ces mots-clé érectiles.
En effet si vous rankez soudainement sur « vi@gra sans ordonnance » il est temps de vérifier ce qui se passe. Par contre dans le cas des redirections, parfois analytics peut ne pas enregistrer ces visites. Mais montrera certainement une montée peu naturelle de votre nombre d’impression de pages si vous êtes inscrit à Google webmaster tools.
Et ils proposent un outil de détection de malware, ce qui peut valoir le coup d’être regardé une fois de temps en temps.

Intéressant non?

Webmaster pro,vivre, et bien, de l’édition de ses sites exclusivement de 1999 à 2012. Consultant et référenceur Senior depuis 2012 après un passage en tant que Chef de Projet SEO en agence (Kelcible.fr) à Angers où j’ai pris la suite de maître Robineau.

Pour le cursus scolaire, j’ai un Bac S spé Maths(1999), un DUT informatique obtenu à l’I.U.T info de La Rochelle(1999-2001), et une Licence de Psychologie obtenue à l’UFR Sciences Humaines de Angers(2008-2011).

Me demandez pas le rapport entre les deux, si ce n’est votre serviteur qui incarne aussi l’Amour entre Tiercé (49125, France) et Abomey-Calavi (Bénin), Yes vise le grand écart ontologique !

Pour le CV amoureux, vous trouverez facilement mon 06!

Twitter Skype 

{lang: 'fr'}
More from Samuel Hounkpe

Le référencement sur Bing

{lang: 'fr'}Tweet Les choix en matière de technologie et les approches des...
Read More

41 Comments

  • Très intéressant comme article, je pense qu’il y’a plusieurs catégories de liens (niveau de confiance peut etre). J’ai un site (white hat) qui a été linké 1 fois par techcrunch.com, 2 mois après il doublé quasiment de trafic seo.
    Pour l’alerte c’est important mais dans ce cas il faut une liste incluant p0ker, cr$dits, f0re* etc.. 🙂 voir la liste complète des médocs 😉

  • Salut mister et merci pour la mention 🙂
    Tres sincèrement c’est une très bonne initiative d’avoir traduit cet article car il est vraiment très instructif, et l’analyse de l’auteur pour remonter jusqu’à la « source » est un cas d’école.
    Il y a peu de SEO qui publient ce type d’analyse et qui surtout vont au bout de leur investigation (attention ce n’est pas une remarque désobligeante). Ce que j’ai également fortement apprécié c’est que pour une fois il n’y a pas d’a priori sur de telles techniques et que le constat final n’est pas lancé au hasard sans démarches préalables.
    Cet article didactique reste pour moi un des meilleurs que j’ai pu lire durant le mois d’avril, il sera dur de faire mieux 😉
    Je me répète, mais good job pour la traduction.

  • Article très intéressant. C’est fou qu’on puisse hacker ainsi un site.
    Les liens en footer, c’est évident, peut importe où il se trouve.
    En ce qui concerne les alertes, je vois mal comment s’en rendre compte, à moins de chercher soi-même du vi@gr@…
    A-t-on alerté les sites concernés d’ailleurs?

  • Incroyable l ingeniosite de certains. Un vrai bonheur de voir une telle analyse

  • Joli travail de déconstruction de tactique black hat. L’algo de Google reposant fondamentalement sur le netlinking, il n’est pas étonnant que l’aspect rédactionnel ait été occulté et que les résultats soient quand même la.

  • C’est intéressant de voir que ces vieilles combines fonctionnent toujours… Même si je pense, qu’il parait de plus en plus difficile de passer à travers les mailles de l’immense filet de Google

  • Rhooo… c’est mal tout cela et pour le coup c’est vraiment du BH sombre et limite bourrin – quoi qu’iol en soit toute la partie reposant sur le hack d’autres sites est ill6gales et finira bien par tomber un jour.

    Bon article en tout cas

    NB – C’est encore un nouveau design ou c;est moi qui suis pas venu depuis longtemps pour spammer tes commentaires???

  • La situation que tu décris fait partie du Top 3 des causes de chute ou fluctuation du positionnement.
    C’est une excellente chose d’avoir traduit ce remarquable billet.
    Chacun devrait surveiller son serveur comme du lait sur le feu.

  • Très bon travail d’analyse ! Il est intéressant de lire des articles originaux sur le seo comme celui-ci. C’est quoi l’outil que tu as utilisé pour voir les différents backlink en fonction de l’anchor ?
    Merci,
    Robin

  • Hello,
    Très fort, même si un peut tiré par les cheveux, belle explication, le plus fort derrière cette technique est le hacking Joomla… le vrai BlackHat est aujourd’hui un bon hacker…

  • Un vrai plaisir de lire ton article et de voir avec quelle ingéniosité les black hat peuvent manipuler Google. Une belle illustration de la puissance du cloaking, sous toutes ces formes.
    Je te rejoins dans ta vision du white hat (cf début d’article) : ça n’existe pas. La simple soumission aux annuaires, c’est déjà plus ou moins contraire aux guidelines, puisque ça n’est pas « naturel ».

  • Article intéressant, merci de nous l’avoir traduis 🙂 De toute façon c’est toujours pareil, toutes les techniques BH, même les plus bourines, fonctionnaient, fonctionnent et fonctionneront encore.

    Mais clairement, au fil des années, la durée de vie de ces types de sites ira en diminuant, que ce soit à cause de l’algo GG ou le spam report… Enfin c’est mon avis.

    De nos jours, la différence entre un BH et un WH se fait juste sur la stratégie. Soit on entretient un réseau stable, soit un réseau qu’on reconstruit en partie régulièrement. La finalité est la même, ranker ^^

    @Axel Logiquement quand tu as un site, tu checkes tes stats, que ce soit tous les jours, toutes les semaines ou tous les mois, mais tu les checkes. Et une des premières choses que tu regardes en général, c’est tes différentes sources…

  • Cela fait longtemps que je n’avais pas pris autant de plaisir à lire un article de ce style. Très bien expliqué, on rentre dans une petite investigation dont le résultat est intéressant.

    J’ai toujours pensé qu’il fallait se méfier des templates « nulled » joomla ou wordpress facilement téléchargeables sur des sites louches 🙂

    Par ailleurs, même pour les templates non nulled mais gratuits, je jette toujours un coup d’oeil sur les fichiers php dont notamment le functions.php présent dans les templates wordpress qui renferme parfois des surprises non désirables !

  • 19 Avril 2011. Bien ! Voilà il est 9h56 et je me prends une belle petite frayeur, mais il vaut mieux être au courant que de choper le problème et de finir stressé à mort.

    De toute façon c’est toujours cool de faire sortir ce genre d’histoire (mais alors c’est qu’on ne se séparera jamais des méchants… ah on l’est tous! Au temps pour moi)

    Le Vi4Gr4 est un peu abusé tout de même.

  • Ce que je trouve amusant, c’est qu’il suffit de checker ses spams de blogs ou autre pour se rendre compte que les plus agressifs sont du domaine du viag.
    La technique reste viable, mais vraiment risquée je trouve.
    Perso je trouve le poids des liens trop important. Ok, c’est le principe même du web, mais cela ouvre la porte à tous les abus possibles. Et surtout cela rend le dépistage des techniques bourrines d’autant plus compliqué.

    Merci pour la traduction, et pour la découverte de ton blog 😀

  • Article très intéressant.
    A savoir maintenant si cela sera toujours possible avec l’arrivée du panda. Sachant que les BH sont en avance sur Google, je pense que c’est fort probable 😉

  • Il faut être naïf pour croire qu’il y a les whitehat d’un côte et la force obscure de l’autre. Bien sûr que ces techniques marchent encore. Mais à ce point là ? J’avoue être un peu surpris. Il faut le voir pour y croire. La supercherie est trop grossière.

  • J’ai regardé 2 fois la date de parution de cet article, car je croyais que cela pouvait être un poisson d’avril… dans le genre de celui de Sylvain chez Axenet. Je dois avouer que je suis surpris et que je vous avez piqué ma curiosité.

  • Merci pour la precision des informations. Je pensais que Google pouvait detecter le cloaking et bannir les sites facilement. Ca n’est pas le cas a ce que je vois.

    L’alerte est une bonne idee. Perso j’ai des alertes google sur mon nom de domaine. Ca marche assez bien pour les sites qui volent du contenu.

    J’aimerais savoir combien de temps ce stratageme va rester en place non detecte. As tu contacte les webmasters?

    John

  • C’est dingue ce qu’ils arrivent à faire, mais bon clairement c’est du piratage de site. En tout cas, ça met bien en valeur l’intérêt du netlinking, en footer ou pas.

  • Comme tout le monde le dit la technique est pas mal du tout. Pas facile à mettre en oeuvre car tous les référenceurs ne sont pas des hackers.

    Mais est ce que des techniques comme celle ci peuvent être pérennes à long terme ? D’ailleurs si c’est une agence ou un consultant qui fait cela je me demandais qui est responsable en cas de plainte de la part du site hacké, est ce que le client peut être mis en cause ?

  • C’est enorme quand meme. Je viens de faire la recherche sur Google pour « vi@gr@ price » et le site jynormous.com est ds le top 3. Donc Google peut a priori dire ce qu’il veut, le blackhat et les rois du linking ont de beaux jours devant eux.
    Du beau travail d’orfevre en tout les cas.

  • J’en reste bouché bée : le claoking est encore utilisé et le site est #2 sur la requête ‘vi*gr* price’. J’imagine pas le CA journalier … mais que fait Google ?

    En tout cas le BH a encore de beaux jours devant lui …

  • Excellent ton article, et oui les armes d’un {bon|bad} black hat peuvent être très puissantes et redoutables comme tu la si bien {démontré|souligné}.
    Comme dit Laurent B. on a intérêt à mettre à jour les serveurs et surveiller de prêt ses logs.
    Un petit exemple rigolo sur un ex-client/connard, regardez sur le site hxxPD\euromar.fr à la ligne 49. C’est GG webmaster tools qui m’a prévenu, et comme j’aime pas ces cons je leur mettrai pas à jour leur joomla 🙂

  • super analyse ! par contre je ne comprends pas pourquoi les hackers n’utilisent pas directement un de leurs sites ? pour pouvoir profiter de l’ancienneté d’un nom de domaine peut-être ?
    voici un autre exemple qu’on peut trouver dans les SERPS, le site http://www.2a.cci.fr/ avec la recherche c@sino en l@gne

Comments are closed.