Content spinning et lutte anti dopage

Rien ne vaut une bonne controverse White hat /Black hat...C'est le cas ici, et le nombre de commentaires montre que la question passionne ;)Bonne lecture !

cyclistes en pleine course Peut-on comparer la lutte de Google contre les black hat à la lutte anti dopage ?

Voici une accroche propice au buzz ! Réfléchissons donc un peu à la question...



Un sportif qui se dope se détruit lui-même, mais il oblige de plus les autres sportifs à se doper eux-mêmes, pour rester au niveau. Quelqu’un qui reste parfaitement sain a en effet très peu de chances face à des concurrents qui ont utilisé de telles substances.

C’est là le problème essentiel du dopage : le fait qu’il tend à s’imposer peu à peu aux autres, à se normaliser, à se propager, vu son efficacité.

Or ne voit-on pas la même chose dans le domaine du référencement ? Cette comparaison est-elle absurde ?

Depuis peu la multiplication des logiciels de spinning fait qu’on peut produire sans effort des centaines de textes aux phrases variant légèrement. Ces textes ne sont pas sans sens, mais ils ont souvent un style qui trahit leur origine automatique (ce sont souvent des tournures de phrase étranges, liées à l'utilisation de synonymes). Plus aucun talent de rédaction n’est demandé. Il suffit de passer au mixer d’un de ces logiciels un texte originel pour obtenir un texte contenant un lien qui va pointer vers le texte à référencer. Cela ne prend que quelques minutes, contre quelques heures pour la rédaction de vrais textes de qualité.

Ce qui fait qu’en tant que freelance seo, je m’intéresse à ce sujet, c’est que depuis quelques temps, je vois apparaître sur Google des sites concurrents sur des mots-clés essentiels à mon activité. Ceux-ci apparaissent dans les premières positions sur des mots-clés en rapport avec le référencement.

Lorsqu’on rentre sur ces sites, on voit qu’ils n’ont aucun contenu. C’est en examinant leur réseau de lien que le doute est confirmé. Leur bonne position est obtenue par leur réseau de liens : une centaine de sites qui contiennent des textes spinnés étranges.

De ce type là :

une page de content spinning

Jusqu’alors, cela ne me posait pas de problème, et je comprends l'approche black hat, qui réside dans un jeu joyeux avec l’algorithme de Google. Il y a là un côté pirate, et un côté enfant qui me séduit. Cela repose aussi sur un pragmatisme pur, qui est une position théorique que j’apprécie : ce qui importe c’est le résultat (la 1ère position sur Google), peu importe les moyens employés pour y parvenir.

Ce qui fait que je commence à m’éloigner de cette approche, c’est le succès incroyable de ces techniques, et je parle en particulier du content spinning. Je vois de plus en plus de concurrents utiliser cette technique, et sur certains mots-clés, les black hat trustent la première place. Je vois des sites vides de tout contenu (de vraies coquilles de noix) créés il y a quelques mois dépasser des sites d’une dizaine d’années, remplis de contenu de qualité, et administrés par des agences d’une quarantaine de personnes.

Inutile de signaler ces sites via un formulaire de spam : ayant testé moi-même cette solution (selon le principe justement du pragmatisme pur : ce qui compte c’est le résultat, peu importe le moyen, même s’il n’est pas très noble), j’ai pu constater qu’aucune pénalisation ne vient frapper ces sites, y compris après plusieurs mois.

Lorsque le black hat se généralise, ce n’est plus une subversion, mais cela devient une nouvelle norme. C’est le poids écrasant de cette norme qui essaie de s’imposer à moi (pour que je puisse truster les premières places, il faudrait que moi aussi j’utilise de tels logiciels) qui fait que tout d’abord je trouve cette technique moins sympathique, et ensuite que je la compare au dopage.

Evidemment, la comparaison a ses limites : le black hat ne se détruit pas, il n’y a pas mort d’homme. Mais le principe reste le même : l’efficacité actuelle du content spinning fait que les white hat sont écrasés par les black hat. Il faudrait donc devenir au minimum « grey » et utiliser, au moins dans une faible mesure, ces logiciels pour rester dans la course.

On trouve le récit d’une telle conversion sur ce site

L’auteur de ce texte au style fleuri va jusqu’à considérer (ce qui est une approche intéressante) que la rédaction de contenu ne fait pas partie du travail de référenceur, mais de celui de rédacteur. Le boulot du référenceur ce ne serait précisément autre chose qu’utiliser de tels logiciels, et de telles techniques.

D’autre part, même s’il n’y a pas mort d’homme, il y a risque de nécrose du web : comme le produit dopant tue le corps qui le reçoit, le texte spinné tue son hôte : les moteurs de recherche perdraient leur raison d’être et disparaitraient si la proportion de textes spinnés dépassaient celle des sites pertinents. Le Web 2.0 serait étouffé sous la masse infinie de ces textes "fous", comme on peut le voir ici.

Enfin le phénomène en cours se rapproche du dopage en ce sens qu’il nous oblige à prendre un risque : le jour où Google détectera mieux le content spinning, les sites de ceux qui ont utilisé ce procédé seront pénalisés. Cela génère une angoisse, analogue à celle de ceux qui se dopent (celle d’être pris ou de voir son corps affecté par ces substances).

Le sens de cet article n’est pas de critiquer l’approche black hat. Il vise à faire part du désarroi d’un référenceur, celui correspondant à la prise de conscience de l’absolue impunité actuelle des techniques de rédaction de texte automatiques. Des sites dont le positionnement repose uniquement sur des réseaux évidents de textes spinnés et signalés comme tels à Google ne sont en aucune manière sanctionnés. Ce qui fait que ces pratiques ne peuvent que se généraliser et devenir une nouvelle norme, à laquelle chacun va devoir se plier. Ce que je ne souhaite pas pour ma part.

La beauté de l’approche du pirate réside dans son jeu de cache-cache incessant avec la loi. Si la loi disparaît et qu’il devient lui-même le législateur, alors il perd ce qui faisait son charme !

Cet article aussi pour chercher des solutions que l’on pourrait mettre en œuvre pour contrer cette tendance aux réseaux de « textes fous ». Que pourraient faire les « white hat » pour piéger les « grey », tout en demeurant dans le même registre malicieux que ceux-ci ?

Telle est la question !


Note : on m'a objecté que les textes produits peuvent être d'excellente qualité, selon le temps que le référenceur aura passé à affiner ces textes, en corrigeant les tournures les plus étranges. De ce fait, ils peuvent ressembler à des textes rédigés par un vrai être humain, si le "master spin est d'excellente qualité", selon l'expression consacrée. Ainsi, le texte pris en exemple dans l'image ci-dessus est un texte spinné de mauvaise qualité.

Mais le problème ne change guère : en fait, cela signifie que le produit dopant devient indétectable donc que tout le monde doit en prendre, vu son efficacité, pour l'optimisation d'un site. De ce fait, la comparaison avec le dopage (et le fait que celui-ci s'impose à tout le monde) devient encore plus pertinente ! Enfin, ce qu'on voit, c'est qu'il est inutile de prendre le temps de rédiger des textes spinnés indétectables : un réseau de textes spinnés de très mauvaise qualité suffit à positionner un site sans contenu devant de vrais sites sans aucune pénalisation, c'était là précisément l'objet de l'article : partager cet étonnant constat.

Merci à ceux qui m'ont laissé un commentaire et qui m'ont ainsi permis de corriger cet article, entre autres des spécialistes du content spinning, Papy Spinning et Cédric d'Effi10.

Cet article vous a plu ? Découvrez-en d'autres !

Commentaires

 
#1 shelko 24-02-2012 09:40
Je pense qu'il ne faut pas généraliser sur le spinning, il y a plusieurs façons de le faire et différence évidente de résultat.Depuis quelques mois, je test le spinning pour les CP et je m'aperçois que je crée moins de DC (avec des phrases qui ont du sens) avec le spining qu'en tapant le text à la main. Mais il est vrai que je prend 3 ou 4 heures pour créer un master spin qui tient la route (gestion féminin, masculin, singulier pluriels, règles de grammaire etc...) et qui est relu avant chaque soumission, mais qui apporte quand même 2 avantage, un gain de temps (création de 30 textes (300 à 400 mots avec 30% d'unicité) en 3 ou 4 heures) et une certitude d'unicité du texte
 
 
#2 Cube @ web vendée 24-02-2012 09:46
Je crois que tu te trompe sur le spinning et que tu confonds le spinning et les splogs. Tu as certainement lu plus d'une fois des textes spinnés sans même t'en rendre compte..et le talent du rédacteur est bien toujours d'actualité, je dirais même que pour un texte qui prend 30 minutes à rédiger en version 'standalone' nécessite au moins 4 fois plus de temps pour avoir un bon masterspin.
 
 
#3 Ulrik Le Geek 24-02-2012 10:05
Bonjour !Je pense aussi que tu fais erreurs sur l'origine du problème (blak hat)En fait le spinning à du bon, le problème n'est pas là.En effet c'est quand même galère de taper 100 CdP différent quand on est en plein plan de com non ? c'est même une abération !Avant le média internet, on tapait 1 seul CdP et les relations presses faisaient le reste.Donc le problème c'est Google qui fait mal son boulo !Pour moi ça semble simple de voir un splog : Google analyse la quantité de lecteur et le taux de rebonds pour voir si la page a un intérêt ou pas !C'est vrai que c'est rageant pour rester poli de voir ces *** de concurrents devant soit avec du spinning qui veut rien dire !
 
 
#4 nike pas cher 24-02-2012 10:20
Bien effectivement cela devient fou pour exemple mon pseudo.Si vous prenez ce nom que vous testez les résultats dans google vous constaterez que les 3 premiers sites ont l'air bien vide et si vous suivez leur liens notamment avec des alertes vous vous rendrez compte qu'ils ne spinnent même pas ils scrappent et depuis plus d'un an et aucune pénalité ne les touchent.Ce qui me pose problème fondamentalemen t avec les techniques Black Hat c'est que bien souvent c'est pour ranker des sites de contrefaçons.La technique est simple ils s'achètent 300 noms de domaines, ils créent des sites presque identiques. Puis op avec un petit logiciel génération de pleins de blog automatique avec du contenu poubelle en masse, la pénalité ils s'en fichent un de domaines est black listé pas de souci y en a encore 299 autres pareil pour prendre le relais, l'utilisateur ne fait pas toujours la différence et se fait arnaquer.Dans toutes la thématique mode c'est vraiment la folie.
 
 
#5 arab seo 24-02-2012 12:52
qui dit spinning dit pas blackhat forcement, mais la façon dont vous utilisez à faire spinner le texte , y en a qui prennent vraiement leurs temps à faire des belles articles sans erreurs et sans fautes et y en a qui font les bourrins
 
 
#6 Cédric G. 24-02-2012 15:30
BonjourC'est un débat très intéressant, qui soulève non pas la question des techniques utilisées, mais ce à quoi on les voue dans leur utilisation.Je suis l'auteur d'un logiciel de content spinning tout récent, et mon idée à l'origine n'a jamais été de produit des blogs de seconde zone en masse (je n'ai que des sites au contenu très correct voire excellent, dans les thématiques que j'aborde - en toute modestie), et encore moins des splogs.L'idée est simplement de pouvoir générer (par exemple) 50 variantes d'un texte de base, qui sont toutes orthographiquem ent et grammaticalemen t correctes, en passant par exemple 3 heures à rédiger le masterspin, alors qu'une seule variante prendrait 20 à 30mn : c'est un gain de temps !
 
 
#7 Cédric G. 24-02-2012 15:32
(suite)On peut parfaitement utiliser le content spinning de manière \"white\" (je préfère le mot \"clean\", personnellement ), c\'est un outil parmi d\'autres.Dans la même optique, je vais beaucoup plus loin dans mes usages personnels puisque j\'utilise mon outil couplé à un autre (non dispo publiquement) qui me permet de générer le code afin de générer (c\'est un exemple) toutes les catégories Wordpress, avec titres et descriptions, d\'un projet que j\'ai, sans avoir à me fader 70 ou 80 fois la réécriture de chaque description.Il n\'y a strictement aucune volonté de tromper qui ou quoi que ce soit, uniquement de gagner du temps.Bien évidemment ce type de technique peut parfaitement être utilisé pour alimenter x blogs de manière automatique, avec un niveau de qualité très bas, ce que font un certain nombre de black hats peu scrupuleux sur les méthodes et la qualité...Mais je persiste à croire que le content spinning fait parti des outils destinés à gagner en productivité, plus qu\'à \"tricher\" d\'une manière ou d\'une autre : il n\'y a pas de mauvais outils, il n\'y a que de mauvais ouvriers ;)
 
 
#8 Thalamus 24-02-2012 15:56
@Cédric G : effectivement,l e débat porte non pas sur le spinning (en tant qu'adepte de la rationalisation du temps, je suis partisan de tout ce qui peut faire gagner des heures !) mais sur l'utilisation qui en est faiteEn fait, il ne s'agit même pas d'une critique du spinning sale pour splog, mais le simple chant de crépuscule d'un White Hat qui ne reconnaît pas son Google, qui semble inerte... :) au fait : j'ai agrandi la longueur des messages, merci pour ce retour
 
 
#9 oweia 25-02-2012 00:17
Ce qui est naze, c'est pas tellement le spinning, qui en soi est un gain de temps et une manière de l'optimiser, le temps, mais les autosplogs qui consistent à créer artificiellement des phrases pour créer un champs sémantique adéquat et y poser ses liens... une bonne bouillie, c'est juste laid, à limiter aux niveaux 2..
 
 
#10 nike pas cher 25-02-2012 14:59
@oweia : à clair je parle surtout de ça en faite et du scrapping pour ma par le spinning c'est comme rouler à 140 sur l'autoroute au lieu de 130.
 
 
#11 Papy Spinning 25-02-2012 16:43
Intéressant parallèle. Comme déjà dans certains commentaires il y a spinning et spinning. Celui qui est abordé ici est très différent de celui qui consiste à fournir des niveaux de lisibilité équivalents entre source et sortie. Pour ma part je tiens la responsabilité de Google en première position dans le phénomène. Après tout c'est lui qui gagne le plus d'argent avec tout ça et c'est lui veut être un monopole et c'est encore lui qui vante les qualités de son mécanisme. C'est donc son problème avant tout. Si l'algorithme n'était pas pourri, si Google faisait vraiment son travail au lieu de se concentrer sur ses résultats trimestriels, tout ceci serait éliminé depuis longtemps.
 
 
#12 French rédacteurs 27-02-2012 14:01
Pendant que tout le monde essaie de gagner du temps en utilisant des outils afin de chercher à s'aligner sur des tarifs de rédaction offshore ou complètement irresponsables, les rédacteurs SEO se mobilisent pour défendre un contenu de qualité qui vise le long terme.
 
 
#13 BeTrash 27-02-2012 14:58
Malheureusement là on parle de soupe et pas de spin. Le spin, le bon spin, tu ne le remarquerais même pas.Bonne journée.
 
 
#14 Mutuelle 27-02-2012 15:53
Si le spin avait été plus correct, tu n'aurai rien remarqué. Forcément, le bon spin de plusieurs niveau et avec un français correct coûte cher... Et il n'y a pas que les BH qui utilise le content spinning.
 
 
#15 Consultant SEO 27-02-2012 21:14
Effectivement comme le dit BeTrash ce n'est pas exactement du spin mais plutôt de la génération de texte. Alors effectivement le problème est que cette bouillie de texte générée aléatoirement par scrapping fonctionne toujours bien sur Google.Mais le content spinning bien réalisé en tout cas dans une approche grey hat (en prenant le temps de bien le paramétrer) est très intéressant par exemple pour les sites de communiqués de presse qui souvent demandent des textes originaux pour passer outre le filtre Panda.D'ailleurs certaines agences SEO ne se cache pas d'utiliser cette technique à cette fin.
 
 
#16 Soul 01-03-2012 10:30
En général la soupe c'est de l'autosplog, pas du spin, ta les gens qui savent pas spinné et les autres ou tu pense que c'est un vrai texte et c'est la tout l'art ;)
 
 
#17 Muriel 26-05-2016 17:20
Comme beaucoup l'ont écrit avant moi, du content spinning de très bonne qualité réalisé par une équipe de très bons rédacteurs, avec plusieurs phases de contrôle, c'est tellement remarquable... qu'on ne le remarque pas ! Qui plus est, c'est drôle de noter la date de cet article, qui a été publié environ 2 mois et demi avant que Google n'applique le filtre Penguin. Entretemps, Google a déposé des brevets qui indiquent à priori clairement comment son algo calcule la similarité entre des textes (simhash) et le content-spinnin g permet de contrôler jusqu'à quel niveau de similitude maximum on accepte de monter entre 2 textes d'un même lot.