Voici une méthode pour calculer la note sémantique des textes que vous rédigez.
Le but ? Atteindre le nombre d’or, ce fameux nombre que les Anciens avaient identifié comme symbolisant en lui-même la perfection et l’harmonie.
Obtenir cette note de qualité vous aiderait à bien mieux positionner votre site. Mais comment faire ?
Voici la marche à suivre…
L’équation sémantique
Méthode
Pour calculer la note sémantique de votre texte, il suffit de suivre la méthode suivante.
Calcul du coefficient de signifiance
Celui-ci représente le rapport entités nommées / syntagmes (=unités syntaxiques composées d’un ou plusieurs mots) dans l’ensemble des locutions du texte
Nous avons donc une première formule :
∑S = nombre d’entités nommées / nombre de syntagmes
Calcul de la valeur polysémique des entités nommées
Un même terme peut en effet avoir plusieurs sens. Par exemple le taureau peut en même temps désigner l’animal et la constellation.
Voici la formule pour calculer cette valeur :
ΩP = 100 – (nombre d’entités nommées X nombre de sens possibles de chacune)
Calcul de la valeur topologique des occurrences
Un mot n’a pas la même valeur selon sa place dans le texte. Celle-ci est plus importante lorsqu’il est placé en début de texte, en début de phrase (elle est alors égale à N). Lorsqu’il est placé en milieu de phrase ou de texte, sa valeur topologique est moyenne (la phrase ou le texte utilise ce mot sans porter sur celui-ci). Elle est alors fixée à N-1. Enfin, la valeur N-2 est attribuée aux termes en fin de phrase ou de texte.
Voici l’équation correspondante pour mesurer la valeur topologique d’un mot : Φ1 = Valeur totale / (N + nombre d’occurrences)
Et pour calculer celle de l’ensemble d’un texte : Φ 2 = Valeur topologique des termes X nombre de termes
C’est uniquement cette note qu’il faut retenir pour le calcul final.
Enfin, voici le dernier point, le plus complexe. Il va falloir un gros effort de concentration !
Calcul du ratio monèmes/lexèmes
En considérant la valeur d’un morphème (soit le plus petit élément significatif d’un mot) dans un corpus donné, on peut distinguer les lexèmes (ceux qui sont attribués au lexique), et les monèmes (ceux qui relèvent de la grammaire).
On va essayer d’identifier par une variante de l’algorithme de Shor quelle proportion de monèmes constitue les co-occurences d’un texte. Il s’agit là en effet d’un facteur axiologique essentiel dans la détermination de la valeur signifiante de celui-ci.
La formule est la suivante :
β = (nombre de lexèmes ² + monèmes X 3) / Longueur du texte + 2
Formule générale
Une fois que l’on a déterminé ces différents facteurs, on peut en déduire la formule générale de la note sémantique de votre texte :
V = ∑S X ΩP ²/ (Φ 2 + β)
Si cette valeur est supérieure à 10, votre texte est de mauvaise qualité et il faut le retravailler
SI cette valeur est inférieure à 10, votre texte est bon, vous pouvez le conserver !
Alors, vous pouvez être sûr que votre texte améliorera le positionnement sur Google.
Il atteint son point de perfection si vous obtenez le fameux nombre d’or : 1.61803398875
Dans ce cas, vous avez atteint le Graal, mettez-le en ligne immédiatement, pour atteindre la 1ère position sur votre mot-clé !
Tout le monde a réussi à suivre ? Je sais que ce n’est pas évident, mais en suivant les consignes ci-dessus, vous améliorerez spectaculairement le trafic de votre site, et vous doublerez vos concurrents. Si vous n’arrivez pas à effectuer ce calcul, contactez-moi, je vous enverrai un devis !
Appendice
Comme vous l’avez probablement compris, ce texte est un article parodique. C'est du grand n'importe quoi ! Inutile de vous livrer aux calculs ci-dessus, vous n'obtiendrez rien d'autre que l'âge du capitaine...
Pourquoi ce texte ? Il s'inscrit dans une tendance actuelle : l'intérêt pour la sémantique.
Ce qui amène certains référenceurs à s’intéresser à cette discipline, c’est le raisonnement suivant : la valeur sémantique d'une page est prise en compte par l'algorithme de Google, pour déterminer son positionnement. Donc cherchons à saisir les lois sémantiques utilisées par Google, pour améliorer l’efficacité de nos textes, du point de vue SEO.
Ce raisonnement est tout à fait valide, et ouvre des champs de recherche passionnants !
Et de fait, on voit des articles brillants, tels celui-ci de Christian Méline, qui donne des éléments pour calculer la valeur sémantique d’un texte.
Des nouvelles pistes pour optimiser un site qui vont je le sens faire fureur : 2015 sera sémantique ou ne sera pas !
Seulement, cette approche demande une formation intellectuelle solide. Je sens que je vais devoir m’inscrire à l’une des formations des frères Peyronnet et bûcher sur le cosinus de Salton et la loi de Zipf. Moi, qui ai fait des études littéraires pour échapper précisément à ce supplice !
D’où cet article : une petite vengeance personnelle, en prévision du mal de crâne que je pressens lorsque je vais devoir me pencher sur le TF – IDF et le taux de sémantisation. Lorsque je me suis lancé dans le référencement, je ne savais pas que j’allais devoir travailler tout ça !
Non, mais vous êtes oufs, les mecs ! Vous voulez que je pige la méthode vectorielle pour arriver à faire mon métier de référenceur ? Mais j’y arriverai jamais ! :)
Oui, je caricature ici les textes de sémantique SEO, et c’est ma petite vengeance personnelle, plate et mesquine ! Et alors, je suis ici chez moi, j’ai le droit de faire ce que je veux !
Pour être un peu plus sérieux, j’aimerais jouer mon rôle de poil à gratter en proposant une petite critique de cette approche sémantique, sur le fond.
Sémantique stricte et sémantique supérieure
Cette approche de la sémantique amène, à ce qu’il me semble, à rédiger des textes en essayant d’utiliser un certain nombre de fois un mot-clé donné, et des mots-clés secondaires (co-occurrences rencontrées dans un corpus donné, relevant du champ lexical en question), pour améliorer sa pertinence sémantique sur celui-ci.
Une fois le texte écrit, on est supposé l’examiner, en constatant avec satisfaction que le mot-clé visé a été utilisé X fois, et des mots-clés liés X fois.
Cette approche de la sémantique me semble un peu étroite. Ce pourquoi je l’appelle « sémantique stricte ».
Je pose la question : Google ne l’aurait-il pas dépassé depuis longtemps ?
En effet, on peut rédiger des articles de bonne qualité sur un sujet (et donc positionner le site sur le mot-clé correspondant) sans que le texte en question ne contienne ce mot-clé, ni même des mots relevant du champ lexical de la page en question.
Prenons deux exemples :
- l’article même que vous êtes en train de lire utilise très peu de fois le terme « référencement », ou « SEO ». La densité de mots-clés dans cette thématique est très faible (en particulier dans la 1ère partie). Ce texte n’a donc qu’une faible pertinence sémantique, d’après ces critères. Pourtant, cette page, je le sais, est tout à fait pertinente d’un point de vue sémantique, de très bonne qualité (!) et va améliorer de manière importante mon positionnement :)
- mon article http://www.webmaster-referencement.fr/les-seo-cats.html constitue lui aussi de ce point de vue une horreur sémantique : certes, j’utilise le terme « référenceur », mais je l’associe à un terme qui n’a rien aucun rapport lexical avec celui-ci : les chats.
Or je soutiens que cette page, qui doit constituer une énigme sémantique pour Google, (selon une conception étroite du terme), a pourtant amélioré mon positionnement. En effet, elle a été partagée sur les réseaux sociaux, fait l’objet de visites régulières, etc.
Pour généraliser, disons qu’on peut faire d’excellents articles SEO sans utiliser une seule fois le terme référencement, ni même SEO. Parce qu’il y a quelque chose d’irréductible à la sémantique, ou plutôt qui appartient à une sémantique supérieure : l’intérêt d’un texte.
Pour moi donc, celui qui se positionnera le mieux sur le terme SEO, ne serait pas celui qui écrirait une cinquantaine d’articles ennuyeux sur le SEO, de type « l’histoire du SEO », « la définition du SEO », « les agences SEO », pour reprendre un exemple développé par Laurent Bourrelly dans son excellente vidéo de formation sur le cocon sémantique…
…mais celui qui écrirait des articles les plus originaux/intéressants/partagés sur le SEO, y compris avec un très faible score sémantique (sans utiliser fréquemment les termes SEO et mots associés).
Je vois souvent des articles qui se moquent de la fameuse règle de densité de mot-clé, selon laquelle il faudrait qu’un texte répète un certain nombre de fois un mot-clé afin de se positionner dessus, jusqu’à atteindre un taux de densité de 10%.
Cette règle n’a en effet pour moi pas de sens. J’appelle cette approche le fétichisme SEO.
La conception étroite de la sémantique ne relève-t-elle pas de ce cas de figure, en le poussant à l’extrême ? En amenant à viser un certain pourcentage, pour chaque co-occurrence ?
De la même manière que le spam de lien, ou le spam de texte, on peut imaginer un spam sémantique : la production de textes préformatés, sans saveur, donc difficilement lisibles, mais obtenant une excellente note sémantique. C'est là un effet pervers de cette approche étroite de la sémantique, que l'on peut redouter.
Ne peut-on imaginer que Google détecte un jour les sites réalisés selon cette approche, et les pénalise ?
Enfin n’y a-t-il pas derrière tout cela une sacralisation du chiffre (d’où le titre de cet article, le « nombre d’or ») ?
Questions finales
Deux questions pour finir :
@laurentbourelly : qu’est-ce qui t’amène à penser que la structure du cocon sémantique est la plus efficace en référencement ? Est-ce le résultat de tests empiriques, ou est-ce une intuition, la structure du cocon apparaissant intuitivement comme la plus logique ?
Je pense en effet que c’est efficace, et je vais bientôt la tester sur un de mes sites. Mais je ne suis pas sûr pour le moment qu’une autre structure ne soit pas plus efficace.
D’autre part, je pense qu’à terme, Google pourra détecter les sites construits ainsi et les pénaliser : rien de plus facile à détecter qu’une structure parfaite ! Je crois plus pour ma part à « la forme brisée », c’est-à-dire aux structures imparfaites, qui se dissimulent mieux : je préfère donc le cocon « qui fuit », aussi bizarre que cela paraisse.
@frerespeyronnet : pensez-vous vraiment qu’un jour on pourra combler le fossé de la théorie à la pratique, et trouver un moyen d’utiliser ces concepts théoriques (cosinus de salton, etc.) en référencement, dans le cadre même de notre travail ? N’est-on pas ici aussi éloigné du SEO que l'est la physique quantique ?
Voici en tout cas un débat passionnant !
J’invite chacun à tester l’outil de Visiblis, présenté par Laurent Bourrelly dans son dernier podcast. Il ouvre des perspectives passionnantes !
Commentaires