Le Natural Language Processing c'est quoi ? - Ep. 4 - LPHS
Description
Qu’est-ce que le Natural Language Processing ? Et quel est son rapport avec le SEO ?
Le Natural Language Processing a pour objectif de permettre aux machines de comprendre le langage humain, et est notamment utilisé dans la recherche d’information. C’est une technologie utilisée par Google pour traiter, comprendre et classer le contenu des pages web, mais également les recherches des utilisateurs.
D'un point de vue historique, une théorie majeure fut développée au milieu des années 50. Il s’agit de ce que l’on appelle l’hypothèse distributionnelle. Elle pose l’idée que les mots qui se trouvent dans des contextes d’apparition proches tendent à avoir des significations similaires.
Plusieurs décennies plus tard, en 1983, Gerard Salton propose le modèle vectoriel, qui consiste à représenter des documents textuels ou des listes de mots sous la forme de vecteurs, c'est-à-dire de valeurs numériques.
Parallèlement, ce même Gérard Salton propose d’utiliser une méthode statistique de pondération, appelée TF-IDF, pour évaluer l’importance d’un terme, devenu une valeur numérique, dans un document.
A partir des années 2010, on commence à utiliser des réseaux de neurones artificielles en NLP.
En 2013, des algorithmes entraînés par des réseaux de neurones et développés par les équipes de Google ont permis de mettre au point le système Word2Vec, un algorithme de word embedding, capable d’identifier les relations entre les mots en prenant en compte le contexte dans lequel ces mots, transformés en vecteur, apparaissent.
Mais depuis 2013, Google ne cesse de repousser les frontières du traitement automatique du langage naturel. On peut citer BERT, son algorithme à l'œuvre depuis 2019 pour comprendre encore plus précisément les requêtes des utilisateurs.
Fin 2020, Google annonce que sa mise à jour “passage indexing” lui permet d’identifier un passage précis d’un contenu qui répond selon lui précisément à la requête de l’internaute. De cette manière, Google peut renvoyer à l’utilisateur un extrait d’un contenu en réponse à sa recherche, peu importe que le contenu d’ensemble de la page n’ait qu’un rapport lointain avec la demande de l’utilisateur.
On le voit, la compréhension qu'a Google de votre contenu est précise.
Les avancées en traitement automatique du langage naturel montre qu’aujourd’hui il est totalement improductif de bourrer votre contenu du mot-clé sur lequel vous souhaitez vous positionner.
De la même manière, les longs textes dilués ne servent à rien. Au contraire. Google souhaite mettre en avant des textes précis, allant à l’essentiel, clairs dans l’objectif qu’ils se donnent de répondre à telle ou telle problématique, autant dans leur globalité que dans chacune des sous-thématiques abordées. Gardez toujours à l’esprit. Ce que Google veut, c’est afficher les réponses les plus pertinentes à la requête de l’utilisateur.
Pour optimiser un contenu, il faut donc d’abord et avant tout être clair dans l’intention qu’on se donne de répondre à une problématique rencontrée par vos utilisateurs. Et plutôt que de bourrer votre page du même mot-clé sur lequel vous souhaitez vous positionner, demandez-vous plutôt quels sont les termes et les thèmes qui tournent autour et qui sont régulièrement abordés lorsqu’on parle du sujet sur lequel vous souhaitez prendre la parole. Structurez votre contenu en conséquence. Chacun des sujets connexes à votre sujet principal pourra faire l’objet d’une sous-partie ou d’un paragraphe spécifique.
Cette manière de structurer votre contenu plaira autant aux internautes qu’au moteur de recherche. Et c’est la combinaison gagnante pour vous rapprocher des premières places dans les pages de résultats de Google.
Retrouvez le podcast Qu'es
Ca faisait plusieurs mois déjà que la rumeur circulait, mais ça y est, c’est désormais officiel : le 25 juillet 2024, OpenAI a annoncé le lancement de SearchGPT, son propre moteur de recherche alimenté à l’IA générative, dont l’objectif est de fournir des réponses rapides et pertinentes aux...
Published 07/27/24
Comment réaliser un audit de maillage interne en 2024 ? J'ai récemment discuté avec un directeur d'agence qui m'a dit que le maillage interne est souvent négligé dans les audits SEO, et je suis d'accord. Actuellement, aucun outil ou consultant SEO, aussi compétent soit-il, ne propose un audit...
Published 07/16/24