Sélectionner une page

PageRank, l’algo de Google

par | Jan 12, 2024 | Histoire, Seo | 0 commentaires

Focus sur PageRank

L’algorithme qui a donné à Google le succès que l’on connaît aujourd’hui.

À une époque où les moteurs de recherche luttaient pour fournir des résultats pertinents et précis, l’arrivée de Google a marqué un tournant décisif. Nous allons observer l’histoire des moteurs de recherche et leur fonctionnement pour comprendre comment Google à révolutionner les moteurs de recherche du web et découvrir comment fonctionne leur célèbre algorithme. De ses origines conceptuelles, imaginées dans les couloirs de Stanford, jusqu’à son rôle actuel dans l’univers du SEO, PageRank demeure une pierre angulaire dans l’histoire du web.

Ensemble, partons pour un voyage à travers l’histoire, la technologie et l’impact du PageRank, l’innovation qui a donné à Google le succès mondial que nous connaissons aujourd’hui.

 

Histoire des moteurs de recherche

Pour bien comprendre PageRank, nous allons voyager dans le temps et examiner les premiers moteurs de recherche, comment ils ont été pensés, quelles ont été leurs limites. Nous comprendrons ainsi mieux pourquoi Google a été brillant avec PageRank.

 

La création du web

L’avènement du World Wide Web en 1989 a marqué une révolution dans la manière dont les informations sont partagées et consultées. Cependant, avec la croissance exponentielle du nombre de sites web dans les années qui ont suivi, il est rapidement devenu évident qu’un mécanisme efficace pour naviguer dans cet océan d’informations était nécessaire. C’est dans ce contexte qu’est née l’idée des moteurs de recherche. Ces outils puissants, conçus pour indexer, trier et rechercher des données sur le Web, sont devenus indispensables pour permettre aux utilisateurs de trouver l’information pertinente parmi un volume de données en constante augmentation.

Le premier moteur de recherche

Le tout premier moteur de recherche a été créé en 1987. Il s’agit d’Archie, pour “Archive”, et il porte bien son nom, car ce moteur de recherche ne consultait pas directement les sites et leur contenu, mais les noms de répertoires (dossiers) des sites sur les serveurs. En gros, si les fichiers de mon site étaient rangés dans un dossier nommé “restaurant” sur le serveur, eh bien, mon site était référencé en tant que restaurant, point barre ! C’était déjà très bien pour une première version de moteur de recherche, mais on est d’accord, c’était quand même limitant.

Capture d'écran d'une session de terminal affichant une connexion au service Archie via telnet, avec des commandes et réponses textuelles indiquant des informations sur le fichier et le serveur.

De nouvelles mécaniques de recherche

Ensuite, des moteurs de recherche sont arrivés avec des mécaniques intéressantes, comme Wandex, qui référençait les sites en fonction du nom de leurs URLs, ou encore Aliweb, qui, lui, ne scannait ni site ni dossier, mais permettait aux administrateurs de sites web de soumettre une description de leurs sites. Dans les deux cas, cela a fait avancer les mécaniques de recherche, mais cela restait encore trop limitant et permissif.

 

Si vous voulez voyager dans le web du passé, Aliweb est encore disponible ici → http://www.aliweb.com/ (vous allez tomber sur beaucoup de pages 404 😄)

Capture d'écran de la page de recherche ALIWEB, l'un des premiers moteurs de recherche sur le Web, avec un formulaire de recherche et des options de filtrage affichées dans un navigateur Web vintage.

Le premier moteur de recherche moderne

C’est WebCrawler, en 1994, qui est le premier moteur de recherche ‘moderne’, c’est-à-dire le premier à consulter le contenu des pages web pour les référencer. C’est une petite révolution. Si le créateur du site indique certaines informations sur sa page, elles pourront être tapées en mot-clé sur le moteur de recherche et trouvées par l’utilisateur. Vous connaissez tous ce principe car Google l’utilise aussi, on ne parle pas encore ici de PageRank. Par la suite, une industrialisation des moteurs a commencé, avec les plus connus tels que Lycos, AltaVista ou encore Yahoo!

Chaque nouveau moteur de recherche a apporté certaines améliorations, comme une base de données plus large ou une bande passante plus rapide.

 

Mais y’a un p’ti problème !

Un problème persiste avec ce modèle : les créateurs de site comprennent rapidement que mettre 50 fois le mot-clé ciblé sur leurs pages est bien vu par les moteurs. Donc, pour mon site de restaurant, je vais écrire 50 fois ‘restaurant’ (ça s’appelle faire du ‘keyword stuffing‘ ou bourrage de mots-clés en français) et cela va donner une pertinence à ma page pour son référencement sur ce mot-clé. Le grand perdant de l’histoire, c’est l’utilisateur, car on perd rapidement en contenu de qualité

Illustration en noir et blanc représentant le concept de 'Keyword Stuffing' avec un personnage fantaisiste entouré de mots et de phrases clés enchevêtrés dans un style de dessin doodle.

L’arrivée du sauveur !

C’est en 1998 que Google débarque avec l’idée de rendre les résultats des moteurs de recherche plus pertinents.

Inspirés par le concept académique de citation dans les articles de recherche, où un document gagne en importance et en pertinence s’il est souvent cité par d’autres, ils ont appliqué une logique similaire au classement des pages web.

L’idée est donc simple : si on prend l’exemple de la physique, beaucoup de projets citent les travaux d’Albert Einstein, c’est cela qui donne la pertinence aux travaux d’Albert Einstein.

Larry Page et Sergey Brin, les créateurs de Google, ont donc inventé un algorithme avec cette idée de fonctionnement.

Illustration colorée dans un style art doodle d'un super-héros avec le logo 'G', symbolisant le moteur de recherche Google, entouré d'icônes de technologie et de médias sociaux sur un fond rayonnant.

PageRank

Alors, comment procéder pour mettre en place ce format de pertinence sur le web ?

En utilisant les liens qui pointent vers notre site, tout simplement.

Je reprends l’exemple du site de mon restaurant : si plusieurs sites de cuisine parlent de mon restaurant et font un lien vers mon site, cela lui donne de la pertinence. Et maintenant, ayant beaucoup de pertinence car j’ai beaucoup de backlinks (liens provenant d’un autre site web qui pointent vers le vôtre), si je fais un lien vers un autre site, mon lien donnera beaucoup de pertinence.

Vous l’avez compris, ce système de backlinks, c’est un peu comme un système de vote : plus je reçois de backlinks sur mon site, plus mon site est pertinent pour le moteur de recherche, et donc mon site sera mieux référencé. C’est avantageux pour tout le monde : le moteur de recherche propose un contenu plus qualitatif et l’utilisateur trouve des résultats plus pertinents sur les mots-clés qu’il recherche. Cela incite également les créateurs de sites web à intégrer du contenu de qualité.

Représentation schématique du PageRank, avec un grand cercle bleu central connecté à trois autres cercles, un jaune et deux roses, symbolisant les liens entre les pages web pour le calcul de l'importance relative.

Comment fonctionne PageRank

La qualité du lien

On l’a vu, PageRank va utiliser le nombre de liens entrants pour donner un score à notre site. Il va également prendre en compte la qualité de ces liens. Effectivement, la valeur d’un lien d’un site fraîchement créé qui ne possède aucun backlink n’aura pas le même poids qu’un site déjà en place avec de nombreux backlinks. On appelle cela des Liens Entrants (Inbound Links).

 

Tous les liens ne se valent pas

Même si un backlink provient d’un site pertinent, si le lien est dans le pied de page du site ou dans une page de mentions légales, cela n’aura pas le même poids sur le score qu’un lien sur un article ou sur la page principale du site, par exemple. C’est un élément important à prendre en compte.

 

Pertinence Thématique

On reprend notre site de restaurant, si j’obtiens un backlink du site de Nike, cela n’aura pas un grand impact sur mon réferencement car, bien que Nike soit un énorme site sur le web, le sujet de Nike, c’est les articles de sport, et nous, la restauration. PageRank ne va pas rendre ce lien pertinent. Un bon exemple dans notre cas, si le site du guide Michelin link vers nous, on gagne des points.

 

Actualité

PageRank prend en compte la date d’un lien. Ainsi, si j’obtiens un lien d’un site très influent sur mon site, mais que ce lien date de dix ans, il pourrait avoir potentiellement moins d’impact qu’un lien plus récent provenant d’un site moins important mais plus actuel. La fraîcheur des liens est un facteur important dans l’évaluation de leur pertinence et de leur influence sur le PageRank.

 

Le comportement des utilisateurs

Un lien qui est peu cliqué peut perdre en notoriété, même s’il est situé sur un site influent. En revanche, un lien fréquemment consulté par les utilisateurs va gagner en notoriété. Cela signifie que l’engagement des utilisateurs avec un lien, mesuré par les clics, peut influencer son importance aux yeux de Google. Un lien souvent cliqué est considéré comme plus pertinent et utile, et peut donc avoir un impact plus positif sur le PageRank.

 

Les liens sortants

Notre site fait partie de la toile ! Et PageRank apprécie que nous tissions des liens avec d’autres sites pertinents par rapport à notre sujet, évidemment ! (On parle ici de Liens Sortants, ou Outbound Links) Donc intégrer des liens sortants depuis notre site est une bonne pratique (avec des liens pertinents).

 

Bien plus encore..

Le PageRank est un mécanisme complexe et nuancé qui va bien au-delà de la simple comptabilisation des liens entrants. Il évalue la qualité, la pertinence et l’actualité des liens, ainsi que l’engagement des utilisateurs et la stratégie des liens sortants. Ces facteurs ne représentent qu’une partie de l’algorithme. Le comportement des utilisateurs, les ajustements algorithmiques constants et l’intégration de nouvelles mesures de qualité sont autant d’éléments qui jouent un rôle dans la compréhension globale du PageRank. Ainsi, même si nous avons couvert des aspects cruciaux de son fonctionnement, le PageRank reste un système vaste et dynamique, dont les subtilités continuent d’évoluer avec le web lui-même. Pour maîtriser pleinement l’optimisation pour les moteurs de recherche, il est essentiel de rester informé aux changements continus de PageRank.

La performance, le format mobile, l’UX et la qualité au programme

Nous sommes maintenant d’accord sur l’importance des backlinks, qui sont la pierre angulaire de la logique de PageRank. Mais ce n’est pas le seul facteur à considérer ; il y a de nombreux autres éléments, souvent plus faciles à optimiser que les backlinks.

 

Performance

La performance de votre site est prise en compte par Google. Si le site met beaucoup de temps à charger une image, si une page est lente ou mal conçue, vous risquez de perdre des points. De cette conception découle l’UX (expérience utilisateur). Si elle est mal pensée, l’utilisateur ne restera pas sur votre site, et Google le remarquera.

 

Design

La conception de votre site doit être adaptée au responsive design, c’est-à-dire qu’elle doit s’adapter aussi bien sur un ordinateur que sur un smartphone, surtout à notre époque où la majorité des visites sur le web se font via un téléphone, et ça, Google le sait !

 

Accessible à tous

L’accessibilité est également prise en compte : la lisibilité de vos polices, le contraste de vos couleurs et de nombreux petits détails qui, mis bout à bout, améliorent votre site et, par conséquent, son référencement.

Pour finir, et c’est probablement l’un des points les plus importants puisqu’on en parle en toile de fond depuis le début de cet article, c’est la qualité du contenu de votre site web. PageRank a été créé et pensé pour mettre en avant la qualité du contenu d’une page web.

Illustration d'un designer UX au travail dans un bureau vibrant et créatif, dos à nous, face à un ordinateur avec des écrans montrant des interfaces utilisateurs. Le mur derrière lui est couvert de notes et de croquis de design, et la pièce est remplie de plantes, de livres et de fournitures de dessin.

Ne pas contrarier PageRank

S’il y a bien une chose à ne pas faire avec PageRank, c’est de le contrarier… Vous pouvez être sûr qu’une fois fait, votre site risque de finir dans les abysses du web. Pour éviter de froisser notre ami, il faut simplement éviter de tricher. Gardez en tête que Google a toujours cet objectif de fournir le résultat le plus pertinent possible à ses utilisateurs et fera tout pour éliminer le contenu de mauvaise qualité. Alors, quelles sont les mauvaises pratiques à éviter ?

 

Bourrage de mot-clés

Pour commencer, comme on l’a vu avec les anciens moteurs de recherche, le bourrage de mots-clés est une mauvaise pratique. Quand je recherche un restaurant, je ne veux pas tomber sur une page où le mot ‘restaurant’ est répété 100 fois juste pour faire plaisir au moteur de recherche. PageRank n’apprécie pas cela. Il est important de créer un contenu de qualité, centré sur la thématique du site. La plupart du temps, il suffit de rester naturel avec son sujet sans en faire trop.

 

 

Ton voisin tu ne copira pas !

Dupliquer, c’est mal. C’est du bon sens, mais si je prends un site concurrent qui fait un article sur l’histoire de PageRank et que je copie-colle le contenu ici, c’est peu recommandable et PageRank n’aime pas ça.

 

Les backlinks ca ce mérite

Obtenir des backlinks de mauvaise qualité est également à éviter. Il existe sur le web des vendeurs de liens pour optimiser votre référencement. Ne vous fiez JAMAIS à ces pratiques qui sont toxiques pour votre site.

 

S’il y a une chose à garder en tête en tant que bonne pratique, c’est d’écrire du contenu qui vise à fournir de la valeur aux lecteurs, plutôt que de simplement essayer de manipuler les algorithmes des moteurs de recherche.

Illustration en noir et blanc représentant un site web stylisé en spirale vers un vortex central, entouré par des éléments de doodle, évoquant l'idée de manipulation ou de triche avec le système de PageRank.

Comment obtenir des backlinks

Le nerf de la guerre

Les backlinks, c’est le nerf de la guerre dans le monde du référencement, tout possesseur de site souhaite avoir son site en top tendance sur Google et veut donc les meilleurs backlinks possible. Pour avoir ces backlinks, il faut que les autres parlent de vous, il faut vous faire connaître de votre thématique et de votre public, il faut communiquer sur le web (du blogging par exemple), faire du contenu sur les réseaux, vous faire connaître dans votre secteur cible. Et surtout faire de la qualité.

On devient pertinent en étant pertinent, c’est bien là la force de PageRank.

Illustration en noir et blanc dans un style doodle représentant deux personnages anthropomorphes joyeux liés par un grand maillon de chaîne, symbolisant l'obtention d'un backlink dans le contexte du SEO, entourés par des éléments d'interface web et des icônes sociales.

L’avenir de Google et son PageRank

Dans cet article, on a survolé PageRank et son histoire, on n’est pas rentré dans le détail de son évolution mais il a évidemment connu de nombreuses mises à jour depuis sa création en 1998, et ce n’est certainement pas fini.

L’émergence de l’IA va certainement bousculer certaines pratiques et en apporter de nouvelles, comme le SGE (en gros, le moteur de recherche qu’on connaît boosté à l’IA)

Plus d’info sur le sujet -> https://www.blogdumoderateur.com/sge-tout-savoir-sur-google-search-generative-experience/

Affaire à suivre !

 

Conclusion

En parcourant l’évolution de PageRank et en explorant ses mécanismes, nous avons pu comprendre pourquoi cet algorithme reste un pilier fondamental du réfrencement. PageRank, dès sa conception, a été une révolution, permettant à Google de s’établir comme le moteur de recherche dominant en fournissant des résultats pertinents et de qualité.

À travers cet article, nous avons vu que le référencement ne se limite pas aux backlinks. D’autres facteurs, comme la qualité du contenu, la performance du site, l’expérience utilisateur, et l’adaptabilité au mobile, jouent un rôle tout aussi crucial. Ces éléments, combinés, déterminent la visibilité et le succès d’un site web dans les résultats de Google.

Avec les avancées continues dans le domaine de l’intelligence artificielle et d’autres technologies émergentes, l’avenir de PageRank et du SEO est prometteur mais incertain. Les prochaines mises à jour de Google, comme l’intégration du SGE (Google Search Generative Experience), pourraient introduire de nouvelles façons de comprendre et de classer l’information sur le web.

En tant que créateurs de contenu et propriétaires de sites web, notre défi est de rester informés et adaptatifs. Nous devons continuer à produire un contenu de qualité, optimiser l’expérience utilisateur et suivre les meilleures pratiques SEO, tout en gardant un œil sur les tendances futures. En fin de compte, l’objectif de Google reste inchangé : fournir la meilleure réponse possible aux requêtes de ses utilisateurs. Et notre objectif, en tant qu’acteurs du web, est de s’assurer que nos sites et notre contenu répondent à ce critère.

 

Les Sources :

Archie : https://fr.wikipedia.org/wiki/Archie_(moteur_de_recherche)

Les premiers moteurs de recherche  : https://googlesystem.blogspot.com/2007/03/creator-of-first-web-search-engine.html

AliWeb  : https://en.wikipedia.org/wiki/ALIWEB

WebCrawler : https://fr.wikipedia.org/wiki/WebCrawler

AltaVista : https://fr.wikipedia.org/wiki/AltaVista

Yahoo! : https://fr.wikipedia.org/wiki/Yahoo!

Bourrage de mot clés : https://fr.wikipedia.org/wiki/Bourrage_de_mots-clés

Inboud/outbound links : https://backlinkworks.com/blogs/inbound-links-vs-outbound-links-understanding-the-difference/

Mauvaise pratique : https://www.semrush.com/blog/bad-seo-practices/

Futur du Seo : https://www.semrush.com/blog/future-of-seo/

PageRank : https://fr.semrush.com/blog/pagerank-google/

https://fr.wikipedia.org/wiki/PageRank

https://www.searchenginejournal.com/google-pagerank/483521/

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.