Soft links
Je laisse tomber cinq minutes mon travail pour exprimer, avec du retard, ce que je pense de l'annonce de l'implémentation d'une balise nofollow dans les méthodes d'indexation des principaux moteurs de recherche du web (Google, Yahoo! et MSN).
Petit rappel : Google propose depuis peu une solution pratique pour éviter le spam sur les blogs. Ces spams qui prennent la forme de faux commentaires sont chargés de liens hypertextes menant vers les sites des indélicats.
Google tient en effet compte pour son classement des pages webs du nombre de liens qui y mènent et du nombre de liens qui en sortent. Ainsi si vous insérez sur de nombreux sites web des liens dirigés vers le votre, celui-ci devrait en théorie monter dans le classement du moteur.
Pour lutter contre cela Google propose un marqueur à glisser dans le code html de ses pages pour indiquer quels liens doivent être référencés et quels liens négliger. Ainsi il suffit de "marquer" les liens dans les commentaires des blogs pour rendre inefficaces les pratiques de spam.
Cela me paraît malheureusement être un aveu d'impuissance des moteurs de recherche. C'est dire clairement que leurs systèmes de filtrage de contenu sont incapables de différencier ce type de spam d'un lien normal. C'est laisser un peu plus les internautes jouer avec le fonctionnement des moteurs. Ce sera aux internautes de faire une partie du travail de nettoyage de l'index de Google.
Déjà, à coup d'études rigoureuses du comportement de Google, les internautes bien informés piègent les spiders, leur font lire le contenu qu'ils désirent, les amènent à naviguer au milieu d'un océan de pages satellites, se les renvoient entre eux comme dans une partie de ping-pong virtuelle.
Le petit jeux du Google Bombing en est l'exemple le plus visible.
Les index des moteurs plient sous ces pressions, se déforment et Google, Yahoo! et MSN sont contraints de modifier constamment leurs algorithmes d'indexation pour éviter d'être débordés, changeant régulièrement leur vision de ce qu'est un contenu pertinent.
Google - et les autres moteurs de recherche à sa suite - est condamné à devenir plus intelligent pour pouvoir conserver des résultats de qualité. Cela veut dire pouvoir reconnaître l'importance d'un site et sa pertinence sur d'autres critères que la densité des mots clés et de son page rank.
On peut imaginer par exemple l'évaluation d'un site en partie basée sur sa qualité orthographique et grammaticale. Le bon contenu est généralement écrit sans fautes d'orthographe. Ce serait assez original, non ? ;-)
Plus sérieusement la barre google propose un système de filtrage qui ne semble pas être actuellement utilisé mais qui représente peut-être justement une des tentatives de Google pour trier autrement les sites en faisant appel aux internautes. Il s'agit de deux petites icônes représentant des smileys et qui permettent de voter pour le site visité et ainsi de désigner au moteur les sites intéressants. Ce système ne représente pas non plus la solution idéale.
La solution pour Google serait sans doute de tenir compte de façon plus poussée du sujet des pages qui proposent des liens. Au lieu de noter un lien en fonction des mots clés qu'il contient, le moteur devrait attacher une importance plus grande à la cohérence de ce lien avec le sujet de la page et même du site. Un lien qui mène vers un site de sexe n'a rien à faire sur un blog dédié à la cuisine et devrait être ignoré (et ce lien parlant de préservatif n'a rien à faire sur ce blog... a bah si en fait...).
Malheureusement les calculs informatiques nécessaires pour appliquer cette analyse aux milliards de page de l'index de Google doivent sans doute être encore trop lourds pour les serveurs du moteur.
[MAJ] Les spammeurs de commentaires semblent maintenant se tourner vers les trackbacks pour compenser les effets de la balise nofollow.



Mon blog était depuis quelques temps en sommeil. Beaucoup de travail, beaucoup d'affaires privées à régler et le c'est le blog qui trinque et s'essoufle.
