Inspiré par un texte récemment publié sur le blogue de Stéphane Guérin, j'ai décidé d'exposer mes quelques idées sur comment déterminer du contenu de qualité sur un site, sans avoir à faire voter les membres du site en question... la motivation première de cette initiative est d'arriver à créer des filtres de qualité du contenu sans avoir à forcer les gens à voter sur le contenu. C'est bien connu, le web participatif ne touche qu'une certaine partie des internautes, il ne faut pas négliger "l'apport" et la contribution des utilisateurs passifs d'un site.

On sous-estime généralement la participation passive, qui renferme des tonnes et des tonnes d'informations précieuses qui permettent de transformer un site à l'image de ses visiteurs, sans qu'ils aient à participer de manière consciente.

Je suis présentement en train de travailler à ce sujet pour mon projet geekomatik.com afin d'utiliser le plus de variables possibles pour recommander du contenu de qualité aux utilisateurs sans nécessairement avoir à les obliger à voter sur le contenu.

Voici donc mes idées sur quelles variables utiliser afin de valider la qualité du contenu de manière tout à fait transparente pour les utilisateurs, et en plus, sans avoir à les faire participer plus qu'ils ne le désirent.

1) La durée de la visite

Un des signes évidents de la qualité d'un contenu est bien entendu la durée de la visite sur une page en particulier. Si le taux de rebond est vraiment grand sur une page, il y des chances que cette page soit de moins bonne qualité qu'une autre page ou le taux de rebond est moins grand. L'idée ici est donc de trouver des corrélations entre les différentes personnes qui passent du temps sur une même page...

Si par exemple 75% des gens quittent une page en moins de 20 secondes, mais que 25% des gens restent plus d'une minute, le système de recommandation devrait pouvoir faire en sorte d'associer les membres qui sont restés sur la page, ainsi que ceux qui l'ont quitté.

2) Le taux de rebond

Le taux de rebond d'un site est un élément important. Les webmasters devraient être en mesure de trouver quelles sont les pages d'entrée de leur site qui génèrent beaucoup de rebonds, afin d'avoir des indices sur la qualité du contenu. Toutefois, il est encore plus important de savoir 'qui' quitte la page afin de trouver encore une fois des relations entre ceux qui ont quitté la page tout de suite et et ceux qui sont restés plus longtemps et qui ont lu le contenu.

Encore une fois si un certain % des utlisateurs restent généralement sur le même types de pages (même thème, même auteur, etc)  de manière constante, le système a tout intérêt à créer une connexion "de confiance" entre ces membres de manière à ce qu'ils puissent se recommander du contre entre eux sans qu'ils s'en rendent compte, de manière totalement automatique.

3) Le taux de retour

Le taux de retour est aussi une variable intéressante à analyser. L'idée est d'observer quel est le contenu qui génère le plus de retour sur le site de manière générale.

Si un texte génère un taux de retour particulièrement élevé parmi les nouveaux visiteurs du site, cela peut très certainement être interpreté comme un signe de qualité du contenu.

Le système de recommandation peut donc utiliser cette variable pour proposer à la communauté les textes qui génèrent le plus de retours sur le site, puisque grâce à ces textes, certaines personnes ont décidé qu'ils voulaient revenir voir le site.

Utiliser la participation passive

Ce genre d'associations et d'analyse du trafic du site permettra à terme de mieux recommander du contenu à chaque personne, selon ses habitudes de lecture et celles des gens qui semblent avoir les mêmes habitudes.

L'essentiel avec ce genre de solutions est de bien faire attention de ne pas tomber dans le piège de recommander du contenu selon des patterns appliqués à tous les membres. Si 25% des membres trouvent un texte intéressant, ils doivent être mis en relation entre eux afin qu'ils puissent automatiquement se recommander du contenu par la suite.

Pas parce que 75% des gens n'aiment pas un contenu, que le contenu n'est pas de bonne qualité, il n'est simplement pas de qualité pour eux. Dans l'autre sens, le contenu jugé de bonne qualité par la majorité n'est en aucun cas certain de plaire à tous les lecteurs et il serait naif de faire comme si c'était le cas.

De là à appliquer ces solutions de manière efficace, c'est toute une autre paire de manches, mais je suis prêt à essayer de relever le défi... J'invite tout ceux qui sont intéressés à travailler dans ce sens ou à donner leurs idées à participer!

J'attends vos commentaires, idées, suggestions...