Problématique de veille: les liens du web social
Par kamablog le mardi, septembre 1 2009, 11:11 - General - Lien permanent
Le lien hypertexte est un élément constitutif du web social: il permet de lier les espaces, de diffuser du contenu stocké en ligne, de transmettre les informations, etc.

Depuis internet, et surtout depuis le web social, tout le monde peut créer des liens hypertextes. La structure d'un lien hypertexte a été (autrefois) plus ou moins implicitement normée par les professionnels d'internet et de la documentation: le lien hypertexte idéal doit porter le nom de l'élément vers lequel il pointe.
Mais depuis le web social, il faut dire que les internautes se soucient peu de savoir quelle est la forme la plus intelligible pour le lecteur d'un lien hypertexte.
Les liens hypertextes sont donc passé d'"éléments" intelligibles" à "éléments lyriques ", sans pour autant modifier leur fonction première: illustrer un propos avec une page web déjà existante.
Il y a, dans cette transformation du lien hypertexte, un enjeu majeur pour la veille, car s'ouvre une nouvelle problématique pour la recherche et la détection des informations.
La disparition des mots clés dans les textes.
En surface, il est courant de voir les internautes se passer de l'écriture de l'élément pointé: l'internaute use facilement des mots "de substitution" pour pointer vers des éléments illustrant son propos. > Par exemple, il est courant de lire "comme je l'ai dit là, là et là", ou "pour plus d'information, lisez ceci".
Dans ce cas, nous nous savons pas, en lisant le texte, vers quelle information l'auteur nous dirige. Lorsque nous lisons en ligne, il est facile de pointer la souris pour prendre connaissance de l'URL du lien, et en déduire la teneur en information. Mais lorsque nous lisons le texte imprimé, il n'est pas possible de avoir de quoi il retourne. Les liens, et donc le texte également, perdent en pertinence.
En terme de recherche et détection d'information, le lien, utilisé de cette façon, est une problématique à lui seul: les moteurs de recherche se basant principalement sur des mots clés, les substitutifs ne peuvent être repérés.

par exemple, "en lisant ceci, je me suis dit que c'était une très bonne idée, et que j'allais faire de même. En fouillant sur le web, j'ai trouvé des initiatives que j'ai apprécié, et
que je n'ai pas apprécié" Etc.
Dans ce cas là, l'auteur ne cite à aucun moment le nom de l'initiative, ni le domaine d'application (et imaginons en plus, un titre insignifiant ou un titre jeu-de mots). Il est impossible pour le moteur de recherche, de détecter ce texte. de plus, cet internaute émet un jugement clair entre entre les éléments qu'il a apprécié, et les autres qu'il a peu apprécié. Nous sommes totalement dans l'analyse des opinions en ligne.
Les veilleurs doivent donc passer par certains subterfuges, comme les recherche avancées des moteurs, les recherches de mots clés dans les liens hypertextes, les recherches de connexions des liens, les recherches sémantiques dans les liens, pour détecter ces éléments.
***
Nouveau mode de linking: le service de tinyurl.
La recherche des mots clés dans les liens est depuis l'arrivée des Tinyurl, est devenue inefficace. Les tinyurl sont des "petites url", des sortes d'url de substitution, générées automatiquement, pointant vers un lien (donc une page). Les tinyurl comportent de nombreux avantages, comme la faculté de se diffuser facilement, notamment sur Twitter, qui ne propose que 140 caractères pour s'exprimer.
Avec les tinyURL, la difficulté de détection des liens s'est corsée. Avec des tinyURL, les veilleurs ne peuvent mettre en place les éléments de recherche décrits ci dessus: les url, n'offrent plus de mots clés, ni aucun élément intelligible dans de l'url. L'autre difficulté des tinyurl, est leur usage unique. Une URL peut donc avoir plusieurs TinyURL.
Les tinyurl étaient souvent utilisés pour les services de microblogging, compte tenu de manque de caractère disponibles dans les messages. Mais depuis peu, les internautes les utilisent également dans les billets, commentaires articles, ou messages de forum.
>>>>> Ainsi, les moteurs de recherche fonctionnant par mots clés ne seront sûrement pas, demain, les moteurs de recherche les plus pertinents sur le web social.
Le veilleur doit donc redoubler d'attention, mettre en place de nouveaux moyens de détection de l'information, faire appel à des outils sophistiqués.
Pour garder leur pertinence (toujours discutable), les moteurs devront en effet s'adapter au nouveau mode de communication des internautes, et à leurs usages des liens hypertextes. Les ranking et autres classements automatiques devront ainsi revoir leur fonctionnement.
Pour les veilleurs, La détection des informations passera de plus en plus par les liens hypertextes "lyriques": les éléments de la toile seront de plus en plus inter-connectés, les utilisateurs, de moins en moins soucieux de se faire comprendre, si ce n'est par leur communauté d'habitués.
La détection des opinions passera par l'appréhension et l'immersion dans les communautés. Le veilleur ne devra plus rechercher, il devra détecter: prendre connaissance des informations sans passer par des moteurs de recherche devenus désuets.
images: pharmacie, telio.be, jouets-veille,





Commentaires
Très bon article encore une fois!
En bref, le veilleur de demain devra être encore plus "compétent" que le veilleur d'aujourd'hui
Reste qu'à trop s'immerger dans certaines communautés, ne risque t'on pas de passer à côté d'une vision globale d'un sujet (fournie en partie par les moteurs de rcherches généralistes) ?!
De même, le développement exponentiel du web dit social ne risque t'il pas d'annuler totalement l'idée d'e-réputation : trop d'informations noie l'information, au rique de ne pas faire émerger d'opinion vraiment "utile" ou "dangereuse" pour une organisation ?!
juste un petite commentaire libre relatif aux tinyurl et Twitter : les liens sont effectivement inintelligibles mais certains moteurs comme backtweets permettent de retrouver le lien de départ. La méthode change pour le veilleur, qui doit partir de l'url source pour retrouver le commentaire. A l'inverse, l'opinion exprimée avant le lien sur Twitter est souvent un commentaire sur l'article en lien ou la reprise du titre de l'article en question. Du coup, c'est comme si le texte d'ancre, le signifiant, se désolidarisait du signifié (la page liée) alors que les deux se superposaient, mais plus pour se jouxter que pour se déconnecter complétement.
Pour le reste, la question de la compréhension par les moteurs des liens "lyriques" comme tu les appelles reste entière. Le véritable enjeu pour Google sur ce sujet a toujours été de comprendre le "contexte du lien", d'aller chercher plus loin que le texte d'ancre pour savoir quel poids attribuer à la page liée. En attendant, les veilleurs devront adopter des stratégies "maison", tu le dis très bien
merci pour cette note
@ Camille A: effectivement, trop d'immersion pourrait nuire à la vision d'ensemble. cette "vision d'ensemble" permise par les moteurs de recherche, est bien utile pour le diagnostique-image que renvoit une entreprise, mais sera de moins en moins pertinente pour étudier le web social et les communautés.
A mon avis, c'est exactement cette différence entre l'image de marque dans les résultats des moteurs et l' études des avis et des communautés, qui fera la différence entre les métiers de l'é-reputation et de la veille d'opinion. Qu'en penses-tu ?
@ Palpitt: je suis tout à fait d'accord avec toi, il existe - et heureusement- de nombreux outils qui permettent de pallier aux difficultés de détection des nouveaux éléments de publications. Et un des grands enjeux est de savoir les intégrer dans mes méthodes de veille.
En ce qui concerne Google, je ne connais pas trop leurs capacités d'évolution dans leur considération du web social, mais la "contextualisation" des liens est effectivement le nouvel enjeu pour les moteurs de recherche.
Merci pour vos comm', ça faisait longtemps que je n'avais pas écrit !
I like this post! Never read more interesting article on this theme. Thanks, mate!