Source ID:; App Source:

Le tri par pertinence est-il fiable?

Yannick Dupuis, Ianik Marcil
Technaute.ca

Les moteurs de recherche affichent les résultats dans un ordre précis. J'ai cru comprendre qu'ils sont présentés par ordre décroissant de pertinence. Peut-on se fier sur cet ordre?

Chaque moteur traite les documents qu'il a identifié selon votre requête par mots-clefs de façon différente. C'est ce qui fait leur particularité. Il existe plusieurs milliers de moteurs de recherche, dont une centaine de principaux.

En gros, les moteurs de recherche se distinguent de trois façons:

D'abord, par la technologie utilisée pour balayer le web. Le premier élément de la technologie logicielle auquel ils ont recours est un « robot » qui balaie en continu le web afin de constituer une gigantesque base de données dans laquelle est archivée tous les documents trouvés (pages web, mais aussi documents visuels ou sonores, documents de type PDF, Word ou PowerPoint, par exemple). La plus ou moins grande rapidité et efficacité de ce robot à balayer le web constituera une première raison pour laquelle les résultats affichés seront différents d'un robot à l'autre.

Ils se distinguent ensuite par la méthode utilisée pour indexer ces gigantesques bases de données. Un autre ensemble de technologies logicielles s'appuient sur des algorithmes sémantiques pour indexer chacun des documents présents dans la base de données. Ces algorithmes sont le coeur de l'actif des entreprises derrière ces moteurs de recherche. Ils sont bien entendu secrets (dans le cas d'entreprises commerciale, évidemment), sans quoi les Google et Yahoo! de ce monde n'auraient plus aucune valeur économique. C'est cet algorithme qui évalue le degré de pertinence des résultats en fonction de votre requête de recherche. Plusieurs variables sont prises en compte: le nombre d'occurrences de vos mots-clefs dans les documents, leur positionnement dans le document (titre de la page, début du texte, etc.), le nombre de sites web qui réfèrent à ce document, etc.

Finalement, la façon d'afficher les résultats dans la page de recherche distinguent également chacun de moteurs de recherche. Certains moteurs, comme Exalead par exemple, présentent une pré-visualisation de la page web dans la liste des résultats. D'autre, comme Kartoo ou Grokker offrent une représentation visuelle par « grappes » de documents apparentés.

En somme, dans la guerre des moteurs de recherche, dominée par les géants Google, Yahoo! et MSN Live, chacun d'entre eux développent et raffinent leurs technologies d'indexation afin de s'attirer la loyauté des internautes, en présentant en premier lieu les résultats qu'ils considèrent les plus pertinents pour eux. Certains se spécialiseront ainsi, de façon affichée ou non, dans certains types de recherche. Par exemple, le méta-moteur Mamma.com a un site spécialisé en santé, mammahealth. Ce moteur se concentre sur des sources médicales afin de donner des résultats pertinents pour ces recherches d'information.

D'autres particularités sont plus subtiles: certains moteurs privilégieront en premier lieu l'affichage de sites d'entreprises, alors que d'autres essaieront d'afficher d'abord des documents informatifs. Un petit essai permet de le montrer rapidement. Si on cherche les mots-clefs « business intelligence » sur Altavista.fr, la majorité des premiers résultats non-commandités sont des sites d'entreprises. En faisant la même recherche sur Google.fr, on obtient que 3 sites d'entreprises dans les premiers résultats affichés.

C'est la raison pour laquelle on doit s'habituer graduellement à comparer les résultats obtenus sur plusieurs moteurs de recherche différents. Mais avant tout, il faut surtout énoncer avec grand soin la requête que l'on fait au moteur, par un choix judicieux et précis de mots-clefs et par le recours aux opérateurs avancés.

Pour en savoir plus: Abondance.com et Searchenginewatch.com.

À vous de chercher maintenant !




la boite: 4391933:box; tpl: 300_B73_videos_playlist.tpl:file;

Autres contenus populaires

La liste:-1:liste; la boite:219:box; tpl:html.tpl:file
image title
Fermer