Comment fonctionnent les principaux moteurs de recherche et comment les utiliser de façon optimale?

Comment fonctionnent les principaux moteurs de recherche et comment les utiliser de façon optimale?

Voilà une vaste question, puisqu'il s'agit du sujet général de cette chronique! Par contre, vous me donnez l'occasion de vous révéler mon meilleur secret. Comme tous les secrets donnant accès à une connaissance extraordinaire, il est d'une simplicité enfantine; vous considérerez sans doute que je vous berne... Mais nenni, je vous assure qu'après avoir mis en application ce simple truc, les résultats de vos recherches seront décuplés en termes de pertinence.

Les moteurs de recherche, Google, Yahoo!, Altavista, AskJeeves et les autres fonctionnent tous sur la même base technologique. Ils disposent d'abord d'une technologie logicielle qui balaie l'internet: un «robot balayeur» - ou web crawler, en anglais. Cet engin visite un grand nombre de pages web (de l'ordre de 10 milliards) et, ce faisant, enregistre le contenu de chacune des pages qu'il visite dans une gigantesque base de données. C'est un peu comme si vous visitiez systématiquement tous les sites webs que vous étiez en mesure de connaître et que vous fissiez un «copier-coller» sur leur contenu pour l'enregistrer sur votre disque dur.

Cela fait, une deuxième technologie logicielle intervient: l'indexation. Le moteur de recherche analyse la base de données et le contenu de chacune des pages web qu'il a jouté à sa base de données, à l'aide d'une armada d'algorithmes sémantiques. La fréquence d'apparition des mots-clefs dans les documents que vous entrez dans votre requête de recherche, leur position relative dans le document (titre, début du document, etc.) auront autant d'influence sur le «jugement» que portera cette technologie logicielle.

Donc: le meilleur conseil que je puis vous donner est le suivant: essayez d'imaginer le document idéal que vous recherchez. À la fois son contenu que sa forme. Ainsi, lorsque vous bâtirez votre requête dans votre moteur de recherche, vous lui indiquerez les mots-clefs qui devront se retrouver dans sa base de données de la façon la plus pertinente que possible, et non pas la description de ce document.

De quelle nature serait ce document? Qui serait susceptible de l'avoir écrit? De quelle manière, en utilisant quel type de langage. Par exemple: une étude prospective sur les investissements industriels du secteur de l'aluminium dans les dix prochaines années. Que cherchez-vous? Une étude rédigée par un économiste, un analyste de marché. De quelle nature devrait être ce document? Un rapport relativement copieux, ayant une facture «finie», par opposition à quelques notes jetées sur une page html. Quel langage est-il susceptible d'avoir été utilisé? Certains «buzz words» propres à ces professions sont manifestement importants: trends, prospective, etc.

En imaginant le document idéal, vous bâtirez une requête de recherche adaptée. Ainsi, plutôt que d'entrer dans Google ou un autre moteur de recherche l'expression: aluminium prospective ten years international trade, vous aurez réfléchi au type de document idéal que vous cherchez et vous aurez plutôt élaboré la requête suivante: aluminium report analysis 2007..2015 (prospective OR forecasts) «international trade» ext:pdf -climate -environment. Dans le premier cas, vous obtenez plus de 200 000 résultats, plus ou moins pertinents, alors que dans le deuxième vous n'avez qu'à consulter moins de 200 documents.

Cela dit, l'ensemble de cette chronique devrait répondre d'une façon ou l'autre à votre question...

À vous de chercher maintenant - et de découvrir pourquoi j'ai choisi cette série de mots-clefs...