À en croire certains, on peut tout retrouver sur Google. Est-ce vrai?

À en croire certains, on peut tout retrouver sur Google. Est-ce vrai?

Google est considéré comme l'engin de recherche le plus utilisé à travers la planète. Chaque jour, des millions et des millions d'internautes y cliquent pour chercher de l'information de toute sorte. Aujourd'hui, il fait carrément partie de nos habitudes quotidiennes du Web et parfois même de notre vocabulaire. Si la popularité de ce moteur de recherche ne cesse de croître de jour en jour, c'est que les internautes en sont grandement satisfaits. En effet, selon emarketer1, plus de 80% des internautes sont très satisfaits de leur utilisation de Google.

Cette satisfaction vient essentiellement du fait de la pertinence des résultats affichés, dûs à la technologie d'indexation de Google «Page Rank» et à la facilité d'utilisation de son interface. On comptait en Novembre 2004, 8 milliards de pages indexées2 et ce chiffre ne cesse de croître de jour en jour. Une technologie qui a rapporté également beaucoup à ses concepteurs. La publicité qui demeure leur principale source de revenu sous la forme de liens sponsorisés, a connu ces deux dernières années une forte croissance, car elle semble de plus en plus adaptée au processus de navigation des internautes.

Si cet engin de recherche connaît autant de succès, c'est parce qu'il permet à tout un chacun, à partir d'un mot clé ou d'un groupe de mots, d'avoir de façon quasi-instantanée accès à un répertoire de sites Webs qui répondent de près ou de loin à la requête initialement formulée. On peut donc, facilement accéder à des descriptions de produits d'entreprise, ou lire des extraits d'ouvrages de bibliothèque ou encore accéder à un article publiée dans la presse, etc… par un simple clic.

Avec Google, la quantité de résultats affichés fait rarement défaut. Bien au contraire, les internautes sont souvent submergés dans une masse incroyable d'information. L'idéal serait de trouver ce qu'on cherche le plus rapidement possible. Si le terme de recherche ou mot clé utilisé est pertinent, on accède facilement à l'information, généralement disponible dans les 5 premiers résultats. Sinon, on est obligé de vérifier un par un les liens affichés, ou parfois au pif, jusqu'à trouver l'information souhaitée. En général, les internautes vont se limiter aux dix premières propositions, soit la première page des résultats.

S'il est effectivement difficile, dans plusieurs des cas de «trouver son aiguille dans un tas de foin», Google, offre une série de commandes, rarement utilisés par le grand public, qui permettent de filtrer l'information et d'y accéder de façon bien précise, dont voici quelques unes :

- Les guillemets : exemple, taper "sport au Québec" : permet de faire une recherche exacte selon ce qui est saisi entre les guillemets.

- La recherche sur un site précis : exemple, taper site:cyberpresse.ca "sport au Québec" : permet de faire une recherche exacte sur un site bien précis. Dans ce cas, chercher la phrase " sport Québec " sur le site cyberpresse.ca.

- La recherche d'un type de fichier : exemple, taper filetype:pdf "sport au Québec" permet de chercher un type de fichier, dans ce cas au format pdf et contenant la phrase exacte "sport au Québec".

- La recherche en fonction du titre de la page : exemple, taper intitle:sport "sport au Québec", permet de chercher toutes les pages webs ayant pour titre sport et contant la phrase "sport au Québec".

- La recherche dans l'adresse URL : exemple, taper inurl:sport, permet d'avoir toutes les adresses url contenant le mot sport.

Comme on peut le constater ces différentes commandes permettent de raffiner la recherche et d'avoir un accès encore plus précis et rapide à l'information souhaitée.

La face cachée de Google

Si ces commandes permettent d'avoir une exactitude dans les résultats, elles demeurent néanmoins un danger si elles sont utilisées par des internautes ayant de mauvaises intentions. En effet, Google est un engin de recherche tellement puissant qu'il va tout indexer à son passage, incluant des défaillances de serveurs, ou de bases de données, des scripts de programmes etc… rendant parfois vulnérables nos informations personnelles. En effet, si ces informations sont généralement protégées, il suffit qu'il y ait une omission de la part d'un responsable de site ou d'une panne de serveur pour que l'information soit accessible au grand public via Google.

Il suffit de taper par exemple la requête : intitle:index.of "parent directory", pour accéder à toutes les pages ayant pour titre index.of. De façon générale, le titre index.of est généré lorsqu'un répertoire web ne contient pas le fichier de démarrage par défaut. Cette petite défaillance permet à tout un chacun d'accéder à un répertoire et aux fichiers qui y sont sauvegardés. Vous imaginerez qu'il est aussi facile de raffiner davantage la recherche en y précisant un mot clé et un site bien précis. C'est comme si vous accédez au disque dur d'un de vos voisins et vous commencez à fouiller dans ses dossiers sans aucune autorisation de sa part.

Cette erreur (index.of) peut être considérée comme bénigne comparativement à d'autres anomalies de bases de données ou de serveurs qui peuvent carrément donner l'accès à des informations de plus grande importance.

Aujourd'hui, plusieurs forums de discussions spécialisés en programmation tirent la sonnette d'alarme pour avertir les responsables de sites webs, quant aux dangers qui peuvent subvenir à tout moment de google. Surtout que chaque jour de nouvelles défaillances sont décelées.

Si aujourd'hui l'objectif de toute entreprise, afin de bien se faire connaître sur le Web, est d'être bien référencée, de façon à être affichée parmi les 5 premiers résultats de Google, il est par ailleurs, de son devoir de protéger son site et les données personnelles de ses clients contre ce même engin de recherche par qui le danger peut arriver à tout moment. Sachez que Google est votre porte drapeau et votre ennemi à la fois.

1 « Search engine marketing », Février 2005

2 www.searchenginewatch.com


Avec la collaboration de Abdel Mekki Berrada