Google fait un pas de plus dans la recherche en commençant à indexer des documents numérisés, à l'aide d'une technologie appelée «reconnaissance optique de caractères».

Le géant de la recherche a réussi à appliquer cette technique à des documents en format PDF, ce qui lui permet de transformer des images de textes en mots, qui peuvent être indexés et recherchés par les internautes.

«Dans le passé, les documents numérisés étaient rarement inclus dans les résultats de recherche puisque nous ne pouvions être certains de leur contenu», note Google sur son blogue.

Dans ses résultats de recherche, Google propose maintenant les documents PDF, qui peuvent également être vus par les internautes en format HTML.

Google affirme que cette technologie lui permettra d'indexer davantage de rapports gouvernementaux et de textes académiques, par exemple.