Une course de vitesse est engagée pour numériser les millions de livres du monde, opposant le géant Google à une vaste coalition anti-Google, l'OCA (Open Content Alliance), appuyée par ses rivaux Yahoo! et surtout Microsoft qui va se lancer à grande échelle sur ce terrain.

Une course de vitesse est engagée pour numériser les millions de livres du monde, opposant le géant Google à une vaste coalition anti-Google, l'OCA (Open Content Alliance), appuyée par ses rivaux Yahoo! et surtout Microsoft qui va se lancer à grande échelle sur ce terrain.

Google a lancé le 31 août son nouveau moteur de recherche, Google Book Search, qui indexe le texte de milliers de livres numérisés par le géant d'Internet.

Google a obtenu l'accord de grandes universités comme Harvard, Oxford, la New York Public Library, la Complutense de Madrid, l'Université de Californie, pour que ses équipes de numérisation aient accès à leurs vastes bibliothèques.

Dernière en date, l'Université du Wisconsin, riche de millions d'ouvrages historiques, s'est ralliée à Google mi-octobre.

Google numérise en fac-similé et mémorise les livres libres de droit mais aussi sous copyright, soit envoyés par des éditeurs, soit sans autorisation. En ce cas, il ne fournit qu'une fiche sur le livre et l'extrait comprenant les mots-clés recherchés, au nom de «la liberté de citation».

Son projet a suscité une levée de boucliers d'éditeurs, pour qui Google n'a pas le droit de créer en propriétaire la version électronique de leurs livres ou des bibliothèques mondiales.

Hors des États-Unis, Google est aussi accusé de privilégier les livres en anglais, ce que le groupe nie. Il promet d'ailleurs une toute prochaine version de Google Book Search en français.

Outre les plaintes d'éditeurs, américains et français notamment - pour l'instant à leurs prémices -, plusieurs opérateurs ont riposté en créant en octobre 2005 l'Open Content Alliance (OCA).

L'OCA, organisation à but non lucratif qui réunit des dizaines de partenaires - universités, fondations, groupes informatiques - crée un «pot commun», libre d'accès, de tous les livres numérisés par chaque membre, avec possibilité de télécharger ou d'imprimer. Pour l'instant elle propose 35 000 ouvrages, incluant ceux de précurseurs comme le projet Gutenberg.

«La question est de savoir si la connaissance du monde sera propriété d'un groupe privé ou ouverte à tous», explique à l'AFP le président de l'Internet Archive et fondateur de l'OCA, Brewster Kahle.

«Chacun de nos partenaires peut en tirer des recettes commerciales. Nous espérons la création de plusieurs moteurs de recherche», ajoute-t-il.

D'abord soutenue par Yahoo!, qui financera la numérisation de 18 000 livres et prépare un moteur de recherche, l'alliance a vite été rejointe par Microsoft, qui a promis une contribution majeure: financer 150 000 livres.

Surtout, Microsoft prépare pour «plus tard cette année» le lancement à grande échelle de son propre moteur de recherche de livres, Windows Live Books Search, et commence à constituer sa propre base privée. Comme Google, il appelle tous les éditeurs à envoyer leurs livres pour une numérisation gratuite.

«Microsoft sera désormais plus fermé», selon le président de l'OCA, inquiet de voir fleurir un nouveau projet privé.

Pour rattraper Google, Microsoft met les bouchées doubles: il a signé mi-octobre un accord avec Kirtas, fabricant de scanners à haute vitesse capables de numériser 2400 pages/heure (8 minutes par livre), et signé un accord avec Cornell University pour numériser sa vaste bibliothèque.

Ni Google ni Microsoft ne dévoilent combien de livres sont déjà numérisés. «Des milliers», a seulement concédé Google.

L'enjeu: les recettes publicitaires accolées aux recherches des internautes. Microsoft a précisé à l'AFP qu'il «étudiait la possibilité d'intégrer des publicités à (son) moteur de recherche de livres».

Deux facteurs détermineront sans doute l'issue du combat: d'éventuelles décisions de justice et le choix des bibliothèques entre l'un ou l'autre camp. L'OCA espère notamment recruter la Bibliothèque Nationale de France où 90 000 livres ont déjà été numérisés.