L'intelligence artificielle, même à Montréal, est un domaine où presque tout se déroule en anglais. Des espaces de travail aux articles publiés en passant par les programmes et les termes utilisés, le français n'y occupe qu'une place marginale.

C'est sur ce dernier aspect bien précis, la terminologie, que DataFranca a annoncé hier la mise sur pied du « premier grand lexique français de l'intelligence artificielle ». Bâti sur le modèle de Wikipédia, ce lexique proposera aux professionnels de l'intelligence artificielle et des sciences des données un espace pour discuter et choisir les termes français adaptés à leur domaine.

L'entreprise en démarrage a bénéficié d'un financement de 100 000 $ de l'Office québécois de la langue française (OQLF). Le laboratoire de recherche montréalais Google Brain, avec Hugo Larochelle à sa tête, a également appuyé l'initiative.

« C'est une belle initiative, a souligné M. Larochelle, qui a accordé hier une rare entrevue à un média. Déjà, Wikipédia a aidé à établir certains termes. Quand j'ai fait mes cours à l'Université de Sherbrooke, je m'y tournais souvent. Mais ce n'était pas nécessairement la traduction officielle. »

EN CONSTRUCTION... PAR DÉFINITION

Un lexique peut-il à lui seul inverser la tendance et imposer un peu plus de français ? « Je pense que ça a beaucoup de valeur, pour l'avoir vécu en tant que professeur, quand vient le temps de faire du matériel pédagogique en français », répond le directeur montréalais de Google Brain.

« Au fur et à mesure que l'intelligence artificielle sort de la recherche fondamentale, qu'on sort de la recherche pour aller dans l'application, l'utilisation d'une nomenclature bien établie en français va être de plus en plus utile. »

Le lexique est déjà disponible - même s'il est « embryonnaire », selon son cofondateur Gérard Pelletier, directeur général de DataFranca - à l'adresse wiki.datafranca.org. On y trouve un demi-millier d'expressions en attente d'un équivalent en français. Seuls les professionnels inscrits peuvent modifier les articles et participer aux discussions, mais n'importe qui peut consulter le lexique.

« C'est en construction, mais c'est le principe même : c'est toujours en construction », précise M. Pelletier, MBA de formation qui s'est initié à l'univers des données il y a cinq ans.

Une fois par semaine, a-t-on expliqué hier en conférence de presse, un bulletin de nouvelles sera envoyé aux participants. On espère que les termes retenus pour ce lexique seront intégrés au grand dictionnaire terminologique (GDT) de l'OQLF.

AUSSI QUÉBÉCOIS QUE L'ÉRABLE

Le temps presse, estime l'autre cofondateur du lexique, Claude Coulombe, doctorant en intelligence artificielle. « Il y a une explosion de nouvelles connaissances et il faut agir avec célérité. Il y a beaucoup de francophones dans les équipes de développeurs qui travaillent en anglais. Il ne faut pas reléguer la langue française au rang de langue folklorique qu'on ressort le dimanche. »

Avec humour, il estime au contraire qu'il faut faire en sorte que « l'intelligence artificielle et les sciences des données soient aussi québécoises que le sirop d'érable et la motoneige ».

L'élaboration de ce lexique aura une incidence importante sur la formation, dit le doctorant. « Ce n'est pas tout le monde qui est bilingue. On pourrait contribuer à réduire ainsi la pénurie de main-d'oeuvre. »

QUATRE TERMES EN QUÊTE DE TRADUCTION FRANÇAISE

« Exploding Gradient Problem »

La traduction littérale de cette expression est « problème de gradient explosif », mais elle n'est pas officielle. De quoi s'agit-il ? Pour résumer à l'extrême, disons qu'il s'agit du comportement d'une intelligence artificielle instable qui apprend mal et dont les réponses sont de plus en plus fausses.

« Cloud Robotics »

Dans le jargon, on utilise fréquemment « cloud robotics » pour désigner ces robots dont toutes les fonctions sont stockées sur des serveurs, dans les « nuages ». Les voitures autonomes de Google, notamment, sont des robots de ce type. Certains utilisent l'expression « robots infonuagiques », mais elle n'est pas consacrée.

« Bio-inspired computing »

L'« informatique bio-inspirée », traduction libre, est un concept plus facile à comprendre pour le commun des mortels : il s'agit de l'utilisation des ordinateurs pour appréhender le vivant et, à l'inverse, de s'inspirer du vivant pour des modèles informatiques.

« First-order logic »

La « logique de premier ordre » est parfois présentée comme le « calcul des prédicats de premier ordre »... Ce sont des expressions traduites de façon littérale de l'anglais pour désigner des modèles mathématique, utilisés en informatique et en intelligence artificielle. Impossible de les résumer ici en quelques mots : précisons qu'elles se définissent entre autres par l'utilisation de variables x y z et de connecteurs logiques (et, ou).