Le test de Turing était l’étalon par excellence pour prouver l’intelligence des machines. La nouvelle génération de robots le rend insignifiant.

Aux yeux de Claes de Graaff, Franz Broseph semblait un joueur de Diplomatie comme les autres. Le pseudonyme était une blague – l’empereur d’Autriche François-Joseph Ier renaissant sous la forme d’un « bro » en ligne –, mais c’est le genre d’humour que les joueurs de Diplomatie tendent à apprécier.

Ce jeu est un classique, apprécié de personnalités comme John F. Kennedy et Henry Kissinger, qui combine stratégie militaire et intrigue politique en recréant la Première Guerre mondiale : les joueurs négocient avec leurs alliés, leurs ennemis et tous ceux qui se trouvent entre les deux, tout en planifiant les mouvements de leurs armées dans l’Europe du XXe siècle.

Lorsque Franz Broseph a pris part à un tournoi en ligne de 20 joueurs à la fin du mois d’août, il a courtisé les autres joueurs, leur a menti et a fini par les trahir. Il a terminé en première place.

De Graaff, un chimiste vivant aux Pays-Bas, a terminé cinquième. Il a passé près de 10 ans à jouer à Diplomatie, tant en ligne que dans des tournois en personne dans le monde entier. Il ne s’est rendu compte que plusieurs semaines plus tard qu’il avait perdu contre une machine. Franz Broseph était un robot.

« J’étais sidéré », raconte M. de Graaff, 36 ans. « Il semblait si authentique, si réaliste. Il pouvait lire mes textes, converser avec moi et faire des projets mutuellement bénéfiques qui nous permettraient à tous les deux d’avancer. Il m’a également menti et m’a trahi, comme le font souvent les meilleurs joueurs. »

Construit par une équipe de chercheurs en intelligence artificielle du géant technologique Meta, du Massachusetts Institute of Technology et d’autres universités de premier plan, Franz Broseph fait partie de la nouvelle génération de robots conversationnels en ligne qui repoussent rapidement les limites des machines.

Lorsque vous discutez avec ces robots, vous avez l’impression de discuter avec une autre personne. En d’autres termes, on peut avoir l’impression que les machines ont réussi un test censé prouver leur intelligence.

Le test de Turing réussi haut la main

Depuis plus de 70 ans, les informaticiens s’efforcent de mettre au point une technologie capable de passer le test de Turing : le point d’inflexion technologique à partir duquel nous, les humains, ne savons plus si nous discutons avec une machine ou une personne.

Le test porte le nom d’Alan Turing, le célèbre mathématicien, philosophe et déchiffreur de codes britannique qui l’a énoncé en 1950. Il pensait qu’il pourrait montrer au monde quand les machines avaient enfin atteint une véritable intelligence.

Le test de Turing est une mesure subjective. Il dépend du fait que les personnes qui posent les questions sont convaincues qu’elles parlent à une autre personne alors qu’elles parlent en fait à une machine.

Mais quelle que soit la personne qui pose les questions, les machines rendront bientôt ce test anecdotique.

Des robots comme Franz Broseph ont déjà passé le test dans des situations particulières, comme négocier des coups de Diplomatie ou appeler un restaurant pour réserver une table.

ChatGPT, un robot lancé en novembre par OpenAI, un laboratoire de San Francisco, donne aux gens l’impression de converser avec une autre personne et non avec un robot. Le laboratoire a déclaré que plus d’un million de personnes l’avaient déjà utilisé. ChatGPT pouvant écrire à peu près n’importe quoi, y compris des travaux de fin d’études, les universités craignent qu’il ne rende les travaux de classe totalement futiles.

Certaines personnes ayant parlé à ces robots les décrivent même comme sensibles ou conscients, croyant que les machines ont en quelque sorte développé une conscience du monde qui les entoure.

En privé, OpenAI a construit un système, GPT-4, qui est encore plus puissant que ChatGPT. Il peut même générer des images aussi bien que des mots.

Et pourtant, ces robots ne sont pas sensibles. Ils ne sont pas conscients. Ils ne sont pas intelligents – du moins, pas à la manière des humains. Même les personnes qui développent cette technologie le reconnaissent.

« Ces systèmes peuvent faire beaucoup de choses utiles », a déclaré Ilya Sutskever, scientifique en chef chez OpenAI et l’un des plus importants chercheurs en IA de la dernière décennie, en parlant de la nouvelle vague de robots conversationnels. « D’un autre côté, ils n’en sont pas là. Les gens pensent qu’ils peuvent faire des choses qu’ils ne peuvent pas faire. »

Alors que les dernières technologies sortent des laboratoires de recherche, il est désormais évident – si ce n’était pas évident auparavant – que les scientifiques doivent repenser et remodeler la façon dont ils suivent les progrès de l’intelligence artificielle. Le test de Turing n’est pas à la hauteur de la tâche.

Des robots qui apprennent sans cesse

À maintes reprises, les technologies de l’IA ont surpassé des tests supposés insurmontables, notamment la maîtrise des échecs (1997), de Jeopardy ! (2011), du go (2016) et du poker (2019). Aujourd’hui, l’IA en surpasse une autre, et là encore, cela ne signifie pas nécessairement ce que nous pensions.

Nous – le public – avons besoin d’un nouveau cadre pour comprendre ce que l’IA peut faire, ce qu’elle ne peut pas faire, ce qu’elle fera à l’avenir et en quoi elle changera nos vies, pour le meilleur ou pour le pire.

Il y a cinq ans, Google, OpenAI et d’autres laboratoires d’IA ont commencé à concevoir des réseaux neuronaux qui analysent d’énormes quantités de textes numériques, notamment des livres, des articles de presse, des articles de Wikipédia et des journaux de discussion en ligne. Les chercheurs les appellent « grands modèles de langage ». En repérant des milliards de modèles distincts dans la façon dont les gens relient les mots, les lettres et les symboles, ces systèmes ont appris à générer leurs propres textes.

Six mois avant la sortie de son agent conversationnel, OpenAI a dévoilé un outil appelé DALL-E.

Clin d’œil à WALL-E, le film d’animation de 2008 sur un robot autonome, et à Salvador Dalí, le peintre surréaliste, cette technologie expérimentale vous permet de créer des images numériques en décrivant simplement ce que vous voulez voir. Il s’agit également d’un réseau neuronal, construit un peu comme Franz Broseph ou ChatGPT. La différence, c’est qu’il apprend à partir d’images et de textes. En analysant des millions d’images numériques et les légendes qui les décrivaient, il a appris à reconnaître des liens entre images et mots.

C’est ce que l’on appelle un système multimodal. Google, OpenAI et d’autres organisations utilisent déjà des méthodes similaires pour construire des systèmes capables de générer des vidéos de personnes et d’objets. De jeunes entreprises créent des robots capables de naviguer dans des applications logicielles et des sites web pour le compte d’un utilisateur.

Ce ne sont pas des systèmes que l’on peut évaluer correctement avec le test de Turing – ou toute autre méthode simple. Leur objectif final n’est pas la conversation.

Le test de Turing permettait de déterminer si une machine pouvait imiter un humain. C’est ainsi que l’on dépeint généralement l’intelligence artificielle, comme l’avènement de machines qui pensent comme des êtres humains. Mais les technologies en cours de développement aujourd’hui sont très différentes de vous et moi. Elles ne peuvent pas traiter des concepts qu’elles n’ont jamais rencontrés auparavant. Et elles ne peuvent pas prendre des idées et les explorer dans le monde physique.

En même temps, ces robots sont supérieurs à vous et moi à bien des égards. Ils ne se fatiguent pas. Ils ne laissent pas leurs émotions obscurcir ce qu’ils essaient de faire. Ils peuvent instantanément puiser dans d’immenses quantités d’informations. Et ils peuvent générer du texte, des images et d’autres médias à des vitesses et des volumes que nous, les humains, ne pourrions jamais atteindre.

Leurs compétences vont également s’améliorer considérablement dans les années à venir.

Dans les mois et les années à venir, ces robots vous aideront à trouver des informations sur l’internet. Ils vous expliqueront des concepts de manière compréhensible. Si vous le souhaitez, ils rédigeront même vos tweets, vos articles de blogue et vos mémoires.

Ils comptabiliseront vos dépenses mensuelles dans vos feuilles de calcul. Ils visiteront des sites immobiliers et trouveront des maisons dans votre fourchette de prix. Ils créeront des avatars en ligne qui ressembleront à des humains. Ils réaliseront des mini-films, avec musique et dialogues.

Il est certain que ces robots vont changer le monde. Mais c’est à vous qu’il incombe de vous méfier de ce que ces systèmes disent et font, de modifier ce qu’ils vous donnent, d’aborder tout ce que vous voyez en ligne avec scepticisme. Les chercheurs savent comment doter ces systèmes d’un large éventail de compétences, mais ils ne savent pas encore comment leur donner la raison, le bon sens ou le sens de la vérité.

Cela dépend encore de vous.

Ce texte a initialement été publié dans le New York Times

Lisez la version d’origine (en anglais)