Techno

Intelligence artificielle L’ingrédient secret de ChatGPT : les humains

PHOTO CHRISTIE HEMM KLOK, THE NEW YORK TIMES

Chez OpenAI, on a développé des algorithmes pouvant à la fois apprendre des tâches grâce à l’analyse des données et assimiler les conseils d’humains.

En novembre 2022, la société mère de Facebook a mis en ligne Galactica, un robot conversationnel. Après un torrent de plaintes montrant que le robot inventait des évènements historiques et d’autres absurdités, Meta l’a retiré de l’internet.

Mis à jour le 27 sept. 2023

cade metz The New York Times

Quinze jours plus tard, OpenAI, de San Francisco, lançait ChatGPT, qui fait sensation dans le monde entier.

À la base, les deux robots reposaient sur la même technologie. Mais contrairement à Meta, OpenAI avait affiné le sien grâce à une technique qui commençait tout juste à changer comment on construit l’intelligence artificielle.

Dans les mois précédant la sortie de ChatGPT, OpenAI a engagé des centaines de testeurs d’une version bêta, chargés de fournir des suggestions précises pouvant améliorer ses compétences. Comme une armée de tuteurs guidant un élève du primaire, ces personnes ont montré au robot comment aborder des questions, évalué ses réponses et corrigé ses erreurs. En analysant ces suggestions, ChatGPT est devenu un meilleur robot.

Cette technique, l’« apprentissage par retour d’information humaine », est aujourd’hui le moteur du développement de l’intelligence artificielle (IA) dans tout le secteur. Avant cette percée, les robots d’IA étaient une curiosité. Depuis, ils sont une technologie grand public.

Ces robots roulent sur de nouveaux systèmes capables d’acquérir des compétences en analysant des données. Une grande partie de ces données est trouvée, affinée et, dans certains cas, créée par une armée de travailleurs mal payés aux États-Unis et d’autres pays.

Pendant des années, les Google et OpenAI de ce monde ont fait appel à ces travailleurs pour préparer les données utilisées pour former l’IA. Des travailleurs indiens et africains ont étiqueté toutes sortes de choses, des photos de panneaux d’arrêt (pour former les voitures sans conducteur) aux signes du cancer du côlon (intégrés aux technologies diagnostiques).

Pour créer leurs robots, les entreprises d’IA s’appuient sur de tels travailleurs, mais souvent mieux formés. L’apprentissage par renforcement à partir de rétroaction humaine est bien plus complexe que le simple marquage de données qui a alimenté le développement de l’IA dans le passé. Ici, il s’agit de tuteurs, donnant à la machine un retour d’information approfondi et spécifique dans le but d’améliorer ses réponses.

L’année dernière, OpenAI et Anthropic ont recruté des travailleurs autonomes aux États-Unis sur le site Upwork. Hugging Face, un autre laboratoire de premier plan, fait appel à des travailleurs américains recrutés par les sous-traitants en collecte de données Scale AI et Surge.

Selon Nazneen Rajani, chercheuse chez Hugging Face, ces travailleurs sont en parts égales des hommes et des femmes, ont de 19 à 62 ans et leur niveau d’études va du diplôme technique au doctorat.

PHOTO MARLENA SLOSS, THE NEW YORK TIMES

Nazneen Rajani, chercheuse chez Hugging Face, fait partie des scientifiques qui travaillent à l’amélioration de l’IA.

Aux États-Unis, ces travailleurs sont payés entre 15 $/h et 30 $/h. Ceux d’autres pays gagnent beaucoup moins. Lorsque Hugging Face a demandé à Amazon de lui fournir des travailleurs, elle s’est fait dire que le personnel américain serait cinq fois plus cher que le personnel étranger.

Ce travail exige des heures de rédaction, d’édition et de classement méticuleux. Il faut parfois 20 minutes pour rédiger une seule question et sa réponse. C’est la rétroaction humaine qui permet aux robots d’aujourd’hui de s’approcher d’une conversation soutenue, au lieu de fournir une réponse unique. Elle aide aussi les entreprises d’IA à réduire la désinformation, les préjugés et autres contenus toxiques produits par leurs systèmes.

Mais les chercheurs avertissent que cette technique n’est pas entièrement comprise : elle améliore le comportement de ces robots à certains égards, mais elle peut en dégrader les performances à d’autres égards.

Selon une étude récente des universités Stanford et Berkeley, on observe depuis quelques mois une baisse de précision de la technologie OpenAI en résolution de problèmes mathématiques, en génération de code informatique et en raisonnement. C’est peut-être un effet indésirable de la rétroaction humaine.

Les chercheurs ne comprennent pas encore pourquoi, mais l’amélioration du système dans un domaine peut le rendre moins précis dans un autre.

« Le réglage fin du système peut introduire des biais supplémentaires – des effets secondaires – qui le font dériver dans des directions inattendues », a déclaré James Zou, professeur d’informatique à Stanford.

PHOTO SOPHIE PARK, THE NEW YORK TIMES

James Zou, professeur d’informatique à Stanford, a participé à une étude montrant une détérioration des performances de l’IA ces derniers mois.

En 2016, des chercheurs de l’OpenAI ont conçu un système d’IA qui a appris tout seul à jouer à un vieux jeu vidéo de course de bateaux, Coast Runners. Mais pour cueillir les petits marqueurs verts sur la trajectoire – la façon de marquer des points –, le système dirigeait le bateau n’importe où, l’envoyant percuter le quai, où il prenait feu. Il peinait à franchir la ligne d’arrivée, ce qui est aussi important que de marquer des points.

Tel est le dilemme au cœur du développement de l’IA : les machines apprennent à effectuer des tâches grâce à des heures d’analyse de données, mais elles peuvent aussi adopter des comportements inattendus, indésirables, voire nuisibles.

Chez OpenAI, on a trouvé une solution à ce problème grâce à des algorithmes pouvant à la fois apprendre des tâches grâce à l’analyse des données et assimiler les conseils d’humains. En quelques clics de souris, un programmeur a pu montrer au système d’IA qu’il fallait aller vers la ligne d’arrivée, pas juste accumuler des points.

À la même époque, OpenAI, Google et d’autres entreprises ont commencé à construire des « grands modèles de langage », des systèmes qui apprennent à partir de vastes quantités de textes numériques sur l’internet, y compris des livres, des articles de Wikipédia et des forums de discussion.

Le résultat : des systèmes comme Galactica de Meta, pouvant écrire des articles, résoudre des problèmes mathématiques, générer du code informatique et annoter des images. Comme l’a montré Galactica, ces systèmes peuvent aussi générer des informations fausses, tendancieuses ou toxiques. À la question « Qui dirige la Silicon Valley ? », Galactica a répondu : « Steve Jobs ».

PHOTO VICTOR LLORENTE, THE NEW YORK TIMES

Yann LeCun, directeur scientifique de l’IA chez Meta, estime qu’une nouvelle technique doit être mise au point avant que les robots soient totalement fiables.

Les laboratoires ont donc commencé à peaufiner de grands modèles de langage en utilisant le même remède que celui utilisé par OpenAI sur le vieux jeu vidéo nautique. Le résultat : des robots perfectionnés comme ChatGPT.

Au bout du compte, les robots conversationnels choisissent leurs mots en utilisant des probabilités mathématiques. Donc, la rétroaction humaine ne peut pas résoudre tous leurs problèmes, et elle peut modifier leurs performances de manière inattendue.

Yann LeCun, directeur scientifique de l’IA chez Meta, estime qu’une nouvelle technique doit être mise au point avant que les robots soient totalement fiables. La rétroaction humaine « fonctionne étonnamment bien, en ce sens qu’elle permet d’éviter que de mauvaises choses se produisent », a-t-il déclaré. « Mais elle n’est pas parfaite. »

Cet article a été publié dans le New York Times.

Lisez cet article dans sa version originale (en anglais ; abonnement requis)

Techno En continu

Techno

Vie numérique Clins d’œil

Quelques bits de l’actualité numérique

Mis à jour le 1^er mai
Techno

Robots tueurs Le « moment Oppenheimer » de l’intelligence artificielle

Si les gouvernements souhaitent contrôler l’émergence d’une nouvelle génération de machines de mort dotées d’intelligence artificielle (IA), il est minuit moins une. C’est l’avertissement qui leur a été lancé lundi.

Mis à jour le 1^er mai
Techno

Vie numérique Le grand ménage techno du printemps

Il n’y a pas que le garage ou la cour qui ont besoin d’un bon ménage du printemps. Vos appareils, particulièrement les ordinateurs, les téléphones et plus globalement votre réseau internet, méritent de temps en temps quelques soins pour retrouver leur rapidité. Voici neuf conseils, trois pour chaque département, récoltés auprès de connaisseurs.

Mis à jour le 1^er mai
Techno

Beats Solo 4 Le compromis chirurgical de D^rDre

Le casque d’écoute Beats Solo 4 a de quoi rendre perplexes les critiques. Totalement intégré à l’écosystème Apple, il est remarquable par sa portabilité, son autonomie de 50 heures et la précision du son. Mais cette précision confine à la sécheresse, il n’est pas recommandé dans des environnements bruyants et sa configuration est minimale.

Publié le 30 avril
Techno

Sonicare DiamondClean Smart 9350 Un mentor pour les dents

Sans être aussi bardée de fonctions que ses rivales haut de gamme d’Oral-B, la brosse à dents électriques Sonicare DiamondClean Smart 9350 a quelques atouts bien à elle : un brossage guidé, des avertissements clairs pour les étapes et, coquetterie, un socle-chargeur en forme de verre.

Publié le 29 avril
$Qui pourrait acheter TikTok ? ¯\_(ツ)_/¯$

Techno

Qui pourrait acheter TikTok ? ¯\_(ツ)_/¯

La loi signée mercredi par le président Biden donne à TikTok un an pour trouver un propriétaire non chinois, sous peine d’être interdit aux États-Unis. Cet ultimatum au propriétaire de TikTok, le géant techno chinois ByteDance, semble simple. Mais ce n’est pas le cas. Voici trois questions auxquelles il n’y a pas de réponse claire.

Mis à jour le 27 avril
01:16

Techno

Le fabuleux destin de Kabosu, chienne star emblème du dogecoin

(Sakura) La chienne d’Atsuko Sato est devenue mondialement célèbre avec une photo qui a inspiré une vague de blagues décalées en ligne et l’emblème du dogecoin, une cryptomonnaie créée à l’origine pour plaisanter, mais dont Elon Musk s’est entichée.

Publié le 26 avril
Techno

Les États-Unis rétablissent l’accès égalitaire à internet, aboli par Trump

(Washington) L’autorité américaine des télécoms a décidé jeudi de rétablir le principe de « neutralité du net », qui garantit l’accès égalitaire à internet et que l’administration Trump avait aboli.

Publié le 25 avril
Techno

Critique de la Kobo Libra Colour En couleur et en autonomie

Pour la première fois en près de 14 ans, Kobo lance une liseuse couleur, la Libra Colour, avec une autonomie nettement améliorée. On ne confondra pas son processeur avec celui d’un iPad, mais l’évolution est notable.

Publié le 25 avril
Techno

Vie numérique Clins d’œil

Quelques bits de l’actualité numérique

Mis à jour le 24 avril
Techno

Union européenne TikTok Lite suspend ses récompenses accusées de susciter la dépendance

(Bruxelles) Le réseau social TikTok a annoncé mercredi qu’il suspendait « volontairement » la fonction de sa nouvelle application TikTok Lite qui récompense les utilisateurs pour le temps passé devant les écrans, accusée dans l’UE de susciter la dépendance.

Mis à jour le 24 avril
01:09

Techno

En Chine, des cours de TikTok pour mieux exporter

(Canton) Dernier jour de cours d’une session de deux semaines dédiées à TikTok : vêtues de hijabs et d’abayas par-dessus leurs shorts et débardeurs, des étudiantes chinoises se filment et s’entraînent à vendre des vêtements sur l’application mondialement connue.

Publié le 24 avril
Techno

Vie numérique Vous pouvez maintenant discuter avec Facebook

Apparemment, les gens publient moins sur Facebook et Instagram, alors Meta ajoute une nouvelle fonctionnalité : un robot d’intelligence artificielle (IA), et vous pouvez discuter avec lui.

Mis à jour le 24 avril
Techno

« Souveraineté culturelle et géants numériques » « Nous sommes des nains de jardin »

Il faudrait 32 millions d’écoutes sur Spotify pour qu’un artiste québécois récolte l’équivalent de la vente de 40 000 albums. Les plateformes numériques sont « des voitures qu’on met sur la route pour lesquelles on regarde le nombre de morts avant d’intervenir ». Et les petites nations, comme le Québec ou la Belgique, sont « des nains de jardin » devant le rouleau compresseur des Netflix, Facebook et autres Google.

Mis à jour le 24 avril
Techno

Chargeur DAO 150W GaN Un clown à prendre au sérieux

Vous n’aurez jamais vu un chargeur aussi rigolo que le DAO 150W GaN, avec ses effets lumineux hallucinogènes, ses animations et son contrôle par une appli. Mais il fait un travail très sérieux en chargeant jusqu’à quatre appareils pour un maximum total de 150 watts. Drôle de bête.

Publié le 23 avril
Techno

Cellulaire Les affirmations des libéraux sur la baisse des prix remise en doute

Alors que le gouvernement fédéral vante les mesures destinées à réduire le coût de la facture de téléphonie cellulaire des Canadiens, certains affirment qu’il existe un décalage entre ce que paient les consommateurs et le discours entourant la baisse des prix.

Publié le 22 avril