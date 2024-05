PHOTO ELIANEL CLINTON, THE NEW YORK TIMES

L’été dernier, alors qu’ils se rendaient à un rendez-vous médical près de chez eux à New York, Paul Skye Lehrman et Linnea Sage écoutaient un balado (podcast) sur l’essor de l’intelligence artificielle (IA) et la menace qu’elle représentait pour le gagne-pain des écrivains, des acteurs et d’autres professionnels du spectacle.

Le sujet était particulièrement important pour ce jeune couple marié. L’un et l’autre gagnaient leur vie en tant qu’acteurs vocaux, et les technologies d’intelligence artificielle commençaient à générer des voix qui ressemblaient à la réalité.

Mais le balado a pris une tournure inattendue. Pour souligner la menace que représente l’IA, l’animateur a mené une longue entrevue avec un agent conversationnel nommé Poe. Celui-ci ressemblait à s’y méprendre à Lehrman.

« Il interrogeait ma voix sur les dangers de l’IA et les effets néfastes qu’elle pourrait avoir sur l’industrie du divertissement, explique M. Lehrman. Nous avons arrêté la voiture et nous sommes restés là, absolument incrédules, à essayer de comprendre ce qui venait de se passer et ce que nous devions faire. »

M. Lehrman et Mme Sage poursuivent maintenant en justice la société qui a créé la voix du robot. Ils affirment que Lovo, une start-up de Berkeley, en Californie, a utilisé illégalement des enregistrements de leurs voix pour créer une technologie capable de rivaliser avec leur travail vocal. Après avoir entendu un clone de la voix de M. Lehrman dans le balado, le couple a découvert que Lovo en avait fait de même pour la voix de Mme Sage.

Le couple rejoint ainsi un nombre croissant d’artistes, d’éditeurs, de programmeurs informatiques et d’autres créateurs qui ont poursuivi les fabricants de technologies d’intelligence artificielle, arguant que ces entreprises ont utilisé leur travail sans autorisation pour créer des outils qui pourraient à terme les remplacer sur le marché du travail. (En décembre, le New York Times a intenté un procès à deux de ces sociétés, OpenAI et son partenaire Microsoft, les accusant d’avoir utilisé ses articles de presse protégés par le droit d’auteur pour créer leurs robots de conversation en ligne.)

Dans sa plainte, déposée jeudi devant le tribunal fédéral de Manhattan, le couple affirme que des employés anonymes de Lovo l’ont payé pour quelques clips vocaux en 2019 et 2020 sans divulguer l’utilisation qui en serait faite.

M. Lehrman et Mme Sage affirment que Lovo, qui a été fondée en 2019, viole la loi fédérale sur les marques et plusieurs lois étatiques sur la vie privée en promouvant des clones de leurs voix. Ils invitent d’autres acteurs vocaux à se joindre à eux.

« Nous ne savons pas combien d’autres personnes ont été touchées », a indiqué leur avocat, Steve Cohen.

Lovo nie les allégations contenues dans la plainte, a affirmé David Case, un avocat représentant la société. Il a ajouté que si toutes les personnes qui ont fourni des enregistrements vocaux à Lovo ont donné leur consentement, « il n’y a pas de problème ».

Tom Lee, PDG de la société, a dit l’année dernière dans un épisode de balado que Lovo offrait désormais un programme de partage des revenus qui permettait aux acteurs de voix d’aider la société à créer des clones de voix d’eux-mêmes et de recevoir une part des revenus générés par ces clones.

Des « scripts de test »

Ce procès semble être le premier du genre, selon Jeffrey Bennett, avocat général de la Screen Actors Guild-American Federation of Television and Radio Artists, le syndicat qui représente 160 000 professionnels des médias dans le monde entier.

Ce procès montrera aux gens – en particulier aux entreprises technologiques – qu’il existe des droits sur votre voix, qu’il y a tout un groupe de personnes qui gagnent leur vie en utilisant leur voix. Jeffrey Bennett, avocat général de la Screen Actors Guild-American Federation of Television and Radio Artists

En 2019, M. Lehrman et Mme Sage se sont fait connaître en tant qu’acteurs vocaux sur Fiverr, un site web où les professionnels indépendants peuvent annoncer leur travail. Grâce à ce marché en ligne, on leur demandait souvent de fournir des voix pour des publicités, des annonces radio, des vidéos en ligne, des jeux vidéo et d’autres médias.

Cette année-là, Mme Sage a été contactée par une personne anonyme qui l’a payée 400 $ pour enregistrer plusieurs scripts radio et lui a expliqué que les enregistrements ne seraient pas utilisés à des fins publiques, selon la correspondance citée dans la plainte.

« Il s’agit de scripts de test pour des publicités radiophoniques », a indiqué la personne anonyme, selon la plainte. « Ils ne seront pas divulgués à l’extérieur et ne seront utilisés qu’en interne, de sorte qu’ils ne nécessiteront aucun droit d’aucune sorte. »

Sept mois plus tard, une autre personne non identifiée a contacté M. Lehrman pour un travail similaire. M. Lehrman, qui travaille également comme acteur de télévision et de cinéma, a demandé comment les clips seraient utilisés. La personne a répondu à plusieurs reprises qu’ils ne seraient utilisés qu’à des fins de recherche et d’enseignement, selon la correspondance citée dans le procès. M. Lehrman a été payé 1200 $. (Il a fourni des enregistrements plus longs que ceux de Mme Sage.)

En avril 2022, M. Lehrman a découvert une vidéo YouTube sur la guerre en Ukraine dont la narration était faite par une voix qui ressemblait à la sienne.

« C’est ma voix qui parle de l’armement dans ce conflit », a-t-il indiqué.

Je suis devenu blanc comme un drap – j’ai eu la chair de poule. Je savais que je n’avais jamais prononcé ces mots dans cet ordre. Paul Skye Lehrman, acteur de voix

Pendant des mois, Mme Sage et lui se sont efforcés de comprendre ce qui s’était passé. Ils ont engagé un avocat pour les aider à retrouver l’auteur de la vidéo YouTube et la manière dont la voix de M. Lehrman avait été recréée. Mais le propriétaire de la chaîne YouTube semblait être établi en Indonésie, et ils n’avaient aucun moyen de le retrouver.

C’est alors qu’ils ont entendu le balado en se rendant chez le médecin. Grâce au balado Deadline Strike Talk, ils ont pu identifier la source du clone vocal de M. Lehrman. Un professeur du Massachusetts Institute of Technology avait assemblé le robot conversationnel en utilisant la technologie de synthèse vocale de Lovo.

Clonage vocal accessible

M. Lehrman et Mme Sage ont également découvert que Lovo faisait la promotion de clones vocaux d’eux sur son site web. Après qu’ils eurent envoyé à la société une mise en demeure, l’entreprise a indiqué qu’elle avait retiré leurs clones vocaux du site. Mais ils ont fait valoir que le logiciel qui pilotait ces clones vocaux avait déjà été téléchargé par un nombre incalculable de clients de la société et qu’il pouvait encore être utilisé.

M. Lehrman s’est également demandé si l’entreprise avait utilisé les voix du couple, ainsi que de nombreuses autres, pour mettre au point la technologie de base de son système de clonage vocal. Les synthétiseurs vocaux acquièrent souvent leurs compétences en analysant des milliers d’heures de paroles, de la même manière que le ChatGPT d’OpenAI et d’autres robots conversationnels acquièrent leurs compétences en analysant de grandes quantités de textes tirés de l’internet.

Lovo a reconnu avoir formé sa technologie en utilisant des milliers d’heures d’enregistrements de milliers de voix, selon la correspondance déposée dans le cadre du procès.

M. Case, l’avocat représentant Lovo, a déclaré que l’entreprise avait entraîné son système d’intelligence artificielle à l’aide d’enregistrements audio provenant d’une base de données librement accessible d’enregistrements en anglais appelée Openslr.org. Il n’a pas répondu à la question de savoir si les enregistrements des voix de M. Lehrman et de Mme Sage avaient été utilisés pour entraîner la technologie.

