L’utilisation par un documentariste d’un logiciel de clonage de la voix humaine pour faire dire au regretté chef Anthony Bourdain des mots qu’il n’a jamais prononcés a suscité des critiques en raison de préoccupations éthiques concernant l’usage de la puissante technologie.

Le film Roadrunner : A Film About Anthony Bourdain est apparu dans les cinémas vendredi et comprend principalement des images réelles du célèbre chef et animateur de télévision globe-trotter avant sa mort en 2018. Mais son réalisateur, Morgan Neville, a déclaré au New Yorker qu’un extrait de dialogue a été créé à l’aide de la technologie de l’intelligence artificielle.

Cela a relancé un débat sur l’avenir de la technologie de clonage vocal, non seulement dans le monde du divertissement, mais aussi dans la politique et dans un secteur commercial en croissance rapide dédié à la transformation du texte en un discours humain réaliste.

« Le clonage vocal non approuvé est une pente glissante », a déclaré Andrew Mason, fondateur et PDG du générateur de voix Descript, dans un article de blogue vendredi. « Dès que vous entrez dans un monde où vous portez un jugement subjectif sur l’éthique de cas en particulier, vous vous rapprochez d’un monde où tout est possible. »

Avant cette semaine, la controverse publique tournait principalement autour de la création d’hypertrucages difficiles à détecter à l’aide de simulations audio et vidéo et leur potentiel d’alimenter la désinformation et les conflits politiques.

Mais M. Mason, qui a précédemment fondé et dirigé Groupon, a déclaré dans une entrevue que Descript avait rejeté à plusieurs reprises les demandes pour ramener à la vie une voix humaine, y compris de « personnes qui ont perdu un proche et sont en deuil ».

« Ce n’est même pas vraiment que nous voulons porter un jugement, a-t-il déclaré. Nous disons simplement que vous devez avoir des lignes claires dans ce qui est bien et ce qui ne l’est pas. »

Les réactions de colère et de malaise à l’égard du clonage de la voix dans le documentaire sur le chef Anthony Bourdain reflètent les attentes et les enjeux de divulgation et de consentement, a soutenu Sam Gregory, directeur de programme chez Witness, une organisation à but non lucratif travaillant sur l’utilisation de la technologie vidéo pour faire avancer les droits de l’homme. L’obtention du consentement et la divulgation de la technologie en question auraient été appropriées, a-t-il fait valoir. Au lieu de cela, les spectateurs ont été stupéfaits – d’abord par le fait du trucage audio, puis par le rejet apparent du réalisateur de toute question éthique – et ont exprimé leur mécontentement en ligne.

« Cela touche également à nos peurs relatives à la mort et à nos idées sur la façon dont les gens pourraient prendre le contrôle de notre ressemblance numérique et nous faire dire ou poser des gestes sans aucun moyen de l’empêcher », a déclaré M. Gregory.

Le réalisateur Morgan Neville n’a pas précisé l’outil qu’il a utilisé pour recréer la voix de M. Bourdain, mais a déclaré qu’il y avait eu recours pour quelques phrases que le chef a écrites, mais jamais dites à haute voix.

« Avec la bénédiction de son agent littéraire et de patrimoine, nous avons utilisé la technologie de l’IA », a déclaré M. Neville par communiqué. « C’était une technique de narration moderne que j’ai utilisée dans quelques endroits où je pensais qu’il était important de donner vie aux paroles de Tony », a-t-il ajouté.

M. Neville a également affirmé au magazine GQ qu’il avait obtenu l’approbation de la veuve et de l’exécuteur testamentaire de M. Bourdain. L’épouse du chef, Ottavia Busia, a répondu sur Twitter : « Je n’étais certainement PAS celle qui a dit que Tony aurait été cool avec ça. »

Bien que des géants de la technologie comme Microsoft, Google et Amazon aient dominé la recherche de synthèse vocale, il existe désormais également un certain nombre de jeunes pousses comme Descript qui proposent un logiciel de clonage vocal. Les utilisations touchent notamment les clavardages de services à la clientèle, les jeux vidéo et la baladodiffusion.

Beaucoup de ces sociétés de clonage vocal mettent en évidence une politique d’éthique sur leur site web qui explique les conditions d’utilisation. Sur près d’une douzaine d’entreprises contactées par l’Associated Press, beaucoup ont déclaré qu’elles n’avaient pas recréé la voix du chef Bourdain et ne l’auraient pas fait si on leur avait demandé. D’autres n’ont pas répondu.

« Nous avons des politiques assez strictes concernant ce qui peut être fait sur notre plate-forme », a déclaré Zohaib Ahmed, fondateur et PDG de Resemble AI, une entreprise de Toronto qui vend un service de générateur de voix d’intelligence artificielle personnalisé. « Lorsque vous créez un clone de voix, cela nécessite le consentement de l’individu. »

M. Ahmed a déclaré que les rares occasions où il a autorisé un clonage vocal posthume étaient pour la recherche universitaire, y compris un projet travaillant avec la voix de Winston Churchill, décédé en 1965.

Il a souligné qu’une utilisation commerciale plus courante consistait à éditer une publicité télévisée enregistrée par de vrais acteurs, puis à la personnaliser en fonction d’une région en ajoutant une référence locale.

M. Neville est un documentariste acclamé qui a également réalisé le portrait de Fred Rogers Won’t You Be My Neighbor ? et le film oscarisé 20 Feet From Stardom. Il a commencé à réaliser son dernier film en 2019, plus d’un an après la mort par suicide de M. Bourdain en juin 2018.