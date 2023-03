Les intelligences artificielles sont partout : ChatGPT permet de discuter avec une IA, Dall-E de créer des images à partir de mots clés et maintenant, c’est au tour des modèles vocaux de faire parler d’eux. Ces intelligences artificielles parviennent à dupliquer des voix existantes pour leur faire dire tout et (surtout) n’importe quoi.

Recréer des discours qui n’ont jamais pu être enregistrés, créer un sample d’un artiste décédé ou utiliser plusieurs voix de célébrités sur un discours de Leonardo DiCaprio… les IA de création vocale permettent d’utiliser la voix de personnes connues ou non et d’en faire à peu près ce que vous voulez. Des contenus rigolos aux fake news : plongeons dans ces nouvelles IA qui font autant rire qu’elles ne soulèvent de questions.

Les utilisations positives des IA vocales

Vous en avez sûrement déjà entendu parler tant cette nouvelle IA a fait parler d’elle ces derniers temps. ElevenLabs permet à n’importe qui de glisser des extraits vocaux d’une personne (connue ou non) dans un logiciel. Celui-ci va alors analyser la voix et en extrapoler un timbre ainsi qu’un rythme vocal. L’utilisateur pourra ensuite écrire ce qui lui passe par la tête et demander à la voix générée de lire son écrit.

Avant de se plonger dans les dérives ténébreuses qui ont émergé avec cette nouvelle IA, on vous propose de découvrir quelques utilisations originales et drôles qui en ont été faites.

Les IA génératives au service de la musique

David Guetta n’a pas révélé les sites qu’il avait utilisés. Toutefois, différentes IA lui ont permis de créer automatiquement des paroles dans le style d’Eminem à partir d’extraits vocaux et ensuite générer un chant avec une voix semblable à celle du rappeur. Résultat : une IA a pris la peau du « Rap God » pour poser des rimes sur les samples produits par David Guetta en plein live.

Alors bien sûr, cette utilisation soulève énormément de questions vis-à-vis des droits d’auteurs et le DJ français a assuré qu’il ne commercialiserait pas le son créé avec l’IA. Il n’en reste pas moins que cela ouvre la porte à de nouvelles créations (à condition que les ayants droits soient consentants bien évidemment).

Eleven Labs, le site pour créer des parodies

Véritable phénomène aux États-Unis, le détournement vocal via ElevenLabs est une source inépuisable de parodies. Certaines créations sont apparues en France, notamment dans l’émission Popcorn de Domingo où les invités ont eu la surprise d’écouter leurs voix générées automatiquement.

Deux limites ont été mises en lumière :

L’IA ne peut pour le moment que générer du texte en anglais.

La restitution invente parfois des accents étrangers

Au pays de l’oncle Sam que les détournements pullulent également et y sont particulièrement efficaces. Les victimes sont généralement Donald Trump, Joe Biden et Barack Obama… À titre d’exemple, on vous propose cette vidéo où les trois présidents jouent à Minecraft et débattent d’Evangelion (meilleur anime en toute objectivité bien sûr).

Les dérives des IA vocales

Malheureusement, les utilisateurs de ces IA vocales ne se contentent pas tous de créer des parodies ou de faire des samples, certains y voient des opportunités bien plus sombres comme cette vidéo utilisant la voix d’Emma Watson pour lire Mein Kampf… D’autres se sont servis de cette application pour créer des fake news et Joe Biden en est une des principales victimes. Du recomptage des voies aux déclarations de guerre à la Russie, tout y passe…

« Funny book »… Mais bien sûr…

Conscient des problèmes d’images et de droits d’auteurs liés à son service, ElevenLabs a communiqué le 31 janvier 2023 – via un thread Twitter – des changements de politiques en termes de sécurité. Le site demande désormais un paiement de 0 euro pour débuter le mois d’essai gratuit afin de pouvoir traquer les utilisateurs et bannir les comptes créant des contenus malveillants.

ElevenLabs propose différentes offres d’abonnements :



– 0 $ / mois = création de 3 voix,

– 5 $ / mois = 10 voix,

– 22 $ / mois = 30 voix,

– 99 $ / mois = 160 voix,

– 330 $ / mois = 660 voix.

Mais malheureusement bon nombre de fake news ont déjà circulé (sur 4Chan notamment) et il semble étonnant que la société ait mis plus d’un an à réaliser que les internautes ne sont pas tous bienveillants… Les deepfakes vidéos (politiques ou érotiques) étaient déjà connus depuis des années et il parait assez inconcevable que des personnes travaillant sur des deepfakes vocaux n’aient pas pensé en amont à des détournements néfastes…