Vous voulez faire dire à votre idole qu’il vous adore ? C’est aujourd’hui possible avec ce qu’on appelle les deepfakes. Voici les secrets de cette nouvelle technologie qui laisse sans voix.
Quel est le point commun entre la vidéo de Barack Obama qui insulte Trump sur BuzzFeed, celle de Tom Cruise avec une sucette, qui fait fureur sur TikTok ou l’émission « Hôtel du temps » sur France 3 ? Et bien, elles ne sont pas vraies, ou du moins transformées. Nous allons vous expliquer pourquoi et quelle intelligence artificielle permet cela.
A l’heure actuelle, les vidéos utilisant le deepfake se retrouvent partout. Une simple recherche permet de trouver n’importe quel type de deepfake sur les réseaux sociaux. Mais à l’origine, seuls les sites pornographiques faisaient usage de ce procédé, en remplaçant le visage du figurant par celui d’une personnalité connue. Le résultat est bluffant, preuve en est de l’attractivité qu’a engendrée cette pratique sur ces sites.
Les deepfakes se sont généralisés et apparaissent comme une technologie à fort enjeux stratégiques. Ils permettent notamment de réaliser des fausses vidéos de célébrités, des films avec de faux acteurs ou encore des faux discours de politiciens — par exemple, dans cette vidéo, on peut voir à gauche un discours d’une personne imitant Trump et à droite, l’incrustation de sa voix sur le visage du vrai président -.
Concrètement, qu’est ce que c’est le deepfake ?
Avant de tout savoir de l’utilisation de l’IA pour réaliser un deepfake, il est nécessaire de le définir et d’expliquer ce qu’il implique concrètement.
Définition de cette pratique
Le Deepfake est une contraction de deep learning et de fake. Il regroupe toute les technologies numériques qui mettent en place un système d’algorithmes afin de développer une “intelligence amplifiée” (IA). L’anglicisme “fake”, quant à lui, signifie “faux, erroné”.
On pourrait finalement résumer cette technique à “une technologie d’apprentissage profond capable de faire une synthèse de fausses vidéos réalistes de personnes faisant des déclarations qu’ils n’ont jamais faites”.
L’utilisation -intentionnée- de l’intelligence amplifiée à la place de l’intelligence artificielle reprend les travaux du chercheur Marc Halévy. L’IA regroupe “l’ensemble des théories et des techniques mises en œuvre en vue de réaliser des machines capables de simuler l’intelligence humaine”. Ainsi, il est beaucoup plus logique de parler d’une intelligence amplifiée de celle humaine que d’une nouvelle forme d’intelligence. Le qualificatif IA que nous utilisons dans le texte diffère donc des initiales classiques de l’intelligence des machines.
Deepfake Tom Cruise, exemple de vidéos truquées
Prenons l’exemple des fausses vidéos de Tom Cruise. En février 2021, des vidéos énigmatiques venant du compte DeepTomCruise montrent l’acteur se ridiculiser en se faisant croc-en-jambe. Toute la planète s’enflamme, quel intérêt l’acteur aurait-il à s’afficher ainsi ?
En réalité, c’est un youtubeur, Chris Umé, qui a créé un deepfake en remplaçant le visage d’un ‘imitateur’ (Miles Fisher) par celui de Tom Cruise. Personne n’a rien remarqué. Il a fallu que ce spécialiste des effets spéciaux se dénonce pour découvrir la supercherie. L’idée derrière cette illusion est d’alerter le public sur les dangers potentiels du Deepfake. Chris Umé souligne d’ailleurs l’importance d’encadrer cette technologie qui peut être utilisée à des fins malveillantes.
Le deepfake développé par Chris Umé a permis deux niveaux de transformation :
- L’incrustation du visage. En prenant une base de données composée de milliers de photos de Tom Cruise, un algorithme a permis d’enregistrer un maximum d’expression de son visage et d’en faire une synthèse afin de rendre le plus fidèle possible la permutation entre le visage de Tom Cruise et celui de l’acteur.
- La transformation de la voix. Un autre logiciel a récupérer la tonalité de la voix de Tom Cruise en y associant le mouvement de ses lèvres afin de le superposer au visage de l’acteur.
A travers ces deux techniques, le rendu vidéo est extrêmement réaliste et permet de limiter au maximum les incohérences que l’on pourrait remarquer sur une image.
C’est cette même technique qui a été utilisé dans l’émission du France 3 « Hotel du temps » où l’animateur Thierry Ardisson interview des grandes personnalités françaises pourtant décédées. La technologie du Deepfake permet de les « ressusciter » et de les faire parler de façon extrêmement réaliste.
Quel est l’intérêt d’une telle pratique ?
A l’inverse d’autres logiciels de tracking tel que After Effect, l’intérêt des logiciels de Deepfake se résume en deux points : sa facilité d’accès et son utilisation à portée de tous.
Une facilité d’accès
Si l’on recherche bien, on peut trouver facilement nombre d’outils de deepfakes gratuits, sans licence et non réglementés. Il existe même des applications portables permettant, peut être de façon moins parfaite que les logiciels, de réaliser des vidéos fake. Prenons l’exemple de FaceApp qui permet à tous, sans compétences particulières, d’appliquer sur des visages un filtre pour les vieillir.
D’autres applications ont décidé d’utiliser ce type de Deepfake appelé « Face Swap » et consistant à échanger sa tête avec celle d’une autre personne présente sur une ou plusieurs photos ou une vidéo. L’application Reface, sortie en juin 2021, permet par exemple d’utiliser cette technique de face swaping en intégrant le visage d’une personne connue sur notre tête. Et le résultat est bluffant !
Une facilité de compréhension et d’utilisation
Les logiciels utilisant un Deepfake sont aussi très faciles à comprendre. Pour vous convaincre, prenons l’exemple d’un type de deepfake, celui du “Lip-Sync Deepfake”. Ce procédé permet d’échanger la voix d’une personne dans un vidéo par celle d’une autre. Pour cela, à partir d’une vidéo de base, il suffit de réaliser un enregistrement vocal du discours que l’on veut implanter, ainsi que le mouvement des lèvres durant ce discours. Ces deux données seront transférées sous forme d’un modèle de réseau neuronal qui synchronisera le nouveau discours sur la vidéo originale.
Cette technique utilise donc un logiciel de “deepfakes” qui, lorsque l’on a choisi sa vidéo, synchronise automatiquement l’ensemble des données transmises et modifie la voix afin de créer de façon très réaliste le faux discours.
Attention aux raccourcis
Il est nécessaire de nuancer quelque peu ces propos. Oui, les logiciels de deepfakes sont facile d’accès et d’utilisation. Mais cela demande du temps et un certain nombre de ressources pour en réaliser un. Il faut déjà avoir à notre disposition un très grand nombre de photos et images de la personne que l’on veut imiter (quelques milliers !) et compter jusqu’à quelques jours pour créer une fake vidéo.
Les dangers des Deepfakes
Vous l’avez compris, les Deepfakes sont ultra-réalistes et à la portée de tous. Vient alors à l’esprit la question du détournement des vidéos à des fins diffamatoires ou d’usurpation d’identité.
L’utilisation du Deepfake permet de transformer n’importe quelle vidéo. Ca peut faire peur : avec cet outil, la manipulation est de plus en plus facile. Les deepfakes posent la question de la véracité de ce que l’on peut voir. Il devient important d’être prudent sur toutes les informations et recherches trouvées sur le web. La désinformation prend tout son sens lorsque l’on devient conscient des dangers qu’elle implique.
Sur le même sujet : quels objets et services de notre quotidien utilisent une intelligence artificielle ?
Voice Deepfake, une arnaque de plus en plus répendue
Un des type de Deepfake qui est le plus rependu dans les arnaques aujourd’hui : le Voice Deepfake. Cette technique consiste à transformer sa voix par celle de quelqu’un d’autre. De nombreuses personnes se sont fait avoir. C’est le cas d’une banque des Emirats Arabes Unis qui, en janvier 2020, a été escroquée de 35 millions de dollars avec cette pratique. Imitant la voix du parton de la banque durant un appel téléphonique, l’escroc à demandé de débloquer pour une acquisition que la banque était sur le point de réaliser. Personne ne s’est aperçu de la supercherie et une enquête à lieu pour connaitre le coupable.
Peut-on faire encore confiance aux images, à ce que l’on entend et même à ce que l’on voit ?
Comment encadrer cette pratique du Deepfake ?
Le monde de la recherche s’essaye à contrôler le procédé du Deepfake avec des applications différentes, les logiciels de détection étant une des solutions les plus viables actuellement.
Les logiciels de détection
Que présage une telle avancée technologique ? Comment contrôler les fakes news ? Il est clair que la facilité déconcertante avec laquelle il est possible pour n’importe qui d’attenter à la vie privée d’une personne ou d’usurper son identité peut faire peur. Il est donc nécessaire de contrôler cette pratique.
Le Deepfake Detection Challenge
Des mesures ont déjà été mises en place comme le DeepFake Detection Challenge (DFDC). Cette initiative toute droit venue des États Unis est menée par Facebook. Elle propose aux participants d’essayer de trouver un programme capable de déceler les fausses vidéos des vraies. Pour l’instant, le modèle le plus efficace a un taux de précision de 82%.
MAJ 23/06/2021 : Facebook a lancé un projet, avec la Michigan State University, pour créer le logiciel de détection de deepfake « le plus aboutie à l’heure actuelle ». Cette technique est appelée la rétro-ingénierie. Elle consiste en la déconstruction de la photo ou vidéo pour repérer les imperfections ajoutées au montage.
Le Checknew
D’autres initiatives voient le jour afin de prévenir des fake news. Checknew est une rubrique de fact-checking venant de France. Elle est développée par le journal Libération. Elle propose un contenu qui a été vérifié au préalable afin d’être sûr de la véracité des propos et des images que comporte l’article. Cette rubrique utilise entre autres le logiciel Assembler, développé par Google, qui permet de détecter les retouches effectuées sur une image pour savoir si elle est réelle ou truquée.
FaceForensics++
On se rend compte que les contrôles de lutte contre les fakenews sont de plus en plus nombreux même s’il n’existe pas encore de logiciels capables de détecter à 100% une fausse vidéo. FaceForensics++ est une base de données qui permet aux chercheurs d’être au courant des dernières avancées de logiciels de détection de deepfake. Cette ensemble de données se base sur différentes méthodes de deepfake qui analysent les vidéos et essayent trouver un indice de trucage à travers un programme de deeplearning appelé CNN (Réseau neuronal convolutif).
Video Athenticator
Microsoft a dévoilé en septembre 2020 un logiciel qui analyser une photo ou une vidéo fixe. Elle va ensuite proposer un pourcentage de chance que le média soit manipulé artificiellement. Dans le cas d’une vidéo, il peut fournir ce pourcentage en temps réel sur toutes les images pendant la lecture de la vidéo. Pour ce faire, il utilise notamment la base de données de FaceForensics++ et a été testé pendant le DeepFake Detection Challenge avec un taux élevé de réussite.
D’autres logiciels devrait voir le jour avec l’introduction de la nouvelle intelligence artificielle, Wu Dao 2.0. Un article dédié est d’ailleurs à retrouver sur notre site pour tout savoir de ce modèle chinois qui se distingue des IA occidentales.
Les défis de détection de cette technologie
Si les logiciels de détection de deepfake comme solution aux dérives se multiplient, la difficulté de leur fiabilité s’explique par plusieurs facteurs.
- La qualité de la vidéo à analyser
Le problème de la qualité de la vidéo est un obstacle auquel se heurtent ces logiciels. Lorsqu’un contenu est mis en ligne sur internet, sa qualité se dégrade du fait de nombreux facteurs – compression des données, redimensionnement etc -. Les performances des logiciels de contrôle s’amoindrissent car une vidéo de qualité médiocre est plus difficilement analysable.
- La multiplicité des méthodes d’utilisation du deepfake
Une autre difficulté rencontrée est la multiplicité des méthodes de deepfake. Mettre en place un logiciel qui généralise l’ensemble des techniques est d’ailleurs l’enjeu majeur du DFDC.
- L’évolution croissante de la technologie
Enfin, l’évolution du deepfake et son niveau de complexité croissant est l’un des défis majeurs pour ces logiciels qui doivent en permanence s’adapter.
Questions fréquentes sur le Deepfake
Quelle est l’origine du mot deepfake ?
Le Deepfake est une contraction anglaise entre deux mots, le deep learning et « fake« . Il utilise donc une branche du machine learning en appliquant une simulation de réseaux neuronaux à des ensembles de données, pour créer un faux.
A quoi sert un deepfake ?
Les utilisations des deepfakes sont nombreuses. Parmi elles, on peut citer la diffusion d’informations erronées pour faire le buzz sur le web, créer des porn deepfakes (plus de 100 000 recherches par mois), se moquer d’un sujet, faire rire…
Quelle technologie est nécessaire pour réaliser un deepfake ?
En quelque jours, avec un ordinateur puissant et un minimum de connaissance, il est possible de créer un deepfake. Il suffit de se rendre sur un site internet de création de deepfake sur ordinateur ou sur smartphone et de suivre leur tutoriel avec leurs outils.
Le deepfake est-il légal ?
Les logiciels de deepfakes sont gratuits, sans licence, non réglementés. Il est donc possible pour toutes personnes d’utiliser de façon totalement légal ces logiciels. Là où réside la barrière de la légalité se trouve dans l’utilisation du deepfake à des fins diffamatoires ou non-consenties.
Quels sont les dangers du deepfake ?
Les Deepfakes sont ultra-réalistes et à la portée de tous. La désinformation, l’usurpation d’identité, les problèmes de copyright, l’atteinte à autrui sont des dangers du deepfake auxquels il faut se méfier. L’enjeu des années à venir est de permettre sa bonne utilisation par des logiciels de contrôle fiables.
Quels sont les contrôles du deepfake ?
Il n’existe pas de véritable contrôle. Seul certains logiciels arrivent à repérer les deepfakes mais avec un taux de précision qui ne dépassent pas 90%. Pour pallier ce problème, les initiatives sont prises. Le Deepfake Detection Challenge est un concours lancé par Facebook. Son but est de trouver le logiciel le plus performant possible pour déceler les fausses vidéos.
Retrouve-t-on du deepfake au cinéma ?
L’industrie du cinéma commence à s’intéresser à la technologie du Deepfake pour ses films, à Hollywood comme en France. Dans la série « Plus belle la vie » par exemple, un épisode utilise le Deepfake pour palier l’absence d’une actrice. Aussi, un spécialiste de cette technologie a été embauché par Lucas Film pour la prochaine saison de « The Mandalorian ».