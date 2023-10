C’est la grande nouveauté proposée par OpenAI au cours du mois de septembre. Alors qu’il était déjà très fort pour converser à l’écrit, ChatGPT va pouvoir discuter avec vous à l’oral, et comprendre tout ce que vous lui dites !

Depuis novembre 2022, date à laquelle il a été mis à la disposition au grand public, ChatGPT ne cesse d’étonner le monde. Véritable révolution dans le monde de l’intelligence artificielle, cet outil vu comme un robot conversationnel répond à toutes vos questions en un instant, et peut même être utilisé comme un véritable assistant personnel. Désormais, l’outil le plus célèbre d’OpenAI a même la particularité de converser de vive voix avec vous.

Cap de discuter des heures avec une intelligence artificielle ?

Le 25 septembre dernier, OpenAI a annoncé à ses plus fervents utilisateurs de son application qu’ils pourront bientôt converser avec son IA à voix haute. Pour y parvenir, la start-up de Sam Altman s’appuiera, entre autres sur Whisper, un modèle retranscrivant les paroles d’un usager en texte. Un modèle de synthèse vocal, sans doute développé par la société, permettra à ChatGPT de s’exprimer oralement.

En clair, ces outils permettent de transformer la voix en texte et vice-versa. Puisque ChatGPT fonctionne avec un modèle de langage, GPT-3 ou GPT-4 en fonction de la version utilisée, il ne comprend pas directement les paroles d’un être humain, et n’est pas capable de restituer ses connaissances vocalement. Il ne comprend que le texte, et c’est en passant par ces deux logiciels qu’il sera capable d’interagir vocalement avec vous.

Dans les prochaines semaines, OpenAI aura la lourde tâche d’humaniser ce rendu, afin que les conversations avec ses utilisateurs soient les plus naturelles et crédibles possibles. L’entreprise s’est rapprochée de plusieurs comédiens professionnels afin de développer cinq voix synthétiques baptisées Sky, Juniper, Cove, Ember et Breeze. Comme l’indique la société :

« À terme, l’IA sera capable de générer un son de type humain seulement à partir de texte et de quelques secondes d’échantillons de parole ».

Avec les nouvelles fonctionnalités de ChatGPT, OpenAI va-t-il mettre un coup de frein aux assistants vocaux personnels ?

Mais jusqu’où ira OpenAI avec ChatGPT ?

Grâce à toutes ces subtilités, le robot conversationnel répondra oralement à toutes les questions d’un utilisateur, mais pourra également lui lire un texte par exemple. Pour OpenAI, le but est de simplifier le processus d’utilisation de l’outil afin de le rendre utilisable par le plus grand nombre.

Elle souhaite également rendre l’interaction toujours plus humaine, comme si l’utilisateur pouvait discuter avec une vraie personne.

Outre cette fonctionnalité, les usagers de ChatGPT auront désormais la possibilité d’importer une ou plusieurs images dans leur conversation afin qu’elles soient analysées par l’intelligence artificielle. Une fonctionnalité qui fait penser à ce que peut proposer Google avec Lens.

En associant le texte et l’image, OpenAI espère que ses utilisateurs auront accès à des réponses plus précises, et pourront proposer toujours plus de requêtes.

Comme Google Lens, OpenAI vous proposera de combiner une requête écrite avec une image.

Avec ces multiples fonctionnalités, les utilisateurs peuvent être sceptiques vis-à-vis des dérives et des fraudes. En proposant un outil aussi puissant, à l’apparence humaine, les escroqueries risquent se multiplier. C’est pourquoi OpenAI a tenté d’apaiser les tensions en réagissant à cette problématique :

« Tout est fait que pour les technologies que nous développons pour alimenter nos outils soient utilisables que dans un seul cas : le chat vocal, et rien d’autre. »

À l’avenir, ChatGPT pourrait bien devenir un outil tout-en-un, qui supplanterait bien d’autres appareils ou logiciels pourtant énormément utilisés aujourd’hui…