La sixième version de Midjouney (v6), le générateur d’images permettant de concevoir des illustrations à partir d’un texte rédigé par un utilisateur, c’est pour bientôt ! Cette mise à jour devrait apporter de nombreuses nouveautés.
Concrètement, Midjourney offre la possibilité aux internautes qui souhaitent concevoir des images sur mesure, de le faire en quelques instants. Cet outil exploite l’intelligence artificielle générative pour générer des images sur mesure à partir de requêtes textuelles (des prompts). Une des particularités de Midjourney, c’est qu’il s’utilise à partir de Discord, sous la forme d’un bot présent directement dans le logiciel de VoIP (Voice over IP : commande vocale) et de messagerie instantanée.
A lire aussi : le top des intelligences artificielles pour paresseux !
C’est en rejoignant le serveur Discord de l’application, puis en allant dans un des salons textuels newbies qu’il vous sera possible de régler le bot en tapant vos commandes « /settings ».
Une fois réalisé, il vous suffit d’entrer la commande « /imagine », puis d’écrire le texte correspondant à ce que vous souhaitez obtenir comme illustration. Précisons toutefois qu’il faudra souscrire à un abonnement dont le montant débute à 8 dollars mensuels pour pouvoir utiliser l’outil à sa guise.
Pour quelle date est prévue la sortie de Midjouney v6 ?
Sortie en mars dernier, la cinquième version de Midjouney est la dernière disponible pour tous les utilisateurs Discord. Entre-temps, un Midjourney v5.1 a fait son apparition afin d’y inclure le mode « raw » offrant plus de précision et de performances dans les fonctionnalités déjà présentes dans Midjourney v5. Pour l’heure, aucune annonce officielle n’a été faite sur la date de sortie de Midjourney, sixième du nom, mais selon les informations de Dataconomy, il se pourrait que la nouvelle version sorte d’ici la fin de l’année, même si initialement, une sortie pour cet été était prévue.
Puisque la date de sortie initiale a été dépassée, on peut légitimement se demander si les chercheurs du laboratoire à l’origine de l’application préfèrent prendre leur temps pour proposer une version plus étoffée, plus fournie, ou simplement pour corriger certains bugs qu’ils ont pu apercevoir.
Quelles nouveautés prévues pour la sixième version de Midjourney ?
Contrairement à Midjourney 5.1, la future version de l’application devrait proposer une multitude de nouveautés, dont des nouvelles fonctionnalités concrètes.
La génération d’images en trois dimensions
Voici une fonctionnalité qui est présente dans la version payante d’un des outils concurrents de Midjourney, DALL-E 2 d’OpenAI avec la fonction Shap-E. Il serait possible dans Midjouney v6 de générer des modèles 3D permettant aux utilisateurs d’avoir accès à des images qu’il sera possible de visionner sur 360° et permettant de modéliser des espaces comme des pièces de maison, des monuments virtuels, des personnages ou des objets dans leur entièreté.
Des illustrations avec une meilleure définition
Si avec Midjourney v5.1, les utilisateurs ont la possibilité de générer des images d’une taille maximale de 1024 par 1024 pixels, cette valeur devrait être doublée en longueur et en largeur pour la sixième version de l’application. Elle passerait alors à 2048 par 2048, laissant envisager une meilleure définition, légèrement supérieur au Full HD.
De nos jours, la majorité des écrans que nous utilisons propose d’afficher des images d’une résolution supérieure à celle proposée par Midjourney. Bien évidemment, la génération d’images Full HD demandera une puissance de calcul plus conséquente.
Début 2023, Alienware proposait même un écran avec un rafraîchissement de 300Hz, mais est-ce réellement utile ?
Plus de variations d’images en fonction de la requête des utilisateurs !
On rentre dans le vif du sujet avec l’amélioration d’une fonctionnalité qui faisait déjà plaisir aux utilisateurs de Midjourney. Actuellement, lorsqu’une personne propose son texte au bot, celui-ci vous propose quatre propositions se rapprochant de ce que vous demandez. Avec Midjourney v6, les internautes pourraient choisir le nombre de propositions suggérées par la machine.
S’ils ne souhaitent qu’une seule variation, laissant la machine décider à leur place, les utilisateurs pourront le faire. A l’inverse, si les quatre possibilités ne sont pas suffisantes à leurs yeux, ils pourront augmenter le nombre d’occurrences et découvrir plus de propositions.
Pour l’heure, aucune limite n’a été annoncée. Bien entendu, l’arrivée d’une telle fonctionnalité sera tout de même bridé à une certaine valeur puisqu’elle nécessitera une forte puissance de calcul en cas d’occurrences très nombreuses.
Quid des vidéos sur Midjourney v6 ?
Voici le rêve de nombre d’utilisateurs, peut-être même le votre : avoir la possibilité de générer des vidéos grâce à l’application. Si pour l’heure, seules des illustrations sont proposées, il se peut que Midjourney sixième du nom puisse proposer une version bêta de génération de vidéos à partir d’une description textuelle.
Néanmoins, cette fonctionnalité n’est pas sûre d’arriver d’ici la fin de l’année. Il semble tout à fait imaginable qu’elle puisse voir le jour dans une autre version, une v6.1 ou la v7.
L’API comprendra mieux les requêtes des utilisateurs
N’importe qui ayant déjà utilisé Midjourney sait de quoi nous parlons. Si l’application permet de générer des illustrations sur mesure, elle n’est pas fiable à 100 %. Les fautes d’orthographe, les approximations, les homonymes, sont souvent mal compris par l’outil qui tente de les décortiquer par tous les moyens.
Ainsi, gare aux « pommes de douche » qui deviennent de véritables pommes sous la douche. La v6 de Midjourney pourrait bien être beaucoup plus flexible, utilisant un modèle de langage comprenant mieux les termes plus familiers des utilisateurs.
Pour aller plus loin : comment fonctionne l’intelligence artificielle ?
Bric-à-brac de nouveautés mais qui pourrait ne pas arriver pour la v6
Enfin, outre les probables nouveautés déjà présentées, les utilisateurs ont des souhaits, et les font connaître. Ils aimeraient que le robot puisse enfin devenir une API, utilisable sans avoir à passer par Discord. Difficile d’imaginer que cela puisse arriver avec la sixième version mais les internautes sont unanimes, cela permettrait de décupler les possibilités de Midjouney.
Autre nouveauté souhaitée par les utilisateurs : les générations non fidèles avec la réalité lorsque la requête le demande. La fin des mains à quatre ou six doigts, des pieds à six orteils, ou encore des objets encastrés les uns les autres : ce n’est pas pour tout de suite, car le deep learning, au centre des algorithmes faisant fonctionner Midjourney, n’est pas assez performant pour éviter parfois, ce genre d’approximations…
De nombreuses nouveautés sont attendues, beaucoup sont espérées pour la prochaine version, mais d’autres verront le jour dans quelques années… ou pas. En bref, seul le temps nous le dira…
depuis la v4 il n’y a quasiment plus de problème avec les mains, sinon merci, hâte de voir ce que va donner la 3d !