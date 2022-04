Google a mis au point une nouvelle IA appelée MUM. Faisant suite à Bert, cette IA plus performante permet de comprendre l’intention de l’utilisateur derrière chaque demande effectuée. Mais ce n’est pas tout, elle vise aussi à protéger ses usagers en simplifiant la recherche d’informations lorsqu’ils sont en situation de crise.

Dans le but de perfectionner son moteur de recherche, Google n’a de cesse de développer des algorithmes toujours plus performants. C’est dans cette optique que l’entreprise a annoncé le 29 mars dernier, lors d’une conférence de presse le lancement de MUM, une nouvelle IA plus performante qui remplacera dès cette année l’algorithme Bert. Grâce à MUM, (acronyme de Multitask Unified Model), Google sera en mesure de donner des réponses encore plus pertinentes à des requêtes plus complexes. Avec cette dernière, Google en est certain : c’est une nouvelle étape de l’IA qui est franchie.

Qu’est-ce que MUM, la nouvelle IA de Google ?

Les ingénieurs de Mountain View sont partis d’un constat : lorsqu’un utilisateur effectue une recherche complexe (composée de plusieurs propositions et/ou de termes comparatifs, par exemple), il lui faut en moyenne huit requêtes différentes pour trouver la réponse qui correspond à son intention première. Ces huit requêtes permettent de préciser la recherche afin d’obtenir des informations qui ne sont pas remontées avec les résultats précédents, comme il était le cas avec l’algorithme Bert.

Ce qui veut dire deux choses : les requêtes formulées sur le moteur de recherche sont à la fois plus complètes et plus complexes. C’est due en grande partie à la recherche vocale via l’assistant de Google. Les utilisateurs ont de plus en plus tendance à formuler leur recherche en langage naturel. Avec MUM, Google veut repenser la recherche internet pour donner des réponses plus pertinentes. Pour ce faire, cet algorithme utilise l’IA et a été développé afin d’être plus à même de comprendre ce que recherche l’internaute.

Cette IA utilise le framework T5 (Text-To-Text Transfer Transformer ), rassemble les enseignements et les améliorations issus des modèles de traitement automatique du langage (Natural Language Processing ) basés sur l’apprentissage par transfert et qui permet de comprendre toutes les nuances de recherche. À titre de comparaison, MUM est 1000 fois plus puissant que son prédécesseur, BERT, et est entraîné pour fonctionner sur 75 langues. Mum est aussi multimodal, il gère différents types de médias (photos,vidéos,etc.)

Google cherche avant tout à offrir une meilleure expérience utilisateur et plus de performance mais la société a aussi ajouté avoir développé MUM dans le but de protéger ses internautes. En effet, dans le cadre de ses principes en matière d’IA, Google se veut utile et donnera des résultats plus pertinents aux personnes en situation de crise, leur permettant ainsi de trouver de l’aide plus facilement.

Une IA entraînée sur des données personnelles

Oui mais voilà, pour arriver à de telles performances, et c’est le principe même de l’IA, des données doivent être récoltées afin de nourrir l’algorithme. Plus les données récoltées sont de qualité et plus l’entraînement de l’IA sera simplifié et les performances accrues. Et vous vous en doutez, récolter des données est loin d’être un problème pour Google qui est le premier moteur de recherche utilisé dans monde. Comme évoqué plus haut, nous sommes de plus en plus nombreux à utiliser la recherche vocale. D’après un rapport du pwc, nous sommes près de 72 % à préférer la recherche vocale à la saisie de requête traditionnelle. Tous les géants d’internet possèdent un assistant vocal et Google ne déroge pas à la règle.

Alors on se pose déjà la question : en déployant une IA aussi performante et complexe que MUM, sur quel type de données les ingénieurs ont-ils basé la méthode d’apprentissage ? Il y a fort à parier que si vous utilisez le moteur de recherche Google, vous ayez participé sans le savoir à l’amélioration de l’IA via le Machine Learning.

Google n’est pas la première entreprise à utiliser les données de ses utilisateurs sans leur consentement, Apple après un énième scandale avait été contraint de fermer plusieurs open-space en Europe (comme GlobalTech) qui traitaient en transcrivant mot à mot, les données vocales de ses utilisateurs. Pour rendre une IA performante, une écoute humaine sera toujours nécessaire et il est très probable que ces sous-traitants travaillent aujourd’hui pour Google.

