Internet

Les réseaux neuronaux ont permis de réduire de 50% les erreurs de transcription de Google Voice

Google a toujours utilisé une sorte d’intelligence artificielle dans ses services, mais ces dernières années, les réseaux dits neuronaux ont gagné encore plus d’espace dans l’entreprise. Un exemple a été donné ce mardi (11) : l’entreprise a expliqué comment les réseaux neuronaux ont contribué à réduire considérablement le nombre d’erreurs dans Google Voice.

Vous pouvez résumer Google Voice comme un service téléphonique en ligne. Une des fonctions proposées (du moins dans les pays anglophones) est la transcription des messages : vous recevez un message vocal d’un ami, par exemple, et l’outil o le transforme en texte.

Cette fonction a plusieurs usages, mais elle se heurte à un problème : il n’est pas rare que les transcriptions présentent tellement d’erreurs qu’il est tout simplement impossible de comprendre le message. Pour atténuer le problème, Google a dû refaire le système de transcription.

Le premier changement a été effectué en 2012, lorsque la société a commencé à utiliser des réseaux neuronaux d’apprentissage profond, un type qui fonctionne essentiellement avec plusieurs couches de “neurones” et peut donc faire des associations entre plusieurs paramètres. Cette technique a permis d’améliorer considérablement les mécanismes de reconnaissance de la parole.

  Facebook permettra d'accéder facilement aux paramètres de confidentialité

Mais Google explique que les choses ne se sont vraiment améliorées que quelque temps plus tard avec l’implémentation des réseaux de neurones récurrents dans la norme LSTM (Long Short Term Memory). Ce type, essentiellement, possède des connexions en cycles et des cellules de mémoire qui permettent au réseau de “se souvenir” des données précédemment analysées.

Les réseaux neuronaux ont besoin d’une quantité considérable de données pour apprendre. Google aurait pu utiliser les transcriptions faites avec l’ancien algorithme, mais cette base de données était déjà “contaminée” par plusieurs erreurs de reconnaissance. L’entreprise a ensuite dû compter sur l’aide des utilisateurs de Voice : des milliers d’entre eux ont accepté de mettre leurs messages à disposition en se basant sur la promesse de Google que ce contenu serait utilisé uniquement pour la formation au système.

Grâce à ce volume de messages, les ingénieurs de Google ont pu soumettre les algorithmes à divers modèles de reconnaissance acoustique et linguistique. L’un d’entre eux a été utilisé pour atténuer les défaillances de score, par exemple. Auparavant, Google Voice transcrivait par exemple la phrase “J’ai reçu le message que vous m’avez laissé” en “J’ai reçu le message”. Tu m’as quitté”. Pouvez-vous imaginer le désordre ?

  Le président français déclare que le web n'est pas un univers parallèle.

Heureusement, les réseaux neuronaux ont fonctionné. Après plusieurs “tours” de formation, dont beaucoup ont été répétés (en courant avec les mêmes données), l’apprentissage a permis à Google Voice de diminuer le nombre d’erreurs de pratiquement 50%.

Les avancées ne doivent pas s’arrêter là. Les algorithmes continuent d’apprendre et, bien sûr, Google poursuit ses efforts pour améliorer l’outil. C’est le genre de service qui exige un travail continu.

Il convient de noter que Voice n’est pas le seul exemple récent de la façon dont les réseaux neuronaux font la différence dans Google. À la fin du mois dernier, la société a révélé comment cette idée rendait le Google Translator plus intelligent dans les traductions à partir d’images.

A propos de l'auteur

Véronique

La trentaine, maman de deux petits monstres de 10 ans. Je pèse chaque jour le pour et le contre dans l'utilisation des écrans pour mes bambins !
J'écris souvent depuis les transports en commun (#teamTablette).

Laisser un commentaire