Logiciels

Voici comment Google Translate réalise des traductions à partir d’images

Ce mercredi (29), les versions mobiles de Google Translator (Google Translate) ont obtenu le soutien de 20 autres langues en traduction en temps réel à partir d’images. C’est une main sur le volant quand on voyage. Vous pointez la caméra du smartphone sur un panneau et voilà : la traduction apparaît sur l’écran presque au même moment.

Cela semble magique, mais c’est quelque chose de beaucoup plus intéressant. La capacité à travailler avec autant de langues est due aux réseaux neuronaux du service, désormais plus intelligents. Google lui-même souligne qu’il y a cinq ans, un tel système ne savait pas comment différencier les chats des chiens sur les photos. Aujourd’hui, la technologie est capable d’identifier même la race de l’animal.

La base de la traduction des images de Google Translator est la technologie de Word Lens Translator, une application similaire qui a été acquise par Google il y a plus d’un an. Les développeurs de l’outil faisaient déjà du bon travail avec les réseaux de neurones artificiels et, dans la nouvelle maison, ils ont pu améliorer les algorithmes.

Google utilise des réseaux de neurones à apprentissage profond, un type qui fonctionne essentiellement avec plusieurs couches de “neurones” et peut donc faire des associations entre plusieurs paramètres. Cela fait toute la différence.

  Comment nettoyer l'inutile galerie de photos sur Android et iOS

Dans un premier temps, explique Google, l’application tente d’identifier les lettres de l’image que l’utilisateur fournit. Ce n’est pas un travail simple, car l’application doit ignorer les branches d’arbres, les voitures, la terre ou tout élément qui apparaît là.

Dans cette tâche, l’outil trouve des groupes de pixels qui ont les mêmes couleurs. Si un groupe est proche d’autres groupes ayant des caractéristiques similaires, il y a probablement un mot qui s’y trouve. Mais le défi consiste en fait à identifier chaque lettre avec précision. C’est là que l’apprentissage profond entre en jeu.

Les lettres ont des formes différentes et peuvent être floues ou délavées, par exemple. C’est pourquoi Google utilise non seulement de vraies photos mais aussi des images modifiées pour simuler des lettres présentant les caractéristiques les plus distinctives afin d’entraîner la reconnaissance des caractères de l’application. Ça marche. L’outil est déjà très bon pour cela.

Dans l’étape suivante, l’algorithme recherche la séquence de caractères identifiée – le mot lui-même – dans un dictionnaire pour finalement effectuer la traduction. Cette recherche fonctionne même avec des termes approximatifs : si l’application recherche “5uper”, elle aura toujours “Super” comme retour.

  Firefox 9 dispose de JavaScript 30% plus rapide, garantit Mozilla

Il suffit ensuite de montrer le résultat à l’écran. L’application affiche la traduction par-dessus l’image originale, en respectant autant que possible les couleurs et la taille des caractères. C’est une façon de rendre l’expérience plus naturelle, pour ainsi dire.

Un détail intéressant est que la traduction peut être faite même lorsqu’il n’y a pas d’accès à Internet. Google en a tenu compte car, de temps en temps, nous rencontrons des connexions lentes ou nous nous mettons simplement hors ligne pour des raisons de circonstances (lorsque nous sommes à l’intérieur d’un avion, par exemple).

Il existe donc un petit réseau de neurones au sein même de l’application Google Translator. Sachant que cela peut nécessiter beaucoup de smartphones de base ou intermédiaires, Google a pris soin d’optimiser l’application au maximum.

Avec la mise à jour d’aujourd’hui, Google Translator prend désormais en charge 27 langues pour la traduction des images (vous devez télécharger un package correspondant à chaque langue). Seule la traduction est toujours effectuée de l’anglais vers une autre langue et vice-versa. Il n’y a pas encore de traduction directe du français vers l’allemand, par exemple, mais je n’ose pas dire que Google n’y arrivera pas.

  Comment sauvegarder votre Mac

Oui, le portugais fait partie des langues prises en charge. Cela se produit depuis le début de l’année, lorsque la traduction à partir d’images a commencé à fonctionner. Ce n’est pas une surprise : la France est l’un des pays qui utilise le plus Google Translator.

En plus des images, l’outil peut traduire de la voix, il est bon de le rappeler. Il suffit d’appuyer sur le bouton du microphone. L’application “écoutera” la personne qui parle, identifiera sa langue, convertira l’audio capturé en texte et fera la traduction. Actuellement, 32 langues sont prises en charge dans ce mode.

Il est vrai que l’application est loin d’être parfaite. Mais Google a déjà fait savoir qu’il est prêt à aller loin dans cette entreprise.

Google Translator est disponible pour Android et iOS. Si vous avez déjà l’application, tenez bon : la mise à jour avec les nouvelles arrive dans les prochains jours.

A propos de l'auteur

Ronan

Le Breton de l'équipe ! Développeur back-end dans une startup française. Internet des objets, domotiques, mes sujets de prédilection sont vastes. #teamLinux sur PerlmOl

Laisser un commentaire