Science

Google présente une technologie capable de “sous-titrer” des photos

Les développeurs de Google travaillent depuis longtemps sur les technologies de reconnaissance et d’interprétation des images. L’un de ces fronts de recherche a été récemment introduit par la société : il s’agit d’un système capable de reconnaître des objets et, dans la mesure du possible, de décrire des scénarios sur des photos.

Il s’agit d’un différentiel important car les algorithmes actuels ne vont pas trop loin dans la contextualisation des images. Le système de Google, cependant, peut “sous-titrer” les images en faisant une association entre les éléments identifiés.

Dans l’exemple ci-dessous, le système a fourni la description suivante : “deux pizzas posées sur le dessus d’un fourneau”, en traduction libre, quelque chose comme “deux pizzas posées sur un fourneau”.

Les descriptions sont parfois redondantes ou ne permettent pas d’identifier telle ou telle caractéristique. Dans l’une des images, le logiciel décrit “deux chiens qui jouent sur l’herbe”, mais la photo montre trois.

En tout état de cause, il s’agit d’imperfections qui peuvent être atténuées avec le temps. Comme vous l’avez peut-être supposé, cette technologie est basée sur des réseaux neuronaux artificiels, de sorte que le système peut apprendre au fur et à mesure qu’il fonctionne.

  Un robot de Boston Dynamics peut faire du Parkour

Plus précisément, la technologie est basée sur une variante appelée réseaux neuronaux récurrents et, plus récemment, sur un type appelé réseaux neuronaux à convolution, qui est utilisé plus souvent précisément dans le traitement des images et des signaux.

Une telle technologie peut aider Google à proposer des recherches d’images plus précises. Mais la société met en avant d’autres applications pertinentes, notamment des systèmes qui aident les malvoyants à comprendre le contexte d’une photo.

L’étude détaillée a été publiée sur cette page.

A propos de l'auteur

Véronique

La trentaine, maman de deux petits monstres de 10 ans. Je pèse chaque jour le pour et le contre dans l'utilisation des écrans pour mes bambins !
J'écris souvent depuis les transports en commun (#teamTablette).

Laisser un commentaire