Logiciels

Inside Graava, une application qui édite des vidéos pour vous

En août 2015, Bruno Gregory, le fondateur de Graava, n’avait aucune idée qu’une nouvelle caméra d’action aurait autant de répercussions. A l’époque, elle était “la caméra qui monte les vidéos pour vous”, mais l’objectif a changé. Après avoir évalué le marché, la start-up a décidé d’adapter toute la technologie à une application, estimant qu’elle apporterait beaucoup plus d’utilisateurs par rapport à un matériel.

Bruno a travaillé comme analyste de systèmes à Paris, en se concentrant sur le domaine financier. Cependant, il a déménagé Berkeley (CA), une région proche de la Silicon Valley, et peu après un accident de vélo, il a eu l’idée de fonder la société. Pera, comment cela ? C’est vrai : Bruno était à vélo avec un ami en ville et a été renversé par une voiture ? son ami, qui était derrière, a tout enregistré avec un GoPro et, selon la police, c’était “la meilleure preuve” qu’ils aient jamais reçue. Le conducteur a été identifié par la plaque d’immatriculation de la voiture.

Une fois la peur passée, quand il était à la maison, le dossier de Bruno est tombé : il il avait le même appareil photo que son ami, mais il n’en a pas utilisé beaucoup “parce qu’elle n’était pas assez bonne”. Bon non en qualité, mais en autonomie et en contenu. “Lorsque vous terminez l’enregistrement, toutes les caméras sur le marché aujourd’hui génèrent un problème, pas une solution. Qu’allez-vous faire de ce matériau brut ?”, demande Bruno.

Quelle est la proposition de M. Graava

Le problème est réel. Beaucoup de gens enregistrent des vidéos mais n’ont pas le temps ou les ressources (connaissances ou équipement) pour les monter ? souvent, ils se contentent de sélectionner un extrait et de le poster sur les réseaux sociaux. “Instagram a poussé la photographie numérique, mais maintenant la vidéo prend aussi le dessus. Au lieu de 15 secondes seulement, vous pouvez poster des vidéos d’une minute. C’est long. Qu’allez-vous en faire ?” dit-il.

Cependant, ils ont réalisé qu’ils auraient peu de public avec une caméra à 250 €, principalement pour mettre en œuvre l’idée ici en France, un marché très important pour les fondateurs. L’appareil photo Graava était littéralement un petit smartphone, puisqu’il était doté de capteurs comme un accéléromètre, un GPS, un capteur de luminosité et deux microphones. À l’importation, il pourrait être encore plus cher qu’un téléphone portable.

Puis il y a eu le changement : le cœur de la caméra a toujours été le logiciel intelligent qui sélectionnait “les meilleurs moments pour vous”. En transmettant cet algorithme à divers appareils, comme un téléphone portable ou un ordinateur (bientôt), ils ne résolvent pas seulement le problème des concurrents, mais mettent aussi un outil d’édition entre les mains de millions de personnes ? celles qui possèdent un smartphone.

  Les premiers smartphones avec Ubuntu arrivent en octobre

“Les gens prennent des milliers de photos, enregistrent des centaines de vidéos, mais s’arrêtent rarement pour revenir dans tout ce contenu. Parfois, ils suppriment des photos qui pourraient être utiles. Notre objectif est de produire de bonnes informations à partager. Il s’agit de générer, en temps réel, les meilleurs moments de votre week-end, par exemple”, explique Bruno.

Autant il existait déjà des applications d’édition automatique de photos et de vidéos sur le smartphone, le grand différentiel de la société est qu’elle le fait en utilisant le fameux intelligence artificielle. Grâce à une série d’algorithmes qui identifient ce qu’il y a de mieux dans votre vidéo, ou comment créer une séquence de photos intéressante, Graava veut produire un contenu digne de ce nom. Et c’est ce qu’il fait.

Comment cela fonctionne-t-il ?

Graava se différencie sur deux points : il ne veut pas que l’utilisateur continue à sélectionner chaque image ? mais le groupe entier, comme toutes les photos du week-end. Une autre question est que, même si vous mettez 100 photos, l’application ne montrera pas nécessairement les 100 : “Notre algorithme identifie les meilleurs moments : les photos sont-elles similaires ? Lequel de ces cinq est le meilleur ? Lequel est le mieux centralisé ? Est-ce que quelqu’un sourit ?”, explique-t-il.

Avec les données existantes dans la vidéo, l’application fonctionne en deux étapes. La première est appelée science, qui utilise les mathématiques et des algorithmes lourds pour identifier les questions mentionnées ci-dessus. Le second, appelé art, analyse les données recueillies et voit quel type de contenu peut être utilisé et comment il peut l’être. Il s’agit du montage lui-même. La différence est que l’utilisateur ne fait rien : l’application livre déjà le résultat prêt.

En consultant des professionnels de la vidéo, l’équipe de Graava a étudié ce que les meilleurs monteurs vidéo feraient de ce contenu. Quel type de transitions ou de musique utiliseraient-ils ? L’application propose également une bibliothèque musicale. “Nous avons pu faire une transition au rythme du son, une fonction très cool qui, chez un monteur professionnel, prendrait des heures, selon la taille de la vidéo”, compare Bruno.

L’interface est aussi simple que possible et l’algorithme s’occupe de tout. Ils ont tout de même veillé à ce que l’utilisateur dispose également d’un doigt de personnalisation, mais sans mettre trop de fonctions pour ne pas se souvenir d’un éditeur vidéo. Les deux outils existants sont de flag et unflag, pour choisir ce qui est cool à inclure dans la vidéo (flag) ou à laisser quelque chose de côté (unflag).

  Steves Jobs et Ballmer seront présents au même événement

“Nous avons décidé cela parce que l’algorithme n’aura pas toujours la partie spéciale. Par exemple, vous faisiez du skateboard et vous êtes tombé. Pour les capteurs, cette partie est importante, pour le mouvement de la caméra, le son, etc. Mais vous ne voudrez peut-être pas partager le fait que vous êtes tombé amoureux de vos amis”, blagues. Et c’est là que réside l’importance du drapeau/drapeau : avec le apprentissage machine, Graava apprend déjà ce qui pourrait ou non être important pour maintenir la cohérence de l’édition.

Effets des changements de plans

Mais l’adaptation de tous ces algorithmes n’a pas été facile. Graava est né comme une caméra de rue, où l’utilisateur faisait des applications similaires à GoPro, en tournant des scènes d’action ? donc il ne fonctionnait qu’avec des vidéos. En transférant ce logiciel sur un marché où les gens prennent beaucoup plus de photos que de vidéos, Bruno a dû étudier comment rendre le résultat final aussi bon que les vidéos ayant aussi des photos (et parfois seulement des photos).

Autre problème : les photos ne sont pas toujours en mode paysage, qui est le motif de la vidéo. Pour couper cette photo sans devenir étrange, l’algorithme doit comprendre où un humain couperait ? c’est là que réside l’importance de la reconnaissance des visages, des sourires, etc. Pour l’instant, l’entrée uniquement de photos ne fonctionne pas si bien lorsqu’elle est combinée avec une vidéo, mais il y a le différentiel de la transition dans le rythme de la musique, ce qui crée un effet très intéressant.

Avec une entrée mixte (photos et vidéos), Bruno dit que le résultat est très beau parce que le point fort est dans les vidéos, mais les photos apparaissent de manière plus organique, afin que la transition ne soit pas trop brutale. Si vous vous contentez de mettre des vidéos, le résultat sera le meilleur possible, après tout, c’est ce à quoi l’algorithme a toujours été habitué.

De la caméra à l’application

Mais vous pourriez penser : dans l’appareil photo, un matériel spécialement conçu à cet effet, il y avait plusieurs capteurs qui seraient actifs pendant l’enregistrement, comme l’accéléromètre, le GPS et d’autres. Sur le téléphone portable, ou une vidéo prête à l’emploi de GoPro, l’utilisateur n’aura souvent que la vidéo et l’audio. Le résultat est le même ? Maintenant, oui. C’est parce que Graava a apporté quelques modifications à l’algorithme pour combler le manque de ces capteurs.

  Comment installer Windows 7 à partir de la clé de démarrage

“Nous avons développé des techniques d’analyse de trame, telles que la reconnaissance d’objets, les scénarios, le visage, le sourire, la conversation et même la vitesse de changement de trame, pour savoir si vous courez ou non. Le résultat est très bon”, garantit Bruno. Plus il y a de capteurs, plus le résultat est précis, mais il sera toujours fourni, quelle que soit la quantité de données d’entrée.

Afin de capter le plus grand nombre d’utilisateurs, ils ont également pris soin de laisser l’application avec une expérience agréable, sans être trop lourde. Toutes les bandes-son sont dans le Cloud, car “si vous n’avez pas d’enfant, cela n’a pas de sens de télécharger des chansons pour enfants”.

Aujourd’hui, l’application iPhone offre une expérience supérieure car iOS offre de meilleures capacités d’identification des images et de gestion des situations. Cependant, l’accent mis sur France a poussé les développeurs à investir massivement dans la version Android.

C’était une décision intelligente : en France, environ 90% des smartphones vendus ces deux dernières années étaient des Androïdes. En raison du nombre d’appareils différents, et par conséquent des différentes versions de l’API des caméras, tout ce qui fonctionnait bien dans un Nexus 5X ne fonctionnait pas bien dans une Galaxie, par exemple. Avant, Android était un peu en retard sur l’iPhone pour identifier les meilleurs moments, mais aujourd’hui le résultat final est “presque égal”.

Certains problèmes auxquels l’équipe est encore confrontée sont liés à la performance. L’application Android consomme plus de batterie et plus de puissance de traitement, qu’ils essaient d’optimiser. Mais la différence pour l’utilisateur est invisible, garantit Bruno.

Ce qui nous attend

Concentrez-vous sur l’application, comme les tests et la correction de bogues ? le lancement de l’appareil photo est mis en pause. L’application Graava est maintenant disponible pour Android et iOS ? déjà téléchargée et elle tient ses promesses. Cependant, en raison des difficultés susmentionnées, rien n’est encore parfait. Plus il y a d’utilisateurs, mieux c’est pour améliorer l’algorithme. Pour l’instant, le point central de la demande est France, non seulement parce que les fondateurs sont des franchisés, mais aussi parce qu’ils considèrent la France comme un lieu très créatif.

“Personne dans le monde n’est plus créatif que la franchise. Nous savons que les résultats seront très variés et nous apprendrons beaucoup des contenus envoyés”, a déclaré Bruno. Une fois l’application améliorée, ils seront diffusés dans le monde entier. Pour l’instant, pas de publicité. Les fondateurs veulent que l’utilisateur enregistré soit réellement intéressé par la proposition d’application.

L’êtes-vous ?

A propos de l'auteur

Zineb

Zineb

Enseignante en lycée, je m'intéresse à tout ce qui touche aux nouvelles technologies. #teamMac sur PerlmOl (je ne me sépare d'ailleurs jamais non plus de mon Iphone).

Laisser un commentaire