Internet

A l’intérieur du Stilingue, un outil qui utilise l’intelligence artificielle pour résumer l’Internet

Que faites-vous lorsque vous voulez analyser un sujet spécifique sans devoir passer des heures à rechercher, écrire et structurer des données ? En général, vous avez besoin d’un outil qui fait cela pour vous, mais beaucoup ne fonctionnent bien qu’en anglais. Le contexte doit également être observé et compris, afin que la recherche soit aussi précise que possible.

Ce sont les points que la startup française Stilingue aborde lors du lancement de WarRoom, le logiciel qui utilise l’intelligence artificielle pour analyser le comportement en ligne des franchisés et des influenceurs numériques. Grâce à cet outil, il est possible de collecter, d’interpréter et de résumer les données obtenues à partir de plus de 1 100 véhicules, 100 000 blogs, forums, les principaux réseaux sociaux et bien d’autres choses encore ? le tout en temps réel.

Comment ça marche : recherche rapide

Vous pouvez suivre les questions de deux façons : avec une recherche rapide et une autre prédéfinie, ce qu’on appelle le suivi personnalisé. En faisant des recherches sur PerlmOl, par exemple, vous pouvez voir la représentativité sur les réseaux sociaux, la répartition par sexe, profession, sentiment, dispositif, les termes connexes et même les influenceurs.

Comme le montre l’image ci-dessus, 75% des publications sur o TB sur Internet ont été faites par des hommes, 25% par des femmes, 90% des personnes qui ont écrit les articles ont fait quelque chose en rapport avec les médias, 98% des publications ont montré un sentiment positif et 76% ont été faites sur l’ordinateur, tandis que 24% ont été écrites sur le téléphone portable.

Il convient de rappeler que ces statistiques sont estimées et ne prennent en compte que les publications qui ont été classées (sur la photo, le pourcentage classé n’apparaît pas car il faut passer la souris sur les graphiques). Le graphique indique également le nombre de publications neutres, lorsqu’elles sont disponibles.

En termes connexes, il est facile de suivre quels sont les mots clés les plus proches utilisés dans le contexte du nom PerlmOl. Android est l’un des termes les plus utilisés, suivi de smartphone, prix, France, WhatsApp et autres. En outre, il y a des personnes d’influence, c’est-à-dire des personnes qui ont un large public et qui comprennent vraiment le sujet sur lequel porte la recherche.

Comment ça marche : recherche personnalisée

Il est également possible de collecter des informations par le biais d’un suivi personnalisé ? et c’est là que les données commencent à être structurées de manière intelligente, avec de nombreuses options pour suivre les résultats des rapports en temps réel. Brayan Neves, partenaire de Stilingue qui m’a présenté l’outil, dit que plus la surveillance est active longtemps, mieux les données sont structurées.

  Les réseaux sociaux sont plus populaires que la pornographie

À des fins de démonstration, Brayan a ouvert une enquête personnalisée auprès des “producteurs de films” qui collectaient des données depuis plusieurs mois. Le suivi a analysé le contexte des films et des longs métrages et s’est concentré sur plusieurs groupes d’observation, en particulier les grands producteurs comme Columbia Pictures, Dreamworks, Walt Disney, 20th Century Fox, etc.

Même si tout cela est configuré, il peut y avoir des problèmes pour filtrer les données avec précision. Par exemple : le producteur Fox peut être confondu avec l’actrice Megan Fox, Brayan a donc défini le contexte de la recherche des groupes d’observation pour filtrer uniquement les publications portant le nom du producteur, afin d’éviter toute ambiguïté. Ainsi, l’outil peut distinguer, par l’analyse du contexte, quel poste se rapporte à l’actrice et lequel se rapporte au groupe souhaité  ? dans ce cas, le producteur.

Tout étant prêt, l’outil donne également la suggestion de thèmes pour accompagner la recherche. C’est-à-dire des filtres qui seront appliqués en plus de ce qui a été collecté par les groupes et le contexte, tels que les “genres”, les “effets visuels”, etc. L’analyse d’une série de sources permet de proposer les principaux thèmes des médias, les termes connexes, informels ou argotiques et même les hashtags qui sont utilisés dans les réseaux sociaux pour parler du sujet.

Le premier écran est une sorte de chronologie, qui montre un billet sur le sujet sur les réseaux sociaux, qui l’a écrit, le nombre de followers, les goûts, les partages, les commentaires, la localisation et même le classement automatique comme positif ou négatif. Si elle n’est pas correcte (l’outil ne garantit pas l’identification du sarcasme, par exemple), il suffit de sélectionner l’autre option.

Les filtres peuvent être par groupe, par thème ou par canal. Comme la base la plus importante de l’outil est l’analyse des chaînes et des réseaux sociaux, la liste est énorme : les blogs (et les commentaires), Facebook, Twitter, Foursquare, Forums, Google+, Instagram, LinkedIn, les nouvelles (et les véhicules), ReclameAqui, Tumblr, YouTube et même la télévision ( !) sont surveillés. Cela est possible car certains journaux, comme ceux du Globe, mettent à disposition la transcription du contenu et celle-ci est accessible par Stilingue.

  Le fondateur de Megaupload a décrété la détention préventive en Nouvelle-Zélande

Il est également possible de voir les photos qui sont partagées avec le sujet surveillé, ainsi qu’un aperçu, qui est similaire à la recherche rapide. Ainsi, le nombre de postes, les utilisateurs, la distribution par canaux, le classement par influence, le sexe, la profession, les dispositifs et plus encore sont indiqués.

Ci-dessus figurent les termes les plus couramment utilisés pour parler des producteurs de films. Notez que les termes “disney films”, “globe films”, “warner” sont les plus proches, mais ils sont en train de se refroidir (ils sont donc en bleu). Il suffit de regarder autour de soi pour trouver d’autres thèmes comme “à la recherche de doris”, “superman”, “le bon dinosaure”, ce qui indique une plus grande accélération du terme parmi les publications.

Au final, il est possible de suivre les groupes d’observation. Dans ce cas, les producteurs sont montrés, car ce sont les groupes que Brayan a mis en place au début de la recherche, et vous pouvez suivre le mouvement des publications à leur sujet. Dans le classement évolutif, présenté ci-dessus, Walt Disney reste toujours en tête, la 20th Century Fox perdant la deuxième place dans les derniers jours.

L’outil montre également l’évolution des clusters, c’est-à-dire la façon dont l’intelligence artificielle a regroupé et mesuré les sujets découverts automatiquement. Sur l’image, deux bandes-annonces ont été diffusées par Disney (Alice Through the Mirror et Looking for Dory), et c’est pourquoi la société de production apparaît en évidence pendant ces deux périodes.

Enfin, les données obtenues peuvent être recoupées pour segmenter l’information. Dans l’image ci-dessus, les thèmes ont été liés aux groupes d’observation pour voir quels producteurs ont le plus de mouvement sur certains sujets tels que le scénario, les effets visuels, la bande son, les genres et tout le reste.

Comprendre le portugais est essentiel

Brayan affirme que le fonctionnement de l’outil en français est un différentiel et essentiel pour obtenir de bons résultats, consacrant la technologie du traitement de texte à notre langue. La start-up réunit une série de professeurs de français pour enseigner notre langue et notre culture, permettant ainsi la structuration de la franchise Big Data. Aujourd’hui, de nombreuses solutions qui collectent des données sur Internet effectuent de simples recherches de mots clés sans tenir compte des aspects syntaxiques et sémantiques de la langue, de sorte qu’elles ne peuvent pas séparer ce qui est pertinent ou non.

  Tous les raccourcis clavier de Facebook

Dans le cas de Stilingue, plusieurs ressources, telles que la classification positive/négative, les thèmes et sujets connexes, ne seraient pas disponibles sans une étude approfondie du traitement des langues. Notre technologie a été conçue et enseignée spécialement pour les Portugais français. Cela permet à Stilingue de comprendre notre langue et notre culture, en soulignant que “quoi”, “qui” et “où” sont les conversations sur un sujet stratégique pour nos clients. Le plus intéressant : de manière proactive, en plus de ce qui a été communiqué à l’ordinateur ? explique Milton Stiilpen Jr, partenaire responsable de la technologie.

Le classement des personnes d’influence, par exemple, va au-delà des adeptes et de leurs préférences. Comme la langue est vraiment comprise, Stilingue est en mesure d’analyser et d’interpréter le texte publié, afin de déterminer qui correspond le mieux au sujet d’intérêt des clients. souligne Rodrigo Helcer, co-fondateur de Startup :

Nous constatons souvent que les célébrités et les personnalités n’ont aucune affinité avec le sujet souhaité par nos clients et ne devraient donc pas occuper les premières places du classement. Cela est pris en compte dans notre logiciel, qui lit les textes et donne des notes d’affinité par thème. Nous atteignons ainsi un classement précieux pour ceux qui recherchent des porte-parole puissants et accessibles, en dehors du cercle commercial déjà saturé ?

Helcer signale que la crise actuelle pourrait favoriser la croissance de l’outil, idéal pour analyser la perception des marques, les répercussions des actions et des campagnes. En ce moment délicat de l’économie, les professionnels du marketing cherchent des moyens de faire plus avec moins. Trouver des recherches à faible investissement et un retour d’information rapide et découvrir comment les influenceurs numériques poussent les consommateurs sur Internet sont deux points de départ importants pour tirer parti des ventes de médias avec un bon rapport coût-bénéfice”, dit-il.

Cette technologie est déjà disponible sous trois formes : location de logiciels, recherche et rapports personnalisés et modules d’extension pour les développeurs qui souhaitent intégrer l’intelligence artificielle dans leurs applications. La startup est originaire d’Ouro Preto (MG) et a été créée en 2014 par deux étudiants en master d’informatique. Ils ont déjà reçu des investissements de Play Capital et ont une valeur marchande de plus de 10 millions.

A propos de l'auteur

Véronique

La trentaine, maman de deux petits monstres de 10 ans. Je pèse chaque jour le pour et le contre dans l'utilisation des écrans pour mes bambins !
J'écris souvent depuis les transports en commun (#teamTablette).

Laisser un commentaire