Internet

L’algorithme Netflix qui suggère les films est beaucoup plus complexe que vous ne le pensez

Netflix a annoncé mercredi (17) un changement dans son algorithme de recommandations personnalisées pour les films et les séries en raison de l’expansion mondiale. En janvier, la société a atteint 130 nouveaux pays, ce qui a nécessité des améliorations pour traiter avec un public beaucoup plus diversifié.

C’est une chose à laquelle l’entreprise pense depuis un certain temps. Lors de la présentation de l’extension, Reed Hastings, PDG de Netflix, a déclaré qu’il espérait que les recommandations seraient si bonnes qu’elles lui permettraient de “recommander exactement la série ou le film qui correspond à son humeur actuelle” selon lui.

Il est certain qu’un plus grand nombre de données provenant d’utilisateurs du monde entier pour structurer et, par conséquent, améliorer les recommandations, est un facteur positif. Mais la société savait déjà qu’elle ne pouvait pas utiliser la même approche de suggestion, qui auparavant prenait principalement en compte ce que l’utilisateur voyait et comparait avec les données de personnes du même endroit, en plus d’autres facteurs tels que la recherche, la similarité, les évaluations, etc.

Et les recommandations de l’entreprise doivent être très précises, car c’est ce qui rend l’utilisateur fidèle au service, selon Carlos Gomez-Uribe, vice-président de l’innovation produit chez Netflix. Il a même écrit un article scientifique détaillant les algorithmes, les innovations et la valeur commerciale de ce système de suggestions.

Lorsqu’un membre se connecte et que nous l’aidons à trouver quelque chose d’attrayant en quelques secondes, cela l’empêche de quitter notre service pour une autre alternative de divertissement”, explique-t-il. La personnalisation des recommandations permet de cibler le public car ce sont elles qui constituent essentiellement la page d’accueil du service. Pouvez-vous imaginer si les recommandations étaient les mêmes pour tout le monde ?

Pour cette raison, la société a créé un nouvel algorithme qui sépare les abonnés en communautés mondiales, indépendamment de leur localisation, et prend en compte les goûts et préférences personnels de chaque utilisateur. Au cours de ce voyage, nous avons réalisé qu’une bonne histoire transcende les frontières et que les téléspectateurs du monde entier ont plus en commun qu’ils ne le pensent”, indique la déclaration.

Ces communautés mondiales peuvent également être comprises comme des groupes d’intérêt, car ce que vous aimez ne dépend pas toujours 1) de ce que les autres personnes de votre pays (ou qui parlent la même langue) regardent et 2) de l’origine du contenu qui est disponible dans le catalogue Netflix. Lorsque le goût est pris en considération, au lieu de la localisation, l’engagement a tendance à être plus important.

  Comment regarder Netflix sur des PC plus anciens avec Windows 7

La déclaration de l’entreprise donne un exemple avec des animes. La communauté des abonnés qui aiment ce type de contenu n’est pas seulement japonaise : seuls 10% des personnes de ce groupe d’intérêt sont effectivement au Japon.

D’accord, les animes sont un peu un contenu spécifique qui n’est pas apprécié de tous. Mais Netflix souligne que ce changement d’algorithme profite à tout le monde. Bien que cela soit particulièrement avantageux pour les abonnés qui font partie d’un nouveau ou d’un petit segment, les abonnés de segments plus importants qui ont des préférences ou des goûts très spécifiques en bénéficient également”, assure-t-elle.

En recueillant des données du monde entier et de pays de tailles diverses, nos algorithmes mondiaux sont en mesure d’accéder à ces informations pour formuler des recommandations plus appropriées et plus cohérentes pour cette communauté spécifique”, explique la société. Au total, il a fallu une année de travail impliquant des dizaines d’équipes d’entreprises et beaucoup de recherches, avec quelques difficultés en cours de route.

Difficultés de développement

Pendant tout ce temps, Netflix a essayé plusieurs approches, mais certains facteurs principaux ont apporté des difficultés à l’évolution du système, comme nous le disent Yves Raimond et Justin Basilico, deux ingénieurs de la société, dans ce post. Tous ces éléments sont liés à l’expansion : disponibilité inégale des contenus, questions culturelles et linguistiques.

Disponibilité

Pour qu’un film apparaisse dans le catalogue d’un pays, Netflix doit signer un accord de licence avec des agences pour obtenir les droits de distribution ? c’est pourquoi le catalogue n’est pas le même pour tout le monde. Cela a une influence sur le comportement de l’algorithme, puisqu’il doit tenir compte de la disponibilité.

Par exemple, si deux films similaires (comme Matrix et Equilibrium) sont accessibles dans deux pays différents chacun (comme la France et les États-Unis, respectivement), les utilisateurs américains qui ont vu Equilibrium ne pourront pas voir Matrix et vice versa. Cela ne signifie pas qu’ils ne sont pas intéressés par l’œuvre, mais que la disponibilité n’est pas la même ? ce facteur doit être pris en compte, car ils auraient probablement regardé l’autre film si l’œuvre était dans le catalogue.

  Utilisation de WhatsApp Business sur le Web ou sur un PC de bureau

Netflix étant présent dans quelque 190 pays différents, il se peut également qu’un film beaucoup plus connu dans le monde entier soit disponible dans un nombre relativement restreint de pays, tandis qu’une production de niche plus petite pourrait faire l’objet de licences pour un nombre beaucoup plus important de lieux. Ainsi, le classement des recherches ou des recommandations donnerait la priorité aux petites productions, car elles sont plus disponibles.

En plus du lieu, le moment où une certaine production est dans le catalogue influence également l’engagement. Le contenu de niche peut avoir été disponible pendant six mois dans le catalogue, tandis qu’un film plus connu peut avoir été ajouté récemment et que le système comprend qu’il ne suscite pas assez d’intérêt. Mais s’il avait été disponible pendant la même durée que le contenu de niche, il aurait probablement suscité plus d’engagement.

En gardant ces préoccupations à l’esprit, les ingénieurs ont fait en sorte que les algorithmes produisent de meilleures recommandations. Nous incorporons dans chaque algorithme les informations auxquelles les membres ont accès dans différents catalogues en fonction de leur emplacement et de leur période [de disponibilité], en prenant comme base les concepts de la communauté statistique sur le traitement des données manquantes”, explique l’ingénieur.

Différences culturelles

Il s’agit de la création de communautés mondiales, puisqu’une population d’une région donnée peut profiter de productions de niche produites dans un autre pays autant qu’un natif de cette localité. Un film de science-fiction sera plus populaire dans un pays que dans un autre, mais qu’en est-il du goût des utilisateurs individuels qui consomment ce genre de contenu ? Cela peut (ou non) être lié au pays.

Le service devait donc réfléchir à un modèle de recommandation qui fonctionnerait pour les pays comptant peu ou beaucoup de membres, et qui refléterait ensuite les différences de goût locales. Ils se sont demandé : “qu’est-ce qui est le plus dominant : le goût ou la personne locale ? Les deux sont importants, mais les normes de goût voyagent dans le monde entier”, ont compris les ingénieurs.

  Sony lance une application de taxi pour concurrencer Uber au Japon

Si un utilisateur aime les films de science-fiction, alors quelqu’un à l’autre bout du monde qui aime aussi les films de science-fiction sera une meilleure source de recommandations que son voisin qui aime regarder des documentaires sur la nourriture. [ ?] Avec un algorithme global, nous pouvons identifier des modèles de goût nouveaux ou différents qui émergent au fil du temps [ ?

Langue

Avec 21 langues provenant de différentes parties du monde, il est important de comprendre comment les mots sont formés pour voir comment indexer les recherches et les recommandations. Dans certaines langues orientales, plusieurs caractères peuvent former une seule syllabe (qui se transforme en un caractère différent), ce qui affecte la recherche.

Par exemple : Oldboy, dans l’alphabet Hangul, utilisé par les Coréens, est ? ???. La première lettre provient de la formation de trois caractères : ? ?. Ils devaient comprendre comment le langage est formé pour présenter la suggestion avec le moins d’interactions possible, en n’obtenant le résultat souhaité qu’en tapant ? ?? au lieu de ? ??.

De plus, Netflix doit tenir compte de la disponibilité des sous-titres et du doublage lorsqu’elle recommande son contenu. Un film français sans sous-titres peut ne pas être compris par un Français moyen, mais il y a des Français qui parlent couramment le français et qui comprendraient le film sans problème.

Comment le service comprendra-t-il cela ? Pour l’instant, ce ne sera pas le cas. Il est assez difficile d’estimer le niveau de connaissance d’une langue par un abonné, c’est pourquoi Netflix utilise des modèles de visualisation et des données auxiliaires pour estimer quelle langue un utilisateur comprend. Ce problème peut également être résolu grâce à une plus grande disponibilité des sous-titres, bien que de nombreuses personnes aiment regarder des contenus dans une langue qu’elles maîtrisent.

Bien sûr, après tant de variables et la création de communautés d’intérêt mondiales, Netflix doit constamment surveiller les évaluations et les données de qualité et voir si sa nouvelle structure fonctionne. Mais vu l’importance de ce facteur pour l’entreprise (en plus d’être l’un de ses différentiels), je crois qu’ils ne laisseront pas cette question de côté.

A propos de l'auteur

Véronique

La trentaine, maman de deux petits monstres de 10 ans. Je pèse chaque jour le pour et le contre dans l'utilisation des écrans pour mes bambins !
J'écris souvent depuis les transports en commun (#teamTablette).

Laisser un commentaire