Internet

RankBrain : Comment Google gère les termes de recherche confus ou ambigus

Ces dernières années, Google a considérablement amélioré la précision de ses résultats de recherche, en introduisant des innovations telles que le Knowledge Graph. Il est possible d’y trouver des informations complètes tirées de l’internet sur une série de sujets, tels que des informations provenant de livres, de célébrités et de lieux. Un autre exemple est Google Now, qui accepte les questions directes et fonctionne de manière similaire à un assistant virtuel, en répondant à des questions objectives telles que “Quelle est la hauteur du mont Everest ?

Et le géant de Mountain View ne s’arrête pas là. Google dispose de centaines d’algorithmes, dont le PageRank, pour organiser rapidement et précisément les résultats de recherche. L’un d’eux (et l’un des plus importants) est RankBrain, qui traite des recherches qui ne sont pas facilement déchiffrables par un ordinateur (ou même un humain).

La différence entre RankBrain et les autres algorithmes est que la plupart d’entre eux sont conçus par les ingénieurs de Google sur la base de ce qu’ils voient ou expérimentent dans le monde réel. Avec RankBrain, c’est différent : l’algorithme utilise l’intelligence artificielle pour interpréter les termes de recherche en utilisant “l’intuition” et apprend au fil du temps.

  Comment supprimer définitivement votre identifiant Apple

Mais pourquoi est-ce nécessaire ? Greg Corrado, un chercheur principal de Google, dans une interview avec Bloomberg, a déclaré que beaucoup de recherches effectuées sur Google sont faites avec des termes ambigus ou rédigées en termes familiers, comme si vous parliez à une personne réelle. “C’est là que les ordinateurs tombent généralement en panne parce qu’ils ne peuvent pas comprendre ou n’ont jamais rencontré cette phrase auparavant”, explique-t-il.

Cette confusion est compréhensible : il est facile de donner des résultats pour une recherche comme “chaîne alimentaire du consommateur primaire”, mais plus compliqué pour une question plus élaborée, avec des termes ambigus comme “quel est le titre du consommateur qui se trouve au plus haut niveau d’une chaîne alimentaire ?” selon l’exemple de Blooomberg.

Ainsi, l’algorithme peut en quelque sorte généraliser la question et l’associer à un terme de recherche du passé. Ainsi, le résultat affiché ne sera pas aussi précis que possible, mais c’est déjà une percée compte tenu du type de question. Corrado compare la performance de RankBrain à une conversation dans un bar bondé. “Je ne peux pas entendre exactement ce que vous dites, mais je peux deviner ce que vous voulez dire et avoir une conversation avec vous”, dit-il.

  Le codec VP9 a aidé YouTube à diffuser pour les connexions lentes

Il est normal que beaucoup de gens commencent à maîtriser certaines techniques de recherche sur Google, comme l’utilisation de guillemets dans les recherches pour les rendre plus coûteuses. Mais il y a aussi beaucoup de gens qui dépendent encore de cet algorithme : environ 15% des millions de recherches par seconde utilisent des termes que Google n’a jamais vus auparavant.

Mais quelle est la précision de cet outil ? Beaucoup de choses : certains ingénieurs de recherche ont été chargés d’analyser la signification des recherches afin de la comparer avec celle de RankBrain. L’algorithme a atteint 80 % des résultats, alors que les ingénieurs n’ont réussi que dans 70 % des cas. Désactiver cet algorithme “équivaudrait à faire subir aux utilisateurs un préjudice similaire à celui d’oublier d’offrir la moitié des pages de Wikipédia”, selon le scientifique.

A propos de l'auteur

Bernard

Actuellement responsable informatique dans une PME, je bosse dans le domaine depuis une vingtaine d'année maintenant. Fan inconditionnel de DBZ, et de la triologie Die Hard. #teamWindows sur Perlmol !

Laisser un commentaire