Comment un ordinateur a appris à vaincre les humains dans un jeu chinois

Depuis 1952, date à laquelle l’ordinateur a pu dominer l’ancien jeu, nous avons vu des machines vaincre les humains dans des jeux simples ou même dans des jeux qui requièrent une logique pure. Ce dernier s’est renforcé plus récemment grâce à l’intelligence artificielle qui se développe comme jamais auparavant.

Il n’est pas étonnant qu’un logiciel créé par Google qui fonctionne sur la base de apprentissage machine ait battu un champion de Go dans un projet. Appelé AlphaGo, il a été développé par DeepMind, un laboratoire du géant de Mountain View qui crée des algorithmes qui résolvent les problèmes en apprenant de leurs propres défauts.

Le jeu chinois en question est simplement appelé Go, Weiqi ou Baduk. Il a été choisi par l’équipe de Google pour tester le logiciel car il est particulièrement difficile pour les ordinateurs. Le joueur doit entourer les pièces de l’adversaire sur un plateau 19×19 en plaçant simplement les boules en ligne.

Avec une telle superficie disponible, vous pouvez déjà imaginer qu’il existe d’innombrables possibilités de jeu. Et comment : chaque joueur a environ 200 options à la fois contre environ 20 aux échecs. Google calcule qu’il y a plus de 10171 positions, alors qu’aux échecs, le maximum trouvé est d’environ 1050. C’est un nombre tellement absurde qu’il dépasse l’estimation des atomes dans l’univers.

Qu'est-ce que les données EXIF des photos et comment les trouver ou les cacher

Tant d’options constituent un défi pour les ordinateurs, alors que les humains les abordent plus naturellement. “Si vous demandez à un grand joueur de Go comment il a fait le mouvement déterminé il vous répondra parfois que cela lui semblait juste. Une façon d’y penser est que le Go est un jeu beaucoup plus intuitif alors que les échecs sont basés sur la logique”, explique Demis Hassabis, membre de l’équipe DeepMind.

Pour tester le logiciel, l’équipe de Google a invité Fan Hui, champion d’Europe de go, qui a consacré sa vie au jeu depuis l’âge de 12 ans. AlphaGo a gagné 5-0, un résultat impressionnant. C’est la première fois qu’un programme bat un joueur professionnel.

Mais comment cela est-il possible ?

La différence est qu’AlphaGo ne fonctionne pas exactement comme les autres logiciels d’intelligence artificielle. Ces analysent la structure de toutes les positions possibles, ce qui n’est pas possible dans Go par la dimension des possibilités et le besoin d’intuition.

YouTube met à la retraite les chaînes payantes et adopte le parrainage pour 7,99 par mois

Google a donc résolu ce problème en créant un système qui apprend avec le temps, d’une certaine manière. Ils ont combiné deux outils : l’algorithme la recherche par arbre de Monte Carlo (MCTS), qui prend des décisions basées sur des processus déjà réalisés ; et les réseaux neuronaux artificiels, qui sont basés sur des couches de relations non linéaires.

Ces réseaux ont été utiles pour créer des couches dans lesquelles le système pense au jeu. Par exemple, l’un décide du prochain coup tandis qu’un autre essaie de prédire le gagnant de la partie. Combiné aux SCTM, qui fondent la prise de décision sur l’apprentissage machine, Google a réussi à faire AlphaGo imiter l’intuition humaine.

Mais il ne suffit pas d’imiter : même si dans 57% des cas le système a prédit le mouvement humain, o AlphaGo devrait gagner la partie. Elle a donc subi une série de tests. Il y a eu plus de 30 millions de mouvements de professionnels analysés et 494 jeux avec d’autres ordinateurs, tous gagnés par le logiciel Google.

Dix ans de Google Chrome : comment le navigateur a dominé le marché

Lorsque tous les membres de l’équipe DeepMind ont pensé qu’AlphaGo était prêt, ils ont invité Fan Hui à jouer (et il a perdu 5-0). Le résultat a surpris les experts, qui ont estimé une victoire du logiciel dans une période pas plus courte que dix ans ( !).

Il est intéressant de noter que la machine a, d’une certaine manière, appris à maîtriser le jeu par elle-même ? comme nous, les humains, le faisons avec l’intuition. Il s’est renforcé avec le temps, ce qui est à la fois fascinant et effrayant.

La prochaine étape consiste à inviter le légendaire Lee Sedol, un joueur de Séoul qui est considéré comme le plus grand concurrent du Go de la dernière décennie. Hassabis l’a décrit comme “le Roger Federer de Go”, en référence au détenteur du record du championnat de tennis. La course aura lieu en mars. Qui va gagner ?