AlphaGo Zero : la nouvelle version de l’IA de Go se suffit à elle même

AlphaGo continue sur sa lancée : l’intelligence artificielle développée par Deepmind, la branche intelligence artificielle de Google, est parvenue à se surpasser elle-même grâce au développement d’une nouvelle version baptisée AlphaGo Zero. Dans un post de blog, l’équipe chargée du développement du programme présente les résultats de sa nouvelle version et ceux-ci sont éloquents : AlphaGo Zero est parvenu à dominer la version précédente de l’IA, qui avait pourtant damé le pion aux plus grands champions humains de Go en 2016.

Cette nouvelle version d’AlphaGo est décrite avec plus de détails dans un article publié par la revue scientifique Science. Pour ses concepteurs, la nouvelle version d’AlphaGo pourrait bien être « le meilleur joueur de Go de l’histoire. »

AlphaGo Zero a choisi une approche différente de celle retenue par son prédécesseur. Si la précédente version d’AlphaGo avait pu analyser plusieurs millions de parties joués par des humains afin de forger son style de jeu, AlphaGo Zero est parti de son côté d’une page blanche : les ingénieurs de Google se sont en effet contentés de lui inculquer les règles du jeu.

Pour le reste, AlphaGo Zero s’est fait tout seul pour ainsi dire : le programme a multiplié les parties en jouant contre lui-même afin d’affiner sa compréhension du jeu et des mécaniques. Cette technique, baptisée «reinforcement learning » a permis à AlphaGo Zero d’améliorer encore ses performances : en l’espace de trois jours, le programme parvenait déjà à décrocher ses premières victoires face à la version du programme ayant vaincu le champion du monde Lee Sedol. En continuant son processus d’amélioration, AlphaGo Zero parvient à améliorer encore ses performances jusqu’à dominer la version d’AlphaGo Master, qui avait dominé plusieurs joueurs humains de très haut niveau sur des compétitions en ligne.

 

AlphaGo surpasse ses prédécesseurs

Cette nouvelle annonce ouvre de nouvelles perspectives en matière d’intelligence artificielle, en montrant la capacité des algorithmes à s’attaquer à des problèmes complexes en disposant de données initiales très réduites. Ici, AlphaGo Zero ne disposait à son démarrage que de la connaissance des règles du Go, contrairement aux versions précédentes qui pouvaient s’appuyer sur un corpus de parties jouées par les humains.

Les chercheurs expliquent que AlphaGo Zero bénéficie également des améliorations apportées au matériel et à son algorithme, ce qui le rend aujourd’hui capable de fonctionner sur une puissance de calcul largement inférieure aux précédentes versions. Le programme est parvenu à utiliser plusieurs coups qui n’avaient auparavant jamais été utilisés par les joueurs humains selon les équipes de DeepMind.

Pour les chercheurs, cette nouvelle réussite vient confirmer l’intérêt croissant pour les réseaux neuronaux largement utilisés par AlphaGo dans ses différentes versions. La nouvelle approche retenue par AlphaGo Zero montre également la viabilité des approches s’appuyant sur des données « non supervisées », c’est-à-dire en l’absence de données classées et triées par des data scientists avant d’être analysés par AlphaGo.

Si le jeu de Go semble aujourd’hui être un problème résolu pour DeepMind, la société s’est lancée dans de nouveaux domaines afin de frotter leurs IA à des domaines différents. Les chercheurs ont ainsi annoncé un partenariat avec un hôpital britannique afin de procéder à de l’analyse de données médicales, ainsi qu’un autre accord avec Blizzard pour développer des intelligences artificielles sur Starcraft 2. Différents terrains de jeux pour les IA de Google, qui permettront de tester les performances dans des cas de figure très différents du jeu de Go, dont les règles et le déroulement ne laissent aucune place au hasard.


ZDNet vous accompagne

6 grands mythes autour de l’Intelligence Artificielle

ZDNet