Technologie

Une I.A. est parvenue à devenir experte en matière d’échecs en seulement 4 heures

Par

le

L’intelligence artificielle de DeepMind est devenue un joueur d’échecs hors norme en seuelement quelques heures, juste pour s’amuser.

Il y a une dizaine d’années, les humains ont eu une faible idée de la capacité des machines intelligentes lorsqu’un superordinateur, Deep Blue d’IBM, a battu le champion mondial d’échecs de l’époque, Gary Kasparov.

Le monde de l’intelligence artificielle (IA), largement défini comme le désir de reproduire l’intelligence humaine dans les machines, a considérablement progressé au cours de ces 10 dernières années. Si bien qu’un document publié par DeepMind, la firme d’IA d’Alphabet, a révélé mardi qu’Alphazero, modelé sur le programme informatique AlphaGo Zero de l’entreprise, ne prenait que quatre heures pour apprendre toutes les règles et maîtriser le jeu. Cela est donc assez pour vaincre le plus puissant moteur d’échecs open-source du monde, Stockfish.

Partant d’un jeu aléatoire, et sans aucune connaissance du domaine, à l’exception des règles du jeu, AlphaZero a battu un programme de champion du monde dans chaque partie d’échecs, shogi (échecs japonais) et le jeu chinois Go dans les 24 heures.

Ce n’est qu’en mars 2016 que le programme informatique de DeepMind, AlphaGo, a battu le champion du Go, Lee Seedol.

Si cela ne suffisait pas, DeepMind a annoncé le 18 octobre que la nouvelle version d’AlphaGo, AlphaGo Zero, est maintenant si puissante qu’elle n’a pas besoin de s’entraîner sur des jeux humains et professionnels pour apprendre à jouer au jeu chinois ancien de Go. En outre, la nouvelle version n’a pas seulement appris d’AlphaGo, le plus grand joueur du monde du jeu chinois Go, mais l’a aussi vaincue.

L’algorithme AlphaZero est une version plus générique de l’algorithme AlphaGo Zero. AlphaGo Zero, selon l’article récemment publié, utilise une nouvelle forme de formation de renforcement pour devenir « son propre professeur ».

L’apprentissage par renforcement est une méthode d’entraînement non supervisée qui utilise des récompenses et des sanctions. C’est la même méthode utilisée par le joueur d’échecs AlphaZero. Le système commence par un réseau neuronal (modélisé librement sur le cerveau, d’où le nom) qui ne connait rien du jeu. Il joue ensuite des parties contre lui-même, en combinant ce réseau de neurones avec un puissant algorithme de recherche. Le réseau neuronal est réglé et mis à jour pour prédire les mouvements ainsi que le gagnant final des parties. Ce réseau neuronal mis à jour est ensuite recombiné avec l’algorithme de recherche pour créer une nouvelle version plus puissante, et ainsi de suite.

L’intelligence artificielle est sans aucun doute devenue plus intelligente grâce aux progrès rapides des algorithmes d’apprentissage automatique (Machine learning) et d’apprentissage en profondeur (Deep learning), aux quantités gigantesques de données volumineuses sur lesquelles ces algorithmes peuvent être formés et à l’augmentation phénoménale de la puissance de calcul.

Articles recommandés