AlphaGo - AlphaGo

Logo AlphaGo
Logo AlphaGo

AlphaGo est un programme informatique qui joue au jeu de société Go . Il a été développé par DeepMind Technologies, une filiale de Google (maintenant Alphabet Inc. ). Les versions ultérieures d'AlphaGo sont devenues de plus en plus puissantes, y compris une version qui a concouru sous le nom de Master . Après s'être retiré du jeu compétitif, AlphaGo Master a été remplacé par une version encore plus puissante connue sous le nom d' AlphaGo Zero , qui était complètement autodidacte sans apprendre des jeux humains. AlphaGo Zero a ensuite été généralisé en un programme connu sous le nom d' AlphaZero , qui jouait à des jeux supplémentaires, notamment les échecs et le shogi . AlphaZero a à son tour été remplacé par un programme connu sous le nom de MuZero qui apprend sans apprendre les règles.

AlphaGo et ses successeurs utilisent un algorithme de recherche arborescente Monte Carlo pour trouver ses mouvements sur la base des connaissances précédemment acquises par l'apprentissage automatique , en particulier par un réseau de neurones artificiels (une méthode d' apprentissage en profondeur ) par une formation approfondie, à la fois humaine et informatique. Un réseau de neurones est formé pour identifier les meilleurs mouvements et les pourcentages gagnants de ces mouvements. Ce réseau de neurones améliore la force de la recherche dans l'arborescence, résultant en une sélection de mouvement plus forte lors de l'itération suivante.

En octobre 2015, lors d'un match contre Fan Hui , l'AlphaGo original est devenu le premier programme informatique de Go à battre un joueur de Go professionnel humain sans handicap sur une planche 19×19 pleine grandeur. En mars 2016, il a battu Lee Sedol dans un match de cinq matchs , la première fois qu'un programme informatique de Go a battu un professionnel de 9 dan sans handicap. Bien qu'il ait perdu contre Lee Sedol lors du quatrième match, Lee a démissionné lors du dernier match, donnant un score final de 4 matchs à 1 en faveur d'AlphaGo. En reconnaissance de la victoire, AlphaGo a reçu un 9-dan honorifique de la Korea Baduk Association . La préparation et le match de défi avec Lee Sedol ont été documentés dans un film documentaire également intitulé AlphaGo , réalisé par Greg Kohs. La victoire d'AlphaGo a été choisie par Science comme l'un des finalistes de la percée de l'année le 22 décembre 2016.

Lors du Future of Go Summit 2017 , la version Master d'AlphaGo a battu Ke Jie , le joueur numéro un au monde à l'époque, dans un match de trois matchs , après quoi AlphaGo a reçu le 9-dan professionnel de la Chinese Weiqi Association. .

Après le match entre AlphaGo et Ke Jie, DeepMind a retiré AlphaGo, tout en poursuivant ses recherches sur l'IA dans d'autres domaines. L'autodidacte AlphaGo Zero a remporté une victoire 100-0 contre la première version compétitive d'AlphaGo, et son successeur AlphaZero est actuellement perçu comme le meilleur joueur mondial de Go ainsi que peut-être d' échecs .

Histoire

Go est considéré comme beaucoup plus difficile à gagner pour les ordinateurs que d'autres jeux tels que les échecs , car son facteur de branchement beaucoup plus important rend l'utilisation de méthodes d'IA traditionnelles telles que l' élagage alpha-bêta , la traversée d'arbres et la recherche heuristique .

Près de deux décennies après que l'ordinateur Deep Blue d' IBM ait battu le champion du monde d'échecs Garry Kasparov lors du match de 1997 , les programmes de Go les plus puissants utilisant des techniques d' intelligence artificielle n'atteignaient qu'un niveau amateur de 5 dan et ne pouvaient toujours pas battre un joueur de Go professionnel sans handicap . En 2012, le logiciel Zen , fonctionnant sur un cluster de quatre PC, a battu Masaki Takemiya ( 9p ) à deux reprises avec des handicaps de cinq et quatre pierres. En 2013, Crazy Stone a battu Yoshio Ishida (9p) avec un handicap de quatre pierres.

Selon David Silver de DeepMind , le projet de recherche AlphaGo a été formé vers 2014 pour tester dans quelle mesure un réseau de neurones utilisant l'apprentissage en profondeur peut rivaliser à Go. AlphaGo représente une amélioration significative par rapport aux programmes Go précédents. En 500 parties contre d'autres programmes de Go disponibles, dont Crazy Stone et Zen, AlphaGo fonctionnant sur un seul ordinateur a remporté tous les prix sauf un. Dans un match similaire, AlphaGo exécuté sur plusieurs ordinateurs a remporté les 500 jeux joués contre d'autres programmes Go, et 77% des jeux joués contre AlphaGo s'exécutant sur un seul ordinateur. La version distribuée en octobre 2015 utilisait 1 202 processeurs et 176 GPU .

Match contre Fan Hui

En octobre 2015, la version distribuée d'AlphaGo a battu le champion d'Europe de Go Fan Hui , un professionnel de 2 dan (sur 9 dan possibles), cinq à zéro. C'était la première fois qu'un programme informatique de Go battait un joueur humain professionnel sur une planche pleine grandeur sans handicap. L'annonce de la nouvelle a été retardée jusqu'au 27 janvier 2016 pour coïncider avec la publication d'un article dans la revue Nature décrivant les algorithmes utilisés.

Match contre Lee Sedol

AlphaGo a joué le joueur professionnel sud-coréen de Go Lee Sedol , classé 9-dan, l'un des meilleurs joueurs de Go, avec cinq matchs se déroulant à l' hôtel Four Seasons de Séoul , en Corée du Sud, les 9, 10, 12, 13 et 15 mars. 2016, qui ont été diffusés en direct. Sur cinq matchs, AlphaGo a remporté quatre matchs et Lee a remporté le quatrième match, ce qui lui a permis d'être enregistré comme le seul joueur humain à avoir battu AlphaGo dans l'ensemble de ses 74 matchs officiels. AlphaGo fonctionnait sur le cloud computing de Google avec ses serveurs situés aux États-Unis. Le match utilisait les règles chinoises avec un komi de 7,5 points , et chaque équipe disposait de deux heures de réflexion plus trois périodes byoyomi de 60 secondes . La version d'AlphaGo jouant contre Lee a utilisé une quantité de puissance de calcul similaire à celle utilisée dans le match Fan Hui. The Economist a indiqué qu'il utilisait 1 920 processeurs et 280 GPU. Au moment du jeu, Lee Sedol avait le deuxième plus grand nombre de victoires au championnat international de Go au monde après le joueur sud-coréen Lee Changho qui a conservé le titre de champion du monde pendant 16 ans. Puisqu'il n'y a pas de méthode officielle unique de classement dans le Go international , les classements peuvent varier selon les sources. Alors qu'il était parfois classé premier, certaines sources ont classé Lee Sedol comme le quatrième meilleur joueur du monde à l'époque. AlphaGo n'a pas été spécialement formé pour affronter Lee et n'a pas été conçu pour rivaliser avec des joueurs humains spécifiques.

Les trois premiers matchs ont été remportés par AlphaGo suite aux démissions de Lee. Cependant, Lee a battu AlphaGo au quatrième jeu, gagnant par démission au coup 180. AlphaGo a ensuite continué à remporter une quatrième victoire, remportant le cinquième jeu par démission.

Le prix était de 1 million de dollars américains. Étant donné qu'AlphaGo en a remporté quatre sur cinq et donc la série, le prix sera remis à des associations caritatives, dont l' UNICEF . Lee Sedol a reçu 150 000 $ pour sa participation aux cinq matchs et 20 000 $ supplémentaires pour sa victoire au match 4.

En juin 2016, lors d'une présentation organisée dans une université aux Pays-Bas, Aja Huang, l'un des membres de l'équipe Deep Mind, a révélé qu'ils avaient corrigé la faiblesse logique survenue lors du 4e match du match entre AlphaGo et Lee, et qu'après coup 78 (qui a été surnommé le " coup divin " par de nombreux professionnels), il jouerait comme prévu et maintiendrait l'avantage des Noirs. Avant le coup 78, AlphaGo menait tout au long du jeu, mais le coup de Lee a détourné et confus les puissances de calcul du programme. Huang a expliqué que le réseau de politique d'AlphaGo consistant à trouver l'ordre de mouvement et la continuation les plus précis n'a pas guidé précisément AlphaGo pour faire la bonne continuation après le mouvement 78, car son réseau de valeur n'a pas déterminé que le 78e mouvement de Lee était le plus probable, et donc quand le mouvement a été fait AlphaGo n'a pas pu faire le bon ajustement à la suite logique.

Soixante jeux en ligne

Le 29 décembre 2016, un nouveau compte sur le serveur Tygem nommé « Magister » (indiqué comme « Magist » dans la version chinoise du serveur) de Corée du Sud a commencé à jouer à des jeux avec des joueurs professionnels. Il a changé son nom de compte en "Master" le 30 décembre, puis déplacé vers le serveur FoxGo le 1er janvier 2017. Le 4 janvier, DeepMind a confirmé que le "Magister" et le "Master" étaient tous deux joués par une version mise à jour d'AlphaGo, appelé AlphaGo Master . Au 5 janvier 2017, le record en ligne d'AlphaGo Master était de 60 victoires et 0 défaites, dont trois victoires contre le joueur le mieux classé de Go, Ke Jie , qui avait été discrètement informé à l'avance que Master était une version d'AlphaGo. Après avoir perdu contre Master, Gu Li a offert une prime de 100 000 yuans (14 400 $ US) au premier joueur humain capable de vaincre Master. Maître a joué au rythme de 10 matchs par jour. Beaucoup ont rapidement suspecté qu'il s'agissait d'un joueur d'IA en raison de peu ou pas de repos entre les jeux. Ses adversaires comprenaient de nombreux champions du monde tels que Ke Jie , Park Jeong-hwan , Yuta Iyama , Tuo Jiaxi , Mi Yuting , Shi Yue , Chen Yaoye , Li Qincheng, Gu Li , Chang Hao , Tang Weixing, Fan Tingyu , Zhou Ruiyang , Jiang. Weijie , Chou Chun-hsun , Kim Ji-seok , Kang Dong-yun , Park Yeong-hun et Won Seong-jin ; champions nationaux ou finalistes des championnats du monde tels que Lian Xiao , Tan Xiao , Meng Tailing, Dang Yifei, Huang Yunsong, Yang Dingxin , Gu Zihao, Shin Jinseo, Cho Han-seung et An Sungjoon. Les 60 jeux sauf un étaient des jeux rapides avec trois byo-yomi de 20 ou 30 secondes . Maître a proposé d'étendre le byo-yomi à une minute lorsqu'il jouait avec Nie Weiping en tenant compte de son âge. Après avoir remporté sa 59e partie, Master s'est révélé dans la salle de discussion pour être contrôlé par le Dr Aja Huang de l'équipe DeepMind, puis a changé sa nationalité pour le Royaume-Uni. Une fois ces jeux terminés, le cofondateur de Google DeepMind, Demis Hassabis , a déclaré dans un tweet : "Nous sommes impatients de jouer à des jeux officiels complets plus tard [2017] en collaboration avec des organisations et des experts Go".

Les experts en go ont été impressionnés par les performances du programme et son style de jeu non humain ; Ke Jie a déclaré que « Après que l'humanité ait passé des milliers d'années à améliorer nos tactiques, les ordinateurs nous disent que les humains ont complètement tort... J'irais jusqu'à dire qu'aucun humain n'a touché le bord de la vérité de Go ».

Sommet du futur du Go

Lors du Future of Go Summit qui s'est tenu à Wuzhen en mai 2017, AlphaGo Master a joué trois matchs avec Ke Jie, le joueur n°1 mondial, ainsi que deux matchs avec plusieurs grands professionnels chinois, un match de Go en paire et un contre un collaborateur. équipe de cinq joueurs humains.

Google DeepMind a offert des prix gagnants de 1,5 million de dollars pour le match de trois matchs entre Ke Jie et Master tandis que le côté perdant a remporté 300 000 dollars. Master a remporté les trois matchs contre Ke Jie, après quoi AlphaGo a reçu le 9 dan professionnel de l'Association chinoise de Weiqi.

Après avoir remporté son match de trois matchs contre Ke Jie, le joueur de go le mieux noté au monde, AlphaGo a pris sa retraite. DeepMind a également dissous l'équipe qui travaillait sur le jeu pour se concentrer sur la recherche sur l'IA dans d'autres domaines. Après le sommet, Deepmind a publié 50 matchs AlphaGo contre AlphaGo complets, en cadeau à la communauté Go.

AlphaGo Zero et AlphaZero

L'équipe d'AlphaGo a publié un article dans la revue Nature le 19 octobre 2017, présentant AlphaGo Zero, une version sans données humaines et plus puissante que n'importe quelle version précédente contre un champion humain. En jouant à des jeux contre lui-même, AlphaGo Zero a dépassé la force d' AlphaGo Lee en trois jours en remportant 100 parties à 0, a atteint le niveau d' AlphaGo Master en 21 jours et a dépassé toutes les anciennes versions en 40 jours.

Dans un article publié sur arXiv le 5 décembre 2017, DeepMind a affirmé avoir généralisé l'approche d'AlphaGo Zero en un seul algorithme AlphaZero, qui a atteint en 24 heures un niveau de jeu surhumain dans les parties d' échecs , de shogi et de Go en battant le champion du monde. programmes, Stockfish , Elmo et la version 3 jours d'AlphaGo Zero dans chaque cas.

Outil pédagogique

Le 11 décembre 2017, DeepMind a publié l'outil pédagogique AlphaGo sur son site Web pour analyser les taux de réussite des différentes ouvertures de Go , calculés par AlphaGo Master . L'outil pédagogique collecte 6 000 ouvertures de Go à partir de 230 000 jeux humains analysés chacun avec 10 000 000 de simulations par AlphaGo Master. La plupart des ouvertures incluent des suggestions de mouvements humains.

Versions

Une première version d'AlphaGo a été testée sur du matériel avec différents nombres de CPU et de GPU , fonctionnant en mode asynchrone ou distribué. Deux secondes de temps de réflexion ont été accordées à chaque mouvement. Les cotes Elo qui en résultent sont répertoriées ci-dessous. Dans les matchs avec plus de temps par coup, des notes plus élevées sont obtenues.

Configuration et performances
Configuration Rechercher des
fils de discussion
Nombre de CPU Nombre de GPU Classement Elo
Unique p. 10–11 40 48 1 2 181
Seul 40 48 2 2 738
Seul 40 48 4 2 850
Seul 40 48 8 2 890
Distribué 12 428 64 2 937
Distribué 24 764 112 3 079
Distribué 40 1 202 176 3 140
Distribué 64 1 920 280 3 168

En mai 2016, Google a dévoilé son propre matériel propriétaire « unités de traitement tensoriel », qui, selon lui, avait déjà été déployé dans plusieurs projets internes à Google, y compris le match AlphaGo contre Lee Sedol.

Lors du Sommet Future of Go en mai 2017, DeepMind a révélé que la version d'AlphaGo utilisée lors de ce sommet était AlphaGo Master et a révélé qu'elle avait mesuré la force de différentes versions du logiciel. AlphaGo Lee, la version utilisée contre Lee, pourrait donner à AlphaGo Fan, la version utilisée dans AlphaGo contre Fan Hui, trois pierres, et AlphaGo Master était même trois pierres plus fort.

Configuration et solidité
Versions Matériel Classement Elo Date Résultats
Ventilateur AlphaGo 176 GPU , distribués 3 144 octobre 2015 5:0 contre Fan Hui
AlphaGo Lee 48 TPU , distribués 3 739 mars 2016 4:1 contre Lee Sedol
Maître AlphaGo 4 TPU, une seule machine 4 858 Mai 2017 60:0 contre des joueurs professionnels ;
Sommet du futur du Go
AlphaGo Zero (bloc 40) 4 TPU, une seule machine 5 185 octobre 2017 100:0 contre AlphaGo Lee

89:11 contre AlphaGo Master

AlphaZero (bloc 20) 4 TPU, une seule machine 5 018

Déc 2017 60:40 contre AlphaGo Zero (bloc 20)

Algorithme

Depuis 2016, l'algorithme d'AlphaGo utilise une combinaison de techniques d' apprentissage automatique et de recherche arborescente , combinée à une formation approfondie, à la fois humaine et informatique. Il utilise la recherche arborescente Monte Carlo , guidée par un « réseau de valeurs » et un « réseau de politiques », tous deux mis en œuvre à l'aide de la technologie de réseau de neurones profonds . Une quantité limitée de pré-traitement de détection de caractéristiques spécifiques au jeu (par exemple, pour mettre en évidence si un mouvement correspond à un modèle de nakade ) est appliquée à l'entrée avant qu'elle ne soit envoyée aux réseaux de neurones. Les réseaux sont des réseaux de neurones convolutifs à 12 couches, entraînés par apprentissage par renforcement .

Les réseaux de neurones du système ont été initialement amorcés à partir de l'expertise humaine en matière de jeu. AlphaGo a été initialement formé pour imiter le jeu humain en essayant de faire correspondre les mouvements de joueurs experts à partir de jeux historiques enregistrés, en utilisant une base de données d'environ 30 millions de mouvements. Une fois qu'il a atteint un certain degré de compétence, il a été entraîné davantage en étant configuré pour jouer un grand nombre de jeux contre d'autres instances de lui-même, en utilisant l' apprentissage par renforcement pour améliorer son jeu. Pour éviter de faire perdre "irrespectivement" le temps à son adversaire, le programme est spécifiquement programmé pour démissionner si son évaluation de la probabilité de gagner tombe en dessous d'un certain seuil ; pour le match contre Lee, le seuil de démission a été fixé à 20 %.

Style de jeu

Toby Manning, l'arbitre du match AlphaGo contre Fan Hui, a qualifié le style du programme de "conservateur". Le style de jeu d'AlphaGo favorise fortement une plus grande probabilité de gagner avec moins de points par rapport à une moindre probabilité de gagner avec plus de points. Sa stratégie consistant à maximiser sa probabilité de gagner est distincte de ce que les joueurs humains ont tendance à faire, qui est de maximiser les gains territoriaux, et explique certains de ses mouvements étranges. Il fait beaucoup de mouvements d'ouverture qui n'ont jamais ou rarement été effectués par des humains. Il aime utiliser les coups à l'épaule , surtout si l'adversaire est trop concentré.

Réponses à la victoire de 2016

communauté IA

La victoire d'AlphaGo en mars 2016 a été une étape majeure dans la recherche sur l'intelligence artificielle. Le Go était auparavant considéré comme un problème difficile dans l'apprentissage automatique qui devait être hors de portée pour la technologie de l'époque. La plupart des experts pensaient qu'un programme Go aussi puissant qu'AlphaGo était dans au moins cinq ans ; certains experts pensaient qu'il faudrait au moins une autre décennie avant que les ordinateurs battent les champions de Go. La plupart des observateurs au début des matchs de 2016 s'attendaient à ce que Lee batte AlphaGo.

Avec des jeux tels que les dames (qui a été " résolu " par l' équipe de joueurs de dames Chinook ), les échecs et maintenant le Go gagnés par les ordinateurs, les victoires aux jeux de société populaires ne peuvent plus servir de jalons majeurs pour l'intelligence artificielle de la manière dont ils l'ont utilisé. à. Deep Blue de Murray Campbell a appelé la victoire de AlphaGo « la fin d'une époque ... jeux de société sont plus ou moins fait et qu'il est temps de passer. »

Comparés à Deep Blue ou Watson , les algorithmes sous-jacents d'AlphaGo sont potentiellement plus polyvalents et peuvent être la preuve que la communauté scientifique progresse vers l'intelligence artificielle générale . Certains commentateurs pensent que la victoire d'AlphaGo est une bonne opportunité pour la société de commencer à se préparer à l'impact futur possible des machines dotées d'une intelligence à usage général . Comme l'a noté l'entrepreneur Guy Suter, AlphaGo ne sait que jouer au Go et ne possède pas d'intelligence à usage général ; "[Il] ne pouvait pas se réveiller un matin et décider qu'il voulait apprendre à utiliser des armes à feu." Le chercheur en IA Stuart Russell a déclaré que les systèmes d'IA tels qu'AlphaGo ont progressé plus rapidement et sont devenus plus puissants que prévu, et nous devons donc développer des méthodes pour nous assurer qu'ils "restent sous contrôle humain". Certains chercheurs, tels que Stephen Hawking , ont averti (en mai 2015 avant les matchs) qu'une future IA auto-améliorée pourrait acquérir une véritable intelligence générale, conduisant à une prise de contrôle inattendue de l' IA ; d'autres chercheurs ne sont pas d'accord : l'expert en IA Jean-Gabriel Ganascia estime que "des choses comme le ' bon sens '... peuvent ne jamais être reproductibles", et dit "Je ne vois pas pourquoi nous parlerions de peurs. Au contraire, cela suscite des espoirs. dans de nombreux domaines tels que la santé et l'exploration spatiale. L'informaticien Richard Sutton a déclaré : "Je ne pense pas que les gens devraient avoir peur... mais je pense que les gens devraient faire attention."

En Chine, AlphaGo a été un « moment Spoutnik » qui a aidé à convaincre le gouvernement chinois de prioriser et d'augmenter considérablement le financement de l'intelligence artificielle.

En 2017, l'équipe DeepMind AlphaGo a reçu la première médaille IJCAI Marvin Minsky pour ses réalisations exceptionnelles en IA. « AlphaGo est une réalisation merveilleuse et un exemple parfait de ce que la Médaille Minsky a été lancée pour reconnaître », a déclaré le professeur Michael Wooldridge , président du comité des prix IJCAI. "Ce qui a particulièrement impressionné IJCAI, c'est qu'AlphaGo réalise ce qu'il fait grâce à une brillante combinaison de techniques d'IA classiques ainsi que des techniques d'apprentissage automatique de pointe auxquelles DeepMind est si étroitement associé. C'est une démonstration époustouflante de l'IA contemporaine, et nous sommes ravis de pouvoir le reconnaître avec ce prix."

Aller communauté

Le go est un jeu populaire en Chine, au Japon et en Corée, et les matchs de 2016 ont été regardés par peut-être une centaine de millions de personnes dans le monde. De nombreux meilleurs joueurs de Go ont qualifié les jeux peu orthodoxes d'AlphaGo de mouvements apparemment douteux qui ont d'abord déconcerté les spectateurs, mais qui ont du sens avec le recul : « Tous les meilleurs joueurs de Go, sauf les meilleurs, créent leur style en imitant les meilleurs joueurs. ." AlphaGo semblait être devenu de manière inattendue beaucoup plus fort, même par rapport à son match d'octobre 2015 où un ordinateur avait battu un professionnel de Go pour la première fois sans l'avantage d'un handicap. Le lendemain de la première défaite de Lee, Jeong Ahram, correspondant principal de Go pour l'un des plus grands quotidiens de Corée du Sud, a déclaré : « La nuit dernière était très sombre... Beaucoup de gens ont bu de l'alcool. La Korea Baduk Association , l'organisation qui supervise les professionnels du Go en Corée du Sud, a décerné à AlphaGo un titre honorifique de 9 dan pour avoir fait preuve de compétences créatives et fait progresser le jeu.

Le Chinois Ke Jie , un jeune de 18 ans généralement reconnu comme le meilleur joueur de Go du monde à l'époque, a d'abord affirmé qu'il serait capable de battre AlphaGo, mais a refusé de jouer contre lui de peur qu'il « copie mon style ». Au fur et à mesure que les matchs avançaient, Ke Jie a fait des allers-retours, déclarant qu'« il est fort probable que je (pourrais) perdre » après avoir analysé les trois premiers matchs, mais qu'il a repris confiance après qu'AlphaGo ait affiché des défauts lors du quatrième match.

Toby Manning, l'arbitre du match d'AlphaGo contre Fan Hui, et Hajin Lee, secrétaire général de la Fédération internationale de go , expliquent tous deux qu'à l'avenir, les joueurs de go recevront de l'aide d'ordinateurs pour apprendre ce qu'ils ont mal fait dans les jeux et améliorer leur compétences.

Après le deuxième match, Lee a déclaré qu'il se sentait "sans voix": "Dès le début du match, je n'ai jamais pu prendre le dessus pour un seul coup. C'était la victoire totale d'AlphaGo." Lee s'est excusé pour ses pertes, déclarant après le troisième match que "j'ai mal évalué les capacités d'AlphaGo et je me suis senti impuissant". Il a souligné que la défaite était « la défaite de Lee Se-dol » et « non une défaite de l'humanité ». Lee a déclaré que sa perte éventuelle contre une machine était "inévitable", mais a déclaré que "les robots ne comprendront jamais la beauté du jeu de la même manière que nous, les humains". Lee a qualifié sa victoire dans le quatrième match de "victoire inestimable que je n'échangerais contre rien".

Systèmes similaires

Facebook a également travaillé sur son propre système de Go-playing darkforest , également basé sur la combinaison de l'apprentissage automatique et de la recherche arborescente Monte Carlo . Bien qu'il soit un solide joueur contre d'autres programmes de Go sur ordinateur, au début de 2016, il n'avait pas encore vaincu un joueur humain professionnel. Darkforest a perdu contre CrazyStone et Zen et est estimé avoir une force similaire à CrazyStone et Zen.

DeepZenGo , un système développé avec le soutien du site de partage de vidéos Dwango et de l' Université de Tokyo , a perdu 2-1 en novembre 2016 face au maître de Go Cho Chikun , qui détient le record du plus grand nombre de titres de Go au Japon.

Un article publié en 2018 dans Nature a cité l'approche d'AlphaGo comme base d'un nouveau moyen de calculer les molécules pharmaceutiques potentielles.

Exemple de jeu

AlphaGo Master (blanc) c. Tang Weixing (31 décembre 2016), AlphaGo a gagné par démission. Blanc 36 a été largement salué.

Allez ul.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez sur ur.svg
Allez l.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 69.svg Allez .svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 83.svg Allez 68.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez .svg Allez w2.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez -.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez b1.svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 73.svg Allez .svg Allez .svg Allez 71.svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 72.svg Allez 70.svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez 58.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 76.svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez 56.svg Allez 57.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 82.svg Allez 78.svg Allez .svg Allez 74.svg Allez 75.svg Allez .svg Allez r.svg
Allez l.svg Allez 54.svg Allez 15.svg Allez -.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez -.svg Allez .svg Allez .svg Allez 80.svg Allez 79.svg Allez .svg Allez 77.svg Allez 67.svg Allez .svg Allez r.svg
Allez l.svg Allez 52.svg Allez 53.svg Allez 36.svg Allez 37.svg Allez .svg Allez 47.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 81.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez 48.svg Allez 39.svg Allez 27.svg Allez .svg Allez 46.svg Allez 41.svg Allez 40.svg Allez 51.svg Allez 92.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 84.svg Allez .svg Allez r.svg
Allez l.svg Allez 42.svg Allez 38.svg Allez b9.svg Allez .svg Allez .svg Allez 44.svg Allez 45.svg Allez .svg Allez 26.svg Allez .svg Allez 91.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 98.svg Allez 93.svg Allez r.svg
Allez 64.svg Allez 43.svg Allez b7.svg Allez w8.svg Allez 10.svg Allez .svg Allez .svg Allez 25.svg Allez .svg Allez .svg Allez 90.svg Allez 89.svg Allez .svg Allez 85.svg Allez .svg Allez 87.svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez 13.svg Allez 22.svg Allez .svg Allez 28.svg Allez 29.svg Allez 19.svg Allez 24.svg Allez .svg Allez .svg Allez 66.svg Allez .svg Allez 86.svg Allez .svg Allez 88.svg Allez w6.svg Allez 99.svg Allez r.svg
Allez l.svg Allez 62.svg Allez 11.svg Allez w4.svg Allez .svg Allez 21.svg Allez .svg Allez 17.svg Allez 18.svg Allez -.svg Allez .svg Allez .svg Allez .svg Allez 30.svg Allez .svg Allez 34.svg Allez 97.svg Allez 96.svg Allez r.svg
Allez l.svg Allez 49.svg Allez 12.svg Allez 14.svg Allez .svg Allez b5.svg Allez .svg Allez 20.svg Allez 16.svg Allez .svg Allez .svg Allez .svg Allez 23.svg Allez 31.svg Allez 35.svg Allez b3.svg Allez 32.svg Allez 95.svg Allez r.svg
Allez 55.svg Allez 50.svg Allez 59.svg Allez .svg Allez .svg Allez 65.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 33.svg Allez 94.svg Allez r.svg
Allez 63.svg Allez 60.svg Allez 61.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez dr.svg
99 premiers coups
Allez ul.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez u.svg Allez sur ur.svg
Allez l.svg Allez 48.svg Allez 46.svg Allez 47.svg Allez .svg Allez 36.svg Allez 54.svg Allez 53.svg Allez 51.svg Allez .svg Allez 27.svg Allez 14.svg Allez 13.svg Allez 17.svg Allez b .svg Allez .svg Allez 85.svg Allez .svg Allez r.svg
Allez l.svg Allez 34.svg Allez 29.svg Allez 33.svg Allez 35.svg Allez w8.svg Allez .svg Allez 52.svg Allez 26.svg Allez b9.svg Allez 23.svg Allez 12.svg Allez b .svg Allez avec .svg Allez .svg Allez .svg Allez 83.svg Allez 84.svg Allez r.svg
Allez 42.svg Allez 31.svg Allez 30.svg Allez w.svg Allez 37.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 22.svg Allez 18.svg Allez 15.svg Allez 10.svg Allez 11.svg Allez .svg Allez b.svg Allez .svg Allez 80.svg Allez r.svg
Allez l.svg Allez 32.svg Allez 41.svg Allez 43.svg Allez 68.svg Allez 40.svg Allez 38.svg Allez 70.svg Allez .svg Allez 24.svg Allez 21.svg Allez 19.svg Allez 16.svg Allez b .svg Allez .svg Allez .svg Allez b .svg Allez 81.svg Allez 82.svg
Allez l.svg Allez 45.svg Allez .svg Allez .svg Allez 44.svg Allez 39.svg Allez 64.svg Allez 63.svg Allez .svg Allez 69.svg Allez .svg Allez .svg Allez 20.svg Allez 71.svg Allez .svg Allez avec .svg Allez avec .svg Allez 78.svg Allez r.svg
Allez l.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 65.svg Allez 66.svg Allez .svg Allez .svg Allez .svg Allez 75.svg Allez 25.svg Allez 72.svg Allez 73.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez avec .svg Allez 28.svg Allez .svg Allez 67.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 74.svg Allez .svg Allez .svg Allez avec .svg Allez .svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez avec .svg Allez b .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 86.svg Allez .svg Allez .svg Allez avec .svg Allez avec .svg Allez .svg Allez avec .svg Allez b .svg Allez .svg Allez r.svg
Allez l.svg Allez avec .svg Allez b .svg Allez -.svg Allez .svg Allez .svg Allez .svg Allez .svg Allez 76.svg Allez 55.svg Allez .svg Allez .svg Allez avec .svg Allez b .svg Allez .svg Allez b.svg Allez b .svg Allez b3.svg Allez r.svg
Allez l.svg Allez avec .svg Allez b .svg Allez avec .svg Allez b .svg Allez .svg Allez b .svg Allez 77.svg Allez .svg Allez 62.svg Allez w6.svg Allez .svg Allez w4.svg Allez b .svg Allez .svg Allez .svg Allez 79.svg Allez w2.svg Allez r.svg
Allez l.svg Allez avec .svg Allez b .svg Allez b .svg Allez .svg Allez avec .svg Allez b .svg Allez avec .svg Allez b .svg Allez avec .svg Allez .svg Allez 56.svg Allez b5.svg Allez 57.svg Allez .svg Allez .svg Allez avec .svg Allez b7.svg Allez r.svg
Allez l.svg Allez avec .svg Allez avec .svg Allez b .svg Allez .svg Allez .svg Allez avec .svg Allez b .svg Allez .svg Allez avec .svg Allez .svg Allez b .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez avec .svg Allez b .svg Allez r.svg
Allez w.svg Allez b .svg Allez b .svg Allez avec .svg Allez avec .svg Allez .svg Allez .svg Allez b .svg Allez .svg Allez .svg Allez avec .svg Allez b .svg Allez .svg Allez b .svg Allez .svg Allez b .svg Allez 00.svg Allez .svg Allez r.svg
Allez l.svg Allez .svg Allez b .svg Allez avec .svg Allez .svg Allez avec .svg Allez b .svg Allez b .svg Allez avec .svg Allez .svg Allez .svg Allez avec .svg Allez .svg Allez avec .svg Allez .svg Allez avec .svg Allez avec .svg Allez b .svg Allez r.svg
Allez l.svg Allez avec .svg Allez b .svg Allez w.svg Allez .svg Allez b .svg Allez .svg Allez b .svg Allez avec .svg Allez -.svg Allez 60.svg Allez 58.svg Allez .svg Allez avec .svg Allez .svg Allez w.svg Allez b .svg Allez avec .svg Allez b1.svg
Allez l.svg Allez b .svg Allez avec .svg Allez avec .svg Allez .svg Allez b .svg Allez .svg Allez avec .svg Allez avec .svg Allez 61.svg Allez 59.svg Allez .svg Allez b .svg Allez b .svg Allez b .svg Allez b .svg Allez .svg Allez b .svg Allez r.svg
Allez b.svg Allez .svg Allez b .svg Allez .svg Allez .svg Allez b .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez .svg Allez b .svg Allez avec .svg Allez r.svg
Allez b.svg Allez d.svg Allez b.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez d.svg Allez dr.svg
Coups 100-186 (149 à 131, 150 à 130)

Impacts sur Go

Le film documentaire AlphaGo a suscité l'espoir que Lee Sedol et Fan Hui auraient bénéficié de leur expérience de jeu AlphaGo, mais en mai 2018, leurs notes avaient peu changé; Lee Sedol était classé 11e au monde et Fan Hui 545e. Le 19 novembre 2019, Lee a annoncé sa retraite du jeu professionnel, arguant qu'il ne pourrait jamais être le meilleur joueur global de Go en raison de la domination croissante de l'IA. Lee les a décrits comme étant « une entité qui ne peut être vaincue ».

Voir également

Les références

Liens externes