AlphaGo contre Lee Sedol - AlphaGo versus Lee Sedol
Séoul , Corée du Sud , 9-15 mars 2016 | |
---|---|
Jeu un | AlphaGo W+R |
Jeu deux | AlphaGo B+R |
Jeu trois | AlphaGo W+R |
Jeu quatre | Lee Sedol W+R |
Jeu cinq | AlphaGo W+R |
AlphaGo contre Lee Sedol , également connu sous le nom de Google DeepMind Challenge Match , était un match de Go de cinq matchs entre Lee Sedol , 18 fois champion du monde et AlphaGo , un programme informatique de Go développé par Google DeepMind , joué à Séoul , en Corée du Sud entre 9 et 15 mars 2016. AlphaGo a remporté tous les matchs sauf le quatrième ; tous les matchs ont été gagnés par démission. Le match a été comparé au match d'échecs historique entre Deep Blue et Garry Kasparov en 1997.
Le vainqueur du match devait gagner 1 million de dollars. Depuis qu'AlphaGo a gagné, Google DeepMind a déclaré que le prix sera remis à des organisations caritatives, dont l' UNICEF et les organisations Go. Lee a reçu 170 000 $ (150 000 $ pour avoir participé aux cinq jeux et 20 000 $ supplémentaires pour avoir gagné un jeu).
Après le match, la Korea Baduk Association a décerné à AlphaGo le rang de grand maître de Go le plus élevé – un « 9 dan honorifique ». Il a été décerné en reconnaissance des "efforts sincères" d'AlphaGo pour maîtriser le Go. Ce match a été choisi par Science comme l'un des finalistes de la percée de l'année le 22 décembre 2016.
Fond
Défi difficile en intelligence artificielle
Vidéo externe | |
---|---|
La machine s'entraîne à battre les humains dans le jeu le plus difficile du monde, Retro Report , 2:51, Retro Report |
Le Go est un jeu de société complexe qui nécessite intuition, réflexion créative et stratégique. Il a longtemps été considéré comme un défi difficile dans le domaine de l' intelligence artificielle (IA) et est considérablement plus difficile à résoudre que les échecs . Beaucoup dans le domaine de l'intelligence artificielle considèrent que le Go requiert plus d'éléments qui imitent la pensée humaine que les échecs . Le mathématicien IJ Good a écrit en 1965 :
Aller sur un ordinateur ? – Afin de programmer un ordinateur pour qu'il joue un jeu raisonnable de Go, plutôt qu'un simple jeu légal – il est nécessaire de formaliser les principes d'une bonne stratégie, ou de concevoir un programme d'apprentissage. Les principes sont plus qualitatifs et mystérieux qu'aux échecs, et dépendent davantage du jugement. Je pense donc qu'il sera encore plus difficile de programmer un ordinateur pour jouer un jeu raisonnable de Go que d'échecs.
Avant 2015, les meilleurs programmes de Go ne parvenaient qu'à atteindre le niveau amateur . Sur le petit plateau 9×9, l'ordinateur s'en sort mieux, et certains programmes réussissent à remporter une fraction de leurs parties 9×9 contre des joueurs professionnels. Avant AlphaGo, certains chercheurs avaient affirmé que les ordinateurs ne battraient jamais les meilleurs humains à Go. Elon Musk , l'un des premiers investisseurs de Deepmind, a déclaré en 2016 que les experts dans le domaine pensaient que l'IA était à 10 ans de remporter une victoire contre un joueur professionnel de haut niveau.
Le match AlphaGo contre Lee Sedol est comparable au match d'échecs de 1997 lorsque Gary Kasparov a perdu contre l'ordinateur IBM Deep Blue . La défaite de Kasparov contre Deep Blue est considérée comme le moment où un ordinateur est devenu meilleur que les humains aux échecs.
AlphaGo est très différent des précédents efforts d'IA. Au lieu d'utiliser des algorithmes de probabilité codés en dur par des programmeurs humains, AlphaGo utilise des réseaux de neurones pour estimer sa probabilité de gagner. AlphaGo accède et analyse l'intégralité de la bibliothèque en ligne de Go ; y compris tous les matchs, les joueurs, les analyses et la littérature ; ainsi que les jeux joués par AlphaGo contre lui-même et d'autres joueurs. Une fois configuré, AlphaGo est indépendant de l'équipe de développeurs et évalue la meilleure voie pour résoudre le Go (c'est-à-dire gagner la partie). En utilisant les réseaux de neurones et la recherche arborescente Monte Carlo , AlphaGo calcule un nombre colossal de probabilités probables et improbables de nombreux déplacements dans le futur.
Les résultats de recherches connexes sont appliqués à des domaines tels que les sciences cognitives , la reconnaissance de formes et l' apprentissage automatique .
Match contre Fan Hui
AlphaGo a battu le champion d'Europe Fan Hui , un professionnel de 2 dan, 5-0 en octobre 2015, la première fois qu'une IA avait battu un joueur professionnel humain au jeu sur un plateau de taille normale sans handicap. Certains commentateurs ont souligné le fossé entre Fan et Lee, qui est classé 9 dan professionnel. Les programmes informatiques Zen et Crazy Stone ont déjà vaincu des joueurs humains classés 9 dan professionnels avec des handicaps de quatre ou cinq pierres. Le spécialiste canadien de l'IA Jonathan Schaeffer , commentant après la victoire contre Fan, a comparé AlphaGo à un "enfant prodige" qui manquait d'expérience, et a estimé que "la véritable réussite sera lorsque le programme jouera un joueur dans le véritable échelon supérieur". Il a ensuite cru que Lee gagnerait le match en mars 2016. Hajin Lee , une joueuse de go professionnelle et secrétaire générale de la Fédération internationale de go , a déclaré qu'elle était "très excitée" à l'idée qu'une IA défie Lee, et a pensé les deux joueurs avaient une chance égale de gagner.
Au lendemain de son match contre AlphaGo, Fan Hui a noté que le jeu lui avait appris à être un meilleur joueur et à voir des choses qu'il n'avait pas vues auparavant. En mars 2016, Wired a rapporté que son classement était passé de 633 dans le monde à environ 300.
Préparation
Les experts de Go ont trouvé des erreurs dans le jeu d'AlphaGo contre Fan, en particulier en raison d'un manque de connaissance de l'ensemble du plateau. Avant le match contre Lee, on ne savait pas à quel point le programme avait amélioré son jeu depuis son match d'octobre. L'ensemble de données d'entraînement original d'AlphaGo a commencé avec des parties de joueurs amateurs puissants à partir de serveurs Internet Go, après quoi AlphaGo s'est entraîné en jouant contre lui-même pendant des dizaines de millions de parties.
Joueurs
AlphaGo
AlphaGo est un programme informatique développé par Google DeepMind pour jouer au jeu de société Go . L'algorithme d'AlphaGo utilise une combinaison de techniques d' apprentissage automatique et de recherche arborescente , combinée à une formation approfondie, à la fois humaine et informatique. Les réseaux de neurones du système ont été initialement amorcés à partir de l'expertise humaine en matière de jeu. AlphaGo a été initialement formé pour imiter le jeu humain en essayant de faire correspondre les mouvements de joueurs experts à partir de jeux historiques enregistrés, en utilisant une base de données KGS Go Server d'environ 30 millions de mouvements de 160 000 jeux par KGS 6 à 9 joueurs humains dan. Une fois qu'il a atteint un certain degré de compétence, il a été entraîné davantage en étant configuré pour jouer un grand nombre de jeux contre d'autres instances de lui-même, en utilisant l' apprentissage par renforcement pour améliorer son jeu. Le système n'utilise pas de "base de données" de coups à jouer. Comme l'a expliqué l'un des créateurs d'AlphaGo :
Bien que nous ayons programmé cette machine pour jouer, nous n'avons aucune idée des mouvements qu'elle proposera. Ses déplacements sont un phénomène émergent dès l'entraînement. Nous créons simplement les ensembles de données et les algorithmes d'entraînement. Mais les mouvements qu'il propose ensuite sont hors de nos mains - et bien meilleurs que nous, en tant que joueurs de Go, pourrions proposer.
Lors du match contre Lee, AlphaGo a utilisé à peu près la même puissance de calcul que lors du match contre Fan Hui, où il a utilisé 1 202 processeurs et 176 GPU . The Economist a indiqué qu'il utilisait 1 920 processeurs et 280 GPU. Google a également déclaré que ses unités de traitement de tenseur propriétaires avaient été utilisées lors du match contre Lee Sedol.
Lee Sedol
Lee Sedol est un joueur de Go professionnel de rang 9 dan et est l'un des joueurs les plus forts de l' histoire du Go . Il a commencé sa carrière en 1996 (promu au rang de dan professionnel à l'âge de 12 ans), remportant depuis 18 championnats du monde. Il est un "héros national" dans sa Corée du Sud natale, connu pour son jeu non conventionnel et créatif. Lee Sedol avait initialement prédit qu'il battrait AlphaGo dans un « glissement de terrain ». Quelques semaines avant le match, il a remporté le titre coréen Myungin , un championnat majeur.
Jeux
Le match était un match de cinq matchs avec un million de dollars US comme grand prix, utilisant les règles chinoises avec un komi de 7,5 points . Pour chaque match, il y avait une limite de temps de deux heures pour chaque joueur, suivie de trois périodes supplémentaires de 60 secondes pour le byo-yomi . Chaque match a commencé à 13h00 KST (04h00 GMT ).
Le match a été joué au Four Seasons Hotel à Séoul , en Corée du Sud en mars 2016 et a été diffusé en direct avec les commentaires de Michael Redmond (professionnel de 9 dan) et Chris Garlock. Aja Huang , membre de l'équipe DeepMind et joueur de Go amateur de 6 dan, a placé des pierres sur le plateau de Go d'AlphaGo, qui passait par la plate-forme Google Cloud avec son serveur situé aux États-Unis.
Sommaire
Jeu | Date | Le noir | blanche | Résultat | Se déplace |
---|---|---|---|---|---|
1 | 9 mars 2016 | Lee Sedol | AlphaGo | Lee Sedol a démissionné | 186 Jeu 1 |
2 | 10 mars 2016 | AlphaGo | Lee Sedol | Lee Sedol a démissionné | 211 Jeu 2 |
3 | 12 mars 2016 | Lee Sedol | AlphaGo | Lee Sedol a démissionné | 176 Jeu 3 |
4 | 13 mars 2016 | AlphaGo | Lee Sedol | AlphaGo a démissionné | 180 Jeu 4 |
5 | 15 mars 2016 | Lee Sedol | AlphaGo | Lee Sedol a démissionné | 280 Jeu 5 |
Résultat : AlphaGo 4 – 1 Lee Sedol |
|||||
^ note 1 : Pour le cinquième jeu, selon les règles officielles, il était prévu que l'attribution des couleurs se fasse au hasard. Cependant, lors de la conférence de presse après le quatrième match, Lee a demandé "... puisque j'ai gagné avec les blancs, j'espère vraiment que dans le cinquième match je pourrais gagner avec les noirs parce que gagner avec les noirs est beaucoup plus précieux." Hassabis a accepté de permettre à Sedol de jouer avec les noirs. |
Jeu 1
AlphaGo (blanc) a remporté le premier match. Lee a semblé avoir le contrôle pendant une grande partie du match, mais AlphaGo a pris l'avantage dans les 20 dernières minutes et Lee a démissionné. Lee a déclaré par la suite qu'il avait fait une erreur critique au début du match; il a dit que la stratégie de l'ordinateur au début du jeu était « excellente » et que l'IA avait fait un mouvement inhabituel qu'aucun joueur de Go humain n'aurait fait. David Ormerod, commentant le jeu à Go Game Guru, a décrit la septième pierre de Lee comme « un mouvement étrange pour tester la force d'AlphaGo dans l'ouverture », qualifiant le mouvement d'erreur et la réponse d'AlphaGo comme « précise et efficace ». Il a décrit la position d'AlphaGo comme favorable dans la première partie du jeu, considérant que Lee a commencé à revenir avec le coup 81, avant de faire des coups "discutables" à 119 et 123, suivis d'un coup "perdant" à 129. Joueur de go professionnel Cho Hanseung a commenté que le jeu d'AlphaGo s'était considérablement amélioré depuis qu'il avait battu Fan Hui en octobre 2015. Michael Redmond a décrit le jeu de l'ordinateur comme étant plus agressif que contre Fan.
Selon le grand maître de Go 9 dan Kim Seong-ryong, Lee a semblé abasourdi par le jeu puissant d'AlphaGo sur la 102e pierre. Après avoir regardé AlphaGo effectuer le 102e coup du jeu, Lee a réfléchi à ses options pendant plus de 10 minutes.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 premiers coups |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mouvements 100-186 |
Jeu 2
AlphaGo (noir) a remporté le deuxième match. Lee a déclaré par la suite que « AlphaGo a joué un jeu presque parfait », « dès le début du jeu, je n'avais pas l'impression qu'il y avait un point que je menais ». L'un des créateurs d'AlphaGo, Demis Hassabis, a déclaré que le système était confiant dans la victoire à mi-parcours, même si les commentateurs professionnels ne pouvaient pas dire quel joueur était devant.
Michael Redmond ( 9p ) a noté que la 19e pierre d'AlphaGo (coup 37) était "créative" et "unique". Lee a mis un temps inhabituellement long à réagir au mouvement. An Younggil (8p) a qualifié le coup 37 d'AlphaGo de "coup d'épaule rare et intrigant", mais a déclaré que le compteur de Lee était "exquis". Il a déclaré que le contrôle était passé entre les joueurs plusieurs fois avant la fin du jeu, et a particulièrement félicité les mouvements 151, 157 et 159 d'AlphaGo, les qualifiant de « brillants ».
AlphaGo a montré des anomalies et des mouvements d'un point de vue plus large que les joueurs professionnels de Go ont décrit comme ressemblant à des erreurs à première vue mais à une stratégie intentionnelle avec le recul. Comme l'a expliqué l'un des créateurs du système, AlphaGo ne cherche pas à maximiser ses points ou sa marge de victoire, mais essaie de maximiser sa probabilité de gagner. Si AlphaGo doit choisir entre un scénario où il gagnera de 20 points avec 80% de probabilité et un autre où il gagnera de 1 point et demi avec 99% de probabilité, il choisira ce dernier, même s'il doit abandonner des points pour atteindre ce. En particulier, le coup 167 d'AlphaGo a semblé donner à Lee une chance de se battre et a été déclaré comme une erreur évidente par les commentateurs. An Younggil a déclaré : « Donc, quand AlphaGo joue un coup d'apparence lâche, nous pouvons le considérer comme une erreur, mais peut-être devrait-il être plus précisément considéré comme une déclaration de victoire ? »
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 premiers coups |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mouvements 100–199 |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mouvements 200-211 |
Jeu 3
AlphaGo (blanc) a remporté le troisième match.
Après le deuxième match, il y avait encore de forts doutes parmi les joueurs quant à savoir si AlphaGo était vraiment un joueur fort dans le sens où un humain pourrait l'être. Le troisième jeu a été décrit comme éliminant ce doute; avec des analystes commentant que :
AlphaGo a gagné de manière si convaincante qu'il a levé tout doute sur sa force dans l'esprit des joueurs expérimentés. En fait, ça jouait si bien que c'en était presque effrayant... En forçant AlphaGo à résister à une attaque unilatérale très sévère, Lee a révélé sa puissance jusque-là non détectée... Lee ne tirait pas assez de profit de son attaque... L'un des plus grands virtuoses du milieu de jeu venait d'être éclipsé dans la clarté du noir et blanc.
Selon An Younggil (8p) et David Ormerod, le jeu a montré que "AlphaGo est tout simplement plus fort que n'importe quel joueur de Go humain connu". AlphaGo a été vu pour naviguer avec compétence dans des situations délicates connues sous le nom de ko qui ne se sont pas produites lors des deux matchs précédents. An et Ormerod considèrent le coup 148 comme particulièrement remarquable : au milieu d'un combat de ko complexe , AlphaGo a montré une "confiance" suffisante pour gagner le combat pour jouer un gros coup ailleurs.
Lee, jouant noir, a ouvert avec une formation chinoise élevée et a généré une large zone d'influence noire, qu'AlphaGo a envahie au coup 12. Cela a obligé le programme à défendre un groupe faible, ce qu'il a fait avec succès. An Younggil a décrit le coup 31 de Lee comme possiblement le "coup perdant" et Andy Jackson de l' American Go Association a estimé que le résultat avait déjà été décidé par le coup 35. AlphaGo avait pris le contrôle du jeu par le coup 48, et a forcé Lee sur la défensive . Lee a contre-attaqué aux coups 77/79, mais la réponse d'AlphaGo a été efficace et son coup 90 a réussi à simplifier la position. Il a ensuite gagné une large zone de contrôle en bas de la planche, renforçant sa position avec des mouvements de 102 à 112 décrits par An comme « sophistiqués ». Lee attaqua à nouveau aux coups 115 et 125, mais les réponses d'AlphaGo furent à nouveau efficaces. Lee a finalement tenté un ko complexe au coup 131, sans forcer une erreur du programme, et il a démissionné au coup 176.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 premiers coups |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Coups de 100 à 176 (122 à 113, 154 à , 163 à 145, 164 à 151, 166 et 171 à 160, 169 à 145, 175 à ) |
Jeu 4
Lee (blanc) a remporté le quatrième match. Lee a choisi de jouer un type de stratégie extrême, connue sous le nom d' amashi , en réponse à la préférence apparente d'AlphaGo pour Souba Go (tenter de gagner par de nombreux petits gains lorsque l'occasion se présente), en prenant le territoire au périmètre plutôt qu'au centre. Ce faisant, son objectif apparent était de forcer un style de situation "tout ou rien" - une faiblesse possible pour un adversaire fort dans les types de jeu de négociation, et qui pourrait rendre la capacité d'AlphaGo à décider des avantages minces largement hors de propos.
Les 11 premiers coups étaient identiques au deuxième jeu, où Lee a également joué blanc. Au début du jeu, Lee s'est concentré sur la prise de territoire dans les bords et les coins du plateau, permettant à AlphaGo de gagner en influence en haut et au centre. Lee a ensuite envahi la zone d'influence d'AlphaGo au sommet avec les coups 40 à 48, suivant la stratégie amashi . AlphaGo a répondu avec un coup à l'épaule au coup 47, sacrifiant ensuite quatre pierres ailleurs et gagnant l'initiative avec les coups 47 à 53 et 69. Lee a testé AlphaGo avec les coups 72 à 76 sans provoquer d'erreur, et à ce stade du jeu les commentateurs avaient commencé à sentir que la pièce de Lee était une cause perdue. Cependant, un jeu inattendu au 78 blanc, décrit comme « un tesuji brillant », a changé la donne. Le mouvement a développé un coin blanc au centre et a augmenté la complexité du jeu. Gu Li (9p) l'a décrit comme un " mouvement divin " et a déclaré que le mouvement avait été complètement imprévu par lui.
AlphaGo a mal répondu au coup 79, moment auquel il a estimé qu'il avait 70% de chances de gagner la partie. Lee a poursuivi avec un coup fort au 82 blanc. La réponse initiale d'AlphaGo aux coups 83 à 85 était appropriée, mais au coup 87, son estimation de ses chances de gagner a soudainement chuté, le poussant à faire une série de très mauvais coups du 87 noir. à 101. David Ormerod a caractérisé les coups 87 à 101 comme typiques des erreurs de programme basées sur Monte Carlo. Lee a pris les devants par les blancs 92, et An Younggil a décrit les noirs 105 comme le dernier coup perdant. Malgré de bonnes tactiques lors des coups 131 à 141, AlphaGo s'est avéré incapable de récupérer pendant la phase finale et a démissionné. La démission d'AlphaGo a été déclenchée lorsqu'elle a évalué ses chances de gagner à moins de 20 % ; ceci est destiné à correspondre à la décision des professionnels qui démissionnent plutôt que de jouer jusqu'au bout lorsque leur position est jugée irrécupérable.
Un Younggil de Go Game Guru a conclu que le jeu était « un chef-d'œuvre pour Lee Sedol et deviendra presque certainement un jeu célèbre dans l'histoire du Go ». Lee a commenté après le match qu'il considérait qu'AlphaGo était le plus fort lorsqu'il jouait en blanc (deuxième). Pour cette raison, il a demandé qu'il joue noir dans le cinquième jeu, ce qui est considéré comme plus risqué.
David Ormerod de Go Game Guru a déclaré que bien qu'une analyse du jeu d'AlphaGo vers 79-87 n'était pas encore disponible, il pensait que c'était le résultat d'une faiblesse connue des algorithmes de jeu qui utilisent la recherche par arbre Monte Carlo . Essentiellement, la recherche tente d'élaguer les séquences qui sont moins pertinentes. Dans certains cas, un jeu peut conduire à une ligne de jeu très spécifique qui est significative, mais qui est négligée lors de l'élagage de l'arbre, et ce résultat est donc "hors du radar de recherche".
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 premiers coups |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Se déplace de 100 à 180 (177 à , 178 à ) |
Jeu 5
AlphaGo (blanc) a remporté le cinquième match. Le match a été décrit comme étant proche. Hassabis a déclaré que le résultat est venu après que le programme a fait une "mauvaise erreur" au début du match.
Lee, jouant noir, a ouvert de la même manière que le premier jeu, puis a commencé à jalonner le territoire dans les coins droit et supérieur gauche – une stratégie similaire à celle qu'il a employée avec succès dans le jeu 4 – tandis qu'AlphaGo gagnait de l'influence au centre de le tableau. Le jeu est resté égal jusqu'à ce que les blancs se déplacent de 48 à 58, qu'AlphaGo a joué en bas à droite. Ces mouvements ont inutilement perdu les menaces ko et aji, permettant à Lee de prendre les devants. Michael Redmond (9p) a émis l'hypothèse qu'AlphaGo avait peut-être raté le tesuji "serrer la pierre tombale" des noirs . Les humains apprennent à reconnaître le modèle spécifique, mais c'est une longue séquence de mouvements s'il doit être calculé à partir de zéro.
AlphaGo a ensuite commencé à développer le haut du tableau ainsi que le centre, et s'est défendu avec succès contre une attaque de Lee dans les coups 69 à 81 que David Ormerod a qualifié de trop prudent. En 90 blancs, AlphaGo avait retrouvé l'égalité, puis a joué une série de coups décrits par Ormerod comme "inhabituels... mais subtilement impressionnants" qui ont gagné un petit avantage. Lee a tenté une passe de Hail Mary avec les coups 167 et 169 mais la défense d'AlphaGo a réussi. An Younggil a noté les coups blancs 154, 186 et 194 comme étant particulièrement forts, et le programme a joué une finale impeccable, maintenant son avance jusqu'à ce que Lee démissionne.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 premiers coups |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Coups de 100 à 199 (118 à 107, 161 à ) |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mouvements 200-280 (240 à 200, 271 à , 275 à , 276 à ) |
Couverture
La vidéo en direct des jeux et les commentaires associés ont été diffusés en coréen, chinois, japonais et anglais. Une couverture en langue coréenne a été rendue disponible par Baduk TV. La couverture en chinois du premier match avec les commentaires des joueurs de 9 dan Gu Li et Ke Jie a été assurée respectivement par Tencent et LeTV , atteignant environ 60 millions de téléspectateurs. La couverture en ligne en anglais présentée par le 9-dan américain Michael Redmond et Chris Garlock, vice-président de l' American Go Association , a atteint une moyenne de 80 000 téléspectateurs avec un pic de 100 000 téléspectateurs vers la fin du jeu 1.
Réponses
communauté IA
La victoire d'AlphaGo a été une étape majeure dans la recherche sur l'intelligence artificielle. Le Go était auparavant considéré comme un problème difficile dans l'apprentissage automatique qui devait être hors de portée pour la technologie de l'époque. La plupart des experts pensaient qu'un programme Go aussi puissant qu'AlphaGo était dans au moins cinq ans ; certains experts pensaient qu'il faudrait au moins une autre décennie avant que les ordinateurs battent les champions de Go. La plupart des observateurs au début des matchs de 2016 s'attendaient à ce que Lee batte AlphaGo.
Avec des jeux tels que les dames, les échecs et maintenant le Go remportés par les joueurs informatiques, les victoires aux jeux de société populaires ne peuvent plus servir de jalons majeurs pour l'intelligence artificielle comme avant. Deep Blue de Murray Campbell a appelé la victoire de AlphaGo « la fin d'une époque ... jeux de société sont plus ou moins fait et qu'il est temps de passer. »
Comparés à Deep Blue ou à Watson , les algorithmes sous-jacents d'AlphaGo sont potentiellement plus polyvalents et peuvent être la preuve que la communauté scientifique progresse vers l'intelligence artificielle générale . Certains commentateurs pensent que la victoire d'AlphaGo est une bonne occasion pour la société de commencer à discuter des préparatifs de l'impact futur possible des machines dotées d'une intelligence à usage général . En mars 2016, le chercheur en IA Stuart Russell a déclaré que "les méthodes d'IA progressent beaucoup plus rapidement que prévu, (ce qui) rend la question du résultat à long terme plus urgente", ajoutant que "afin de garantir que les systèmes d'IA de plus en plus puissants restent complètement sous contrôle humain... il y a beaucoup de travail à faire." Certains chercheurs, comme le physicien Stephen Hawking , préviennent qu'une future IA auto-améliorée pourrait acquérir une véritable intelligence générale, conduisant à une prise de contrôle inattendue de l' IA ; d'autres chercheurs ne sont pas d'accord : l'expert en IA Jean-Gabriel Ganascia estime que "des choses comme le 'bon sens'... peuvent ne jamais être reproductibles", et dit "Je ne vois pas pourquoi nous parlerions de peurs. Au contraire, cela suscite des espoirs. dans de nombreux domaines tels que la santé et l'exploration spatiale. Richard Sutton a déclaré : "Je ne pense pas que les gens devraient avoir peur... mais je pense que les gens devraient faire attention."
L'équipe DeepMind AlphaGo a reçu la médaille inaugurale IJCAI Marvin Minsky pour ses réalisations exceptionnelles en IA. « AlphaGo est une réalisation merveilleuse et un exemple parfait de ce que la Médaille Minsky a été lancée pour reconnaître », a déclaré le professeur Michael Wooldridge , président du comité des prix IJCAI. "Ce qui a particulièrement impressionné IJCAI, c'est qu'AlphaGo réalise ce qu'il fait grâce à une brillante combinaison de techniques d'IA classiques ainsi que des techniques d'apprentissage automatique de pointe auxquelles DeepMind est si étroitement associé. C'est une démonstration époustouflante de l'IA contemporaine, et nous sommes ravis de pouvoir le reconnaître avec ce prix".
Aller communauté
Le go est un jeu populaire en Corée du Sud, en Chine et au Japon, et ce match a été regardé et analysé par des millions de personnes dans le monde. De nombreux meilleurs joueurs de Go ont qualifié les jeux peu orthodoxes d'AlphaGo de mouvements apparemment douteux qui ont d'abord déconcerté les spectateurs, mais qui ont du sens avec le recul : « Tous les meilleurs joueurs de Go, sauf les meilleurs, créent leur style en imitant les meilleurs joueurs. ." AlphaGo semblait être devenu de manière inattendue beaucoup plus fort, même par rapport à son match d'octobre 2015 contre Fan Hui, où un ordinateur avait battu un professionnel de Go pour la première fois sans l'avantage d'un handicap.
Le joueur numéro un chinois , Ke Jie , qui était à l'époque le joueur le mieux classé au monde, a d'abord affirmé qu'il serait capable de battre AlphaGo, mais a refusé de jouer contre lui de peur qu'il "copie mon style". Au fur et à mesure que les matchs avançaient, Ke Jie a fait des allers-retours, déclarant qu'« il est fort probable que je (pourrais) perdre » après avoir analysé les trois premiers matchs, mais qu'il a repris confiance après le quatrième match.
Toby Manning, l'arbitre du match d'AlphaGo contre Fan Hui, et Hajin Lee, secrétaire général de la Fédération internationale de go , expliquent tous deux qu'à l'avenir, les joueurs de go recevront de l'aide d'ordinateurs pour apprendre ce qu'ils ont mal fait dans les jeux et améliorer leur compétences.
Lee s'est excusé pour ses pertes, déclarant après le troisième match que "j'ai mal évalué les capacités d'AlphaGo et je me suis senti impuissant". Il a souligné que la défaite était « la défaite de Lee Se-dol » et « non une défaite de l'humanité ». Lee a déclaré que sa perte éventuelle contre une machine était "inévitable", mais a déclaré que "les robots ne comprendront jamais la beauté du jeu de la même manière que nous, les humains". Lee a qualifié sa victoire dans le quatrième match de "victoire inestimable que je n'échangerais contre rien".
Gouvernement
En réponse au match, le gouvernement sud-coréen a annoncé le 17 mars 2016 qu'il investirait 863 millions de dollars (1 000 milliards de won) dans la recherche sur l'intelligence artificielle (IA) au cours des cinq prochaines années.
Film documentaire
Un film documentaire sur les matchs, AlphaGo , a été réalisé en 2017. Le 13 mars 2020, le film a été mis en ligne gratuitement sur la chaîne YouTube de DeepMind.
Voir également
Les références
Liens externes
Commentaire officiel du match
Commentaire officiel du match par Michael Redmond (9 dan pro) et Chris Garlock sur la chaîne YouTube de Google DeepMind :
- Jeu 1 ( résumé de 15 minutes )
- Jeu 2 ( résumé de 15 minutes )
- Jeu 3 ( résumé de 15 minutes )
- Jeu 4 ( résumé de 15 minutes )
- Jeu 5 ( résumé de 15 minutes )
Fichiers SGF
- Jeu 1 (Go Game Guru)
- Jeu 2 (Go Game Guru)
- Jeu 3 (Go Game Guru)
- Jeu 4 (Go Game Guru)
- Jeu 5 (Go Game Guru)
Coordonnées : 37.5706°N 126.9754°E 37°34′14″N 126°58′31″E /