DeepMind - DeepMind

DeepMind Technologies Limited
DeepMind logo.png
Type de commerce Filiale
Fondé 23 septembre 2010 ; il y a 11 ans ( 2010-09-23 )
Quartier général
Fondateur(s)
PDG Demis Hassabis
Directeur général Lila Ibrahim
Industrie Intelligence artificielle
Des produits AlphaGo , AlphaStar , AlphaFold , AlphaZero
Des employés >1 000 (juin 2020)
Parent Indépendant (2010-2014)
Google Inc. (2014-2015)
Alphabet Inc. (2015-présent)
URL www.deepmind.com

DeepMind Technologies est une filiale britannique d'intelligence artificielle d' Alphabet Inc. et un laboratoire de recherche fondé en septembre 2010. DeepMind a été racheté par Google en 2014. La société est basée à Londres, avec des centres de recherche au Canada, en France et aux États-Unis. En 2015, elle est devenue une filiale à 100 % d' Alphabet Inc , la société mère de Google.

DeepMind a créé un réseau de neurones qui apprend à jouer à des jeux vidéo d'une manière similaire à celle des humains, ainsi qu'une machine de Turing neuronale , ou un réseau de neurones pouvant accéder à une mémoire externe comme une machine de Turing conventionnelle , résultant dans un ordinateur qui imite la mémoire à court terme du cerveau humain.

DeepMind a fait les manchettes en 2016 après son AlphaGo programme a battu un professionnel humain Go joueur Lee Sedol , le champion du monde, dans un match de cinq matchs , ce qui a fait l'objet d'un film documentaire. Un programme plus général, AlphaZero , a battu les programmes les plus puissants jouant au go , aux échecs et au shogi (échecs japonais) après quelques jours de jeu contre lui-même en utilisant l' apprentissage par renforcement . En 2020, DeepMind a fait des avancées significatives dans le problème du repliement des protéines .

Histoire

Entrée du bâtiment où Google et DeepMind sont situés au 6 Pancras Square, Londres, Royaume-Uni.

La start-up a été fondée par Demis Hassabis , Shane Legg et Mustafa Suleyman en 2010. Hassabis et Legg se sont rencontrés pour la première fois à la Gatsby Computational Neuroscience Unit de l' University College London .

Au cours de l'une des interviews, Demis Hassabis a déclaré que la start-up avait commencé à travailler sur la technologie de l'intelligence artificielle en lui apprenant à jouer à d'anciens jeux des années 70 et 80, qui sont relativement primitifs par rapport à ceux qui sont disponibles aujourd'hui. Certains de ces jeux comprenaient Breakout , Pong et Space Invaders . L'IA a été initiée à un jeu à la fois, sans aucune connaissance préalable de ses règles. Après avoir passé du temps à apprendre le jeu, l'IA deviendrait finalement un expert en la matière. « On dit que les processus cognitifs par lesquels passe l'IA ressemblent beaucoup à ceux qu'un humain qui n'avait jamais vu le jeu utiliserait pour le comprendre et tenter de le maîtriser. L'objectif des fondateurs est de créer une IA polyvalente qui peut être utile et efficace pour presque tout.

Les principales sociétés de capital-risque Horizons Ventures et Founders Fund ont investi dans la société, ainsi que les entrepreneurs Scott Banister, Peter Thiel et Elon Musk . Jaan Tallinn a été l'un des premiers investisseurs et conseiller de l'entreprise. Le 26 janvier 2014, Google a annoncé que la société avait acquis DeepMind pour 500 millions de dollars et qu'elle avait accepté de reprendre DeepMind Technologies. La vente à Google a eu lieu après que Facebook aurait mis fin aux négociations avec DeepMind Technologies en 2013. La société a ensuite été renommée Google DeepMind et a conservé ce nom pendant environ deux ans.

En 2014, DeepMind a reçu le prix « Entreprise de l'année » du Cambridge Computer Laboratory .

En septembre 2015, DeepMind et le Royal Free NHS Trust ont signé leur accord initial de partage d'informations (ISA) pour co-développer une application de gestion des tâches cliniques, Streams.

Après l'acquisition de Google, la société a mis en place un comité d' éthique de l'intelligence artificielle . Le comité d'éthique de la recherche sur l'IA reste un mystère, Google et DeepMind refusant de révéler qui siège au conseil. DeepMind, avec Amazon, Google, Facebook, IBM et Microsoft, est un membre fondateur de Partnership on AI , une organisation consacrée à l'interface société-IA. DeepMind a ouvert une nouvelle unité appelée DeepMind Ethics and Society et s'est concentrée sur les questions éthiques et sociétales soulevées par l'intelligence artificielle avec l'éminent philosophe Nick Bostrom comme conseiller. En octobre 2017, DeepMind a lancé une nouvelle équipe de recherche pour enquêter sur l'éthique de l'IA.

En décembre 2019, le co-fondateur Suleyman a annoncé qu'il quitterait DeepMind pour rejoindre Google, travaillant dans un rôle politique. En 2021, le Wall Street Journal a révélé que Suleyman avait été mis en congé chez DeepMind en 2019, à la suite d'une enquête sur les allégations d'employés selon lesquelles il les avait intimidés. L'entreprise a engagé un avocat externe pour enquêter sur les allégations selon lesquelles Suleyman aurait intimidé des employés, et il a été mis en congé avant de partir pour rejoindre Google. Un e-mail envoyé au personnel après la parution de l'histoire, publié par Business Insider , a déclaré que "le style de gestion de Suleyman n'était pas à la hauteur" des normes attendues.

Business Insider US a également publié de plus amples détails sur des allégations historiques d'intimidation contre Suleyman, notamment des allégations selon lesquelles il se vantait d'"écraser les gens", "avait l'habitude de s'envoler de nulle part", et a exigé que les employés effectuent des tâches sans rapport avec leur travail.

Produits et technologies

Selon le site Web de la société, l'objectif de DeepMind Technologies est de combiner "les meilleures techniques de l'apprentissage automatique et des neurosciences des systèmes pour créer de puissants algorithmes d'apprentissage à usage général ".

Google Research a publié un article en 2016 concernant la sécurité de l'IA et la prévention des comportements indésirables pendant le processus d'apprentissage de l'IA. Deepmind a également publié plusieurs publications via son site Web. En 2017, DeepMind a publié GridWorld, un banc d'essai open source pour évaluer si un algorithme apprend à désactiver son kill switch ou présente certains comportements indésirables.

En juillet 2018, des chercheurs de DeepMind ont entraîné l'un de ses systèmes à jouer au jeu vidéo Quake III Arena .

En 2020, DeepMind a publié plus d'un millier d'articles, dont treize articles qui ont été acceptés par Nature ou Science . DeepMind a attiré l'attention des médias pendant la période AlphaGo ; selon une recherche LexisNexis , 1842 articles d'actualité publiés mentionnaient DeepMind en 2016, tombant à 1363 en 2019.

Apprentissage profond par renforcement

Contrairement à d' autres AIs, comme IBM de Deep Blue ou Watson , qui ont été développés dans un but défini avant et seule fonction dans son champ d' application, DeepMind affirme que son système est pré-programmé pour ne pas: il apprend de l' expérience, en utilisant seulement pixels bruts en entrée de données. Techniquement, il utilise l'apprentissage en profondeur sur un réseau de neurones convolutifs , avec une nouvelle forme de Q-learning , une forme d' apprentissage par renforcement sans modèle . Ils testent le système sur des jeux vidéo, notamment des premiers jeux d'arcade , comme Space Invaders ou Breakout . Sans altérer le code, l'IA commence à comprendre comment jouer au jeu, et après un certain temps, pour quelques jeux (notamment Breakout ), un jeu plus efficace que n'importe quel humain.

En 2013, DeepMind a publié des recherches sur un système d'IA qui pourrait surpasser les capacités humaines dans des jeux tels que Pong , Breakout et Enduro , tout en surpassant les performances de pointe sur Seaquest , Beamrider et Q*bert . Ce travail aurait conduit à l'acquisition de la société par Google. L'IA de DeepMind avait été appliquée aux jeux vidéo réalisés dans les années 1970 et 1980 ; le travail était en cours pour des jeux 3D plus complexes tels que Quake , qui est apparu pour la première fois dans les années 1990.

En 2020, DeepMind a publié Agent57, un agent IA qui surpasse les performances de niveau humain sur les 57 jeux de la suite Atari2600.

AlphaGo et successeurs

En 2014, la société a publié des recherches sur les systèmes informatiques capables de jouer au Go .

En octobre 2015, un programme informatique de Go appelé AlphaGo, développé par DeepMind, a battu le champion européen de Go Fan Hui , un professionnel de 2 dan (sur 9 dan possibles), cinq à zéro. C'était la première fois qu'une intelligence artificielle (IA) battait un joueur de Go professionnel. Auparavant, les ordinateurs n'étaient connus pour jouer au Go qu'au niveau "amateur". Le Go est considéré comme beaucoup plus difficile à gagner pour les ordinateurs par rapport à d'autres jeux comme les échecs , en raison du nombre beaucoup plus grand de possibilités, ce qui rend la tâche prohibitive pour les méthodes d'IA traditionnelles telles que la force brute .

En mars 2016, il a battu Lee Sedol, un joueur du 9e dan de go et l'un des joueurs les mieux classés au monde, avec un score de 4 à 1 dans un match de cinq matchs .

Lors du Future of Go Summit 2017 , AlphaGo a remporté un match de trois matchs avec Ke Jie , qui à l'époque détenait en permanence le classement n ° 1 mondial pendant deux ans. Il a utilisé un protocole d' apprentissage supervisé , étudiant un grand nombre de jeux joués par des humains les uns contre les autres.

En 2017, une version améliorée, AlphaGo Zero, a battu AlphaGo 100 jeux à 0. Les stratégies d'AlphaGo Zero étaient autodidactes. AlphaGo Zero a pu battre son prédécesseur après seulement trois jours avec moins de puissance de traitement qu'AlphaGo ; en comparaison, l'AlphaGo original a eu besoin de mois pour apprendre à jouer.

Plus tard cette année-là, AlphaZero, une version modifiée d'AlphaGo Zero mais pour gérer n'importe quel jeu à deux joueurs d'informations parfaites, a acquis des capacités surhumaines aux échecs et au shogi. Comme AlphaGo Zero, AlphaZero a appris uniquement par l'auto-jeu.

La technologie

La technologie AlphaGo a été développée sur la base de l' approche d' apprentissage par renforcement profond . Cela rend AlphaGo différent du reste des technologies d'IA sur le marché. Cela dit, le «cerveau» d'AlphaGo a été initié à divers mouvements basés sur les données historiques du tournoi. Le nombre de déménagements a été augmenté progressivement jusqu'à ce qu'il en traite finalement plus de 30 millions. L'objectif était que le système imite le joueur humain et devienne finalement meilleur. Il a joué contre lui-même et a appris non seulement de ses propres défaites, mais aussi de ses victoires ; ainsi, il a appris à s'améliorer au fil du temps et a augmenté son taux de victoire en conséquence.

AlphaGo a utilisé deux réseaux de neurones profonds : un réseau de politiques pour évaluer les probabilités de déplacement et un réseau de valeur pour évaluer les positions. Le réseau politique a été formé via un apprentissage supervisé, et a ensuite été affiné par un apprentissage par renforcement à gradient politique . Le réseau de valeur a appris à prédire les gagnants des jeux joués par le réseau politique contre lui-même. Après la formation, ces réseaux ont utilisé une recherche d'arborescence de Monte Carlo (MCTS), utilisant le réseau de politiques pour identifier les mouvements candidats à forte probabilité, tandis que le réseau de valeur (en conjonction avec des déploiements de Monte Carlo utilisant une politique de déploiement rapide) a évalué les positions des arbres.

Zero s'est entraîné à l'aide d'un apprentissage par renforcement dans lequel le système a joué des millions de jeux contre lui-même. Son seul guide était d'augmenter son taux de victoire. Il l'a fait sans apprendre des jeux joués par les humains. Ses seules caractéristiques d'entrée sont les pierres noires et blanches du tableau. Il utilise un seul réseau de neurones, plutôt que des réseaux de stratégie et de valeur séparés. Sa recherche arborescente simplifiée s'appuie sur ce réseau de neurones pour évaluer les positions et échantillonner les mouvements, sans déploiements Monte Carlo. Un nouvel algorithme d'apprentissage par renforcement intègre une recherche anticipée dans la boucle d'entraînement. AlphaGo Zero employait environ 15 personnes et des millions de ressources informatiques. En fin de compte, il nécessitait beaucoup moins de puissance de calcul qu'AlphaGo, fonctionnant sur quatre processeurs d'IA spécialisés (Google TPU ), au lieu des 48 d'AlphaGo.

AlphaFold

En 2016, DeepMind a tourné son intelligence artificielle vers le repliement des protéines , l'un des problèmes les plus difficiles de la science. En décembre 2018, AlphaFold de DeepMind a remporté la 13e évaluation critique des techniques de prédiction de la structure des protéines (CASP) en prédisant avec succès la structure la plus précise pour 25 des 43 protéines. "Il s'agit d'un projet phare, notre premier investissement majeur en termes de personnes et de ressources dans un problème scientifique fondamental, très important et réel", a déclaré Hassabis au Guardian . En 2020, lors du 14e CASP, les prédictions d'AlphaFold ont atteint un score de précision considéré comme comparable aux techniques de laboratoire. Le Dr Andriy Kryshtafovych, l'un des membres du panel de juges scientifiques, a qualifié la réalisation de "vraiment remarquable" et a déclaré que le problème de prédire comment les protéines se repliaient avait été "en grande partie résolu".

WaveNet et WaveRNN

En 2016, DeepMind a introduit WaveNet, un système de synthèse vocale . Il était à l'origine trop gourmand en calculs pour être utilisé dans les produits de consommation, mais à la fin de 2017, il est devenu prêt à être utilisé dans des applications grand public telles que Google Assistant . En 2018, Google a lancé un produit commercial de synthèse vocale, Cloud Text-to-Speech, basé sur WaveNet.

En 2018, DeepMind a introduit un modèle plus efficace appelé WaveRNN co-développé avec Google AI . En 2019, Google a commencé à le déployer auprès des utilisateurs de Google Duo .

AlphaStar

En 2016, Hassabis a présenté le jeu StarCraft comme un futur défi, car il nécessite une réflexion stratégique et une gestion d'informations imparfaites.

En janvier 2019, DeepMind a présenté AlphaStar, un programme jouant au jeu de stratégie en temps réel StarCraft II . AlphaStar a utilisé l'apprentissage par renforcement basé sur les rediffusions de joueurs humains, puis a joué contre lui-même pour améliorer ses compétences. Au moment de la présentation, AlphaStar avait des connaissances équivalentes à 200 ans de temps de jeu. Il a remporté 10 matchs consécutifs contre deux joueurs professionnels, même s'il avait l'injuste avantage de pouvoir voir l'ensemble du terrain, contrairement à un joueur humain qui doit déplacer la caméra manuellement. Une version préliminaire dans laquelle cet avantage a été corrigé a perdu un match ultérieur.

En juillet 2019, AlphaStar a commencé à jouer contre des humains aléatoires sur l'échelle multijoueur européenne 1v1. Contrairement à la première itération d'AlphaStar, qui ne jouait que Protoss contre Protoss, celle-ci jouait comme toutes les races du jeu et avait des avantages injustes antérieurs corrigés. En octobre 2019, AlphaStar a atteint le niveau Grandmaster sur l' échelle StarCraft II sur les trois courses StarCraft , devenant la première IA à atteindre la ligue supérieure d'un esport très populaire sans aucune restriction de jeu.

Contributions diverses à Google

Google a déclaré que les algorithmes DeepMind ont considérablement augmenté l'efficacité du refroidissement de ses centres de données. De plus, DeepMind (aux côtés d'autres chercheurs d'Alphabet AI) assiste les recommandations d'applications personnalisées de Google Play . DeepMind a également collaboré avec l' équipe Android de Google pour la création de deux nouvelles fonctionnalités qui ont été mises à la disposition des personnes disposant d'appareils exécutant Android Pie, le neuvième volet du système d'exploitation mobile de Google. Ces fonctionnalités, Adaptive Battery et Adaptive Brightness, utilisent l'apprentissage automatique pour économiser l'énergie et faciliter l'utilisation des appareils exécutant le système d'exploitation. C'est la première fois que DeepMind utilise ces techniques à une si petite échelle, avec des applications d'apprentissage automatique typiques nécessitant des ordres de grandeur plus de puissance de calcul.

DeepMind Health

En juillet 2016, une collaboration entre DeepMind et Moorfields Eye Hospital a été annoncée pour développer des applications d'IA pour les soins de santé . DeepMind serait appliqué à l'analyse de scans oculaires anonymisés , à la recherche de signes précoces de maladies conduisant à la cécité .

En août 2016, un programme de recherche avec l' University College London Hospital a été annoncé dans le but de développer un algorithme capable de différencier automatiquement les tissus sains des tissus cancéreux dans les zones de la tête et du cou.

Il existe également des projets avec le Royal Free London NHS Foundation Trust et l' Imperial College Healthcare NHS Trust pour développer de nouvelles applications cliniques mobiles liées aux dossiers électroniques des patients . Le personnel du Royal Free Hospital aurait déclaré en décembre 2017 que l'accès aux données des patients via l'application avait permis de gagner "un temps considérable" et avait fait une différence "phénoménale" dans la gestion des patients atteints d'insuffisance rénale aiguë. Les données des résultats des tests sont envoyées aux téléphones portables du personnel et les avertissent de tout changement dans l'état du patient. Il permet également au personnel de voir si quelqu'un d'autre a répondu et de montrer aux patients leurs résultats sous forme visuelle.

En novembre 2017, DeepMind a annoncé un partenariat de recherche avec le Cancer Research UK Centre de l'Imperial College de Londres dans le but d'améliorer la détection du cancer du sein en appliquant l'apprentissage automatique à la mammographie. De plus, en février 2018, DeepMind a annoncé qu'il travaillait avec le département américain des Anciens Combattants pour tenter d'utiliser l'apprentissage automatique pour prédire l'apparition d'une insuffisance rénale aiguë chez les patients, et aussi plus largement la détérioration générale des patients pendant un séjour à l'hôpital. que les médecins et les infirmières puissent traiter plus rapidement les patients dans le besoin.

DeepMind a développé une application appelée Streams, qui envoie des alertes aux médecins sur les patients à risque de blessure grave. Le 13 novembre 2018, DeepMind a annoncé que sa division santé et l'application Streams seraient absorbées par Google Health . Les défenseurs de la vie privée ont déclaré que l'annonce trahissait la confiance des patients et semblait contredire les déclarations précédentes de DeepMind selon lesquelles les données des patients ne seraient pas connectées aux comptes ou services Google. Un porte-parole de DeepMind a déclaré que les données des patients seraient toujours séparées des services ou projets Google.

Controverse sur le partage des données du NHS

En avril 2016, New Scientist a obtenu une copie d'un accord de partage de données entre DeepMind et le Royal Free London NHS Foundation Trust . Ce dernier gère trois hôpitaux londoniens où environ 1,6 million de patients sont traités chaque année. L'accord montre que DeepMind Health avait accès aux données sur les admissions, les sorties et les transferts, les accidents et les urgences, la pathologie et la radiologie, ainsi que les soins intensifs dans ces hôpitaux. Cela comprenait des détails personnels tels que si les patients avaient été diagnostiqués séropositifs , souffraient de dépression ou avaient déjà subi un avortement afin de mener des recherches pour obtenir de meilleurs résultats dans divers problèmes de santé.

Une plainte a été déposée auprès du Bureau du Commissaire à l' information (ICO), arguant que les données devraient être pseudonymisées et cryptées. En mai 2016, New Scientist a publié un autre article affirmant que le projet n'avait pas obtenu l'approbation du groupe consultatif sur la confidentialité de l' Agence de réglementation des médicaments et des produits de santé .

En mai 2017, Sky News a publié une lettre divulguée du National Data Guardian, Dame Fiona Caldicott , révélant que, selon son "opinion mûrement réfléchie", l'accord de partage de données entre DeepMind et Royal Free avait eu lieu sur une "base juridique inappropriée". Le Commissariat à l'information a statué en juillet 2017 que l'hôpital Royal Free ne s'était pas conformé à la loi sur la protection des données lorsqu'il a remis les données personnelles de 1,6 million de patients à DeepMind.

DeepMind Éthique et Société

En octobre 2017, DeepMind a annoncé une nouvelle unité de recherche, DeepMind Ethics & Society. Leur objectif est de financer des recherches externes sur les thèmes suivants : confidentialité, transparence et équité ; impacts économiques; gouvernance et responsabilité; gérer les risques liés à l'IA ; moralité et valeurs de l'IA ; et comment l'IA peut relever les défis du monde. En conséquence, l'équipe espère mieux comprendre les implications éthiques de l'IA et aider la société à voir que l'IA peut être bénéfique.

Cette nouvelle subdivision de DeepMind est une unité complètement distincte du partenariat d'entreprises de premier plan utilisant l'IA, des universités, des organisations de la société civile et des organisations à but non lucratif du nom de Partenariat sur l'intelligence artificielle au profit des personnes et de la société, dont DeepMind fait également partie. Le conseil d'éthique et de société de DeepMind est également distinct du comité d'éthique de l'IA que Google a initialement accepté de former lors de l'acquisition de DeepMind.

Professeurs DeepMind d'apprentissage automatique

DeepMind parraine trois chaires d'apprentissage automatique :

  1. une à l' Université de Cambridge , détenue par Neil Lawrence , au Département d' informatique et de technologie
  2. un autre à l' Université d'Oxford , détenu par Phil Blunsom . au département d'informatique
  3. un autre à l' University College London , tenu par Marc Deisenroth . au département d'informatique de la faculté des sciences de l'ingénieur

Voir également

Les références

Liens externes