Richard S. Sutton - Richard S. Sutton
Richard S. Sutton
| |
---|---|
Nationalité | canadien |
Citoyenneté | canadien |
mère nourricière |
Université du Massachusetts Amherst Université de Stanford |
Connu pour | Apprentissage par différence temporelle , Dyna, Options, GQ(λ) |
Récompenses |
AAAI Fellow (2001) President's Award (INNS) (2003) Royal Society of Canada Fellow (2016) |
Carrière scientifique | |
Des champs |
Apprentissage par renforcement de l' intelligence artificielle |
Établissements | Université de l'Alberta |
Thèse | Attribution de crédits temporels en apprentissage par renforcement (1984) |
Conseiller de doctorat | André Barto |
Doctorants | David Silver , Doina Precup |
Site Internet | incompletideas |
Richard S. Sutton FRS est un informaticien canadien . Il est actuellement un chercheur scientifique distingué à DeepMind et un professeur d'informatique à l' Université de l'Alberta . Sutton est considéré comme l'un des pères fondateurs de l' apprentissage par renforcement informatique moderne , ayant plusieurs contributions significatives dans le domaine, y compris l'apprentissage par différence temporelle et les méthodes de gradient politique.
Vie et éducation
Richard Sutton est né dans l' Ohio et a grandi à Oak Brook, dans l'Illinois , une banlieue de Chicago .
Sutton a obtenu son baccalauréat en psychologie de l'Université de Stanford en 1978 avant d'obtenir une maîtrise (1980) et un doctorat. (1984) en informatique de l' Université du Massachusetts Amherst sous la direction d' Andrew Barto . Sa thèse de doctorat, Temporal Credit Assignment in Reinforcement Learning , a présenté les architectures acteur-critique et l' attribution temporelle de crédits .
Carrière
En 1984, Sutton était chercheur postdoctoral à l'Université du Massachusetts.
De 1985 à 1994, il a été l'un des principaux membres du personnel technique du Laboratoire des systèmes informatiques et intelligents de GTE à Waltham, Massachusetts . En 1995, il est retourné à l'Université du Massachusetts en tant que chercheur principal.
De 1998 à 2002, Sutton a travaillé au laboratoire AT&T Shannon à Florham Park, New Jersey en tant que principal membre du personnel technique du département d'intelligence artificielle.
Depuis 2003, il est professeur d'informatique à l' Université de l'Alberta . Il a dirigé le laboratoire d'apprentissage par renforcement et d'intelligence artificielle de l'institution jusqu'en 2018.
Tout en conservant son poste de professeur, Sutton a rejoint Deepmind en juin 2017 en tant que chercheur scientifique distingué et co-fondateur de son nouveau bureau d' Edmonton .
Sutton est devenu citoyen canadien en 2015 et a renoncé à sa citoyenneté américaine en 2017.
Publications sélectionnées
- Sutton, RS, Barto, AG, Apprentissage par renforcement : une introduction . MIT Press, 1998. Également traduit en japonais et en russe. Deuxième édition MIT Press 2018.
- Miller, WT, Sutton, RS, Werbos, PJ (Eds.), Réseaux neuronaux pour le contrôle . MIT Press, 1991.
- Sutton, RS (éd.), Apprentissage par renforcement. Réimpression d'un numéro spécial de Machine Learning Journal. Presse académique Kluwer, 1992
Récompenses et honneurs
Sutton est membre de l' Association for the Advancement of Artificial Intelligence (AAAI) depuis 2001. En 2003, il a reçu le President's Award de l'International Neural Network Society et en 2013, le Outstanding Achievement in Research Award de l' Université du Massachusetts Amherst .
La nomination de Sutton en tant que membre de l'AAAI se lit comme suit :
Pour des contributions significatives à de nombreux sujets en apprentissage automatique, y compris l'apprentissage par renforcement, les techniques de différence temporelle et les réseaux de neurones.
En 2021, Sutton a été élu membre de la Royal Society.
Les références
Liens externes
- La page d'accueil de Richard Sutton
- Publications de Richard S. Sutton indexées par Google Scholar