La théorie des jeux - Game theory

La théorie des jeux est l'étude des modèles mathématiques d'interactions stratégiques entre décideurs rationnels . Elle trouve des applications dans tous les domaines des sciences sociales , ainsi qu'en logique , en science des systèmes et en informatique . À l'origine, il s'agissait de jeux à somme nulle , dans lesquels les gains ou les pertes de chaque participant sont exactement équilibrés par ceux des autres participants. Au 21e siècle, la théorie des jeux s'applique à un large éventail de relations comportementales et est maintenant un terme générique pour la science de la prise de décision logique chez les humains, les animaux et les ordinateurs.

La théorie des jeux moderne a commencé avec l'idée d'équilibres à stratégies mixtes dans un jeu à somme nulle à deux personnes et sa démonstration par John von Neumann . La preuve originale de Von Neumann utilisait le théorème du point fixe de Brouwer sur les applications continues dans des ensembles convexes compacts , qui est devenu une méthode standard en théorie des jeux et en économie mathématique . Son article a été suivi par le livre de 1944 Theory of Games and Economic Behavior , co-écrit avec Oskar Morgenstern , qui considérait les jeux coopératifs de plusieurs joueurs. La deuxième édition de ce livre a fourni une théorie axiomatique de l'utilité attendue, qui a permis aux statisticiens et aux économistes mathématiques de traiter la prise de décision dans l'incertitude.

La théorie des jeux a été largement développée dans les années 1950 par de nombreux chercheurs. Il a été explicitement appliqué à l' évolution dans les années 1970, bien que des développements similaires remontent au moins aux années 1930. La théorie des jeux est largement reconnue comme un outil important dans de nombreux domaines. En 2014, avec le prix Nobel commémoratif des sciences économiques décerné au théoricien des jeux Jean Tirole , onze théoriciens des jeux ont remporté le prix Nobel d'économie. John Maynard Smith a reçu le prix Crafoord pour son application de la théorie des jeux évolutionnaires .

Histoire

Précurseurs

Les discussions sur les mathématiques des jeux ont commencé bien avant l'avènement de la théorie mathématique moderne des jeux. Les travaux de Cardano sur les jeux de hasard dans le Liber de ludo aleae ( Livre sur les jeux de hasard ), écrit vers 1564 mais publié à titre posthume en 1663, ont formulé certaines des idées de base du domaine. Dans les années 1650, Pascal et Huygens ont développé le concept d' attente sur le raisonnement sur la structure des jeux de hasard, et Huygens a publié son calcul du jeu dans De ratiociniis in ludo aleæ ( Sur le raisonnement dans les jeux de hasard ) en 1657.

En 1713, une lettre attribuée à Charles Waldegrave analyse un jeu appelé "le Her". Il était un jacobite actif et l'oncle de James Waldegrave , un diplomate britannique. Dans cette lettre, Waldegrave propose une solution de stratégie mixte minimax à une version à deux du jeu de cartes le Her , et le problème est maintenant connu sous le nom de problème de Waldegrave . Dans ses 1838 Recherches sur les principes mathématiques de la théorie des richesses ( Recherches sur les principes mathématiques de la théorie de la richesse ), Antoine Augustin Cournot a considéré un duopole et présente une solution qui est l' équilibre de Nash du jeu.

En 1913, Ernst Zermelo a publié Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( Sur une application de la théorie des ensembles à la théorie du jeu d'échecs ), qui a prouvé que la stratégie optimale d'échecs est strictement déterminée . Cela a ouvert la voie à des théorèmes plus généraux.

En 1938, l'économiste mathématicien danois Frederik Zeuthen a prouvé que le modèle mathématique avait une stratégie gagnante en utilisant le théorème du point fixe de Brouwer . Dans son livre de 1938 Applications aux Jeux de Hasard et dans ses notes précédentes, Émile Borel a prouvé un théorème minimax pour les jeux matriciels à somme nulle à deux personnes uniquement lorsque la matrice de paiement était symétrique et fournit une solution à un jeu infini non trivial (connu en anglais comme jeu Blotto ). Borel a conjecturé la non-existence d'équilibres à stratégies mixtes dans les jeux finis à somme nulle à deux personnes , conjecture qui a été prouvée fausse par von Neumann.

Naissance et premiers développements

La théorie des jeux n'existait pas vraiment en tant que domaine unique jusqu'à ce que John von Neumann publie l'article Sur la théorie des jeux de stratégie en 1928. La preuve originale de Von Neumann utilisait le théorème du point fixe de Brouwer sur les applications continues dans des ensembles convexes compacts , qui est devenu une méthode standard. en théorie des jeux et en économie mathématique . Son article a été suivi par son livre de 1944 Theory of Games and Economic Behavior co-écrit avec Oskar Morgenstern . La deuxième édition de ce livre a fourni une théorie axiomatique de l'utilité , qui a réincarné l' ancienne théorie de l'utilité (de l'argent) de Daniel Bernoulli en tant que discipline indépendante. Les travaux de Von Neumann sur la théorie des jeux ont abouti à ce livre de 1944. Ce travail fondamental contient la méthode pour trouver des solutions mutuellement cohérentes pour les jeux à somme nulle à deux personnes. Les travaux ultérieurs se sont concentrés principalement sur la théorie des jeux coopératifs , qui analyse les stratégies optimales pour des groupes d'individus, en supposant qu'ils peuvent faire respecter les accords entre eux sur les stratégies appropriées.

En 1950, la première discussion mathématique du dilemme du prisonnier est apparue, et une expérience a été entreprise par les mathématiciens notables Merrill M. Flood et Melvin Dresher , dans le cadre des recherches de la RAND Corporation sur la théorie des jeux. RAND a poursuivi les études en raison d'applications possibles à la stratégie nucléaire mondiale . Vers la même époque, John Nash a développé un critère de cohérence mutuelle des stratégies des joueurs connu sous le nom d' équilibre de Nash , applicable à une plus grande variété de jeux que le critère proposé par von Neumann et Morgenstern. Nash a prouvé que chaque jeu non coopératif fini à n joueurs, à somme non nulle (pas seulement à deux joueurs à somme nulle) a ce qui est maintenant connu comme un équilibre de Nash dans les stratégies mixtes.

La théorie des jeux a connu une vague d'activité dans les années 1950, au cours de laquelle les concepts du noyau , le vaste jeu de forme , jeu fictif , les jeux répétés , et la valeur de Shapley ont été développés. Les années 1950 ont également vu les premières applications de la théorie des jeux à la philosophie et aux sciences politiques .

Des réalisations primées

En 1965, Reinhard Selten a présenté son concept de solution d' équilibres parfaits de sous- jeux , qui a encore affiné l'équilibre de Nash. Plus tard, il introduira également la perfection de la main tremblante . En 1994, Nash, Selten et Harsanyi sont devenus lauréats du prix Nobel d' économie pour leurs contributions à la théorie des jeux économiques.

Dans les années 1970, la théorie des jeux a été largement appliquée en biologie , en grande partie grâce aux travaux de John Maynard Smith et à sa stratégie d'évolution stable . De plus, les concepts d' équilibre corrélé , de perfection de la main tremblante et de connaissance commune ont été introduits et analysés.

En 2005, les théoriciens des jeux Thomas Schelling et Robert Aumann ont suivi Nash, Selten et Harsanyi en tant que lauréats du prix Nobel. Schelling a travaillé sur des modèles dynamiques, premiers exemples de la théorie des jeux évolutionniste . Aumann a davantage contribué à l'école de l'équilibre, en introduisant le grossissement de l'équilibre et les équilibres corrélés, et en développant une analyse formelle approfondie de l'hypothèse de la connaissance commune et de ses conséquences.

En 2007, Leonid Hurwicz , Eric Maskin et Roger Myerson ont reçu le prix Nobel d'économie « pour avoir jeté les bases de la théorie de la conception des mécanismes ». Les contributions de Myerson incluent la notion d' équilibre approprié et un important texte de troisième cycle : Game Theory, Analysis of Conflict . Hurwicz a introduit et formalisé le concept de compatibilité incitative .

En 2012, Alvin E. Roth et Lloyd S. Shapley ont reçu le prix Nobel d'économie « pour la théorie des allocations stables et la pratique de la conception du marché ». En 2014, le prix Nobel est allé au théoricien des jeux Jean Tirole .

Types de jeux

Coopératif / non coopératif

Un jeu est coopératif si les joueurs sont capables de former des engagements contraignants appliqués de l'extérieur (par exemple par le biais du droit des contrats ). Un jeu n'est pas coopératif si les joueurs ne peuvent pas former d'alliances ou si tous les accords doivent s'appliquer d' eux-mêmes (par exemple par le biais de menaces crédibles ).

Les jeux coopératifs sont souvent analysés dans le cadre de la théorie des jeux coopératifs , qui se concentre sur la prédiction des coalitions qui se formeront, les actions conjointes que les groupes entreprennent et les bénéfices collectifs qui en résultent. Elle s'oppose à la théorie traditionnelle des jeux non coopératifs qui se concentre sur la prédiction des actions et des gains des joueurs individuels et sur l'analyse des équilibres de Nash . L'accent mis sur les gains individuels peut entraîner un phénomène connu sous le nom de tragédie des biens communs , où les ressources sont utilisées à un niveau collectivement inefficace. L'absence de négociation formelle conduit à la détérioration des biens publics par une surutilisation et une sous-offre qui découle des incitations privées.

La théorie des jeux coopératifs fournit une approche de haut niveau car elle ne décrit que la structure, les stratégies et les gains des coalitions, tandis que la théorie des jeux non coopératifs examine également comment les procédures de négociation affecteront la distribution des gains au sein de chaque coalition. Comme la théorie des jeux non coopératifs est plus générale, les jeux coopératifs peuvent être analysés par l'approche de la théorie des jeux non coopératifs (l'inverse n'est pas vrai) à condition que des hypothèses suffisantes soient faites pour englober toutes les stratégies possibles disponibles pour les joueurs en raison de la possibilité de l'application externe de la coopération. Bien que l'utilisation d'une théorie unique puisse être souhaitable, dans de nombreux cas, les informations disponibles sont insuffisantes pour modéliser avec précision les procédures formelles disponibles pendant le processus de négociation stratégique, ou le modèle résultant serait trop complexe pour offrir un outil pratique dans le monde réel. Dans de tels cas, la théorie des jeux coopératifs fournit une approche simplifiée qui permet une analyse du jeu dans son ensemble sans avoir à faire d'hypothèse sur les pouvoirs de négociation.

Symétrique / asymétrique

E F
E 1, 2 0, 0
F 0, 0 1, 2
Un jeu asymétrique

Un jeu symétrique est un jeu où les gains pour jouer à une stratégie particulière ne dépendent que des autres stratégies employées, pas de qui les joue. C'est-à-dire que si les identités des joueurs peuvent être modifiées sans changer le gain des stratégies, alors un jeu est symétrique. La plupart des jeux 2×2 couramment étudiés sont symétriques. Les représentations classiques du poulet , du dilemme du prisonnier et de la chasse au cerf sont toutes des jeux symétriques. Certains chercheurs considéreraient également certains jeux asymétriques comme des exemples de ces jeux. Cependant, les gains les plus courants pour chacun de ces jeux sont symétriques.

Les jeux asymétriques les plus couramment étudiés sont les jeux où il n'y a pas d'ensembles stratégiques identiques pour les deux joueurs. Par exemple, le jeu de l' ultimatum et de même le jeu du dictateur ont des stratégies différentes pour chaque joueur. Il est cependant possible qu'un jeu ait des stratégies identiques pour les deux joueurs, tout en étant asymétrique. Par exemple, le jeu illustré dans le graphique de cette section est asymétrique malgré des ensembles de stratégies identiques pour les deux joueurs.

Somme nulle / somme non nulle

UNE B
UNE –1, 1 3, –3
B 0, 0 –2, 2
Un jeu à somme nulle

Les jeux à somme nulle sont un cas particulier de jeux à somme constante dans lesquels les choix des joueurs ne peuvent ni augmenter ni diminuer les ressources disponibles. Dans les jeux à somme nulle, le bénéfice total va à tous les joueurs d'un jeu, pour chaque combinaison de stratégies, s'ajoute toujours à zéro (de manière plus informelle, un joueur n'en profite qu'aux dépens égaux des autres). Le poker est un exemple de jeu à somme nulle (ignorant la possibilité de couper la maison), car on gagne exactement le montant que ses adversaires perdent. Parmi les autres jeux à somme nulle, citons les pièces de monnaie assorties et la plupart des jeux de société classiques, notamment le go et les échecs .

De nombreux jeux étudiés par les théoriciens des jeux (y compris le célèbre dilemme du prisonnier ) sont des jeux à somme non nulle, car le résultat a des résultats nets supérieurs ou inférieurs à zéro. De manière informelle, dans les jeux à somme non nulle, un gain d'un joueur ne correspond pas nécessairement à une perte d'un autre.

Les jeux à somme constante correspondent à des activités comme le vol et le jeu, mais pas à la situation économique fondamentale dans laquelle il existe des gains potentiels du commerce . Il est possible de transformer n'importe quel jeu en un jeu à somme nulle (éventuellement asymétrique) en ajoutant un joueur fictif (souvent appelé "le plateau") dont les pertes compensent les gains nets des joueurs.

Simultané / séquentiel

Les jeux simultanés sont des jeux où les deux joueurs se déplacent simultanément, ou à la place les derniers joueurs ne sont pas conscients des actions des premiers joueurs (les rendant effectivement simultanées). Les jeux séquentiels (ou jeux dynamiques) sont des jeux où les joueurs ultérieurs ont une certaine connaissance des actions antérieures. Cela n'a pas besoin d'être une information parfaite sur chaque action des joueurs précédents ; c'est peut-être très peu de connaissances. Par exemple, un joueur peut savoir qu'un joueur précédent n'a pas effectué une action particulière, alors qu'il ne sait pas laquelle des autres actions disponibles le premier joueur a réellement effectuée.

La différence entre les jeux simultanés et séquentiels est capturée dans les différentes représentations discutées ci-dessus. Souvent, la forme normale est utilisée pour représenter les jeux simultanés, tandis que la forme extensive est utilisée pour représenter les jeux séquentiels. La transformation de la forme extensive en forme normale est à sens unique, ce qui signifie que plusieurs jeux de forme extensive correspondent à la même forme normale. Par conséquent, les notions d'équilibre pour les jeux simultanés sont insuffisantes pour raisonner sur les jeux séquentiels ; voir la perfection du sous-jeu .

En bref, les différences entre les jeux séquentiels et simultanés sont les suivantes :

Séquentiel Simultané
Normalement désigné par Arbres de décision Matrices de gains
Connaissance préalable
du mouvement de l'adversaire ?
Oui Non
Axe du temps ? Oui Non
Aussi connu sous le nom
Jeu de forme
extensive Jeu de forme extensive
Jeu de
stratégie Jeu de stratégie

Concours Cournot

Le modèle de concurrence de Cournot implique que les joueurs choisissent la quantité d'un produit homogène à produire indépendamment et simultanément, où le coût marginal peut être différent pour chaque entreprise et le profit de l'entreprise est le profit. Les coûts de production sont des informations publiques et l'entreprise vise à trouver leur quantité maximisant le profit en fonction de ce qu'elle pense que l'autre entreprise produira et se comportera comme des monopoles. Dans ce jeu, les entreprises veulent produire à la quantité de monopole mais il y a une forte incitation à s'écarter et à produire plus, ce qui diminue le prix d'équilibre du marché. Par exemple, les entreprises peuvent être tentées de s'écarter de la quantité monopolistique s'il existe une quantité monopolistique faible et un prix élevé, dans le but d'augmenter la production pour maximiser le profit. Cependant, cette option n'offre pas la rentabilité la plus élevée, car la capacité d'une entreprise à maximiser ses profits dépend de sa part de marché et de l'élasticité de la demande du marché. L'équilibre de Cournot est atteint lorsque chaque entreprise opère sur sa fonction de réaction sans incitation à dévier, car elle a la meilleure réponse en fonction de la production des autres entreprises. Dans le jeu, les entreprises atteignent l'équilibre de Nash lorsque l'équilibre de Cournot est atteint.

Equilibre pour le concours quantitatif de Cournot

Concours Bertrand

La concurrence Bertrand , suppose des produits homogènes et un coût marginal constant et les acteurs choisissent les prix. L'équilibre de la concurrence par les prix est celui où le prix est égal aux coûts marginaux, en supposant une information complète sur les coûts des concurrents. Par conséquent, les entreprises sont incitées à s'écarter de l'équilibre car un produit homogène avec un prix inférieur gagnera la totalité des parts de marché, ce que l'on appelle un avantage de coût.

Information parfaite et information imparfaite

Un jeu d'informations imparfaites (la ligne pointillée représente l'ignorance de la part du joueur 2, formellement appelé un ensemble d'informations )

Un sous-ensemble important de jeux séquentiels est constitué de jeux d' informations parfaites . Un jeu est celui d'une information parfaite si tous les joueurs, à chaque mouvement du jeu, connaissent les mouvements précédemment effectués par tous les autres joueurs. En réalité, cela peut être appliqué aux entreprises et aux consommateurs ayant des informations sur le prix et la qualité de tous les biens disponibles sur un marché. Un jeu d'informations imparfaites est joué lorsque les joueurs ne connaissent pas tous les mouvements déjà effectués par l'adversaire tel qu'un jeu de mouvements simultanés. La plupart des jeux étudiés en théorie des jeux sont des jeux à information imparfaite. Des exemples de jeux à information parfaite incluent le morpion , les dames , les échecs infinis et le Go .

De nombreux jeux de cartes sont des jeux d'informations imparfaites, comme le poker et le bridge . L'information parfaite est souvent confondue avec l' information complète , qui est un concept similaire. Une information complète nécessite que chaque joueur connaisse les stratégies et les gains disponibles pour les autres joueurs mais pas nécessairement les actions entreprises, alors qu'une information parfaite est une connaissance de tous les aspects du jeu et des joueurs. Les jeux d' informations incomplètes peuvent cependant être réduits à des jeux d'informations imparfaites en introduisant des « coups par nature ».

jeu bayésien

Pour l'une des hypothèses derrière le concept d'équilibre de Nash, chaque joueur a des croyances justes sur les actions des autres joueurs. En théorie des jeux, il existe de nombreuses situations où les participants ne comprennent pas pleinement les caractéristiques de leurs adversaires. Les négociateurs peuvent ignorer l'évaluation par leur adversaire de l'objet de la négociation, les entreprises peuvent ignorer les fonctions de coût de leur adversaire, les combattants peuvent ignorer les points forts de leur adversaire et les jurés peuvent ne pas être au courant de l'interprétation de leur collègue des preuves au procès. Dans certains cas, les participants peuvent bien connaître le caractère de leur adversaire, mais peuvent ne pas savoir dans quelle mesure leur adversaire connaît son propre caractère.

Le jeu bayésien signifie un jeu stratégique avec des informations incomplètes. Pour un jeu stratégique, les décideurs sont des joueurs, et chaque joueur a un groupe d'actions. Une partie essentielle de la spécification d'informations imparfaites est l'ensemble des états. Chaque état décrit complètement une collection de caractéristiques pertinentes pour le joueur, telles que ses préférences et des détails à son sujet. Il doit y avoir un état pour chaque ensemble de fonctionnalités qui, selon certains joueurs, peuvent exister.

exemple de jeu bayésien

Par exemple, lorsque le joueur 1 ne sait pas si le joueur 2 préfère sortir avec elle ou s'éloigner d'elle, alors que le joueur 2 comprend les préférences du joueur 1 comme avant. Pour être précis, supposons que le joueur 1 pense que le joueur 2 veut sortir avec elle sous une probabilité de 1/2 et s'éloigner d'elle sous une probabilité de 1/2 (cette évaluation vient probablement de l'expérience du joueur 1 : elle affronte des joueurs qui veulent sortir avec elle la moitié du temps dans un tel cas et les joueurs qui veulent l'éviter la moitié du temps). En raison de la probabilité en jeu, l'analyse de cette situation nécessite de comprendre la préférence du joueur pour le tirage au sort, même si les gens ne s'intéressent qu'à l'équilibre stratégique pur.

Jeux combinatoires

Les jeux dans lesquels la difficulté de trouver une stratégie optimale découle de la multiplicité des mouvements possibles sont appelés jeux combinatoires. Les exemples incluent les échecs et le go. Les jeux qui impliquent des informations imparfaites peuvent également avoir un fort caractère combinatoire, par exemple le backgammon . Il n'y a pas de théorie unifiée traitant des éléments combinatoires dans les jeux. Il existe cependant des outils mathématiques qui peuvent résoudre des problèmes particuliers et répondre à des questions générales.

Les jeux de l'information parfaite ont été étudiés dans la théorie des jeux combinatoires , qui a développé de nouvelles représentations, par exemple les nombres surréalistes , ainsi que des méthodes de preuve combinatoire et algébrique (et parfois non-constructives ) pour résoudre des jeux de certains types, y compris des jeux "boucles" qui peut entraîner des séquences de mouvements infiniment longues. Ces méthodes abordent des jeux avec une complexité combinatoire plus élevée que ceux habituellement considérés dans la théorie des jeux traditionnelle (ou « économique »). Un jeu typique qui a été résolu de cette façon est Hex . Un domaine d'étude connexe, tiré de la théorie de la complexité computationnelle , est la complexité du jeu , qui consiste à estimer la difficulté de calcul pour trouver des stratégies optimales.

La recherche en intelligence artificielle a porté sur les jeux d'information parfaits et imparfaits qui ont des structures combinatoires très complexes (comme les échecs, le go ou le backgammon) pour lesquels aucune stratégie optimale démontrable n'a été trouvée. Les solutions pratiques impliquent l'heuristique informatique, comme l' élagage alpha-bêta ou l'utilisation de réseaux de neurones artificiels entraînés par l'apprentissage par renforcement , qui rendent les jeux plus faciles à maîtriser dans la pratique informatique.

Des jeux infiniment longs

Les jeux, tels qu'étudiés par les économistes et les joueurs du monde réel, sont généralement terminés en un nombre fini de mouvements. Les mathématiciens purs ne sont pas aussi contraints et les théoriciens des ensembles étudient en particulier les jeux qui durent une infinité de mouvements, le gagnant (ou autre gain) n'étant connu qu'une fois tous ces mouvements terminés.

L'attention n'est généralement pas tant sur la meilleure façon de jouer à un tel jeu, mais si un joueur a une stratégie gagnante . (On peut prouver, en utilisant l' axiome du choix , qu'il existe des jeux – même avec une information parfaite et où les seuls résultats sont « gagner » ou « perdre » – pour lesquels aucun des joueurs n'a de stratégie gagnante.) L'existence de telles stratégies , pour les jeux intelligemment conçus, a des conséquences importantes dans la théorie descriptive des ensembles .

Jeux discrets et continus

Une grande partie de la théorie des jeux concerne des jeux finis et discrets qui ont un nombre fini de joueurs, de mouvements, d'événements, de résultats, etc. Cependant, de nombreux concepts peuvent être étendus. Les jeux continus permettent aux joueurs de choisir une stratégie parmi un ensemble de stratégies continues. Par exemple, la concurrence de Cournot est généralement modélisée avec les stratégies des joueurs étant des quantités non négatives, y compris des quantités fractionnaires.

Jeux différentiels

Les jeux différentiels tels que le jeu de poursuite continue et d'évasion sont des jeux continus où l'évolution des variables d'état des joueurs est régie par des équations différentielles . Le problème de trouver une stratégie optimale dans un jeu différentiel est étroitement lié à la théorie du contrôle optimal . En particulier, il existe deux types de stratégies : les stratégies en boucle ouverte sont trouvées en utilisant le principe du maximum de Pontryagin tandis que les stratégies en boucle fermée sont trouvées en utilisant la méthode de programmation dynamique de Bellman .

Un cas particulier de jeux différentiels sont les jeux à horizon temporel aléatoire . Dans de tels jeux, le temps terminal est une variable aléatoire avec une fonction de distribution de probabilité donnée . Par conséquent, les joueurs maximisent l' espérance mathématique de la fonction de coût. Il a été montré que le problème d'optimisation modifié peut être reformulé comme un jeu différentiel actualisé sur un intervalle de temps infini.

Théorie des jeux évolutionnaires

La théorie évolutionniste des jeux étudie les joueurs qui ajustent leurs stratégies au fil du temps selon des règles qui ne sont pas nécessairement rationnelles ou clairvoyantes. En général, l'évolution des stratégies au fil du temps selon de telles règles est modélisée comme une chaîne de Markov avec une variable d'état telle que le profil de stratégie actuel ou la façon dont le jeu a été joué dans un passé récent. Ces règles peuvent comporter l'imitation, l'optimisation ou la survie du plus apte.

En biologie, de tels modèles peuvent représenter l' évolution , dans laquelle la progéniture adopte les stratégies de ses parents et les parents qui jouent des stratégies plus efficaces (c'est-à-dire correspondant à des gains plus élevés) ont un plus grand nombre de descendants. En sciences sociales, de tels modèles représentent généralement un ajustement stratégique par des joueurs qui jouent à un jeu plusieurs fois au cours de leur vie et, consciemment ou inconsciemment, ajustent occasionnellement leurs stratégies.

Résultats stochastiques (et relation avec d'autres domaines)

Les problèmes de décision individuelle avec des résultats stochastiques sont parfois considérés comme des « jeux à un joueur ». Ces situations ne sont pas considérées comme des jeux théoriques par certains auteurs. Ils peuvent être modélisés à l'aide d'outils similaires dans les disciplines connexes de la théorie de la décision , de la recherche opérationnelle et des domaines de l' intelligence artificielle , en particulier la planification de l'IA (avec incertitude) et le système multi-agents . Bien que ces domaines puissent avoir des motivations différentes, les mathématiques impliquées sont sensiblement les mêmes, par exemple en utilisant les processus de décision de Markov (MDP).

Les résultats stochastiques peuvent également être modélisés en termes de théorie des jeux en ajoutant un joueur agissant au hasard qui effectue des « coups de chance » (« coups par nature »). Ce joueur n'est généralement pas considéré comme un troisième joueur dans ce qui est autrement un jeu à deux joueurs, mais sert simplement à fournir un lancer de dés lorsque le jeu l'exige.

Pour certains problèmes, différentes approches de modélisation des résultats stochastiques peuvent conduire à des solutions différentes. Par exemple, la différence d'approche entre les MDP et la solution minimax est que cette dernière considère le pire des cas sur un ensemble de mouvements contradictoires, plutôt que de raisonner en attente de ces mouvements étant donné une distribution de probabilité fixe. L'approche minimax peut être avantageuse lorsque les modèles stochastiques d'incertitude ne sont pas disponibles, mais peut également surestimer des événements extrêmement improbables (mais coûteux), influençant considérablement la stratégie dans de tels scénarios si l'on suppose qu'un adversaire peut forcer un tel événement à se produire. (Voir la théorie du cygne noir pour une discussion plus approfondie sur ce type de problème de modélisation, en particulier en ce qui concerne la prévision et la limitation des pertes dans la banque d'investissement.)

Des modèles généraux qui incluent tous les éléments de résultats stochastiques, d'adversaires et d'observabilité partielle ou bruyante (des mouvements d'autres joueurs) ont également été étudiés. Le " gold standard " est considéré comme un jeu stochastique partiellement observable (POSG), mais peu de problèmes réalistes sont réalisables informatiquement dans la représentation POSG.

Méta-jeux

Ce sont des jeux dont le jeu est l'élaboration des règles d'un autre jeu, le jeu cible ou sujet. Les méta-jeux cherchent à maximiser la valeur d'utilité de l'ensemble de règles développé. La théorie des métajeux est liée à la théorie de la conception des mécanismes .

Le terme analyse de métajeu est également utilisé pour désigner une approche pratique développée par Nigel Howard. où une situation est présentée comme un jeu stratégique dans lequel les parties prenantes tentent de réaliser leurs objectifs au moyen des options qui s'offrent à elles. Les développements ultérieurs ont conduit à la formulation de l' analyse de la confrontation .

Jeux de mise en commun

Ce sont des jeux qui prévalent sur toutes les formes de société. Les jeux de mise en commun sont des jeux répétés avec une table de gains changeante en général sur un chemin expérimenté, et leurs stratégies d'équilibre prennent généralement une forme de convention sociale évolutive et de convention économique. La théorie des jeux de mise en commun émerge pour reconnaître formellement l'interaction entre le choix optimal dans un jeu et l'émergence du prochain chemin de mise à jour du tableau des gains, identifier l'existence et la robustesse de l'invariance et prédire la variance au fil du temps. La théorie est basée sur la classification de transformation topologique de la mise à jour du tableau des gains au fil du temps pour prédire la variance et l'invariance, et relève également de la compétence de la loi de calcul de l'optimalité atteignable pour le système ordonné.

Théorie des jeux de champ moyen

La théorie des jeux à champ moyen est l'étude de la prise de décision stratégique dans de très grandes populations de petits agents en interaction. Cette classe de problèmes a été considérée dans la littérature économique par Boyan Jovanovic et Robert W. Rosenthal , dans la littérature technique par Peter E. Caines , et par les mathématiciens Pierre-Louis Lions et Jean-Michel Lasry.

Représentation de jeux

Les jeux étudiés en théorie des jeux sont des objets mathématiques bien définis. Pour être complètement défini, un jeu doit spécifier les éléments suivants : les joueurs du jeu , les informations et les actions disponibles pour chaque joueur à chaque point de décision, et les gains pour chaque résultat. (Eric Rasmusen désigne ces quatre « éléments essentiels » par l'acronyme « PAPI ».) Un théoricien des jeux utilise généralement ces éléments, ainsi qu'un concept de solution de leur choix, pour déduire un ensemble de stratégies d' équilibre pour chaque joueur de telle sorte que, lorsque ces stratégies sont employées, aucun joueur ne peut profiter en s'écartant unilatéralement de sa stratégie. Ces stratégies d'équilibre déterminent un équilibre du jeu, un état stable dans lequel soit un résultat se produit, soit un ensemble de résultats se produisent avec une probabilité connue.

La plupart des jeux coopératifs sont présentés sous la forme de fonction caractéristique, tandis que les formes extensive et normale sont utilisées pour définir les jeux non coopératifs.

Forme étendue

Un jeu de forme étendu

La forme extensive peut être utilisée pour formaliser des jeux avec un séquençage temporel des mouvements. Les jeux ici sont joués sur des arbres (comme illustré ici). Ici, chaque sommet (ou nœud) représente un point de choix pour un joueur. Le joueur est spécifié par un numéro répertorié par le sommet. Les lignes hors du sommet représentent une action possible pour ce joueur. Les gains sont spécifiés au bas de l'arbre. La forme extensive peut être considérée comme une généralisation multi-joueurs d'un arbre de décision . Pour résoudre n'importe quel jeu de forme étendu, l' induction en arrière doit être utilisée. Cela implique de remonter dans l'arbre du jeu pour déterminer ce qu'un joueur rationnel ferait au dernier sommet de l'arbre, ce que ferait le joueur avec le coup précédent étant donné que le joueur avec le dernier coup est rationnel, et ainsi de suite jusqu'au premier sommet de l'arbre est atteint.

Le jeu illustré se compose de deux joueurs. La façon dont ce jeu particulier est structuré (c'est-à-dire avec une prise de décision séquentielle et une information parfaite), le joueur 1 "se déplace" d'abord en choisissant F ou U (juste ou injuste). Suivant dans la séquence, le joueur 2 , qui a maintenant vu le joueur 1 ' le mouvement de, choisit de jouer soit A ou R . Une fois que le joueur 2 a fait son choix, le jeu est considéré comme terminé et chaque joueur reçoit sa récompense respective. Supposons que le joueur 1 choisisse U et que le joueur 2 choisisse A : le joueur 1 obtient alors un gain de « huit » (ce qui, en termes réels, peut être interprété de plusieurs manières, dont la plus simple est en termes d'argent mais pourrait signifier des choses comme huit jours de vacances ou huit pays conquis ou même huit occasions supplémentaires de jouer le même jeu contre d'autres joueurs) et le joueur 2 obtient un gain de « deux ».

Le formulaire étendu peut également capturer des jeux à mouvements simultanés et des jeux avec des informations imparfaites. Pour le représenter, soit une ligne pointillée relie différents sommets pour les représenter comme faisant partie du même ensemble d'informations (c'est-à-dire que les joueurs ne savent pas à quel point ils se trouvent), soit une ligne fermée est dessinée autour d'eux. (Voir exemple dans la section informations imparfaites .)

Forme normale

Le joueur 2
choisit Gauche
Le joueur 2
choisit à droite
Le joueur 1
choisit Haut
4 , 3 –1 , –1
Le joueur 1
choisit  Bas
0 , 0 3 , 4
Forme normale ou matrice de gains d'un jeu à 2 joueurs et 2 stratégies

Le jeu normal (ou sous forme stratégique) est généralement représenté par une matrice qui montre les joueurs, les stratégies et les gains (voir l'exemple à droite). Plus généralement, il peut être représenté par n'importe quelle fonction qui associe un gain pour chaque joueur à chaque combinaison possible d'actions. Dans l'exemple ci-joint, il y a deux joueurs ; l'un choisit la ligne et l'autre la colonne. Chaque joueur a deux stratégies, qui sont spécifiées par le nombre de lignes et le nombre de colonnes. Les gains sont fournis à l'intérieur. Le premier nombre est le gain reçu par le joueur de ligne (le joueur 1 dans notre exemple) ; le second est le gain pour le joueur de colonne (le joueur 2 dans notre exemple). Supposons que le joueur 1 joue Up et que le joueur 2 joue Left . Ensuite, le joueur 1 obtient un gain de 4 et le joueur 2 obtient 3.

Lorsqu'un jeu est présenté sous forme normale, il est présumé que chaque joueur agit simultanément ou, au moins, sans connaître les actions de l'autre. Si les joueurs ont des informations sur les choix des autres joueurs, le jeu est généralement présenté sous une forme détaillée.

Chaque jeu de forme extensive a un jeu de forme normale équivalent, cependant, la transformation en forme normale peut entraîner une augmentation exponentielle de la taille de la représentation, ce qui la rend peu pratique sur le plan informatique.

Forme de fonction caractéristique

Dans les jeux qui possèdent une utilité amovible, des récompenses séparées ne sont pas données ; c'est plutôt la fonction caractéristique qui décide du gain de chaque unité. L'idée est que l'unité qui est « vide », pour ainsi dire, ne reçoit aucune récompense.

L'origine de cette forme se trouve dans le livre de John von Neumann et Oskar Morgenstern ; en examinant ces instances, ils ont deviné que lorsqu'une union apparaît, elle agit contre la fraction comme si deux individus jouaient à un jeu normal. Le gain équilibré de C est une fonction de base. Bien qu'il existe différents exemples qui aident à déterminer les montants de coalition à partir de jeux normaux, tous ne semblent pas pouvoir en être dérivés dans leur forme fonctionnelle.

Formellement, une fonction caractéristique est vue comme : (N,v), où N représente le groupe de personnes et est une utilité normale.

Ces fonctions caractéristiques se sont étendues pour décrire des jeux où il n'y a pas d'utilitaire amovible.

Représentations de jeu alternatives

Des formes alternatives de représentation des jeux existent et sont utilisées pour certaines sous-classes de jeux ou adaptées aux besoins de la recherche interdisciplinaire. En plus des représentations de jeu classiques, certaines des représentations alternatives codent également des aspects liés au temps.

Nom Année Moyens Type de jeux Temps
Jeu d'encombrement 1973 les fonctions sous-ensemble de jeux à n personnes, mouvements simultanés Non
Forme séquentielle 1994 matrices Jeux à 2 d'informations imparfaites Non
Jeux chronométrés 1994 les fonctions jeux à 2 Oui
Gala 1997 logique jeux à n personnes d'informations imparfaites Non
Jeux à effets locaux 2003 les fonctions sous-ensemble de jeux à n personnes, mouvements simultanés Non
GDL 2005 logique jeux déterministes à n personnes, mouvements simultanés Non
Jeu de Petri-nets 2006 filet de Pétri jeux déterministes à n personnes, mouvements simultanés Non
Jeux en continu 2007 les fonctions sous-ensemble de jeux à 2 personnes d'informations imparfaites Oui
PNSI 2008 filet de Pétri jeux à n personnes d'informations imparfaites Oui
Jeux de graphes d'action 2012 graphiques, fonctions jeux à n personnes, mouvements simultanés Non
Jeux graphiques 2015 graphiques, fonctions jeux à n personnes, mouvements simultanés Non

Utilisations générales et appliquées

En tant que méthode de mathématiques appliquées , la théorie des jeux a été utilisée pour étudier une grande variété de comportements humains et animaux. Il a été initialement développé en économie pour comprendre un large éventail de comportements économiques, y compris les comportements des entreprises, des marchés et des consommateurs. La première utilisation de l'analyse de la théorie des jeux a été faite par Antoine Augustin Cournot en 1838 avec sa solution du duopole de Cournot . L'utilisation de la théorie des jeux dans les sciences sociales s'est étendue et la théorie des jeux a également été appliquée aux comportements politiques, sociologiques et psychologiques.

Bien que les naturalistes d' avant le vingtième siècle tels que Charles Darwin aient fait des déclarations de type théorie des jeux, l'utilisation de l'analyse de la théorie des jeux en biologie a commencé avec les études de Ronald Fisher sur le comportement animal dans les années 1930. Ce travail est antérieur au nom de "théorie des jeux", mais il partage de nombreuses caractéristiques importantes avec ce domaine. Les développements de l'économie ont ensuite été appliqués à la biologie en grande partie par John Maynard Smith dans son livre de 1982 Evolution and the Theory of Games .

En plus d'être utilisée pour décrire, prédire et expliquer le comportement, la théorie des jeux a également été utilisée pour développer des théories du comportement éthique ou normatif et pour prescrire un tel comportement. En économie et en philosophie , les chercheurs ont appliqué la théorie des jeux pour aider à comprendre le bon ou le bon comportement. Les arguments de la théorie des jeux de ce type remontent à Platon . Une version alternative de la théorie des jeux, appelée théorie des jeux chimiques , représente les choix du joueur en tant que molécules métaphoriques de réactifs chimiques appelées « knowlecules ». La théorie des jeux chimiques calcule ensuite les résultats en tant que solutions d'équilibre d'un système de réactions chimiques.

Description et modélisation

Un jeu de mille - pattes en quatre étapes

L'utilisation principale de la théorie des jeux est de décrire et de modéliser le comportement des populations humaines. Certains chercheurs pensent qu'en trouvant les équilibres des jeux, ils peuvent prédire comment les populations humaines réelles se comporteront lorsqu'elles seront confrontées à des situations analogues au jeu étudié. Cette vision particulière de la théorie des jeux a été critiquée. Il est soutenu que les hypothèses faites par les théoriciens des jeux sont souvent violées lorsqu'elles sont appliquées à des situations du monde réel. Les théoriciens des jeux supposent généralement que les joueurs agissent de manière rationnelle, mais dans la pratique, le comportement humain s'écarte souvent de ce modèle. Les théoriciens des jeux répondent en comparant leurs hypothèses à celles utilisées en physique . Ainsi, bien que leurs hypothèses ne tiennent pas toujours, ils peuvent traiter la théorie des jeux comme un idéal scientifique raisonnable semblable aux modèles utilisés par les physiciens . Cependant, des travaux empiriques ont montré que dans certains jeux classiques, tels que le jeu des mille - pattes , devinez les 2/3 du jeu moyen , et le jeu du dictateur , les gens ne jouent régulièrement pas aux équilibres de Nash. Il y a un débat en cours concernant l'importance de ces expériences et si l'analyse des expériences capture pleinement tous les aspects de la situation pertinente.

Certains théoriciens des jeux, à la suite des travaux de John Maynard Smith et George R. Price , se sont tournés vers la théorie des jeux évolutionnistes afin de résoudre ces problèmes. Ces modèles supposent soit une absence de rationalité, soit une rationalité limitée de la part des acteurs. Malgré son nom, la théorie des jeux évolutionnaires ne suppose pas nécessairement la sélection naturelle au sens biologique. La théorie des jeux évolutionnistes comprend à la fois l'évolution biologique et culturelle, ainsi que des modèles d'apprentissage individuel (par exemple, la dynamique du jeu fictif ).

Analyse prescriptive ou normative

Coopérer Défaut
Coopérer -1, -1 -10, 0
Défaut 0, -10 -5, -5
Le dilemme du prisonnier

Certains chercheurs voient la théorie des jeux non pas comme un outil prédictif du comportement des êtres humains, mais comme une suggestion sur la façon dont les gens devraient se comporter. Puisqu'une stratégie, correspondant à un équilibre de Nash d'un jeu constitue la meilleure réponse aux actions des autres joueurs – à condition qu'ils soient dans le (même) équilibre de Nash – jouer une stratégie faisant partie d'un équilibre de Nash semble approprié. Cette utilisation normative de la théorie des jeux a également fait l'objet de critiques.

Économie et entreprise

La théorie des jeux est une méthode majeure utilisée en économie mathématique et en affaires pour modéliser les comportements concurrents d' agents en interaction . Les applications incluent un large éventail de phénomènes et d'approches économiques, tels que les enchères , la négociation , la tarification des fusions et acquisitions , la division équitable , les duopoles , les oligopoles , la formation de réseaux sociaux , l' économie computationnelle basée sur les agents , l'équilibre général , la conception de mécanismes et les systèmes de vote ; et à travers ces grands domaines comme l' économie expérimentale , économie comportementale , économie de l' information , l' organisation industrielle et l' économie politique .

Cette recherche se concentre généralement sur des ensembles particuliers de stratégies appelées « concepts de solution » ou « équilibres » . Une hypothèse courante est que les joueurs agissent de manière rationnelle. Dans les jeux non coopératifs, le plus célèbre d'entre eux est l' équilibre de Nash . Un ensemble de stratégies est un équilibre de Nash si chacune représente une meilleure réponse aux autres stratégies. Si tous les joueurs jouent les stratégies dans un équilibre de Nash, ils n'ont aucune incitation unilatérale à s'en écarter, puisque leur stratégie est la meilleure qu'ils puissent faire compte tenu de ce que font les autres.

Les gains du jeu sont généralement considérés comme représentant l' utilité des joueurs individuels.

Un article prototype sur la théorie des jeux en économie commence par présenter un jeu qui est une abstraction d'une situation économique particulière. Un ou plusieurs concepts de solution sont choisis, et l'auteur démontre quels ensembles de stratégies dans le jeu présenté sont des équilibres du type approprié. Les économistes et les professeurs de commerce suggèrent deux utilisations principales (notées ci-dessus) : descriptive et prescriptive .

Le Chartered Institute of Procurement & Supply (CIPS) promeut la connaissance et l'utilisation de la théorie des jeux dans le contexte de l' approvisionnement des entreprises . CIPS et TWS Partners ont mené une série d'enquêtes conçues pour explorer la compréhension, la sensibilisation et l'application de la théorie des jeux parmi les professionnels de l' approvisionnement . Voici quelques-unes des principales conclusions de leur troisième enquête annuelle (2019) :

  • l'application de la théorie des jeux à l'activité d'approvisionnement a augmenté - à l'époque, elle était de 19 % pour tous les répondants à l'enquête
  • 65% des participants prédisent que l'utilisation des applications de la théorie des jeux va augmenter
  • 70 % des personnes interrogées déclarent avoir « seulement une compréhension basique ou inférieure à la base » de la théorie des jeux
  • 20% des participants avaient suivi une formation en cours d'emploi en théorie des jeux
  • 50 % des personnes interrogées ont déclaré que des solutions logicielles nouvelles ou améliorées étaient souhaitables
  • 90% des personnes interrogées ont déclaré ne pas disposer du logiciel dont elles ont besoin pour leur travail.

Gestion de projet

Une prise de décision judicieuse est essentielle à la réussite des projets. En gestion de projet, la théorie des jeux est utilisée pour modéliser le processus de prise de décision des acteurs, tels que les investisseurs, les chefs de projet, les entrepreneurs, les sous-traitants, les gouvernements et les clients. Assez souvent, ces acteurs ont des intérêts concurrents, et parfois leurs intérêts sont directement préjudiciables aux autres acteurs, ce qui rend les scénarios de gestion de projet bien adaptés pour être modélisés par la théorie des jeux.

Piraveenan (2019) dans sa revue fournit plusieurs exemples où la théorie des jeux est utilisée pour modéliser des scénarios de gestion de projet. Par exemple, un investisseur a généralement plusieurs options d'investissement, et chaque option aboutira probablement à un projet différent, et donc l'une des options d'investissement doit être choisie avant que la charte du projet puisse être produite. De même, tout grand projet impliquant des sous-traitants, par exemple un projet de construction, a une interaction complexe entre l'entrepreneur principal (le chef de projet) et les sous-traitants, ou entre les sous-traitants eux-mêmes, qui a généralement plusieurs points de décision. Par exemple, s'il existe une ambiguïté dans le contrat entre l'entrepreneur et le sous-traitant, chacun doit décider à quel point il doit pousser sa cause sans mettre en péril l'ensemble du projet, et donc sa propre participation. De même, lorsque des projets d'organisations concurrentes sont lancés, le personnel marketing doit décider du meilleur timing et de la meilleure stratégie pour commercialiser le projet, ou le produit ou service qui en résulte, afin qu'il puisse gagner en force face à la concurrence. Dans chacun de ces scénarios, les décisions requises dépendent des décisions d'autres joueurs qui, d'une manière ou d'une autre, ont des intérêts concurrents aux intérêts du décideur, et peuvent donc idéalement être modélisées à l'aide de la théorie des jeux.

Piraveenan résume que les jeux à deux joueurs sont principalement utilisés pour modéliser des scénarios de gestion de projet, et en fonction de l'identité de ces joueurs, cinq types de jeux distincts sont utilisés dans la gestion de projet.

  • Jeux gouvernemental-secteur privé (jeux qui modélisent les partenariats public-privé )
  • Jeux entrepreneur-entrepreneur
  • Jeux entrepreneur-sous-traitant
  • Jeux sous-traitants-sous-traitants
  • Jeux impliquant d'autres joueurs

En termes de types de jeux, à la fois coopératifs et non coopératifs, de forme normale et extensive, et à somme nulle ou non, sont utilisés pour modéliser divers scénarios de gestion de projet.

Science politique

L'application de la théorie des jeux à la science politique se concentre sur les domaines chevauchants de la division équitable , de l'économie politique , du choix public , de la négociation de guerre , de la théorie politique positive et de la théorie du choix social . Dans chacun de ces domaines, les chercheurs ont développé des modèles de théorie des jeux dans lesquels les acteurs sont souvent des électeurs, des États, des groupes d'intérêts particuliers et des politiciens.

Les premiers exemples de théorie des jeux appliquée à la science politique sont fournis par Anthony Downs . Dans son livre de 1957 An Economic Theory of Democracy , il applique le modèle de localisation de l'entreprise Hotelling au processus politique. Dans le modèle downsien, les candidats politiques s'engagent dans des idéologies sur un espace politique unidimensionnel. Downs montre d'abord comment les candidats politiques convergeront vers l'idéologie préférée par l'électeur médian si les électeurs sont pleinement informés, mais soutient ensuite que les électeurs choisissent de rester rationnellement ignorants, ce qui permet une divergence entre les candidats. La théorie des jeux a été appliquée en 1962 à la crise des missiles de Cuba pendant la présidence de John F. Kennedy.

Il a également été proposé que la théorie des jeux explique la stabilité de toute forme de gouvernement politique. Prenant le cas le plus simple d'une monarchie, par exemple, le roi, étant une seule personne, ne maintient pas et ne peut pas maintenir son autorité en exerçant personnellement un contrôle physique sur tous ou même un nombre important de ses sujets. Le contrôle souverain s'explique plutôt par la reconnaissance par chaque citoyen que tous les autres citoyens s'attendent à ce que l'autre considère le roi (ou un autre gouvernement établi) comme la personne dont les ordres seront suivis. La coordination de la communication entre les citoyens pour remplacer le souverain est effectivement interdite, car le complot pour remplacer le souverain est généralement punissable en tant que crime. Ainsi, dans un processus qui peut être modelé par des variantes du dilemme du prisonnier , pendant les périodes de stabilité aucun citoyen ne trouvera rationnel de se déplacer pour remplacer le souverain, même si tous les citoyens savent qu'ils seraient mieux s'ils devaient tous agir collectivement.

Une explication théorique des jeux pour la paix démocratique est que le débat public et ouvert dans les démocraties envoie des informations claires et fiables concernant leurs intentions aux autres États. En revanche, il est difficile de connaître les intentions des dirigeants non démocratiques, quel effet les concessions auront, et si les promesses seront tenues. Ainsi, il y aura méfiance et réticence à faire des concessions si au moins une des parties à un différend est une non-démocratie.

Cependant, la théorie des jeux prédit que deux pays peuvent encore entrer en guerre même si leurs dirigeants sont conscients des coûts des combats. La guerre peut résulter d'une information asymétrique ; deux pays peuvent être incités à déformer la quantité de ressources militaires dont ils disposent, les rendant incapables de régler les différends de manière agréable sans recourir au combat. De plus, la guerre peut survenir à cause de problèmes d'engagement : si deux pays souhaitent régler un différend par des moyens pacifiques, mais que chacun souhaite revenir sur les termes de ce règlement, ils peuvent n'avoir d'autre choix que de recourir à la guerre. Enfin, la guerre peut résulter de l'indivisibilité des problèmes.

La théorie des jeux pourrait également aider à prédire les réponses d'une nation lorsqu'une nouvelle règle ou loi doit être appliquée à cette nation. Un exemple est la recherche de Peter John Wood (2013) sur ce que les nations pourraient faire pour aider à réduire le changement climatique. Wood pensait que cela pouvait être accompli en concluant des traités avec d'autres nations pour réduire les émissions de gaz à effet de serre . Cependant, il a conclu que cette idée ne pouvait pas fonctionner car elle créerait un dilemme de prisonnier pour les nations.

La biologie

faucon Colombe
faucon 20, 20 80, 40
Colombe 40, 80 60, 60
Le jeu de la colombe

Contrairement à ceux de l'économie, les gains des jeux en biologie sont souvent interprétés comme correspondant à la forme physique . De plus, l'accent a été moins mis sur les équilibres qui correspondent à une notion de rationalité et plus sur ceux qui seraient maintenus par les forces évolutives . L'équilibre le plus connu en biologie est connu sous le nom de stratégie évolutivement stable (ESS), introduit pour la première fois dans ( Maynard Smith & Price 1973 ). Bien que sa motivation initiale n'implique aucune des exigences mentales de l' équilibre de Nash , chaque ESS est un équilibre de Nash.

En biologie, la théorie des jeux a été utilisée comme modèle pour comprendre de nombreux phénomènes différents. Il a d'abord été utilisé pour expliquer l'évolution (et la stabilité) des sex-ratios approximatifs de 1:1 . ( Fisher 1930 ) a suggéré que les rapports de masculinité de 1:1 sont le résultat de forces évolutives agissant sur des individus qui pourraient être considérés comme essayant de maximiser leur nombre de petits-enfants.

De plus, les biologistes ont utilisé la théorie des jeux évolutionnaires et l'ESS pour expliquer l'émergence de la communication animale . L'analyse des jeux de signalisation et d' autres jeux de communication a permis de mieux comprendre l'évolution de la communication entre les animaux. Par exemple, le comportement de mobbing de nombreuses espèces, dans lequel un grand nombre de proies attaquent un prédateur plus grand, semble être un exemple d'organisation émergente spontanée. Les fourmis ont également été démontré que présentent un comportement anticipatif semblable à la mode (voir Paul Ormerod de l' économie papillon ).

Les biologistes ont utilisé le jeu du poulet pour analyser le comportement de combat et la territorialité.

Selon Maynard Smith, dans la préface de L' évolution et la théorie des jeux , "paradoxalement, il s'est avéré que la théorie des jeux s'applique plus facilement à la biologie qu'au domaine du comportement économique pour lequel elle a été conçue à l'origine". La théorie des jeux évolutionnaires a été utilisée pour expliquer de nombreux phénomènes apparemment incongrus dans la nature.

L'un de ces phénomènes est connu sous le nom d'altruisme biologique . Il s'agit d'une situation dans laquelle un organisme semble agir d'une manière qui profite à d'autres organismes et est préjudiciable à lui-même. Ceci est distinct des notions traditionnelles d'altruisme car de telles actions ne sont pas conscientes, mais semblent être des adaptations évolutives pour augmenter la forme physique globale. Des exemples peuvent être trouvés dans des espèces allant des chauves-souris vampires qui régurgitent le sang qu'elles ont obtenu d'une nuit de chasse et le donnent aux membres du groupe qui n'ont pas réussi à se nourrir, aux abeilles ouvrières qui prennent soin de la reine des abeilles toute leur vie et ne s'accouplent jamais, à singes vervets qui avertissent les membres du groupe de l'approche d'un prédateur, même lorsqu'il met en danger les chances de survie de cet individu. Toutes ces actions augmentent la forme physique globale d'un groupe, mais se produisent à un coût pour l'individu.

La théorie des jeux évolutionnaires explique cet altruisme avec l'idée de sélection de parenté . Les altruistes font la distinction entre les personnes qu'ils aident et favorisent les proches. La règle de Hamilton explique la logique évolutive derrière cette sélection avec l'équation c < b × r , où le coût c pour l'altruiste doit être inférieur au bénéfice b pour le bénéficiaire multiplié par le coefficient de parenté r . Les deux organismes les plus étroitement liés entraînent une augmentation des incidences d'altruisme, car ils partagent bon nombre des mêmes allèles. Cela signifie que l'individu altruiste, en s'assurant que les allèles de son proche parent sont transmis par la survie de sa progéniture, peut renoncer à l'option d'avoir lui-même une progéniture parce que le même nombre d'allèles est transmis. Par exemple, aider un frère (chez les animaux diploïdes) a un coefficient de 12 , car (en moyenne) un individu partage la moitié des allèles de la progéniture de son frère. Veiller à ce qu'une quantité suffisante de la progéniture d'un frère survive jusqu'à l'âge adulte exclut la nécessité pour l'individu altruiste de produire une progéniture. Les valeurs des coefficients dépendent fortement de l'étendue du terrain de jeu ; par exemple, si le choix de ceux à privilégier inclut tous les êtres vivants génétiques, et pas seulement tous les parents, nous supposons que l'écart entre tous les humains ne représente qu'environ 1 % de la diversité du terrain de jeu, un coefficient qui était de 12 dans le plus petit champ devient 0,995. De même, si l'on considère que des informations autres que celles de nature génétique (par exemple l'épigénétique, la religion, la science, etc.) ont persisté dans le temps, le terrain de jeu s'agrandit encore et les écarts s'amenuisent.

Informatique et logique

La théorie des jeux a joué un rôle de plus en plus important en logique et en informatique . Plusieurs théories logiques ont une base dans la sémantique des jeux . De plus, les informaticiens ont utilisé des jeux pour modéliser des calculs interactifs . Aussi, la théorie des jeux fournit une base théorique au domaine des systèmes multi-agents .

Séparément, la théorie des jeux a joué un rôle dans les algorithmes en ligne ; en particulier, le problème k- server , qui a été appelé dans le passé jeux avec coûts de déplacement et jeux de requête-réponse . Le principe de Yao est une technique de théorie des jeux pour prouver les limites inférieures de la complexité de calcul des algorithmes aléatoires , en particulier des algorithmes en ligne.

L'émergence d'Internet a motivé le développement d'algorithmes pour trouver des équilibres dans les jeux, les marchés, les enchères informatiques, les systèmes peer-to-peer et les marchés de la sécurité et de l'information. La théorie algorithmique des jeux et, en son sein , la conception de mécanismes algorithmiques combinent la conception d'algorithmes de calcul et l'analyse de systèmes complexes avec la théorie économique.

Philosophie

Cerf lièvre
Cerf 3, 3 0, 2
lièvre 2, 0 2, 2
Chasse au cerf

La théorie des jeux a été mise à plusieurs usages en philosophie . En réponse à deux articles de WVO Quine  ( 1960 , 1967 ), Lewis (1969) a utilisé la théorie des jeux pour développer une explication philosophique de la convention . Ce faisant, il a fourni la première analyse du savoir commun et l'a utilisé pour analyser le jeu dans les jeux de coordination . De plus, il a d'abord suggéré que l'on peut comprendre le sens en termes de jeux de signalisation . Cette dernière suggestion a été poursuivie par plusieurs philosophes depuis Lewis. Suivant la théorie des jeux de Lewis (1969) , Edna Ullmann-Margalit (1977) et Bicchieri (2006) ont développé des théories des normes sociales qui les définissent comme des équilibres de Nash résultant de la transformation d'un jeu à motifs mixtes en un jeu de coordination.

La théorie des jeux a également mis les philosophes au défi de penser en termes d' épistémologie interactive : ce que signifie pour un collectif d'avoir des croyances ou des connaissances communes, et quelles sont les conséquences de ces connaissances sur les résultats sociaux résultant des interactions des agents. Les philosophes qui ont travaillé dans ce domaine incluent Bicchieri (1989, 1993), Skyrms (1990) et Stalnaker (1999).

En éthique , certains auteurs (notamment David Gauthier, Gregory Kavka et Jean Hampton) ont tenté de poursuivre le projet de Thomas Hobbes de dériver la moralité de l'intérêt personnel. Étant donné que des jeux comme le dilemme du prisonnier présentent un conflit apparent entre la moralité et l'intérêt personnel, expliquer pourquoi la coopération est requise par l'intérêt personnel est une composante importante de ce projet. Cette stratégie générale est une composante de la conception générale du contrat social en philosophie politique (pour des exemples, voir Gauthier (1986) et Kavka (1986) ).

D'autres auteurs ont tenté d'utiliser la théorie des jeux évolutionnistes pour expliquer l'émergence d'attitudes humaines à l'égard de la moralité et des comportements animaux correspondants. Ces auteurs examinent plusieurs jeux dont le dilemme du prisonnier, la chasse au cerf et le jeu de négociation de Nash comme fournissant une explication à l'émergence d'attitudes envers la moralité (voir, par exemple, Skyrms ( 1996 , 2004 ) et Sober et Wilson ( 1998 )).

Prix ​​des produits de détail et de consommation

Les applications de la théorie des jeux sont largement utilisées dans les stratégies de prix des marchés de détail et de consommation, en particulier pour la vente de biens inélastiques . Les détaillants étant constamment en concurrence les uns contre les autres pour les parts de marché des consommateurs, il est devenu une pratique assez courante pour les détaillants de réduire certains produits, par intermittence, dans l'espoir d'augmenter le trafic piétonnier dans les emplacements physiques (visites de sites Web pour les détaillants de commerce électronique) ou augmenter les ventes de produits auxiliaires ou complémentaires.

Le Black Friday , une fête de magasinage populaire aux États-Unis, est le moment où de nombreux détaillants se concentrent sur des stratégies de prix optimales pour capturer le marché du magasinage des Fêtes. Dans le scénario du Black Friday, les détaillants utilisant des applications de théorie des jeux demandent généralement « quelle est la réaction du concurrent dominant à mon égard ? » Dans un tel scénario, le jeu a deux acteurs : le détaillant et le consommateur. Le détaillant se concentre sur une stratégie de prix optimale, tandis que le consommateur se concentre sur la meilleure offre. Dans ce système fermé, il n'y a souvent pas de stratégie dominante car les deux acteurs ont des options alternatives. C'est-à-dire que les détaillants peuvent trouver un client différent et les consommateurs peuvent faire leurs achats chez un détaillant différent. Compte tenu de la concurrence sur le marché ce jour-là, cependant, la stratégie dominante des détaillants consiste à surpasser leurs concurrents. Le système ouvert suppose plusieurs détaillants vendant des produits similaires et un nombre fini de consommateurs exigeant les produits à un prix optimal. Un blog par une université Cornell professeur a fourni un exemple d'une telle stratégie, quand Amazon prix un téléviseur Samsung 100 $ en dessous de la valeur au détail, la sous - cotation des concurrents effectifs. Amazon a compensé une partie de la différence en augmentant le prix des câbles HDMI, car il a été constaté que les consommateurs sont moins discriminatoires en matière de prix lorsqu'il s'agit de vendre des articles secondaires.

Les marchés de détail continuent de développer des stratégies et des applications de la théorie des jeux en matière de tarification des biens de consommation. Les informations clés trouvées entre les simulations dans un environnement contrôlé et les expériences de vente au détail dans le monde réel montrent que les applications de telles stratégies sont plus complexes, car chaque détaillant doit trouver un équilibre optimal entre les prix , les relations avec les fournisseurs , l' image de marque et le potentiel de cannibalisation. la vente d'articles plus rentables.

Épidémiologie

Étant donné que la décision de prendre un vaccin contre une maladie particulière est souvent prise par des individus, qui peuvent prendre en compte une série de facteurs et de paramètres pour prendre cette décision (tels que l'incidence et la prévalence de la maladie, les risques perçus et réels associés à la maladie , taux de mortalité, risques perçus et réels associés à la vaccination et coût financier de la vaccination), la théorie des jeux a été utilisée pour modéliser et prédire le recours à la vaccination dans une société.

Dans la culture populaire

  • Basé sur le livre de 1998 de Sylvia Nasar , l'histoire de la vie du théoricien des jeux et mathématicien John Nash a été transformée en biopic de 2001 A Beautiful Mind , avec Russell Crowe dans le rôle de Nash.
  • 1959 de science - fiction militaire roman Starship Troopers par Robert A. Heinlein a mentionné la « théorie des jeux » et « théorie des jeux ». Dans le film du même nom de 1997 , le personnage Carl Jenkins a fait référence à sa mission de renseignement militaire comme étant assignée aux « jeux et théorie ».
  • Le film de 1964 Dr. Strangelove fait la satire des idées de la théorie des jeux sur la théorie de la dissuasion . Par exemple, la dissuasion nucléaire dépend de la menace de représailles catastrophiques si une attaque nucléaire est détectée. Un théoricien des jeux pourrait argumenter que de telles menaces peuvent ne pas être crédibles , dans le sens où elles peuvent conduire à des équilibres imparfaits des sous-jeux . Le film pousse cette idée un peu plus loin, l'Union soviétique s'engageant irrévocablement dans une réponse nucléaire catastrophique sans rendre la menace publique.
  • Le groupe de power pop des années 1980 Game Theory a été fondé par le chanteur/compositeur Scott Miller , qui a décrit le nom du groupe comme faisant allusion à « l'étude du calcul de l'action la plus appropriée face à un adversaire  … pour vous donner le minimum d'échecs ».
  • Liar Game , un manga japonais de 2005et une série télévisée de 2007, présente les personnages principaux de chaque épisode avec un jeu ou un problème typiquement tiré de la théorie des jeux, comme le démontrent les stratégies appliquées par les personnages.
  • Le roman de 1974 Spy Story de Len Deighton explore des éléments de la théorie des jeux en ce qui concerne les exercices de l'armée de la guerre froide.
  • Le roman de 2008 The Dark Forest de Liu Cixin explore la relation entre la vie extraterrestre, l'humanité et la théorie des jeux.
  • Le principal antagoniste Joker dans le film The Dark Knight présente des concepts de théorie des jeux, notamment le dilemme du prisonnier dans une scène où il demande aux passagers de deux ferries différents de bombarder l'autre pour sauver le leur.

Voir également

Listes

Remarques

Références et lectures complémentaires

Manuels et références générales

Textes d'importance historique

  • édition réimprimée : R. Duncan Luce ; Howard Raiffa (1989), Jeux et décisions : introduction et enquête critique , New York : Dover Publications , ISBN 978-0-486-65943-5CS1 maint : plusieurs noms : liste des auteurs ( lien )

Autres références imprimées

Liens externes