Superrationalité - Superrationality

En économie et en théorie des jeux , un participant est considéré comme ayant une superrationalité (ou rationalité renormalisée ) s'il a une rationalité parfaite (et maximise ainsi son utilité ) mais suppose que tous les autres joueurs sont également superrationnels et qu'un individu superrationnel proposera toujours le même stratégie que tout autre penseur superrational face au même problème. En appliquant cette définition, un joueur superrationnel jouant contre un adversaire superrationnel dans le dilemme d' un prisonnier coopérera tandis qu'un joueur rationnellement intéressé ferait défection.

Cette règle de décision n'est pas un modèle courant dans la théorie des jeux et a été suggérée par Douglas Hofstadter dans son article, sa série et son livre Metamagical Themas comme un type alternatif de prise de décision rationnelle différente de la théorie des jeux largement acceptée . Superrationalité est une forme de Immanuel Kant l » impératif catégorique , et est étroitement liée à la notion d' équilibre kantien proposé par l'économiste et marxiste analytique John Roemer . Hofstadter a fourni cette définition : « Les penseurs superrationnels, par définition récursive, incluent dans leurs calculs le fait qu'ils font partie d'un groupe de penseurs superrationnels. Cela équivaut à raisonner comme si tout le monde dans le groupe obéissait à l'impératif catégorique de Kant : « on devrait prendre ces actions et seulement ces actions que l'on préconiserait que tous les autres prennent aussi.

Contrairement au supposé « humain réciproque », le penseur superrationnel ne jouera pas toujours l'équilibre qui maximise l'utilité sociale totale et n'est donc pas un philanthrope .

Le dilemme du prisonnier

L'idée de la superrationalité est que deux penseurs logiques analysant le même problème penseront à la même réponse correcte. Par exemple, si deux personnes sont toutes les deux douées en mathématiques et qu'elles ont toutes les deux le même problème compliqué à résoudre, elles obtiendront toutes les deux la même bonne réponse. En mathématiques, savoir que les deux réponses seront les mêmes ne change pas la valeur du problème, mais dans la théorie des jeux, savoir que la réponse sera la même peut changer la réponse elle-même.

Le dilemme du prisonnier est généralement formulé en termes de peines de prison pour les criminels, mais il peut être tout aussi bien exprimé avec des prix en espèces à la place. Deux joueurs ont chacun le choix de coopérer (C) ou de faire défection (D). Les joueurs choisissent sans savoir ce que l'autre va faire. Si les deux coopèrent, chacun recevra 100 $. S'ils font tous les deux défaut, ils reçoivent chacun 1 $. Si l'un coopère et que l'autre fait défaut, alors le joueur défaillant reçoit 200 $, tandis que le joueur coopérant ne reçoit rien.

Les quatre résultats et le gain pour chaque joueur sont énumérés ci-dessous.

Le joueur B coopère Défauts du joueur B
Le joueur A coopère Les deux reçoivent 100 $ Joueur A: 0 $
Joueur B: 200 $
Défauts du joueur A Joueur A : 200 $
Joueur B : 0 $
Les deux reçoivent 1 $

Une manière valable pour les joueurs de raisonner est la suivante :

  1. En supposant que l'autre joueur fasse défaut, si je coopère, je n'obtiens rien et si je fais défaut, je reçois un dollar.
  2. En supposant que l'autre joueur coopère, je reçois 100 $ si je coopère et 200 $ si je fais défection.
  3. Donc, quoi que fasse l'autre joueur, mon gain est augmenté en faisant défection, ne serait-ce que d'un dollar.

La conclusion est que la chose rationnelle à faire est de faire défection. Ce type de raisonnement définit la rationalité de la théorie des jeux et deux joueurs rationnels de la théorie des jeux jouant à ce jeu échouent et reçoivent chacun un dollar.

La superrationalité est une méthode alternative de raisonnement. Premièrement, on suppose que la réponse à un problème symétrique sera la même pour tous les joueurs superrationnels. Ainsi la similitude est prise en compte avant de savoir quelle sera la stratégie. La stratégie est trouvée en maximisant le gain pour chaque joueur, en supposant qu'ils utilisent tous la même stratégie. Puisque le joueur superrationnel sait que l'autre joueur superrationnel fera la même chose, quelle qu'elle soit, il n'y a que deux choix pour deux joueurs superrationnels. Les deux coopéreront ou les deux feront défaut en fonction de la valeur de la réponse superrationnelle. Ainsi, les deux acteurs superrationnels coopéreront tous les deux puisque cette réponse maximise leur gain. Deux joueurs superrational jouant à ce jeu repartiront chacun avec 100 $.

Notez qu'un joueur superrational jouant contre un joueur rationnel théorique du jeu fera défaut, puisque la stratégie suppose seulement que les joueurs superrationnels seront d'accord. Un joueur superrationnel jouant contre un joueur de superrationalité incertaine fera parfois défaut et parfois coopérera, en fonction de la probabilité que l'autre joueur soit superrationnel.

Bien que la théorie des jeux standard suppose une connaissance commune de la rationalité, elle le fait d'une manière différente. L'analyse de la théorie des jeux maximise les gains en permettant à chaque joueur de changer de stratégie indépendamment des autres, même si en fin de compte, elle suppose que la réponse dans un jeu symétrique sera la même pour tous. C'est la définition d'un équilibre de Nash de la théorie des jeux , qui définit une stratégie stable comme une stratégie dans laquelle aucun joueur ne peut améliorer les gains en changeant unilatéralement de cap. L'équilibre superrational dans un jeu symétrique est celui où toutes les stratégies des joueurs sont forcées d'être les mêmes avant l'étape de maximisation. (Il n'y a pas d'extension convenue du concept de superrationalité aux jeux asymétriques.)

Certains soutiennent que la superrationalité implique une sorte de pensée magique dans laquelle chaque joueur suppose que sa décision de coopérer amènera l'autre joueur à coopérer, même s'il n'y a pas de communication. Hofstadter souligne que le concept de "choix" ne s'applique pas lorsque le but du joueur est de comprendre quelque chose, et que la décision ne fait pas coopérer l'autre joueur, mais plutôt la même logique conduit à la même réponse indépendamment de la communication ou de cause à effet. Ce débat porte sur la question de savoir s'il est raisonnable pour les êtres humains d'agir de manière superrationnelle, et non sur ce que signifie la superrationalité, et est similaire aux arguments sur la question de savoir s'il est raisonnable pour les humains d'agir de manière « rationnelle », comme décrit par la théorie des jeux. (où ils peuvent comprendre ce que les autres joueurs auront fait ou auront fait en se demandant ce que je ferais si j'étais eux, et en appliquant l' induction en arrière et l' élimination itérée des stratégies dominées ).

Stratégies probabilistes

Pour simplifier, l'explication précédente de la superrationalité a ignoré les stratégies mixtes : la possibilité que le meilleur choix soit de lancer une pièce, ou plus généralement de choisir différents résultats avec une certaine probabilité. Dans le dilemme du prisonnier , il est super rationnel de coopérer avec la probabilité 1 même lorsque des stratégies mixtes sont admises, car le gain moyen lorsqu'un joueur coopère et les autres défauts sont les mêmes que lorsque les deux coopèrent et donc la défection augmente le risque de défection, ce qui diminue le paiement attendu. Mais dans certains cas, la stratégie superrationnelle est mitigée.

Par exemple, si les gains sont les suivants :

CC – 100$/100$
CD – 0 $/1 000 000 $
CD – 1 000 000 $/0 $
JJ - 1 $ / 1 $

Alors que la défection a une énorme récompense, la stratégie superrationnelle fait défection avec une probabilité de 499 900/999 899 ou un peu plus de 49,995%. Au fur et à mesure que la récompense augmente à l'infini, la probabilité ne s'approche que de 1/2 plus loin, et les pertes pour l'adoption de la stratégie plus simple de 1/2 (qui sont déjà minimes) approchent 0. Dans un exemple moins extrême, si le gain pour un coopérateur et un transfuge était de 400 $ et 0 $, respectivement, le monde de la stratégie mixte superrationnelle faisait défection avec une probabilité de 100/299 ou environ 1/3.

Dans des situations similaires avec plus de joueurs, l'utilisation d'un dispositif de randomisation peut être essentielle. Un exemple discuté par Hofstadter est le dilemme platonia : un trillionaire excentrique contacte 20 personnes, et leur dit que si une et une seule d'entre elles lui envoie un télégramme (supposé ne rien coûter) avant midi le lendemain, cette personne recevra un milliard de dollars. S'ils reçoivent plus d'un télégramme ou aucun, personne ne recevra d'argent et la communication entre les joueurs est interdite. Dans cette situation, la chose superrationnelle à faire (si l'on sait que tous les 20 sont superrationnels) est d'envoyer un télégramme avec une probabilité p = 1/20, c'est-à-dire que chaque destinataire lance essentiellement un dé à 20 faces et n'envoie qu'un télégramme s'il apparaît "1". Cela maximise la probabilité qu'un seul télégramme soit reçu.

Notez cependant que ce n'est pas la solution dans l'analyse classique de la théorie des jeux. Vingt joueurs théoriquement rationnels enverraient chacun des télégrammes et ne recevraient donc rien. En effet, l'envoi de télégrammes est la stratégie dominante ; si un joueur individuel envoie des télégrammes, il a une chance de recevoir de l'argent, mais s'il n'envoie aucun télégramme, il ne peut rien obtenir. (Si tous les télégrammes étaient assurés d'arriver, ils n'en enverraient qu'un et personne ne s'attendrait à recevoir de l'argent).

Voir également

Les références