Stratégie évolutive stable - Evolutionarily stable strategy

Stratégie évolutive stable
Un concept de solution en théorie des jeux
Relation
Sous-ensemble de équilibre de Nash
Superset de Équilibre stochastiquement stable , équilibre de Nash fort stable
Intersecte avec Équilibre parfait sous - jeu , Trembling main équilibre parfait , l' équilibre parfait bayesien
Importance
Proposé par John Maynard Smith et George R. Price
Utilisé pour Modélisation biologique et théorie des jeux évolutive
Exemple Hawk-colombe

Une stratégie évolutive stable ( SSE ) est une stratégie (ou un ensemble de stratégies) qui est imperméable lorsqu'elle est adoptée par une population en adaptation à un environnement spécifique, c'est-à-dire qu'elle ne peut pas être déplacée par une stratégie alternative (ou un ensemble de stratégies) qui peut être nouveau ou initialement rare. Introduit par John Maynard Smith et George R. Price en 1972/3, c'est un concept important en écologie comportementale , en psychologie évolutionniste , en théorie mathématique des jeux et en économie , avec des applications dans d'autres domaines tels que l' anthropologie , la philosophie et les sciences politiques .

En termes de théorie des jeux, un ESS est un raffinement d'équilibre de l' équilibre de Nash , étant un équilibre de Nash qui est également «évolutivement stable ». Ainsi, une fois fixée dans une population, la sélection naturelle à elle seule suffit à empêcher des stratégies alternatives ( mutantes ) de la remplacer (bien que cela n'exclut pas la possibilité qu'une meilleure stratégie, ou un ensemble de stratégies, émerge en réponse aux pressions sélectives résultant de changement environnemental).

Histoire

Des stratégies évolutives stables ont été définies et introduites par John Maynard Smith et George R. Price dans un article de 1973 sur Nature . Le temps pris pour examiner par les pairs le papier pour Nature fut tel que celui-ci fut précédé par un essai de 1972 de Maynard Smith dans un livre d'essais intitulé On Evolution . L'essai de 1972 est parfois cité au lieu de l'article de 1973, mais les bibliothèques universitaires sont beaucoup plus susceptibles d'avoir des copies de Nature . Les articles dans Nature sont généralement courts; en 1974, Maynard Smith a publié un article plus long dans le Journal of Theoretical Biology . Maynard Smith explique plus en détail dans son livre de 1982 Evolution and the Theory of Games . Parfois, ceux-ci sont cités à la place. En fait, le SSE est devenu si central dans la théorie des jeux que souvent aucune citation n'est donnée, car le lecteur est supposé le connaître.

Maynard Smith a formalisé mathématiquement un argument verbal avancé par Price, qu'il a lu en examinant l'article de Price. Lorsque Maynard Smith s'est rendu compte que Price quelque peu désorganisé n'était pas prêt à réviser son article pour publication, il a proposé d'ajouter Price en tant que co-auteur.

Le concept est dérivé du travail de RH MacArthur et WD Hamilton sur les rapports de masculinité , dérivé du principe de Fisher , en particulier du concept de Hamilton (1967) d'une stratégie imbattable . Maynard Smith a reçu conjointement le prix Crafoord 1999 pour son développement du concept de stratégies évolutives stables et l'application de la théorie des jeux à l'évolution du comportement.

Utilisations de l'ESS:

Motivation

L' équilibre de Nash est le concept de solution traditionnel en théorie des jeux . Cela dépend des capacités cognitives des joueurs. On suppose que les joueurs sont conscients de la structure du jeu et essaient consciemment de prédire les mouvements de leurs adversaires et de maximiser leurs propres gains . De plus, il est présumé que tous les joueurs le savent (voir notoriété publique ). Ces hypothèses sont ensuite utilisées pour expliquer pourquoi les joueurs choisissent les stratégies d'équilibre de Nash.

Les stratégies évolutives stables sont motivées de manière totalement différente. Ici, on suppose que les stratégies des joueurs sont biologiquement codées et héritables . Les individus n'ont aucun contrôle sur leur stratégie et n'ont pas besoin d'être conscients du jeu. Ils se reproduisent et sont soumis aux forces de la sélection naturelle , les gains du jeu représentant le succès reproducteur ( aptitude biologique ). On imagine que des stratégies alternatives du jeu se produisent occasionnellement, via un processus comme la mutation . Pour être un SSE, une stratégie doit résister à ces alternatives.

Compte tenu des hypothèses de motivation radicalement différentes, il peut être surprenant que les équilibres ESS et Nash coïncident souvent. En fait, chaque ESS correspond à un équilibre de Nash, mais certains équilibres de Nash ne sont pas des ESS.

équilibre de Nash

Un ESS est une forme raffinée ou modifiée d'un équilibre de Nash . (Voir la section suivante pour des exemples qui opposent les deux.) Dans un équilibre de Nash, si tous les joueurs adoptent leurs parties respectives, aucun joueur ne peut en bénéficier en passant à une stratégie alternative. Dans une partie à deux joueurs, c'est une paire de stratégie. Soit E ( S , T ) représentent la récompense pour jouer la stratégie S contre la stratégie T . La paire de stratégies ( S , S ) est un équilibre de Nash dans une partie à deux joueurs si et seulement si pour les deux joueurs, pour toute stratégie T :

E ( S , S ) ≥ E ( T , S )

Dans cette définition, une stratégie T S peut être une alternative neutre à S (notant également bien, mais pas mieux). Un équilibre de Nash est présumé être stable , même si T scores aussi, en supposant qu'il n'y a pas d' incitation à long terme pour les joueurs à adopter T au lieu de S . Ce fait représente le point de départ du SSE.

Maynard Smith et Price spécifient deux conditions pour qu'une stratégie S soit un ESS. Pour tout T S , soit

  1. E ( S , S )> E ( T , S ), ou
  2. E ( S , S ) = E ( T , S ) et E ( S , T )> E ( T , T )

La première condition est parfois appelée un équilibre de Nash strict . La seconde est parfois appelée «la seconde condition de Maynard Smith». Le second moyen de condition que , bien que la stratégie T est neutre par rapport à la récompense contre la stratégie S , la population des joueurs qui continuent de jouer la stratégie S a un avantage lorsque vous jouez contre T .

Il existe également une définition alternative plus forte de l'ESS, due à Thomas. Cela met un accent différent sur le rôle du concept d'équilibre de Nash dans le concept ESS. Suivant la terminologie donnée dans la première définition ci-dessus, cette définition exige que pour tout T S

  1. E ( S , S ) ≥ E ( T , S ) et
  2. E ( S , T )> E ( T , T )

Dans cette formulation, la première condition spécifie que la stratégie est un équilibre de Nash, et la seconde spécifie que la seconde condition de Maynard Smith est remplie. Notez que les deux définitions ne sont pas exactement équivalentes: par exemple, chaque stratégie pure dans le jeu de coordination ci-dessous est un ESS par la première définition mais pas la seconde.

En quelques mots, cette définition ressemble à ceci: le gain du premier joueur lorsque les deux joueurs jouent à la stratégie S est supérieur (ou égal à) le gain du premier joueur lorsqu'il passe à une autre stratégie T et le second joueur garde sa stratégie S et le gain du premier joueur lorsque seul son adversaire change sa stratégie en T est plus élevé que son gain au cas où les deux joueurs changent leur stratégie en T.

Cette formulation met plus clairement en évidence le rôle de la condition d'équilibre de Nash dans l'ESS. Il permet également une définition naturelle de concepts connexes tels qu'un ESS faible ou un ensemble évolutif stable .

Exemples de différences entre les équilibres de Nash et les ESS

Coopérer Défaut
Coopérer 3, 3 1, 4
Défaut 4, 1 2, 2
Le dilemme du prisonnier
UNE B
UNE 2, 2 1, 2
B 2, 1 2, 2
Nuire à ton voisin

Dans la plupart des jeux simples, les équilibres ESS et Nash coïncident parfaitement. Par exemple, dans le dilemme du prisonnier, il n'y a qu'un seul équilibre de Nash, et sa stratégie ( Défaut ) est aussi un ESS.

Certains jeux peuvent avoir des équilibres de Nash qui ne sont pas des ESS. Par exemple, dans nuire à ton voisin (dont la matrice de gain est montrée ici) les deux ( A , A ) et ( B , B ) sont des équilibres de Nash, puisque les joueurs ne peuvent pas faire mieux en s'éloignant de l'un ou l'autre. Cependant, seul B est un ESS (et un Nash fort). A n'est pas un ESS, donc B peut envahir une population neutre de A stratégistes et prédominer, car B scores plus élevés contre B que A ne contre B . Cette dynamique est capturée par la deuxième condition de Maynard Smith, puisque E ( A , A ) = E ( B , A ), mais ce n'est pas le cas que E ( A , B )> E ( B , B ).

C
C 2, 2 1, 2
2, 1 0, 0
Nuire à tout le monde
Embardée Rester
Embardée 0,0 −1, + 1
Rester + 1, −1 −20, −20
Poulet

Les équilibres de Nash avec des alternatives de notation équivalentes peuvent être des ESS. Par exemple, dans le jeu Harm tout le monde , C est un ESS parce qu'il satisfait la deuxième condition de Maynard Smith. Les stratèges D peuvent temporairement envahir une population de stratèges C en marquant également bien contre C , mais ils paient un prix lorsqu'ils commencent à jouer les uns contre les autres; C scores mieux contre D que ne le D . Donc ici bien que E ( C , C ) = E ( D , C ), c'est aussi le cas que E ( C , D )> E ( D , D ). En conséquence, C est un ESS.

Même si un jeu a des équilibres de stratégie pure Nash, il se peut qu'aucune de ces stratégies pures ne soit ESS. Considérez le jeu du poulet . Il y a deux équilibres de stratégie pure Nash dans ce jeu ( Swerve , Stay ) et ( Stay , Swerve ). Cependant, en l'absence d'une asymétrie non corrélée , ni Swerve ni Stay ne sont des ESS. Il y a un troisième équilibre de Nash, une stratégie mixte qui est un ESS pour ce jeu (voir Jeu Hawk-dove et Meilleure réponse pour l'explication).

Ce dernier exemple met en évidence une différence importante entre les équilibres de Nash et l'ESS. Les équilibres de Nash sont définis sur des ensembles de stratégies (une spécification d'une stratégie pour chaque acteur), tandis que les ESS sont définis en termes de stratégies elles-mêmes. Les équilibres définis par ESS doivent toujours être symétriques , et donc avoir moins de points d'équilibre.

Contre. état évolutif stable

En biologie des populations, les deux concepts d'une stratégie évolutive stable (ESS) et d'un état évolutif stable sont étroitement liés mais décrivent des situations différentes.

Dans une stratégie évolutive stable , si tous les membres d'une population l'adoptent, aucune stratégie mutante ne peut envahir. Une fois que pratiquement tous les membres de la population utilisent cette stratégie, il n'y a pas d'alternative «rationnelle». L'ESS fait partie de la théorie des jeux classique .

Dans un état évolutif stable , la composition génétique d'une population est restaurée par sélection après une perturbation, si la perturbation n'est pas trop importante. Un état évolutivement stable est une propriété dynamique d'une population qui recommence à utiliser une stratégie, ou un mélange de stratégies, si elle est perturbée à partir de cet état initial. Il fait partie de la génétique des populations , du système dynamique ou de la théorie des jeux évolutifs . Cela s'appelle maintenant la stabilité convergente.

B. Thomas (1984) applique le terme ESS à une stratégie individuelle qui peut être mixte, et un état de population évolutivement stable à un mélange de population de stratégies pures qui peut être formellement équivalente à l'ESS mixte.

Le fait qu'une population soit stable sur le plan évolutif n'a pas de rapport avec sa diversité génétique: elle peut être génétiquement monomorphe ou polymorphe .

ESS stochastique

Dans la définition classique d'un ESS, aucune stratégie mutante ne peut envahir. Dans les populations finies, n'importe quel mutant pourrait en principe envahir, quoique à faible probabilité, ce qui implique qu'aucun ESS ne peut exister. Dans une population infinie, un ESS peut au contraire être défini comme une stratégie qui, s'il était envahi par une nouvelle stratégie mutante avec probabilité p, serait capable de contre-inviter à partir d'un seul individu de départ avec probabilité> p, comme l'illustre l'évolution de couverture de pari .

Le dilemme du prisonnier

Coopérer Défaut
Coopérer 3, 3 1, 4
Défaut 4, 1 2, 2
Le dilemme du prisonnier

Le dilemme du prisonnier est un modèle courant d' altruisme et de coopération sociale . Ici, un groupe de joueurs serait collectivement mieux s'il pouvait jouer à Cooperate , mais comme Defect se porte mieux, chaque joueur individuel a une incitation à jouer à Defect . Une solution à ce problème consiste à introduire la possibilité de représailles en faisant jouer le jeu à plusieurs reprises contre le même joueur. Dans la soi-disant itérée dilemme du prisonnier, les deux mêmes personnes jouent le dilemme du prisonnier à plusieurs reprises. Alors que le dilemme du prisonnier n'a que deux stratégies ( Coopérer et Défaut ), le dilemme répété du prisonnier comporte un grand nombre de stratégies possibles. Puisqu'un individu peut avoir un plan d'urgence différent pour chaque histoire et que le jeu peut être répété un nombre indéfini de fois, il peut en fait y avoir un nombre infini de tels plans d'urgence.

Trois plans d'urgence simples qui ont reçu une attention considérable sont Always Defect , Always Cooperate et Tit for Tat . Les deux premières stratégies font la même chose quelles que soient les actions de l'autre joueur, tandis que ce dernier répond au tour suivant en faisant ce qui lui a été fait au tour précédent - il répond à Coopérer avec Coopérer et Défaut avec Défaut .

Si toute la population joue Tit-for-Tat et qu'un mutant survient qui joue Always Defect , Tit-for-Tat surclassera Always Defect . Si la population du mutant devient trop importante, le pourcentage du mutant restera faible. Tit pour Tat est donc un ESS, par rapport à ces deux stratégies uniquement . En revanche, une île de joueurs Always Defect sera stable face à l'invasion de quelques joueurs Tit-for-Tat , mais pas contre un grand nombre d'entre eux. Si nous introduisons Always Cooperate , une population de Tit-for-Tat n'est plus un ESS. Puisqu'une population de joueurs de Tit-for-Tat coopère toujours, la stratégie Always Cooperate se comporte de manière identique dans cette population. En conséquence, un mutant qui joue Always Cooperate ne sera pas éliminé. Cependant, même si une population de Always Cooperate et Tit-for-Tat peut coexister, s'il y a un petit pourcentage de la population qui est Always Defect , la pression sélective est contre Always Cooperate et en faveur de Tit-for-Tat . Cela est dû aux gains inférieurs de la coopération que ceux de la défection en cas de défaut de l'adversaire.

Cela démontre les difficultés à appliquer la définition formelle d'un ESS à des jeux avec de grands espaces stratégiques, et a motivé certains à envisager des alternatives.

Comportement humain

Les domaines de la sociobiologie et de la psychologie évolutionniste tentent d'expliquer le comportement animal et humain et les structures sociales, en grande partie en termes de stratégies évolutives stables. La sociopathie (comportement antisocial ou criminel chronique) peut résulter d'une combinaison de deux de ces stratégies.

Des stratégies évolutives stables ont été initialement envisagées pour l'évolution biologique, mais elles peuvent s'appliquer à d'autres contextes. En fait, il existe des états stables pour une grande classe de dynamiques adaptatives . En conséquence, ils peuvent être utilisés pour expliquer des comportements humains dépourvus d'influences génétiques.

Voir également

Les références

Lectures complémentaires

Liens externes