Théorème d'utilité de Von Neumann-Morgenstern - Von Neumann–Morgenstern utility theorem

En théorie de la décision , le théorème d'utilité de von Neumann-Morgenstern ( VNM ) montre que, sous certains axiomes de comportement rationnel , un décideur confronté à des résultats risqués (probabilistes) de différents choix se comportera comme s'il maximisait la valeur attendue. d'une fonction définie sur les résultats potentiels à un moment donné dans le futur. Cette fonction est connue sous le nom de fonction d'utilité de von Neumann-Morgenstern. Le théorème est la base de la théorie de l'utilité espérée .

En 1947, John von Neumann et Oskar Morgenstern ont prouvé que tout individu dont les préférences satisfont à quatre axiomes a une fonction d'utilité ; les préférences d'un tel individu peuvent être représentées sur une échelle d'intervalle et l'individu préférera toujours des actions qui maximisent l'utilité attendue. Autrement dit, ils ont prouvé qu'un agent est (VNM-)rationnel si et seulement s'il existe une fonction à valeur réelle u définie par des résultats possibles tels que chaque préférence de l'agent est caractérisée par la maximisation de la valeur attendue de u , qui peut alors être défini comme l' utilitaire VNM de l'agent (il est unique jusqu'à l'ajout d'une constante et la multiplication par un scalaire positif). Aucune réclamation n'est faite que l'agent a un "désir conscient" de maximiser u , seulement que u existe.

L' hypothèse d'utilité espérée est que la rationalité peut être modélisée comme maximisant une valeur attendue , qui, étant donné le théorème, peut être résumée comme « la rationalité est VNM-rationalité ». Cependant, les axiomes eux-mêmes ont été critiqués pour divers motifs, ce qui a donné aux axiomes une justification supplémentaire.

VNM-utility est un utilitaire de décision en ce sens qu'il est utilisé pour décrire les préférences de décision . Elle est liée , mais pas équivalent à ce qu'on appelle E-services publics (services publics d'expérience), les notions d'utilité destinées à mesurer le bonheur comme celui de Bentham de plus grand bonheur principe .

Installer

Dans le théorème, un agent individuel est confronté à des options appelées loteries . Compte tenu de certains résultats qui s'excluent mutuellement , une loterie est un scénario dans lequel chaque résultat se produira avec une probabilité donnée , toutes les probabilités étant additionnées à une. Par exemple, pour deux résultats A et B ,

désigne un scénario où P ( A ) = 25 % est la probabilité que A se produise et P ( B ) = 75 % (et exactement l'un d'entre eux se produira). Plus généralement, pour une loterie à plusieurs issues possibles A i , on écrit :

avec la somme des s égale à 1.

Les résultats d'une loterie peuvent eux-mêmes être des loteries entre d'autres résultats, et l'expression développée est considérée comme une loterie équivalente : 0,5 (0,5 A  + 0,5 B ) + 0,5 C = 0,25 A  + 0,25 B  + 0,50 C .

Si la loterie M est préférée à la loterie L , nous écrivons , ou de manière équivalente, . Si l'agent est indifférent entre L et  M , on écrit la relation d'indifférence Si M est soit préféré, soit regardé avec indifférence par rapport à L , on écrit

Les axiomes

Les quatre axiomes de la VNM-rationalité sont alors la complétude , la transitivité , la continuité et l' indépendance .

L'exhaustivité suppose qu'un individu a des préférences bien définies :

Axiome 1 (Complétude) Pour toutes les loteries L,M , exactement l'une des conditions suivantes est vérifiée :
, , ou

(soit M est préféré, L est préféré, soit l'individu est indifférent).

La transitivité suppose que les préférences sont cohérentes entre trois options :

Axiome 2 (Transitivité) Si et , alors , et de même pour .

La continuité suppose qu'il existe un "point de basculement" entre être meilleur et pire qu'une option médiane donnée :

Axiome 3 (Continuité) : Si , alors il existe une probabilité telle que

où la notation du côté gauche fait référence à une situation dans laquelle L est reçu avec une probabilité p et N est reçu avec une probabilité (1– p ).

Au lieu de continuité, on peut supposer un axiome alternatif qui n'implique pas une égalité précise, appelée la propriété d'Archimède . Il dit que toute séparation de préférence peut être maintenue sous une déviation suffisamment petite des probabilités :

Axiome 3′ (Propriété d'Archimède) : Si , alors il existe une probabilité telle que

Un seul de (3) ou (3′) doit être supposé, et l'autre sera impliqué par le théorème.

L'indépendance des alternatives non pertinentes suppose qu'une préférence est valable indépendamment de la possibilité d'un autre résultat :

Axiome 4 (Indépendance) : Pour tout et ,

L'axiome d'indépendance implique l'axiome sur la réduction des loteries composées :

Axiome 4′ (Réduction des loteries composées) : Pour toute loterie et toute ,

Pour voir comment Axiom 4 implique Axiom 4', définissez l'expression dans Axiom 4 et développez.

Le théorème

Pour tout agent VNM-rationnel (c'est-à-dire satisfaisant les axiomes 1 à 4), il existe une fonction u qui attribue à chaque résultat A un nombre réel u(A) tel que pour deux loteries,

E(u(L)) , ou plus brièvement Eu ( L ) est donné par

En tant que tel, u peut être déterminé de manière unique (jusqu'à ajouter une constante et à multiplier par un scalaire positif) par des préférences entre des loteries simples , c'est-à-dire celles de la forme pA  + (1 −  p ) B n'ayant que deux résultats. Inversement, tout agent agissant pour maximiser l'espérance d'une fonction u obéira aux axiomes 1–4. Une telle fonction est appelée utilitaire von Neumann-Morgenstern (VNM) de l'agent .

Croquis de preuve

La preuve est constructive : elle montre comment la fonction désirée peut être construite. Ici, nous décrivons le processus de construction pour le cas dans lequel le nombre de résultats sûrs est fini.

Supposons qu'il y ait n résultats sûrs, . Notez que chaque résultat sûr peut être vu comme une loterie : c'est une loterie dégénérée dans laquelle le résultat est sélectionné avec probabilité 1. Par conséquent, par les axiomes de complétude et de transitivité, il est possible de classer les résultats du pire au meilleur :

Nous supposons qu'au moins une des inégalités est stricte (sinon la fonction d'utilité est triviale - une constante). Alors . Nous utilisons ces deux résultats extrêmes, le pire et le meilleur, comme unité d'échelle de notre fonction d'utilité, et définissons :

et

Pour chaque probabilité , définissez une loterie qui sélectionne le meilleur résultat avec probabilité et le pire résultat sinon :

Notez que et .

Par l'axiome de continuité, pour chaque résultat sûr , il existe une probabilité telle que :

et

Pour chaque , la fonction d'utilité pour le résultat est définie comme

donc l'utilité de chaque loterie est l'espérance de u :

Pour voir pourquoi cette fonction d'utilité a du sens, considérons une loterie , qui sélectionne le résultat avec probabilité . Mais, par notre hypothèse, le décideur est indifférent entre le résultat sûr et la loterie . Ainsi, par l'axiome de Réduction, il est indifférent entre la loterie et la loterie suivante :

La loterie est, en effet, une loterie dans laquelle le meilleur résultat est gagné avec probabilité , et le pire résultat sinon.

Par conséquent, si , un décideur rationnel préférerait la loterie à la loterie , car cela lui donne une plus grande chance de gagner le meilleur résultat.

D'où:

si et seulement si

Réaction

Von Neumann et Morgenstern anticipaient la surprise devant la force de leur conclusion. Mais selon eux, la raison pour laquelle leur fonction d'utilité fonctionne est qu'elle est construite précisément pour remplir le rôle de quelque chose dont l'espérance est maximisée :

"Beaucoup d'économistes auront l'impression que nous supposons beaucoup trop... N'avons-nous pas trop montré ?... Pour autant que nous puissions le voir, nos postulats [sont] plausibles... Nous avons pratiquement défini l'utilité numérique comme étant chose pour laquelle le calcul des espérances mathématiques est légitime." – VNM 1953, § 3.1.1 p.16 et § 3.7.1 p. 28

Ainsi, le contenu du théorème est que la construction de u est possible, et ils revendiquent peu sur sa nature.

Conséquences

Prise en compte automatique de l'aversion au risque

Il arrive souvent qu'une personne, confrontée à des paris réels avec de l'argent, n'agisse pas pour maximiser la valeur attendue de ses actifs en dollars. Par exemple, une personne qui ne possède que 1 000 $ d'économies peut être réticente à tout risquer pour avoir 20 % de chances de gagner 10 000 $, même si

Cependant, si la personne est VNM-rationnelle, ces faits sont automatiquement pris en compte dans leur fonction d'utilité u . Dans cet exemple, nous pourrions conclure que

où les montants en dollars représentent ici réellement des résultats (cf. « valeur »), les trois situations possibles auxquelles l'individu pourrait être confronté. En particulier, u peut présenter des propriétés telles que u (1 $) + u (1 $) ≠ u (2 $) sans contredire du tout la rationalité VNM. Cela conduit à une théorie quantitative de l'aversion au risque monétaire.

Implications pour l'hypothèse d'utilité espérée

En 1738, Daniel Bernoulli a publié un traité dans lequel il postule que le comportement rationnel peut être décrit comme maximisant l'espérance d'une fonction u , qui en particulier n'a pas besoin d'être valorisée monétairement, rendant ainsi compte de l'aversion au risque. C'est l' hypothèse d'utilité espérée . Comme indiqué, l'hypothèse peut sembler être une affirmation audacieuse. L'objectif du théorème d'utilité espérée est de fournir des « conditions modestes » (c'est-à-dire des axiomes) décrivant quand l'hypothèse d'utilité espérée est vérifiée, qui peuvent être évaluées directement et intuitivement :

"Les axiomes ne doivent pas être trop nombreux, leur système doit être aussi simple et transparent que possible, et chaque axiome doit avoir un sens intuitif immédiat par lequel sa pertinence peut être jugée directement. Dans une situation comme la nôtre, cette dernière exigence est particulièrement vitale , malgré son imprécision : nous voulons rendre un concept intuitif susceptible d'un traitement mathématique et voir aussi clairement que possible quelles hypothèses cela nécessite." – VNM 1953 § 3.5.2, p. 25

En tant que tel, les affirmations selon lesquelles l'hypothèse d'utilité attendue ne caractérise pas la rationalité doivent rejeter l'un des axiomes VNM. Diverses théories de l' utilité espérée généralisée ont vu le jour, dont la plupart abandonnent ou relâchent l'axiome d'indépendance.

Implications pour l'éthique et la philosophie morale

Parce que le théorème ne suppose rien sur la nature des résultats possibles des paris, ils pourraient être des événements moralement significatifs, impliquant par exemple la vie, la mort, la maladie ou la santé d'autrui. Un agent rationnel de von Neumann-Morgenstern est capable d'agir avec une grande préoccupation pour de tels événements, sacrifiant beaucoup de richesse ou de bien-être personnel, et toutes ces actions seront prises en compte dans la construction/définition de la fonction d'utilité VNM de l'agent. En d'autres termes, ce qui est naturellement perçu comme un « gain personnel » et ce qui est naturellement perçu comme un « altruisme » sont implicitement équilibrés dans la fonction VNM-utilité d'un individu VNM-rationnel. Par conséquent, la gamme complète de comportements axés sur les agents à neutres sur les agents est possible avec diverses fonctions utilitaires VNM .

Si l'utilité de est , un agent rationnel de von Neumann-Morgenstern doit être indifférent entre et . Un agent rationnel de von Neumann-Morgenstern centré sur l'agent ne peut donc pas favoriser des distributions d'utilité plus égales, ou "justes", entre ses propres futurs possibles.

Distinction avec les autres notions d'utilité

Certaines théories morales utilitaristes s'intéressent à des quantités appelées « utilité totale » et « l'utilité moyenne » des collectifs, et caractérisent la morale en termes de favoriser l'utilité ou le bonheur des autres au mépris du sien. Ces notions peuvent être liées à l'utilitaire VNM, mais en sont distinctes :

  • 1) VNM-utility est une utilité de décision : c'est celle en fonction de laquelle on décide, et donc par définition ne peut pas être quelque chose que l'on méconnaît.
  • 2) L'utilité VNM n'est pas canoniquement additive sur plusieurs individus (voir Limitations), donc "l'utilité VNM totale" et "l'utilité VNM moyenne" ne sont pas immédiatement significatives (une sorte d'hypothèse de normalisation est requise).

Le terme E-utilitaire « expérience utilitaire » a été inventé pour désigner les types d'utilité « hédoniste » comme celle de Bentham de principe du plus grand bonheur . Puisque la moralité affecte les décisions, la moralité d'un agent VNM-rationnel affectera la définition de sa propre fonction d'utilité (voir ci-dessus). Ainsi, la moralité d'un agent rationnel VNM peut être caractérisée par la corrélation de l'utilité VNM de l'agent avec l'utilité VNM, l'utilité électronique ou le « bonheur » des autres, entre autres moyens, mais pas par le mépris de l'agent lui-même. VNM-utility, une contradiction dans les termes.

Limites

Jeu imbriqué

Puisque si L et M sont des loteries, alors pL  + (1 −  p ) M est simplement « étendu » et considéré comme une loterie elle-même, le formalisme VNM ignore ce qui peut être vécu comme un « jeu imbriqué ». Ceci est lié au problème d'Ellsberg où les gens choisissent d'éviter la perception des risques sur les risques . Von Neumann et Morgenstern ont reconnu cette limitation :

« ... des concepts comme une utilité spécifique du jeu ne peuvent pas être formulés sans contradiction à ce niveau. Cela peut sembler être une affirmation paradoxale. Mais quiconque a sérieusement essayé d'axiomatiser ce concept insaisissable sera probablement d'accord avec lui. » – VNM 1953 § 3.7.1, p. 28 .

Incomparabilité entre les agents

Étant donné que pour deux agents VNM X et Y , leurs fonctions d'utilité VNM u X et u Y ne sont déterminées que jusqu'à des constantes additives et des scalaires multiplicatifs positifs, le théorème ne fournit aucun moyen canonique de comparer les deux. Par conséquent, des expressions comme u X ( L ) + u Y ( L ) et u X ( L ) −  u Y ( L ) ne sont pas définies canoniquement, pas plus que des comparaisons comme u X ( L ) <  u Y ( L ) canoniquement vraies ou fausses . En particulier, l'« utilité VNM totale » et l'« utilité VNM moyenne » susmentionnées d'une population ne sont pas canoniquement significatives sans hypothèses de normalisation.

Applicabilité à l'économie

L' hypothèse de l'utilité attendue s'est avérée avoir une précision prédictive limitée dans un ensemble d'expériences empiriques en laboratoire, telles que le paradoxe d'Allais . Ce qui amène certains à interpréter comme une preuve que

  • les humains ne sont pas toujours rationnels, ou
  • La rationalité VNM n'est pas une caractérisation appropriée de la rationalité, ou
  • une combinaison des deux, ou
  • les humains ne se comportent VNM-rationnelle , mais l'évaluation objective de u et la construction de u sont difficiles à résoudre des problèmes.

Références et lectures complémentaires