Théorème de Berry – Esseen - Berry–Esseen theorem

En théorie des probabilités , le théorème de la limite centrale stipule que, dans certaines circonstances, la distribution de probabilité de la moyenne mise à l'échelle d'un échantillon aléatoire converge vers une distribution normale lorsque la taille de l'échantillon augmente à l'infini. Sous des hypothèses plus solides, le théorème de Berry – Esseen , ou inégalité de Berry – Esseen , donne un résultat plus quantitatif, car il spécifie également la vitesse à laquelle cette convergence a lieu en donnant une borne sur l'erreur maximale d' approximation entre la distribution normale et la distribution vraie de la moyenne de l'échantillon mis à l'échelle. L'approximation est mesurée par la distance Kolmogorov – Smirnov . Dans le cas d' échantillons indépendants , le taux de convergence est n −1/2 , où n est la taille de l'échantillon, et la constante est estimée en fonction des troisièmes moments normalisés absolus .

Énoncé du théorème

Les déclarations du théorème varient, car il a été découvert indépendamment par deux mathématiciens , Andrew C. Berry (en 1941) et Carl-Gustav Esseen (1942), qui ensuite, avec d'autres auteurs, l'ont raffiné à plusieurs reprises au cours des décennies suivantes.

Sommets distribués à l'identique

Une version, sacrifiant quelque peu la généralité par souci de clarté, est la suivante:

Il existe une constante positive C telle que si X 1 , X 2 , ..., sont des variables aléatoires iid avec E ( X 1 ) = 0, E ( X 1 2 ) = σ 2 > 0, et E (| X 1 | 3 ) = ρ <∞, et si on définit
la moyenne de l' échantillon , avec F n la fonction de distribution cumulative de
et Φ la fonction de distribution cumulative de la distribution normale standard , alors pour tout x et n ,
Illustration de la différence des fonctions de distribution cumulative évoquée dans le théorème.

Autrement dit: étant donné une séquence de variables aléatoires indépendantes et distribuées de manière identique , chacune ayant une moyenne nulle et une variance positive , si en plus le troisième moment absolu est fini, alors les fonctions de distribution cumulative de la moyenne standard de l' échantillon et de la distribution normale standard diffèrent (verticalement, sur un graphique) par pas plus que le montant spécifié. Notez que l'erreur d'approximation pour tout n (et donc le taux de convergence limite pour n indéfini suffisamment grand) est bornée par l' ordre de n −1/2 .

Les valeurs calculées de la constante C ont nettement diminué au fil des années, passant de la valeur initiale de 7,59 par Esseen (1942) , à 0,7882 par van Beek (1972) , puis 0,7655 par Shiganov (1986) , puis 0,7056 par Shevtsova (2007) , puis 0,7005 par Shevtsova (2008) , puis 0,5894 par Tyurin (2009) , puis 0,5129 par Korolev & Shevtsova (2010a) , puis 0,4785 par Tyurin (2010) . La revue détaillée se trouve dans les articles Korolev & Shevtsova (2010a) et Korolev & Shevtsova (2010b) . La meilleure estimation en 2012, C  <0,4748, découle de l'inégalité

due à Shevtsova (2011) , puisque σ 3  ≤ ρ et 0,33554 · 1,415 <0,4748. Cependant, si ρ ≥ 1,286σ 3 , alors l'estimation

ce qui est également prouvé dans Shevtsova (2011) , donne une estimation supérieure encore plus précise.

Esseen (1956) a prouvé que la constante satisfait également la borne inférieure

Sommets distribués de manière non identique

Soit X 1 , X 2 , ..., des variables aléatoires indépendantes avec E ( X i ) = 0, E ( X i 2 ) = σ i 2 > 0, et E (| X i | 3 ) = ρ i < ∞. Aussi, laissez
être la n- ième somme partielle normalisée . Notons F n le cdf de S n , et Φ le cdf de la distribution normale standard . Pour des raisons de commodité, notons
En 1941, Andrew C. Berry a prouvé que pour tout n il existe une constante absolue C 1 telle que
Indépendamment, en 1942, Carl-Gustav Esseen a prouvé que pour tout n il existe une constante absolue C 0 telle que

Il est facile de s'assurer que ψ 0 ≤ψ 1 . En raison de cette circonstance, l'inégalité (3) est classiquement appelée inégalité de Berry – Esseen, et la quantité ψ 0 est appelée la fraction de Lyapunov du troisième ordre. De plus, dans le cas où les sommations X 1 , ..., X n ont des distributions identiques

et ainsi les bornes énoncées par les inégalités (1), (2) et (3) coïncident indépendamment de la constante.

Concernant C 0 , évidemment, la borne inférieure établie par Esseen (1956) reste valable:

Les limites supérieures de C 0 ont ensuite été abaissées de l'estimation originale de 7,59 en raison d' Esseen (1942) à (compte tenu des résultats récents uniquement) 0,9051 en raison de Zolotarev (1967) , 0,7975 en raison de van Beek (1972) , 0,7915 en raison de Shiganov (1986 ) , 0,6379 et 0,5606 dus à Tyurin (2009) et Tyurin (2010) . En 2011, la meilleure estimation est de 0,5600 obtenue par Shevtsova (2010) .

Version multidimensionnelle

Comme pour le théorème de la limite centrale multidimensionnelle , il existe une version multidimensionnelle du théorème de Berry – Esseen.

Soit des vecteurs aléatoires à valeurs indépendantes, chacun ayant une moyenne de zéro. Ecrire et supposer est inversible. Soit une Gaussienne -dimensionnelle avec la même matrice de moyenne et de covariance que . Alors pour tous les ensembles convexes ,

,

où est une constante universelle et (la troisième puissance de la norme L 2 ).

La dépendance vis-à-vis de est supposée optimale, mais pourrait ne pas l'être.

Voir également

Remarques

  1. ^ Puisque les variables aléatoires sont distribuées de manière identique, X 2 , X 3 , ... ont toutes les mêmes moments que X 1 .

Les références

  • Berry, Andrew C. (1941). "La Précision de l'Approximation Gaussienne à la Somme des Variantes Indépendantes" . Transactions de l'American Mathematical Society . 49 (1): 122-136. doi : 10.1090 / S0002-9947-1941-0003498-3 . JSTOR   1990053 .
  • Durrett, Richard (1991). Probabilité: théorie et exemples . Pacific Grove, Californie: Wadsworth et Brooks / Cole. ISBN   0-534-13206-5 .
  • Esseen, Carl-Gustav (1942). "Sur la limite d'erreur de Liapunoff dans la théorie des probabilités". Arkiv pour Matematik, Astronomi et Fysik . A28 : 1–19. ISSN   0365-4133 .
  • Esseen, Carl-Gustav (1956). "Une inégalité de moment avec une application au théorème central limite". Skand. Aktuarietidskr . 39 : 160-170.
  • Feller, William (1972). Une introduction à la théorie des probabilités et ses applications, volume II (2e éd.). New York: John Wiley & Sons. ISBN   0-471-25709-5 .
  • Korolev, V. Yu .; Shevtsova, IG (2010a). "Sur la borne supérieure de la constante absolue dans l'inégalité Berry-Esseen". Théorie de la probabilité et ses applications . 54 (4): 638–658. doi : 10.1137 / S0040585X97984449 .
  • Korolev, Victor; Shevtsova, Irina (2010b). "Une amélioration de l'inégalité de Berry – Esseen avec des applications aux sommes aléatoires de Poisson et mixtes de Poisson". Journal actuariel scandinave . 2012 (2): 1–25. arXiv : 0912.2795 . doi : 10.1080 / 03461238.2010.485370 . S2CID   115164568 .
  • Manoukian, Edward B. (1986). Concepts et théorèmes modernes de la statistique mathématique . New York: Springer-Verlag. ISBN   0-387-96186-0 .
  • Serfling, Robert J. (1980). Théorèmes d'approximation de la statistique mathématique . New York: John Wiley & Sons. ISBN   0-471-02403-1 .
  • Shevtsova, IG (2008). "Sur la constante absolue dans l'inégalité Berry-Esseen". Collection d'articles de jeunes scientifiques de la Faculté de mathématiques computationnelles et de cybernétique (5): 101-110.
  • Shevtsova, Irina (2007). "Aiguisage de la borne supérieure de la constante absolue dans l'inégalité Berry-Esseen". Théorie de la probabilité et ses applications . 51 (3): 549–553. doi : 10.1137 / S0040585X97982591 .
  • Shevtsova, Irina (2010). "Une amélioration des estimations de taux de convergence dans le théorème de Lyapunov". Mathématiques Doklady . 82 (3): 862–864. doi : 10.1134 / S1064562410060062 . S2CID   122973032 .
  • Shevtsova, Irina (2011). "Sur les constantes absolues dans les inégalités de type Berry Esseen pour des sommets à distribution identique". arXiv : 1111,6554 [ math.PR ].
  • Shiganov, IS (1986). "Raffinement de la borne supérieure d'une constante dans le reste du terme du théorème de la limite centrale". Journal des mathématiques soviétiques . 35 (3): 109-115. doi : 10.1007 / BF01121471 . S2CID   120112396 .
  • Tyurin, IS (2009). "Sur la précision de l'approximation gaussienne". Mathématiques Doklady . 80 (3): 840–843. doi : 10.1134 / S1064562409060155 . S2CID   121383741 .
  • Tyurin, IS (2010). "Une amélioration des estimations supérieures des constantes dans le théorème de Lyapunov". Enquêtes mathématiques russes . 65 (3 (393)): 201-202. doi : 10.1070 / RM2010v065n03ABEH004688 .
  • van Beek, P. (1972). "Une application des méthodes de Fourier au problème de l'aggravation de l'inégalité Berry-Esseen". Zeitschrift für Wahrscheinlichkeitstheorie und Verwandte Gebiete . 23 (3): 187–196. doi : 10.1007 / BF00536558 . S2CID   121036017 .
  • Zolotarev, VM (1967). "Une aggravation de l'inégalité de Berry-Esseen". Zeitschrift für Wahrscheinlichkeitstheorie und Verwandte Gebiete . 8 (4): 332–342. doi : 10.1007 / BF00531598 . S2CID   122347713 .

Liens externes