En statistique , le théorème de Fisher-Tippett-Gnedenko (également le théorème de Fisher-Tippett ou le théorème des valeurs extrêmes ) est un résultat général de la théorie des valeurs extrêmes concernant la distribution asymptotique des statistiques d'ordre extrême . Le maximum d'un échantillon de variables aléatoires iid après renormalisation appropriée ne peut converger en distribution que vers l'une des 3 distributions possibles, la distribution de Gumbel , la distribution de Fréchet ou la distribution de Weibull . Le crédit pour le théorème des valeurs extrêmes et ses détails de convergence est attribué à Fréchet (1927), Ronald Fisher et Leonard Henry Caleb Tippett (1928), Mises (1936) et Gnedenko (1943).
Le rôle du théorème des types extrémaux pour les maxima est similaire à celui du théorème central limite pour les moyennes, sauf que le théorème central limite s'applique à la moyenne d'un échantillon de toute distribution à variance finie, tandis que le théorème de Fisher-Tippet-Gnedenko indique seulement que si la distribution d'un maximum normalisé converge, alors la limite doit appartenir à une classe particulière de distributions. Il n'indique pas que la distribution du maximum normalisé converge.
Déclaration
Soit une séquence de variables aléatoires indépendantes et identiquement distribuées avec une fonction de distribution cumulative . Supposons qu'il existe deux suites de nombres réels et telles que les limites suivantes convergent vers une fonction de distribution non dégénérée :
-
,
ou équivalent:
-
.
Dans de telles circonstances, la distribution limite appartient soit à la famille Gumbel , soit à la famille Fréchet, soit à la famille Weibull .
En d'autres termes, si la limite ci-dessus converge, nous aurons pris la forme :
ou sinon
pour certains paramètres Il s'agit de la fonction de distribution cumulative de la distribution généralisée des valeurs extrêmes (VGE) avec l' indice des valeurs extrêmes . La distribution GEV regroupe les distributions de Gumbel, Fréchet et Weibull en une seule. Notez que la deuxième formule (la distribution de Gumbel) est la limite de la première car elle tend vers zéro.
Conditions de convergence
Le théorème de Fisher-Tippett-Gnedenko est un énoncé sur la convergence de la distribution limite ci-dessus. L'étude des conditions de convergence vers des cas particuliers de la distribution généralisée des valeurs extrêmes a commencé avec Mises, R. (1936) et a été approfondie par Gnedenko, BV (1943).
Soit la fonction de distribution de , et un échantillon iid de celle-ci. Soit également le maximum de population, c'est-à-dire . La distribution limite du maximum d'échantillon normalisé, donnée par ci-dessus, sera alors :
- Une distribution de Fréchet ( ) si et seulement si et pour tout .
- Cela correspond à ce que l'on peut appeler une queue lourde . Dans ce cas, les séquences possibles qui satisferont les conditions du théorème sont et .
- Une distribution de Gumbel ( ), avec fini ou infini, si et seulement si pour tout avec .
- Les séquences possibles ici sont et .
- Une distribution de Weibull ( ) si et seulement si est finie et pour tout .
- Les séquences possibles ici sont et .
Exemples
Distribution Fréchet
Si on prend la distribution de Cauchy
la fonction de distribution cumulée est :
est asymptotique à ou
et nous avons
Ainsi nous avons
et laisser (et sauter quelques explications)
pour tout La valeur maximale attendue augmente donc linéairement avec n .
Distribution de Gumbel
Prenons la distribution normale avec fonction de distribution cumulative
Nous avons
et
Ainsi nous avons
Si nous définissons comme la valeur qui satisfait
puis autour
Au fur et à mesure que n augmente, cela devient une bonne approximation pour une plage de plus en plus large de ce qui nous permet de trouver que
On peut le voir et puis
le maximum devrait donc monter de plus en plus lentement vers l'infini.
Distribution de Weibull
On peut prendre l'exemple le plus simple, une distribution uniforme entre 0 et 1, avec fonction de distribution cumulative
-
de 0 à 1.
En approchant de 1 nous avons
Puis
Laissant nous avons
Le maximum attendu s'approche de 1 inversement proportionnellement à n .
Voir également
Remarques