Théorème de Fisher-Tippett-Gnedenko - Fisher–Tippett–Gnedenko theorem

En statistique , le théorème de Fisher-Tippett-Gnedenko (également le théorème de Fisher-Tippett ou le théorème des valeurs extrêmes ) est un résultat général de la théorie des valeurs extrêmes concernant la distribution asymptotique des statistiques d'ordre extrême . Le maximum d'un échantillon de variables aléatoires iid après renormalisation appropriée ne peut converger en distribution que vers l'une des 3 distributions possibles, la distribution de Gumbel , la distribution de Fréchet ou la distribution de Weibull . Le crédit pour le théorème des valeurs extrêmes et ses détails de convergence est attribué à Fréchet (1927), Ronald Fisher et Leonard Henry Caleb Tippett (1928), Mises (1936) et Gnedenko (1943).

Le rôle du théorème des types extrémaux pour les maxima est similaire à celui du théorème central limite pour les moyennes, sauf que le théorème central limite s'applique à la moyenne d'un échantillon de toute distribution à variance finie, tandis que le théorème de Fisher-Tippet-Gnedenko indique seulement que si la distribution d'un maximum normalisé converge, alors la limite doit appartenir à une classe particulière de distributions. Il n'indique pas que la distribution du maximum normalisé converge.

Déclaration

Soit une séquence de variables aléatoires indépendantes et identiquement distribuées avec une fonction de distribution cumulative . Supposons qu'il existe deux suites de nombres réels et telles que les limites suivantes convergent vers une fonction de distribution non dégénérée : $X_{1},X_{2},\ldots ,X_{n}$ ${\style d'affichage F}$ $a_{n}>0$ $b_{n}\in \mathbb {R}$

\lim _{n\to \infty }P\left({\frac {\max\{X_{1},\dots ,X_{n}\}-b_{n}}{a_{n} }}\leq x\right)=G(x)

,

ou équivalent:

\lim _{n\to \infty }F^{n}\left(a_{n}x+b_{n}\right)=G(x)

.

Dans de telles circonstances, la distribution limite appartient soit à la famille Gumbel , soit à la famille Fréchet, soit à la famille Weibull . ${\style d'affichage G}$

En d'autres termes, si la limite ci-dessus converge, nous aurons pris la forme : ${\style d'affichage G(x)}$

G_{\gamma }(x)=\exp \left(-(1+\gamma \,x)^{-1/\gamma }\right),\;\;1+\gamma \,x_ {a,b}>0

ou sinon

G_{0}(x)=\exp \left(-\exp(-x)\right)

pour certains paramètres Il s'agit de la fonction de distribution cumulative de la distribution généralisée des valeurs extrêmes (VGE) avec l' indice des valeurs extrêmes . La distribution GEV regroupe les distributions de Gumbel, Fréchet et Weibull en une seule. Notez que la deuxième formule (la distribution de Gumbel) est la limite de la première car elle tend vers zéro. $\gamma .$ ${\style d'affichage \gamma }$ ${\style d'affichage \gamma }$

Conditions de convergence

Le théorème de Fisher-Tippett-Gnedenko est un énoncé sur la convergence de la distribution limite ci-dessus. L'étude des conditions de convergence vers des cas particuliers de la distribution généralisée des valeurs extrêmes a commencé avec Mises, R. (1936) et a été approfondie par Gnedenko, BV (1943). ${\style d'affichage G(x)}$ ${\style d'affichage G}$

Soit la fonction de distribution de , et un échantillon iid de celle-ci. Soit également le maximum de population, c'est-à-dire . La distribution limite du maximum d'échantillon normalisé, donnée par ci-dessus, sera alors : ${\style d'affichage F}$ ${\style d'affichage X}$ $X_{1},\dots ,X_{n}$ ${\style d'affichage x^{*}}$ $x^{*}=\sup\{x\mid F(x)<1\}$ ${\style d'affichage G}$

Une distribution de Fréchet ( ) si et seulement si et pour tout . $\gamma >0$ $x^{*}=\infty$ $\lim _{t\rightarrow \infty }{\frac {1-F(ut)}{1-F(t)}}=u^{-1/|\gamma |}$ ${\style d'affichage u>0}$

Cela correspond à ce que l'on peut appeler une queue lourde . Dans ce cas, les séquences possibles qui satisferont les conditions du théorème sont et .

{\style d'affichage b_{n}=0}

a_{n}=F^{-1}\left(1-{\frac {1}{n}}\right)

Une distribution de Gumbel ( ), avec fini ou infini, si et seulement si pour tout avec . ${\style d'affichage \gamma =0}$ ${\style d'affichage x^{*}}$ $\lim _{t\rightarrow 0^{-}}{\frac {1-F(t+uf(t))}{1-F(t)}}=e^{-u}$ ${\style d'affichage u>0}$ $f(t):={\frac {\int _{t}^{x^{*}}1-F(s)ds}{1-F(t)}}$

Les séquences possibles ici sont et .

b_{n}=F^{-1}\left(1-{\frac {1}{n}}\right)

a_{n}=f\left(F^{-1}\left(1-{\frac {1}{n}}\right)\right)

Une distribution de Weibull ( ) si et seulement si est finie et pour tout . ${\style d'affichage \gamma <0}$ ${\style d'affichage x^{*}}$ $\lim _{t\rightarrow 0^{+}}{\frac {1-F(x^{*}-ut)}{1-F(x^{*}-t)}}=u ^{1/|\gamma |}$ ${\style d'affichage u>0}$

Les séquences possibles ici sont et .

b_{n}=x^{*}

a_{n}=x^{*}-F^{-1}\left(1-{\frac {1}{n}}\right)

Exemples

Distribution Fréchet

Si on prend la distribution de Cauchy

f(x)=(\pi ^{2}+x^{2})^{-1}

la fonction de distribution cumulée est :

F(x)=1/2+{\frac {1}{\pi }}\arctan(s/\pi )

${\style d'affichage 1-F(x)}$ est asymptotique à ou ${\style d'affichage 1/x,}$

{\style d'affichage \ln F(x)\sim -1/x}

et nous avons

\ln F(x)^{n}=-n\ln F(x)\sim -n/x.

Ainsi nous avons

F(x)^{n}\approx \exp(-n/x)

et laisser (et sauter quelques explications) ${\style d'affichage u=x/n-1}$

\lim _{n\to \infty }F(nu+n)^{n}=\exp(-(1+u)^{-1})=G_{1}(u)

pour tout La valeur maximale attendue augmente donc linéairement avec $n$ . $u.$

Distribution de Gumbel

Prenons la distribution normale avec fonction de distribution cumulative

F(x)={\frac {1}{2}}{\text{erfc}}(-x/{\sqrt {2}}).

Nous avons

\ln F(x)\sim -{\frac {\exp(-x^{2}/2)}{{\sqrt {2\pi }}x}}

et

\ln F(x)^{n}=-n\ln F(x)\sim -{\frac {n\exp(-x^{2}/2)}{{\sqrt {2\ pi }}x}}.

Ainsi nous avons

F(x)^{n}\approx \exp \left(-{\frac {n\exp(-x^{2}/2)}{{\sqrt {2\pi }}x}} \droit).

Si nous définissons comme la valeur qui satisfait ${\style d'affichage b_{n}}$

{\frac {n\exp(-b_{n}^{2}/2)}{{\sqrt {2\pi }}b_{n}}}=1

puis autour ${\style d'affichage x=b_{n}}$

{\frac {n\exp(-x^{2}/2)}{{\sqrt {2\pi }}x}}\approx \exp(b_{n}(b_{n}-x )).

Au fur et à mesure que $n$ augmente, cela devient une bonne approximation pour une plage de plus en plus large de ce qui nous permet de trouver que ${\style d'affichage b_{n}(b_{n}-x)}$ $u=b_{n}(b_{n}-x)$