Gamme (statistiques) - Range (statistics)

Dans les statistiques , la plage d'un ensemble de données est la différence entre les valeurs les plus grandes et les plus petites. La différence ici est spécifique, la plage d'un ensemble de données est le résultat de la soustraction du maximum et du minimum de l' échantillon .

Cependant, en statistique descriptive , cette notion d'étendue a un sens plus complexe. La plage est la taille du plus petit intervalle (statistiques) qui contient toutes les données et fournit une indication de la dispersion statistique . Il est mesuré dans les mêmes unités que les données. Puisqu'il ne dépend que de deux des observations, il est très utile pour représenter la dispersion de petits ensembles de données.

Pour les variables aléatoires IID continues

Pour n variables aléatoires continues indépendantes et identiquement distribuées X 1 , X 2 , ..., X n avec fonction de distribution cumulative G( x ) et fonction de densité de probabilité g( x ). Soit T l'étendue d'un échantillon de taille n d'une population de fonction de distribution G ( x ).

Distribution

La plage a une fonction de distribution cumulative

Gumbel note que "la beauté de cette formule est complètement entachée par le fait que, en général, on ne peut pas exprimer G ( x  +  t ) par G ( x ), et que l'intégration numérique est longue et fastidieuse".

Si la distribution de chaque X i est limitée à droite (ou à gauche) alors la distribution asymptotique de la plage est égale à la distribution asymptotique de la plus grande (plus petite) valeur. Pour des distributions plus générales, la distribution asymptotique peut être exprimée comme une fonction de Bessel .

Des moments

La gamme moyenne est donnée par

x ( G ) est la fonction inverse. Dans le cas où chacun des X i a une distribution normale standard , la plage moyenne est donnée par

Pour les variables aléatoires continues non IID

Pour n variables aléatoires continues indépendantes distribuées de manière non identique X 1 , X 2 , ..., X n avec des fonctions de distribution cumulative G 1 ( x ), G 2 ( x ), ..., G n ( x ) et des fonctions de densité de probabilité g 1 ( x ), g 2 ( x ), ..., g n ( x ), la plage a une fonction de distribution cumulative

Pour les variables aléatoires IID discrètes

Pour n variables aléatoires discrètes indépendantes et identiquement distribuées X 1 , X 2 , ..., X n avec une fonction de distribution cumulative G ( x ) et une fonction de masse de probabilité g ( x ) la plage des X i est la plage d'un échantillon de taille n à partir d'une population avec une fonction de distribution G ( x ). On peut supposer sans perte de généralité que le support de chaque X i est {1,2,3,..., N } où N est un entier positif ou l'infini.

Distribution

La plage a une fonction de masse de probabilité

Exemple

Si nous supposons que g ( x ) = 1/ N , la distribution uniforme discrète pour tout x , alors nous trouvons

Dérivation

La probabilité d'avoir une valeur de plage spécifique, t , peut être déterminée en additionnant les probabilités d'avoir deux échantillons différant de t , et chaque autre échantillon ayant une valeur entre les deux extrêmes. La probabilité qu'un échantillon ait une valeur de x est . La probabilité qu'un autre ait une valeur t supérieure à x est :

La probabilité que toutes les autres valeurs se situent entre ces deux extrêmes est :

La combinaison des trois donne :

Quantités associées

La gamme est un exemple spécifique de statistiques de commandes . En particulier, la plage est une fonction linéaire des statistiques d'ordre, ce qui la fait entrer dans le cadre de la L-estimation .

Voir également

Les références