Normalisation (statistiques) - Normalization (statistics)

Dans les statistiques et les applications des statistiques, la normalisation peut avoir plusieurs significations. Dans les cas les plus simples, la normalisation des évaluations signifie l'ajustement des valeurs mesurées sur différentes échelles à une échelle théoriquement commune, souvent avant de faire la moyenne. Dans des cas plus compliqués, la normalisation peut faire référence à des ajustements plus sophistiqués où l'intention est d'aligner toutes les distributions de probabilité des valeurs ajustées. Dans le cas de la normalisation des scores dans l'évaluation pédagogique, il peut y avoir une intention d'aligner les distributions sur une distribution normale . Une approche différente de la normalisation des distributions de probabilité est la normalisation des quantiles , où les quantiles des différentes mesures sont alignés.

Dans une autre utilisation des statistiques, la normalisation fait référence à la création de versions décalées et mises à l'échelle des statistiques, où l'intention est que ces valeurs normalisées permettent la comparaison des valeurs normalisées correspondantes pour différents ensembles de données d'une manière qui élimine les effets de certaines influences grossières, comme dans une série chronologique d'anomalies . Certains types de normalisation n'impliquent qu'une remise à l'échelle, pour arriver à des valeurs relatives à une variable de taille. En termes de niveaux de mesure , de tels ratios n'ont de sens que pour les mesures de ratio (où les ratios de mesures sont significatifs), pas les mesures d' intervalle (où seules les distances sont significatives, mais pas les ratios).

En statistique théorique, la normalisation paramétrique peut souvent conduire à des grandeurs pivots – des fonctions dont la distribution d'échantillonnage ne dépend pas des paramètres – et à des statistiques annexes – des grandeurs pivots qui peuvent être calculées à partir d'observations, sans connaître les paramètres.

Exemples

Il existe différents types de normalisations en statistiques - les rapports d'erreurs non dimensionnels, les résidus, les moyennes et les écarts-types , qui sont donc invariants à l'échelle - dont certains peuvent être résumés comme suit. Notez qu'en termes de niveaux de mesure , ces ratios n'ont de sens que pour les mesures de ratio (où les ratios de mesures sont significatifs), pas les mesures d' intervalle (où seules les distances sont significatives, mais pas les ratios). Voir aussi Catégorie:Ratios statistiques .

Nom Formule Utilisation
Note normalisée Erreurs de normalisation lorsque les paramètres de population sont connus. Fonctionne bien pour les populations qui sont normalement distribuées
La statistique t de Student l'écart de la valeur estimée d'un paramètre par rapport à sa valeur hypothétique, normalisée par son erreur type.
Résidu studentisé Normalisation des résidus lorsque les paramètres sont estimés, en particulier sur différents points de données dans l'analyse de régression .
Moment normalisé Moments de normalisation, en utilisant l'écart type comme mesure d'échelle.
Coefficient de
variation
Normaliser la dispersion, en utilisant la moyenne comme mesure d'échelle, en particulier pour les distributions positives telles que la distribution exponentielle et la distribution de Poisson .
Mise à l'échelle des fonctionnalités min-max La mise à l'échelle des caractéristiques est utilisée pour amener toutes les valeurs dans la plage [0,1]. C'est ce qu'on appelle aussi la normalisation basée sur l'unité. Cela peut être généralisé pour restreindre la plage de valeurs dans l'ensemble de données entre des points arbitraires et , en utilisant par exemple .

Notez que certains autres ratios, tels que le ratio variance/moyenne , sont également effectués pour la normalisation, mais ne sont pas adimensionnels : les unités ne s'annulent pas, et donc le ratio a des unités et n'est pas invariant à l'échelle.

Autres types

D'autres normalisations non dimensionnelles qui peuvent être utilisées sans hypothèse sur la distribution comprennent :

  • Attribution des centiles . Ceci est courant sur les tests standardisés. Voir aussi normalisation quantile .
  • Normalisation par addition et/ou multiplication par des constantes pour que les valeurs soient comprises entre 0 et 1. Ceci est utilisé pour les fonctions de densité de probabilité , avec des applications dans des domaines tels que la chimie physique pour attribuer des probabilités à | ψ | 2 .

Voir également

Les références