Écart quadratique moyen - Root-mean-square deviation

L' écart quadratique moyen ( RMSD ) ou l' erreur quadratique moyenne ( RMSE ) est une mesure fréquemment utilisée des différences entre les valeurs (valeurs d'échantillon ou de population) prédites par un modèle ou un estimateur et les valeurs observées. Le RMSD représente la racine carrée du deuxième moment d'échantillonnage des différences entre les valeurs prédites et les valeurs observées ou la moyenne quadratique de ces différences. Ces écarts sont appelés résidus lorsque les calculs sont effectués sur l'échantillon de données utilisé pour l'estimation et sont appelés erreurs (ou erreurs de prédiction) lorsqu'ils sont calculés hors échantillon. Le RMSD sert à agréger les amplitudes des erreurs dans les prédictions pour divers points de données en une seule mesure de la puissance prédictive. Le RMSD est une mesure de précision , pour comparer les erreurs de prévision de différents modèles pour un ensemble de données particulier et non entre des ensembles de données, car il dépend de l'échelle.

Le RMSD est toujours non négatif, et une valeur de 0 (presque jamais atteinte dans la pratique) indiquerait un ajustement parfait aux données. En général, un RMSD inférieur est meilleur qu'un RMSD supérieur. Cependant, les comparaisons entre différents types de données seraient invalides car la mesure dépend de l'échelle des nombres utilisés.

RMSD est la racine carrée de la moyenne des erreurs au carré. L'effet de chaque erreur sur le RMSD est proportionnel à la taille de l'erreur au carré ; ainsi, des erreurs plus importantes ont un effet disproportionné sur le RMSD. Par conséquent, RMSD est sensible aux valeurs aberrantes.

Formule

La RMSD d'un estimateur par rapport à un paramètre estimé est définie comme la racine carrée de l' erreur quadratique moyenne :

Pour un estimateur sans biais , le RMSD est la racine carrée de la variance, appelée écart type .

Le RMSD des valeurs prédites pour les temps t d'une variable dépendante d'une régression avec des variables observées sur T temps, est calculé pour T différentes prédictions comme la racine carrée de la moyenne des carrés des écarts :

(Pour les régressions sur données transversales , l'indice t est remplacé par i et T est remplacé par n .)

Dans certaines disciplines, le RMSD est utilisé pour comparer les différences entre deux choses qui peuvent varier, dont aucune n'est acceptée comme la « norme ». Par exemple, lors de la mesure de la différence moyenne entre deux séries temporelles et , la formule devient

Normalisation

La normalisation du RMSD facilite la comparaison entre des ensembles de données ou des modèles à différentes échelles. Bien qu'il n'y ait pas de moyen de normalisation cohérent dans la littérature, les choix courants sont la moyenne ou la plage (définie comme la valeur maximale moins la valeur minimale) des données mesurées :

ou .

Cette valeur est communément appelée écart ou erreur quadratique moyenne normalisée (NRMSD ou NRMSE), et souvent exprimée en pourcentage, où des valeurs inférieures indiquent moins de variance résiduelle. Dans de nombreux cas, en particulier pour les échantillons plus petits, la gamme d'échantillons est susceptible d'être affectée par la taille de l'échantillon, ce qui entraverait les comparaisons.

Une autre méthode possible pour faire du RMSD une mesure de comparaison plus utile consiste à diviser le RMSD par l' intervalle interquartile . Lors de la division du RMSD avec l'IQR, la valeur normalisée devient moins sensible aux valeurs extrêmes de la variable cible.

avec et où CDF −1 est la fonction quantile .

Lors de la normalisation par la valeur moyenne des mesures, le terme coefficient de variation du RMSD, CV(RMSD) peut être utilisé pour éviter toute ambiguïté. Ceci est analogue au coefficient de variation avec le RMSD prenant la place de l' écart type .

Erreur absolue moyenne

Certains chercheurs ont recommandé l'utilisation de l' erreur absolue moyenne (MAE) au lieu de la déviation quadratique moyenne. Le MAE possède des avantages en termes d'interprétabilité par rapport au RMSD. MAE est la moyenne des valeurs absolues des erreurs. La MAE est fondamentalement plus facile à comprendre que la racine carrée de la moyenne des erreurs au carré. De plus, chaque erreur influence la MAE en proportion directe de la valeur absolue de l'erreur, ce qui n'est pas le cas pour RMSD.

Applications

Voir également

Les références

  1. ^ Hyndman, Rob J.; Koehler, Anne B. (2006). "Un autre regard sur les mesures de l'exactitude des prévisions". Journal international de prévision . 22 (4) : 679-688. CiteSeerX  10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
  2. ^ un b Ponce, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). « Composants d'informations pour la comparaison de résolutions multiples entre des cartes qui partagent une variable réelle ». Statistiques écologiques environnementales . 15 (2) : 111-142. doi : 10.1007/s10651-007-0043-y .
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). « Sur l'utilisation de mesures d'erreur dimensionnées pour évaluer les performances des interpolateurs spatiaux ». Revue internationale des sciences de l'information géographique . 20 : 89-102. doi : 10.1080/13658810500286976 .
  4. ^ "Coastal Inlets Research Program (CIRP) Wiki - Statistics" . Consulté le 4 février 2015 .
  5. ^ "FAQ : Quel est le coefficient de variation ?" . Consulté le 19 février 2019 .
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). « Mesures d'erreur pour la généralisation des méthodes de prévision : comparaisons empiriques » (PDF) . Journal international de prévision . 8 (1) : 69-80. CiteSeerX  10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
  7. ^ Anderson, député; Woessner, WW (1992). Modélisation appliquée des eaux souterraines : simulation de l'écoulement et du transport adventif (2e éd.). Presse académique.
  8. ^ Modèle de réseau de neurones d'ensemble
  9. ^ ANSI/BPI-2400-S-2012 : Pratique standard pour la qualification normalisée des prévisions d'économies d'énergie dans toute la maison par étalonnage en fonction de l'historique de la consommation d'énergie