Moyenne interquartile - Interquartile mean

La moyenne interquartile (IQM) (ou moyenne moyenne ) est une mesure statistique de la tendance centrale basée sur la moyenne tronquée de l' intervalle interquartile . L'IQM est très similaire à la méthode de notation utilisée dans les sports qui sont évalués par un jury: écarter les scores les plus bas et les plus élevés; calculer la valeur moyenne des scores restants .

Calcul

Dans le calcul de l'IQM, seules les données comprises entre le premier et le troisième quartile sont utilisées, et les 25% les plus bas et les 25% les plus élevés des données sont rejetés.

en supposant que les valeurs ont été ordonnées.

Exemples

Taille de l'ensemble de données divisible par quatre

La méthode est mieux expliquée par un exemple. Considérez l'ensemble de données suivant:

5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6

Triez d'abord la liste du plus bas au plus élevé:

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

Il y a 12 observations (points de données) dans l'ensemble de données, donc nous avons 4 quartiles de 3 nombres. Ignorez les 3 valeurs les plus basses et les plus élevées:

1, 3, 4 , 5, 6, 6, 7, 7, 8, 8, 9, 38

Nous avons maintenant 6 des 12 observations restantes; ensuite, nous calculons la moyenne arithmétique de ces nombres:

x IQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6,5

C'est la moyenne interquartile.

À titre de comparaison, la moyenne arithmétique de l'ensemble de données d'origine est

(5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8,5

en raison de la forte influence de la valeur aberrante, 38.

La taille de l'ensemble de données n'est pas divisible par quatre

L'exemple ci-dessus consistait en 12 observations dans l'ensemble de données, ce qui a rendu la détermination des quartiles très facile. Bien entendu, tous les ensembles de données n'ont pas un nombre d'observations divisible par 4. Nous pouvons ajuster la méthode de calcul de l'IQM pour tenir compte de cela. Donc, idéalement, nous voulons que l'IQM soit égal à la moyenne des distributions symétriques, par exemple:

1, 2, 3, 4, 5

a une valeur moyenne x moyenne = 3, et comme il s'agit d'une distribution symétrique, x IQM = 3 serait souhaitable.

Nous pouvons résoudre ce problème en utilisant une moyenne pondérée des quartiles et du jeu de données interquartile:

Considérez l'ensemble de données suivant de 9 observations:

1, 3, 5, 7, 9, 11, 13, 15, 17

Il y a 9/4 = 2,25 observations dans chaque quartile et 4,5 observations dans l'intervalle interquartile. Tronquez la taille du quartile fractionnaire et supprimez ce nombre des 1er et 4e quartiles (2,25 observations dans chaque quartile, donc le 2 le plus bas et le 2 le plus élevé sont supprimés).

1, 3 , (5), 7, 9, 11, (13), 15, 17

Ainsi, il y a 3 observations complètes dans l'intervalle interquartile et 2 observations fractionnaires. Puisque nous avons un total de 4,5 observations dans l'intervalle interquartile, les deux observations fractionnaires comptent chacune pour 0,75 (et donc 3 × 1 + 2 × 0,75 = 4,5 observations).

L'IQM est maintenant calculé comme suit:

x IQM = {(7 + 9 + 11) + 0,75 × (5 + 13)} / 4,5 = 9

Dans l'exemple ci-dessus, la moyenne a une valeur x moyenne = 9. Identique à l'IQM, comme prévu. La méthode de calcul de l'IQM pour un nombre quelconque d'observations est analogue; les contributions fractionnaires à l'IQM peuvent être de 0, 0,25, 0,50 ou 0,75.

Comparaison avec la moyenne et la médiane

La moyenne interquartile partage certaines propriétés de la moyenne et de la médiane :

  • Comme la médiane , l'IQM est insensible aux valeurs aberrantes ; dans l'exemple donné, la valeur la plus élevée (38) était une valeur aberrante évidente de l'ensemble de données, mais sa valeur n'est pas utilisée dans le calcul de l'IQM. En revanche, la moyenne commune (la moyenne arithmétique ) est sensible à ces valeurs aberrantes: x moyenne = 8,5.
  • Comme la moyenne , l'IQM est un paramètre distinct, basé sur un grand nombre d'observations de l'ensemble de données. La médiane est toujours égale à l' une des observations de l'ensemble de données (en supposant un nombre impair d'observations). La moyenne peut être égale à n'importe quelle valeur entre l'observation la plus basse et la plus élevée, selon la valeur de toutes les autres observations. L'IQM peut être égal à n'importe quelle valeur entre le premier et le troisième quartiles, en fonction de toutes les observations dans l'intervalle interquartile.

Voir également

Statistiques connexes

Applications

  • London Interbank Offered Rate estime un taux d'intérêt de référence comme la moyenne interquartile des taux proposés par plusieurs banques.
  • Everything2 utilise la moyenne interquartile des réputations des écritures d'un utilisateur pour déterminer la qualité de la contribution de l'utilisateur. [1]