Moyenne arithmétique - Arithmetic mean


Un article de Wikipédia, l'encyclopédie libre

En mathématiques et statistiques , la moyenne arithmétique ( / ˌ æ r ɪ & thetav m ɛ t ɪ k m Ï n / , le stress sur la troisième syllabe de « arithmétique »), ou simplement la moyenne ou moyenne lorsque le contexte est clair, est la somme d'un ensemble de nombres , divisé par le nombre de chiffres dans la collection. La collection est souvent un ensemble de résultats d'une expérience ou d' une étude d' observation , ou souvent un ensemble de résultats d'une enquête . Le terme « moyenne arithmétique » est préféré dans certains contextes en mathématiques et statistiques , car il aide à distinguer d'autres moyens , comme la moyenne géométrique et la moyenne harmonique .

En plus des mathématiques et des statistiques, la moyenne arithmétique est fréquemment utilisé dans de nombreux domaines divers tels que l' économie , l' anthropologie et l' histoire , et il est utilisé dans presque tous les domaines universitaires dans une certaine mesure. Par exemple, le revenu par habitant est le revenu moyen arithmétique de la population d'une nation.

Alors que la moyenne arithmétique est souvent utilisé pour signaler les tendances centrales , ce n'est pas une statistique robuste , ce qui signifie qu'elle est fortement influencée par les valeurs aberrantes (valeurs qui sont très grandes ou plus petites que la plupart des valeurs). En particulier, pour les distributions asymétriques , comme la répartition des revenus pour lesquels quelques revenus des gens sont beaucoup plus importants que la plupart des gens, plus la moyenne arithmétique peut ne pas coïncider avec sa notion de « milieu », et des statistiques robustes, telles que la médiane , peut - être une meilleure description de la tendance centrale.

Définition

La moyenne arithmétique (ou moyenne ou moyenne ), (lu bar ), est la moyenne des valeurs .

La moyenne arithmétique est le plus couramment utilisé et mesure facilement compris la tendance centrale dans un ensemble de données . Dans les statistiques, la moyenne à long terme fait référence à l' une des mesures de tendance centrale. La moyenne arithmétique d'un ensemble de données observées est définie comme étant égale à la somme des valeurs numériques de chaque observation divisé par le nombre total d'observations. Symbolique, si nous avons un ensemble de données comprenant les valeurs , la moyenne arithmétique est défini par la formule:

(Voir sommation pour une explication de l' opérateur de sommation ).

Par exemple, considérons le salaire mensuel de 10 employés d'une entreprise: 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. La moyenne arithmétique est

Si l'ensemble de données est une population statistique (c. -à-se compose de toutes les observations possibles et non pas seulement un sous - ensemble d'entre eux), la moyenne de cette population est appelée la population moyenne . Si l'ensemble de données est un échantillon statistique (un sous - ensemble de la population), nous appelons la statistique résultant de ce calcul un échantillon moyenne .

propriétés motivants

La moyenne arithmétique a plusieurs propriétés qui le rendent utile, en particulier en tant que mesure de la tendance centrale. Ceux-ci inclus:

  • Si les chiffres ont dire , alors . Depuis la distance d'un nombre donné à la moyenne, une façon d'interpréter cette propriété est aussi dire que les chiffres à gauche de la moyenne sont équilibrés par les chiffres à la droite de la moyenne. La moyenne est le seul numéro unique pour lequel les résidus (écarts par rapport à l'estimation) Somme à zéro.
  • S'il est nécessaire d'utiliser un seul numéro comme une valeur « typique » pour un ensemble de nombres connus , la moyenne arithmétique des chiffres fait ce meilleur, au sens de minimiser la somme des carrés des écarts de la valeur typique: la somme de . (Il en résulte que la moyenne d' échantillon est également le meilleur prédicteur dans le sens d'avoir la plus faible erreur quadratique moyenne .) Si la moyenne arithmétique d'une population de nombres est souhaitée, l'estimation de celui - ci qui est impartiale est la moyenne arithmétique d'un échantillon tiré de la population.

Le contraste avec la médiane

La moyenne arithmétique peut être comparée à la médiane. La médiane est définie de telle sorte que pas plus de la moitié des valeurs sont plus grandes que, et pas plus de la moitié sont plus petites que, la médiane. Si des éléments dans les données augmentent arithmétiquement , lorsqu'ils sont placés dans un certain ordre, puis la médiane et la moyenne arithmétique sont égaux. Par exemple, considérons l'échantillon de données . La moyenne est , comme la médiane. Cependant, lorsque l' on considère un échantillon qui ne peut être agencé de manière à augmenter arithmétiquement, tels que , la médiane et la moyenne arithmétique peuvent différer de manière significative. Dans ce cas, la moyenne arithmétique est de 6,2 et la médiane est 4. En général, la valeur moyenne peut varier de manière significative de la plupart des valeurs de l'échantillon, et peut être plus ou moins que la plupart d'entre eux.

Il y a des applications de ce phénomène dans de nombreux domaines. Par exemple, depuis les années 1980, le revenu médian aux États-Unis a augmenté plus lentement que la moyenne arithmétique des revenus.

généralisations

Moyenne pondérée

Une moyenne pondérée ou moyenne pondérée, est en moyenne dans laquelle certains points de données comptent plus que d' autres, en ce sens qu'ils ont plus de poids dans le calcul. Par exemple, la moyenne arithmétique et est , ou de manière équivalente . En revanche, une pondérée moyenne dans laquelle le premier numéro reçoit, par exemple, deux fois plus de poids que la seconde (peut - être parce qu'il est supposé apparaître deux fois plus souvent dans la population générale à partir de laquelle ces chiffres ont été prélevés) serait calculé comme . Ici , les poids, somme nécessairement à la valeur un, sont et , le premier étant deux fois celui - ci. Notez que la moyenne arithmétique (parfois appelée la « moyenne non pondérée » ou « moyenne également pondérée ») peut être interprété comme un cas particulier d'une moyenne pondérée dans laquelle tous les poids sont égaux les uns aux autres (égale à Dans l'exemple ci - dessus, et égale à une situation chiffres étant en moyenne).

les distributions de probabilité continues

Comparaison de deux distributions log-normale avec la même moyenne mais différents dissymétrie , ce qui entraîne différents médianes et les modes .

Si une propriété numérique, et tout échantillon de données qu'il contient , pourrait prendre une valeur à partir d' une plage continue, au lieu, par exemple, à des entiers, alors la probabilité d'un nombre se situant dans une plage de valeurs possibles peuvent être décrites en intégrant une distribution de probabilité continue dans cette gamme, même si la probabilité naïve pour un certain nombre d'échantillons prenant une certaine valeur de plusieurs infiniment est égal à zéro. L'analogue d'une moyenne pondérée dans le présent contexte, dans lequel il existe un nombre infini de possibilités pour la valeur précise de la variable dans chaque plage, est appelée la moyenne de la distribution de probabilité . Une distribution de probabilité la plus largement rencontrée est appelée la distribution normale ; il a la propriété que toutes les mesures de la tendance centrale, y compris non seulement la moyenne , mais aussi la médiane précitée et le mode de (les trois M de), sont égaux entre eux. Cette égalité ne tient pas pour d' autres distributions de probabilités, comme l' illustre la distribution log - normale ici.

angles

Il faut prendre un soin particulier lors de l' utilisation des données cycliques, comme les phases ou les angles . En prenant la moyenne arithmétique naïve de 1 ° et 359 ° donne un résultat de 180 °. Ceci est incorrect pour deux raisons:

  • Tout d' abord, des mesures d'angle ne sont définies à une constante additive de 360 ° (ou 2π, si la mesure en radians ). Ainsi , on pourrait aussi facilement appeler ces 1 ° et -1 ° ou 361 ° et 719 °, dont chacun donne une moyenne différente.
  • D' autre part, dans ce cas, 0 ° ( de façon équivalente, 360 °) est géométriquement une meilleure moyenne valeur: il est plus faible dispersion à ce sujet (les points sont tous deux à 1 ° par rapport à elle, et 179 ° par 180 °, la moyenne putatif).

En application générale, une telle surveillance conduira à la valeur moyenne mobile artificiellement vers le milieu de la plage numérique. Une solution à ce problème consiste à utiliser la formulation d'optimisation ( à savoir. , Définir la moyenne en tant que point central: le point sur lequel on a la dispersion la plus faible), et redéfinir la différence en tant que distance modulaire ( à savoir, la distance sur le cercle : si la distance modulaire entre 1 ° et 359 ° est de 2 °, et non pas 358 °).

Symboles et encodage

La moyenne arithmétique est souvent notée par une barre, par exemple comme dans (lu bar ).

Certains logiciels ( processeurs de texte , les navigateurs Web ) ne peut pas afficher le symbole correctement x¯. Par exemple, le symbole X en HTML est en fait une combinaison de deux codes - la lettre de base x plus un code pour la ligne ci - dessus (& # 772: ou ¯).

Dans certains textes, comme pdfs , le symbole peut être remplacé x¯ par un cent (¢) symbole ( Unicode & # 162) lorsqu'il est copié vers le processeur de texte tel que Microsoft Word .

Voir également

Références

Pour en savoir plus

Liens externes