Test de Dunnett - Dunnett's test

En statistique , le test de Dunnett est une procédure de comparaison multiple développée par le statisticien canadien Charles Dunnett pour comparer chacun des traitements avec un seul contrôle. Les comparaisons multiples à un contrôle sont également appelées comparaisons plusieurs à un.

Histoire

Le test de Dunnett a été développé en 1955; un tableau actualisé des valeurs critiques a été publié en 1964.

Problème de comparaisons multiples

Le problème des comparaisons multiples, de la multiplicité ou des tests multiples survient lorsque l'on considère simultanément un ensemble d'inférences statistiques ou en déduit un sous-ensemble de paramètres sélectionnés en fonction des valeurs observées. Le problème majeur dans toute discussion sur les procédures de comparaison multiple est la question de la probabilité d'erreurs de type I. La plupart des différences entre les techniques alternatives résultent d'approches différentes de la question de savoir comment contrôler ces erreurs. Le problème est en partie technique; mais il s'agit en réalité beaucoup plus d'une question subjective de savoir comment vous voulez définir le taux d'erreur et à quel point vous êtes prêt à laisser le taux d'erreur maximal possible. Les tests de Dunnett sont bien connus et largement utilisés dans la procédure de comparaison multiple pour comparer simultanément, par estimation d'intervalle ou test d'hypothèse, tous les traitements actifs avec un contrôle lors de l'échantillonnage à partir d'une distribution où l'hypothèse de normalité est raisonnable. Le test de Dunnett est conçu pour maintenir le taux d'erreur familial égal ou inférieur lors de la réalisation de comparaisons multiples du groupe de traitement avec le contrôle.

Utilisations du test de Dunnett

Le travail original sur le problème des comparaisons multiples a été réalisé par Tukey et Scheffé . Leur méthode était générale, qui considérait toutes sortes de comparaisons par paires. Les méthodes de Tukey et Scheffé permettent un nombre quelconque de comparaisons parmi un ensemble de moyennes d'échantillons. D'autre part, le test de Dunnett ne compare qu'un groupe avec les autres, traitant un cas particulier de problème de comparaisons multiples - des comparaisons par paires de plusieurs groupes de traitement avec un seul groupe témoin. Dans le cas général, où nous comparons chacune des paires, nous faisons des comparaisons (où k est le nombre de groupes), mais dans le cas traitement vs témoins, nous ne ferons que des comparaisons. Si dans le cas des groupes de traitement et de contrôle nous devions utiliser les méthodes plus générales de Tukey et Scheffé, elles peuvent entraîner des intervalles de confiance inutilement larges. Le test de Dunnett prend en considération la structure spéciale de comparaison du traitement au contrôle, ce qui donne des intervalles de confiance plus étroits. Il est très courant d'utiliser le test de Dunnett dans des expériences médicales, par exemple en comparant les mesures de la formule sanguine sur trois groupes d'animaux, dont l'un servait de contrôle tandis que les deux autres étaient traités avec deux médicaments différents. Une autre utilisation courante de cette méthode est chez les agronomes: les agronomes peuvent vouloir étudier l'effet de certains produits chimiques ajoutés au sol sur le rendement des cultures, ils laisseront donc certaines parcelles non traitées (parcelles témoins) et les compareront aux parcelles où des produits chimiques ont été ajoutés. le sol (parcelles de traitement).

Description officielle du test de Dunnett

Le test de Dunnett est effectué en calculant une statistique t de Student pour chaque groupe expérimental ou de traitement, où la statistique compare le groupe de traitement à un seul groupe témoin. Puisque chaque comparaison a le même contrôle en commun, la procédure incorpore les dépendances entre ces comparaisons. En particulier, les statistiques t sont toutes dérivées de la même estimation de la variance d'erreur qui est obtenue en regroupant les sommes des carrés pour l'erreur dans tous les groupes (de traitement et de contrôle). La statistique de test formelle pour le test de Dunnett est soit la plus grande en valeur absolue de ces statistiques t (si un test bilatéral est requis), soit la plus négative ou la plus positive des statistiques t (si un test unilatéral est obligatoire).

Dans le test de Dunnett nous pouvons utiliser une table commune des valeurs critiques, mais des options plus flexibles sont aujourd'hui facilement disponibles dans de nombreux logiciels statistiques tels que R . Les valeurs critiques pour tout point de pourcentage donné dépendent: du fait qu'un test unilatéral ou bilatéral est effectué; le nombre de groupes comparés; le nombre total d’essais.

Hypothèses

L'analyse considère le cas où les résultats de l'expérience sont numériques, et l'expérience est réalisée pour comparer p traitements avec un groupe témoin. Les résultats peuvent être résumés comme un ensemble de moyennes calculées des ensembles d'observations, tout en faisant référence au traitement et en faisant référence à l'ensemble d'observations de contrôle, et constituent une estimation indépendante de l'écart-type commun de tous les ensembles d'observations. Tous les ensembles d'observations sont supposés être indépendamment et normalement distribués avec une variance et des moyennes communes . Il existe également une hypothèse selon laquelle il existe une estimation disponible pour .

Calcul

Le calcul du test de Dunnett est une procédure basée sur le calcul des déclarations de confiance concernant les valeurs vraies ou attendues des différences , donc les différences entre la moyenne des groupes de traitement et la moyenne du groupe témoin. Cette procédure assure que la probabilité de tous les états étant simultanément correcte est égale à une valeur spécifiée, . Lors du calcul de l' intervalle de confiance unilatéral supérieur (ou inférieur) pour la valeur réelle de la différence entre la moyenne du traitement et le groupe témoin , constitue la probabilité que cette valeur réelle soit inférieure à la limite supérieure (ou supérieure à la limite inférieure) de cet intervalle. Lors du calcul de l' intervalle de confiance bilatéral , constitue la probabilité que la valeur vraie se situe entre les limites supérieure et inférieure.

Tout d'abord, nous désignerons les N observations disponibles par quand et et estimerons la variance commune par, par exemple: quand est la moyenne du groupe et est le nombre d'observations dans le groupe , et les degrés de liberté. Comme mentionné précédemment, nous aimerions obtenir des limites de confiance séparées pour chacune des différences de telle sorte que la probabilité que tous les intervalles de confiance contiendront le correspondant soit égale à .

Nous considérerons le cas général où il existe des groupes de traitement et un groupe témoin. Nous écrirons:

nous écrirons également:, qui suit la distribution statistique t de Student avec n degrés de liberté . Les limites de confiance inférieures avec coefficient de confiance conjoint pour les effets du traitement seront données par:

et les constantes sont choisies de telle sorte que . De même, les limites supérieures seront données par:

Pour la délimitation dans les deux sens, l'intervalle suivant peut être pris:

quand sont choisis pour satisfaire . La solution à ces valeurs particulières pour le test bilatéral et pour le test unilatéral est donnée dans les tableaux. Un tableau actualisé des valeurs critiques a été publié en 1964.

Exemples

Résistance à la rupture du tissu

L'exemple suivant a été adapté de celui donné par Villars [6]. Les données représentent des mesures de la résistance à la rupture du tissu traité par trois procédés chimiques différents par rapport à une méthode standard de fabrication.

résistance à la rupture (lbs.)
la norme processus 1 processus 2 processus 3
55 55 55 50
47 64 49 44
48 64 52 41
Veux dire 50 61 52 45
Variance 19 27 9 21

Ici, p = 3 et N = 3. La variance moyenne est , qui est une estimation de la variance commune des quatre ensembles avec (p + 1) (N-1) = 8 degrés de liberté. Cela peut être calculé comme suit:

.

L'écart type est et l'erreur standard estimée d'une différence entre deux moyennes est .

La quantité qui doit être ajoutée et / ou soustraite des différences observées entre les moyens pour donner leurs limites de confiance a été appelée par Tukey une "tolérance" et est donnée par , où t est tiré de la distribution t multivariée , ou peut être obtenu à partir du tableau 1 de Dunnett si des limites d'un côté sont souhaitées ou du tableau 2 de Dunnett si des limites bilatérales sont souhaitées. Pour p = 3 et df = 8, t = 2,42 pour les limites d'un côté et t = 2,88 pour les limites bilatérales pour p = 95%. Des valeurs analogues de t peuvent être déterminées à partir des tableaux si une confiance p = 99% est requise. Pour les limites unilatérales, la tolérance est A = (2,42) (3,56) = 9 et l'expérimentateur peut conclure que:

  • La résistance à la rupture utilisant le procédé 1 dépasse la norme d'au moins
  • La résistance à la rupture utilisant le procédé 2 dépasse la norme d'au moins .
  • La résistance à la rupture utilisant le procédé 3 dépasse la norme d'au moins .

La déclaration conjointe composée des trois conclusions ci-dessus a un coefficient de confiance de 95%, c'est-à-dire qu'à long terme, 95% de ces déclarations conjointes seront effectivement correctes. Les limites supérieures pour les trois différences pourraient être obtenues de manière analogue. Pour les limites bilatérales, la tolérance est A = (2,94) (3,56) = 11 et l'expérimentateur peut conclure que:

  • La résistance à la rupture utilisant le procédé 1 dépasse la norme d'un montant compris entre

et

  • La résistance à la rupture utilisant le procédé 2 dépasse la norme d'un montant compris entre

et .

  • La résistance à la rupture utilisant le procédé 3 dépasse la norme d'un montant compris entre

et . Le coefficient de confiance conjoint pour ces trois énoncés est supérieur à 95%. (En raison d'une approximation faite dans le calcul des tableaux 2a et 2b, les valeurs tabulées de t sont un peu plus grandes que nécessaire, de sorte que les p réels atteints sont légèrement supérieurs à 95 et 99%. Aucune approximation de ce type n'a été faite dans le calcul des tableaux 1a et 1b) .

Les références

  1. ^ Upton G. et Cook I. (2006.) Un dictionnaire de statistiques , 2e, Oxford University Press, Oxford, Royaume-Uni.
  2. ^ Rumsey, Deborah (19/08/2009). Statistiques II pour les nuls . Wiley. p. 186 . Récupéré le 22/08/2012 . Test de dunnett développé par.
  3. ^ Everett BS & Shrondal A. (2010.) Le Dictionnaire Cambridge des Statistiques , 4e, Cambridge University Press, Cambridge, Royaume-Uni.
  4. ^ "Logiciel statistique | Université de la technologie de l'information du Kentucky" . Uky.edu. Archivé de l'original le 31/07/2012 . Récupéré le 22/08/2012 .
  5. ^ A b c d Dunnett CW (1955). "Une procédure de comparaison multiple pour comparer plusieurs traitements avec un contrôle" . Journal de l'American Statistical Association . 50 : 1096-1121. doi : 10.1080 / 01621459.1955.10501294 .
  6. ^ un b Dunnett CW (1964.) "De nouvelles tables pour des comparaisons multiples avec un contrôle", Biométrie , 20 : 482–491.
  7. ^ A b c David C. Howell, "Méthodes statistiques pour la psychologie", 8e éd.
  8. ^ Test de Dunnett , HyperStat en ligne: un manuel d'introduction aux statistiques et un didacticiel en ligne pour l'aide dans les cours de statistiques
  9. ^ Mécanique de différents tests - Biostatistique BI 345 Archivé le 01/06/2010 à la Wayback Machine , Collège Saint Anselm