Statistique J de Youden - Youden's J statistic

La statistique J de Youden (également appelée indice de Youden ) est une statistique unique qui capture les performances d'un test de diagnostic dichotomique . L'information est sa généralisation au cas multiclasse et estime la probabilité d'une décision éclairée.

Définition

La statistique J de Youden est

les deux grandeurs de droite étant la sensibilité et la spécificité . Ainsi, la formule développée est:

L'indice a été suggéré par WJ Youden en 1950 comme un moyen de résumer la performance d'un test de diagnostic. Sa valeur va de 0 à 1 (inclus), et a une valeur nulle lorsqu'un test de diagnostic donne la même proportion de résultats positifs pour les groupes avec et sans la maladie, c'est-à-dire que le test est inutile. Une valeur de 1 indique qu'il n'y a pas de faux positifs ou de faux négatifs, c'est-à-dire que le test est parfait. L'indice donne un poids égal aux valeurs faussement positives et fausses négatives, de sorte que tous les tests avec la même valeur d'indice donnent la même proportion du total des résultats mal classés. Bien qu'il soit techniquement possible d'obtenir une valeur inférieure à zéro à partir de cette équation, par exemple la classification ne donne que des faux positifs et des faux négatifs, une valeur inférieure à zéro indique simplement que les étiquettes positive et négative ont été permutées. Après avoir corrigé les étiquettes, le résultat sera alors compris entre 0 et 1.

Exemple de courbe caractéristique de fonctionnement du récepteur. Rouge fixe: courbe ROC; Ligne pointillée: niveau de chance; Ligne verticale (J) valeur maximale de l'indice de Youden pour la courbe ROC

L'indice de Youden est souvent utilisé en conjonction avec l' analyse des caractéristiques de fonctionnement du récepteur (ROC). L'indice est défini pour tous les points d'une courbe ROC, et la valeur maximale de l'indice peut être utilisée comme critère de sélection du point de coupure optimal lorsqu'un test de diagnostic donne un résultat numérique plutôt que dichotomique. L'indice est représenté graphiquement comme la hauteur au-dessus de la ligne de hasard, et il est également équivalent à l'aire sous la courbe sous-tendue par un seul point de fonctionnement.

L'indice de Youden est également connu sous le nom de deltaP et se généralise du cas dichotomique au cas multiclasse en tant qu'information.

L'utilisation d'un seul indice n'est "généralement pas à recommander", mais la connaissance ou l'indice de Youden est la probabilité d'une décision éclairée (par opposition à une estimation aléatoire) et prend en compte toutes les prédictions.

Une combinaison non liée mais couramment utilisée de statistiques de base à partir de la recherche d'informations est le F-score , qui est une moyenne harmonique (éventuellement pondérée) de rappel et de précision rappel = sensibilité = taux réellement positif, mais la spécificité et la précision sont des mesures totalement différentes. Le score F, comme le rappel et la précision, ne considère que les prédictions dites positives, le rappel étant la probabilité de ne prédire que la classe positive, la précision étant la probabilité qu'une prédiction positive soit correcte, et le score F équivalant à ces probabilités sous le hypothèse effective selon laquelle les étiquettes positives et les prédictions positives devraient avoir la même distribution et la même prévalence , similaire à l'hypothèse sous-jacente du kappa de Fleiss . Le J, l'information, le rappel, la précision et le score F de Youden sont intrinsèquement non directionnels et visent à évaluer l' efficacité déductive des prédictions dans la direction proposée par une règle, une théorie ou un classificateur. La marque (deltaP) est le J de Youden utilisé pour évaluer la direction inverse ou abductive , et correspond bien à l'apprentissage humain des associations ; les règles et les superstitions comme nous modélisons la causalité possible ; tandis que la corrélation et le kappa évaluent de manière bidirectionnelle.

Le coefficient de corrélation de Matthews est la moyenne géométrique du coefficient de régression du problème et de son dual , où les coefficients de régression des composants du coefficient de corrélation de Matthews sont Markedness (inverse du J de Youden ou deltaP) et de l'information (Youden's J ou deltaP '). Les statistiques kappa telles que le kappa de Fleiss et le kappa de Cohen sont des méthodes de calcul de la fiabilité inter-juges basées sur différentes hypothèses sur les distributions marginales ou antérieures, et sont de plus en plus utilisées comme alternatives corrigées au hasard à la précision dans d'autres contextes. Le kappa de Fleiss , comme le F-score, suppose que les deux variables sont tirées de la même distribution et ont donc la même prévalence attendue, tandis que le kappa de Cohen suppose que les variables sont tirées de distributions distinctes et référencées à un modèle d' attente qui suppose que les prévalences sont indépendant.

Lorsque les vraies prévalences pour les deux variables positives sont égales comme supposées dans Fleiss kappa et F-score, c'est-à-dire que le nombre de prédictions positives correspond au nombre de classes positives dans le cas dichotomique (deux classes), le kappa différent et la mesure de corrélation s'effondrent à l'identité avec le J de Youden, et le rappel, la précision et le score F sont de même identiques avec l' exactitude .

Les références

  1. ^ un b Youden, WJ (1950). "Index pour évaluer les tests de diagnostic" . Le cancer . 3 : 32–35. doi : 10.1002 / 1097-0142 (1950) 3: 1 <32 :: aid-cncr2820030106> 3.0.co; 2-3 . PMID   15405679 .
  2. ^ Schisterman, EF; Perkins, NJ; Liu, A .; Bondell, H. (2005). "Le point de coupure optimal et son index Youden correspondant pour discriminer les individus en utilisant des échantillons de sang groupés". Epidémiologie . 16 (1): 73–81. doi : 10.1097 / 01.ede.0000147512.81966.ba . PMID   15613948 .
  3. ^ A b c d e f Powers, David MW (2011). "Évaluation: De la précision, rappel et F-score à ROC, informedness, marquage et corrélation". Journal des technologies d'apprentissage automatique . 2 (1): 37–63. hdl : 2328/27165 .
  4. ^ un b Perruchet, P .; Peereman, R. (2004). "L'exploitation des informations de distribution dans le traitement des syllabes". J. Neurolinguistique . 17 (2–3): 97-119. doi : 10.1016 / s0911-6044 (03) 00059-9 .
  5. ^ Everitt BS (2002) Le Dictionnaire Cambridge des Statistiques. CUP ISBN   0-521-81099-X
  6. ^ A b c Pouvoirs, David MW (2012). Le problème avec Kappa . Conférence du chapitre européen de l'Association for Computational Linguistics. 345–355. hdl : 2328/27160 .