Le paradoxe de Freedman - Freedman's paradox

Dans l'analyse statistique , le paradoxe de Freedman , nommé d'après David Freedman , est un problème de sélection de modèle dans lequel les variables prédictives sans relation avec la variable dépendante peuvent passer des tests de signification - à la fois individuellement via un test t et conjointement via un test F pour l'importance de la régression. Freedman a démontré (par simulation et calcul asymptotique) qu'il s'agit d'un phénomène courant lorsque le nombre de variables est similaire au nombre de points de données.

Plus précisément, si la variable dépendante et les k régresseurs sont des variables normales indépendantes et qu'il y a n observations, alors comme k et n vont ensemble à l'infini dans le rapport k / n = ρ ,

  1. le R 2 va vers ρ ,
  2. la statistique F pour la régression globale passe à 1,0, et
  3. le nombre de régresseurs faussement significatifs va à αk où α est la probabilité critique choisie (probabilité d'erreur de type I pour un régresseur). Ce troisième résultat est intuitif car il dit que le nombre d'erreurs de type I est égal à la probabilité d'une erreur de type I sur un paramètre individuel multiplié par le nombre de paramètres pour lesquels la signification est testée.

Plus récemment, de nouveaux estimateurs théoriques de l'information ont été développés pour tenter de réduire ce problème, en plus du problème connexe du biais de sélection du modèle, dans lequel les estimateurs des variables prédictives qui ont une faible relation avec la variable de réponse sont biaisés.

Références

  1. ^ Freedman, David A. (1983). "Une note sur les équations de régression de dépistage". Le statisticien américain . 37 (2): 152–155. doi : 10.1080 / 00031305.1983.10482729 . ISSN   0003-1305 .
  2. ^ Freedman, Laurence S .; Pee, David (novembre 1989). "Revenez à une note sur les équations de régression de dépistage". Le statisticien américain . 43 (4): 279-282. doi : 10.2307 / 2685389 . JSTOR   2685389 .
  3. ^ Lukacs, PM, Burnham, KP et Anderson, DR (2010) "Le biais de sélection de modèle et le paradoxe de Freedman." Annales de l'Institut de mathématiques statistiques , 62 (1), 117–125 doi : 10.1007 / s10463-009-0234-4
  4. ^ Burnham, KP et Anderson, DR (2002). Sélection de modèle et inférence multimodèle: une approche pratique-théorique, 2e éd. Springer-Verlag.