Modèle à effets fixes - Fixed effects model

En statistiques , un modèle à effets fixes est un modèle statistique dans lequel les paramètres du modèle sont des quantités fixes ou non aléatoires. Cela contraste avec les modèles à effets aléatoires et les modèles mixtes dans lesquels tout ou partie des paramètres du modèle sont des variables aléatoires. Dans de nombreuses applications, y compris l' économétrie et la biostatistique, un modèle à effets fixes fait référence à un modèle de régression dans lequel les moyennes de groupe sont fixes (non aléatoires) par opposition à un modèle à effets aléatoires dans lequel les moyennes de groupe sont un échantillon aléatoire d'une population. Généralement, les données peuvent être regroupées selon plusieurs facteurs observés. Les moyennes de groupe pourraient être modélisées sous forme d'effets fixes ou aléatoires pour chaque groupe. Dans un modèle à effets fixes, chaque moyenne de groupe est une quantité fixe spécifique au groupe.

Dans les données de panel où des observations longitudinales existent pour le même sujet, les effets fixes représentent les moyennes spécifiques au sujet. Dans l'analyse des données de panel, le terme estimateur à effets fixes (également connu sous le nom d' estimateur intra ) est utilisé pour désigner un estimateur des coefficients dans le modèle de régression, y compris ces effets fixes (une interception invariante dans le temps pour chaque sujet).

Description qualitative

De tels modèles aident à contrôler le biais de variable omis dû à une hétérogénéité non observée lorsque cette hétérogénéité est constante dans le temps. Cette hétérogénéité peut être supprimée des données par différenciation, par exemple en soustrayant la moyenne au niveau du groupe dans le temps, ou en prenant une différence première qui supprimera toutes les composantes invariantes dans le temps du modèle.

Il existe deux hypothèses communes concernant l'effet spécifique individuel : l'hypothèse des effets aléatoires et l'hypothèse des effets fixes. L' hypothèse des effets aléatoires est que les effets spécifiques à l'individu ne sont pas corrélés avec les variables indépendantes. L'hypothèse d'effet fixe est que les effets spécifiques à l'individu sont corrélés avec les variables indépendantes. Si l'hypothèse des effets aléatoires est vérifiée, l'estimateur à effets aléatoires est plus efficace que l'estimateur à effets fixes. Cependant, si cette hypothèse n'est pas vérifiée, l'estimateur des effets aléatoires n'est pas cohérent . Le test de Durbin-Wu-Hausman est souvent utilisé pour discriminer entre les modèles à effets fixes et aléatoires.

Modèle formel et hypothèses

Considérons le modèle à effets linéaires non observés pour les observations et les périodes :

pour et

Où:

  • est la variable dépendante observée pour l'individu au moment .
  • est le vecteur régresseur variant dans le temps (le nombre de variables indépendantes).
  • est la matrice des paramètres.
  • est l'effet individuel invariant dans le temps non observé. Par exemple, la capacité innée des individus ou les facteurs historiques et institutionnels des pays.
  • est le terme d'erreur .

Contrairement à , ne peut pas être observé directement.

Contrairement au modèle à effets aléatoires où l'inobservé est indépendant de pour tout , le modèle à effets fixes (FE) permet d'être corrélé avec la matrice de régresseur . Une exogénéité stricte par rapport au terme d'erreur idiosyncratique est toujours requise.

Estimation statistique

Estimateur d'effets fixes

Comme il n'est pas observable, il ne peut pas être directement contrôlé . Le modèle FE élimine par dégradant les variables à l' aide de l' intérieur de transformation:

où , , et .

Puisque est constant, et donc l'effet est éliminé. L'estimateur FE est alors obtenu par une régression OLS de sur .

Au moins trois alternatives à l' intérieur de exist transformation avec des variations.

L'une consiste à ajouter une variable muette pour chaque individu (en omettant le premier individu en raison de la multicolinéarité ). Ceci est numériquement, mais pas informatiquement, équivalent au modèle à effets fixes et ne fonctionne que si la somme du nombre de séries et du nombre de paramètres globaux est inférieure au nombre d'observations. L'approche des variables fictives est particulièrement exigeante en ce qui concerne l'utilisation de la mémoire de l'ordinateur et elle n'est pas recommandée pour les problèmes plus grands que la RAM disponible et la compilation du programme appliqué peuvent traiter.

La deuxième alternative consiste à utiliser une approche de réitérations consécutives pour les estimations locales et globales. Cette approche est très adaptée aux systèmes à faible mémoire sur lesquels elle est beaucoup plus efficace en termes de calcul que l'approche des variables fictives.

La troisième approche est une estimation emboîtée dans laquelle l'estimation locale pour les séries individuelles est programmée dans le cadre de la définition du modèle. Cette approche est la plus efficace en termes de calcul et de mémoire, mais elle nécessite des compétences de programmation compétentes et un accès au code de programmation du modèle ; bien qu'il puisse être programmé même en SAS.

Enfin, chacune des alternatives ci-dessus peut être améliorée si l'estimation spécifique à la série est linéaire (au sein d'un modèle non linéaire), auquel cas la solution linéaire directe pour les séries individuelles peut être programmée dans le cadre de la définition du modèle non linéaire.

Estimateur de première différence

Une alternative à la transformation interne est la transformation en différence première , qui produit un estimateur différent. Pour :

L'estimateur FD est alors obtenu par une régression OLS de sur .

Lorsque , les estimateurs de la différence première et des effets fixes sont numériquement équivalents. Car ils ne le sont pas. Si les termes d'erreur sont homoscédastiques sans corrélation sérielle , l'estimateur à effets fixes est plus efficace que l'estimateur par différence première. Si suit une marche aléatoire , cependant, l'estimateur par différence première est plus efficace.

Égalité des estimateurs à effets fixes et différences premières lorsque T=2

Pour le cas spécial à deux périodes ( ), l'estimateur à effets fixes (FE) et l'estimateur en différence première (FD) sont numériquement équivalents. Cela est dû au fait que l'estimateur FE « double effectivement l'ensemble de données » utilisé dans l'estimateur FD. Pour voir cela, établissons que l'estimateur à effets fixes est :

Puisque chacun peut être réécrit sous la forme , nous allons réécrire la ligne sous la forme :

Méthode Chamberlain

La méthode de Gary Chamberlain , une généralisation de l'estimateur intra, remplace par sa projection linéaire sur les variables explicatives. En écrivant la projection linéaire sous la forme :

cela donne l'équation suivante :

qui peut être estimée par estimation de distance minimale .

Méthode Hausman-Taylor

Besoin d'avoir plus d'un régresseur variant dans le temps ( ) et régresseur invariant dans le temps ( ) et au moins un et un qui ne sont pas corrélés avec .

Partitionnez les variables et de telle sorte que où et ne soient pas corrélées avec . Besoin .

L'estimation via OLS sur l' utilisation et en tant qu'instruments donne une estimation cohérente.

Généralisation avec incertitude d'entrée

Lorsqu'il existe une incertitude d'entrée pour les données, , alors la valeur, plutôt que la somme des carrés des résidus, doit être minimisée. Ceci peut être obtenu directement à partir des règles de substitution :

,

alors les valeurs et les écarts types pour et peuvent être déterminés via l' analyse classique des moindres carrés ordinaires et la matrice de variance-covariance .

Tester les effets fixes (FE) vs les effets aléatoires (RE)

Nous pouvons tester si un modèle à effets fixes ou aléatoires est approprié en utilisant un test de Durbin-Wu-Hausman .

:
:

Si est vrai, les deux et sont cohérents, mais seul est efficace. Si est vrai, est cohérent et ne l'est pas.

Le test de Hausman est un test de spécification, donc une statistique de test importante peut indiquer qu'il pourrait y avoir des erreurs dans les variables (EIV) ou que notre modèle est mal spécifié. Si l'hypothèse FE est vraie, nous devrions trouver que .

Une heuristique simple est que s'il pouvait y avoir EIV.

Voir également

Remarques

Les références

  • Christensen, Ronald (2002). Réponses d'avion aux questions complexes : La théorie des modèles linéaires (le troisième rédacteur). New York : Springer. ISBN 0-387-95361-2.
  • Gujarati, Damodar N.; Porter, Dawn C. (2009). "Modèles de régression de données de panel". Econométrie de base (cinquième édition internationale). Boston : McGraw-Hill. p. 591-616. ISBN 978-007-127625-2.
  • Hsiao, Cheng (2003). "Modèles à effets fixes" . Analyse des données de panel (2e éd.). New York : Cambridge University Press. p. 95-103. ISBN 0-521-52271-4.
  • Wooldridge, Jeffrey M. (2013). "Estimation des effets fixes". Introduction à l'économétrie : une approche moderne (cinquième édition internationale). Mason, OH : sud-ouest. p. 466-474. ISBN 978-1-111-53439-4.

Liens externes