Validité interne - Internal validity

La validité interne est la mesure dans laquelle un élément de preuve soutient une affirmation sur la cause et l'effet , dans le contexte d'une étude particulière. C'est l'une des propriétés les plus importantes des études scientifiques et c'est un concept important dans le raisonnement sur les preuves en général. La validité interne est déterminée par la capacité d'une étude à exclure d'autres explications de ses résultats (généralement, des sources d' erreur systématique ou de « biais »). Elle contraste avec la validité externe , la mesure dans laquelle les résultats peuvent justifier des conclusions sur d'autres contextes (c'est-à-dire la mesure dans laquelle les résultats peuvent être généralisés ).

Des détails

On dit que les inférences possèdent une validité interne si une relation causale entre deux variables est correctement démontrée. Une inférence causale valide peut être faite lorsque trois critères sont satisfaits :

  1. la "cause" précède l'"effet" dans le temps (priorité temporelle),
  2. la "cause" et "l'effet" ont tendance à se produire ensemble (covariation), et
  3. il n'y a pas d'explications alternatives plausibles pour la covariation observée (non-spuriousness).

Dans les contextes expérimentaux scientifiques, les chercheurs modifient souvent l'état d'une variable (la variable indépendante ) pour voir quel effet cela a sur une seconde variable (la variable dépendante ). Par exemple, un chercheur peut manipuler le dosage d'un médicament particulier entre différents groupes de personnes pour voir quel effet il a sur la santé. Dans cet exemple, le chercheur veut faire une inférence causale, à savoir que différentes doses du médicament peuvent être tenues pour responsables des changements ou des différences observés. Lorsque le chercheur peut attribuer en toute confiance les changements ou les différences observés dans la variable dépendante à la variable indépendante (c'est-à-dire lorsque le chercheur observe une association entre ces variables et peut exclure d'autres explications ou hypothèses rivales ), alors l'inférence causale est dite être valable en interne.

Dans de nombreux cas, cependant, l' ampleur des effets trouvés dans la variable dépendante peut ne pas dépendre uniquement de

  • variations de la variable indépendante,
  • la puissance des instruments et des procédures statistiques utilisés pour mesurer et détecter les effets, et
  • le choix des méthodes statistiques (voir : Validité des conclusions statistiques ).

Au contraire, un certain nombre de variables ou de circonstances non contrôlées (ou incontrôlables) peuvent conduire à des explications supplémentaires ou alternatives (a) pour les effets trouvés et/ou (b) pour l'ampleur des effets trouvés. La validité interne est donc plus une question de degré que de soit-ou, et c'est exactement pourquoi des conceptions de recherche autres que de véritables expériences peuvent également donner des résultats avec un degré élevé de validité interne.

Afin de permettre des inférences avec un degré élevé de validité interne, des précautions peuvent être prises lors de la conception de l'étude. En règle générale, les conclusions basées sur la manipulation directe de la variable indépendante permettent une plus grande validité interne que les conclusions basées sur une association observée sans manipulation.

Lorsque l'on considère uniquement la validité interne, de véritables conceptions expérimentales hautement contrôlées (c. . Cependant, les méthodes mêmes utilisées pour augmenter la validité interne peuvent également limiter la généralisabilité ou la validité externe des résultats. Par exemple, l'étude du comportement des animaux dans un zoo peut faciliter l'établissement d'inférences causales valides dans ce contexte, mais ces inférences peuvent ne pas se généraliser au comportement des animaux dans la nature. En général, une expérience typique en laboratoire, étudiant un processus particulier, peut laisser de côté de nombreuses variables qui affectent normalement fortement ce processus dans la nature.

Exemples de menaces

Pour rappeler huit de ces menaces à la validité interne, utilisez l' acronyme mnémotechnique , CE MESSAGE , qui signifie :

  • Essai,
  • Histoire,
  • Changement d'instrument,
  • Régression statistique vers la moyenne,
  • Maturation,
  • Mortalité expérimentale,
  • Sélection, et
  • Interaction de sélection.

Priorité temporelle ambiguë

Lorsqu'on ne sait pas quelle variable a changé en premier, il peut être difficile de déterminer quelle variable est la cause et quelle est l'effet.

Confondre

Une menace majeure pour la validité des inférences causales est la confusion : les changements de la variable dépendante peuvent plutôt être attribués aux variations d'une troisième variable qui est liée à la variable manipulée. Lorsque des relations parasites ne peuvent être exclues, des hypothèses rivales à l'inférence causale originale peuvent être développées.

Biais de séléction

Le biais de sélection fait référence au problème selon lequel, lors du pré-test, il existe des différences entre les groupes qui peuvent interagir avec la variable indépendante et ainsi être « responsables » du résultat observé. Les chercheurs et les participants apportent à l'expérience une myriade de caractéristiques, certaines apprises et d'autres inhérentes. Par exemple, le sexe, le poids, les cheveux, les yeux et la couleur de la peau, la personnalité, les capacités mentales et physiques, mais aussi des attitudes comme la motivation ou la volonté de participer.

Au cours de l'étape de sélection de l'étude de recherche, si un nombre inégal de sujets de test ont des variables similaires liées au sujet, la validité interne est menacée. Par exemple, un chercheur a créé deux groupes de test, le groupe expérimental et le groupe témoin. Les sujets des deux groupes ne sont pas semblables en ce qui concerne la variable indépendante mais similaires dans une ou plusieurs des variables liées au sujet.

L'autosélection a également un effet négatif sur le pouvoir d'interprétation de la variable dépendante. Cela se produit souvent dans les sondages en ligne où les individus de données démographiques spécifiques optent pour le test à des taux plus élevés que les autres données démographiques.

Histoire

Des événements en dehors de l'étude/de l'expérience ou entre des mesures répétées de la variable dépendante peuvent affecter les réponses des participants aux procédures expérimentales. Il s'agit souvent d'événements à grande échelle (catastrophe naturelle, changement politique, etc.) qui affectent les attitudes et les comportements des participants de telle sorte qu'il devient impossible de déterminer si un changement sur les mesures dépendantes est dû à la variable indépendante ou à l'événement historique. .

Maturation

Les sujets changent au cours de l'expérience ou même entre les mesures. Par exemple, les jeunes enfants peuvent mûrir et leur capacité de concentration peut changer à mesure qu'ils grandissent. Les changements permanents, tels que la croissance physique et temporaires comme la fatigue, fournissent des explications alternatives « naturelles » ; ainsi, ils peuvent changer la façon dont un sujet réagirait à la variable indépendante. Ainsi, à la fin de l'étude, le chercheur peut ne pas être en mesure de déterminer si la cause de l'écart est due au temps ou à la variable indépendante.

Tests répétés (également appelés effets de test)

Mesurer à plusieurs reprises les participants peut entraîner un biais. Les participants peuvent se souvenir des bonnes réponses ou être conditionnés à savoir qu'ils sont testés. Passer à plusieurs reprises des tests d'intelligence (identiques ou similaires) conduit généralement à des gains de score, mais au lieu de conclure que les compétences sous-jacentes ont changé pour de bon, cette menace pour la validité interne fournit de bonnes hypothèses rivales.

Changement d'instrument (instrumentalité)

L'instrument utilisé pendant le processus de test peut changer l'expérience. Cela fait également référence aux observateurs qui sont plus concentrés ou amorcés, ou qui ont inconsciemment modifié les critères qu'ils utilisent pour porter des jugements. Cela peut également être un problème avec les mesures d'auto-évaluation données à des moments différents. Dans ce cas, l'impact peut être atténué par l'utilisation de prétests rétrospectifs. Si des changements d'instrumentation se produisent, la validité interne de la conclusion principale est affectée, car des explications alternatives sont facilement disponibles.

Régression vers la moyenne

Ce type d'erreur se produit lorsque les sujets sont sélectionnés sur la base de scores extrêmes (un loin de la moyenne) lors d'un test. Par exemple, lorsque les enfants ayant les pires scores en lecture sont sélectionnés pour participer à un cours de lecture, les améliorations à la fin du cours peuvent être dues à une régression vers la moyenne et non à l'efficacité du cours. Si les enfants avaient été testés à nouveau avant le début du cours, ils auraient probablement obtenu de meilleures notes de toute façon. De même, les valeurs aberrantes extrêmes sur les scores individuels sont plus susceptibles d'être capturées dans une instance de test, mais évolueront probablement vers une distribution plus normale avec des tests répétés.

Mortalité/attrition différentielle

Cette erreur se produit si les déductions sont faites sur la base des seuls participants qui ont participé du début à la fin. Cependant, les participants peuvent avoir abandonné l'étude avant la fin, et peut-être même en raison de l'étude, du programme ou de l'expérience elle-même. Par exemple, le pourcentage de membres du groupe ayant arrêté de fumer au post-test a été trouvé beaucoup plus élevé dans un groupe ayant reçu un programme de formation pour arrêter de fumer que dans le groupe témoin. Cependant, dans le groupe expérimental, seulement 60 % ont terminé le programme. Si cette attrition est systématiquement liée à une caractéristique de l'étude, à l'administration de la variable indépendante, à l'instrumentation, ou si le décrochage entraîne des biais de pertinence entre les groupes, toute une classe d'explications alternatives est possible qui rend compte des différences observées.

Interaction sélection-maturation

Cela se produit lorsque les variables liées au sujet, la couleur des cheveux, la couleur de la peau, etc., et les variables liées au temps, l'âge, la taille physique, etc., interagissent. Si un écart entre les deux groupes se produit entre les tests, l'écart peut être dû aux différences d'âge dans les catégories d'âge.

La diffusion

Si les effets du traitement se propagent des groupes de traitement aux groupes de contrôle, un manque de différences entre les groupes expérimentaux et de contrôle peut être observé. Cela ne signifie cependant pas que la variable indépendante n'a pas d'effet ou qu'il n'y a pas de relation entre variable dépendante et variable indépendante.

Rivalité compensatoire/démoralisation rancunière

Le comportement des groupes témoins peut changer à la suite de l'étude. Par exemple, les membres du groupe témoin peuvent travailler très dur pour voir que la supériorité attendue du groupe expérimental n'est pas démontrée. Encore une fois, cela ne signifie pas que la variable indépendante n'a produit aucun effet ou qu'il n'y a pas de relation entre la variable dépendante et la variable indépendante. Vice versa, les changements dans la variable dépendante ne peuvent être affectés qu'en raison d'un groupe témoin démoralisé, travaillant moins dur ou motivé, et non en raison de la variable indépendante.

Biais de l'expérimentateur

Le biais de l'expérimentateur se produit lorsque les individus qui mènent une expérience affectent par inadvertance le résultat en se comportant inconsciemment de différentes manières vis-à-vis des membres des groupes de contrôle et expérimentaux. Il est possible d'éliminer la possibilité de biais de l'expérimentateur grâce à l'utilisation de plans d'étude en double aveugle , dans lesquels l'expérimentateur n'est pas conscient de la condition à laquelle appartient un participant.

Problème de validité mutuelle interne

Les expériences qui ont une validité interne élevée peuvent produire des phénomènes et des résultats qui n'ont aucune pertinence dans la vie réelle, ce qui entraîne un problème de validité mutuelle interne. Il survient lorsque les chercheurs utilisent des résultats expérimentaux pour développer des théories, puis utilisent ces théories pour concevoir des expériences de test théorique. Cette rétroaction mutuelle entre les expériences et les théories peut conduire à des théories qui n'expliquent que les phénomènes et les résultats dans des environnements de laboratoire artificiels mais pas dans la vie réelle.

Voir également

Les références

Liens externes