Randomisation restreinte - Restricted randomization

En statistique , la randomisation restreinte intervient dans la conception des expériences et en particulier dans le cadre d' expériences randomisées et d' essais contrôlés randomisés . La randomisation restreinte permet d'éviter des allocations intuitivement pauvres de traitements aux unités expérimentales, tout en conservant les avantages théoriques de la randomisation. Par exemple, dans un essai clinique d'un nouveau traitement proposé de l'obésité par rapport à un contrôle, un expérimentateur voudrait éviter les résultats de la randomisation dans laquelle le nouveau traitement a été attribué uniquement aux patients les plus lourds.

Le concept a été introduit par Frank Yates (1948) et William J. Youden (1972) «comme un moyen d'éviter de mauvais modèles spatiaux de traitements dans des expériences conçues».

Exemple de données imbriquées

Envisagez un processus par lots qui utilise 7 tranches de moniteur dans chaque exécution. Le plan demande en outre de mesurer une variable de réponse sur chaque tranche à chacun des 9 sites. L'organisation du plan d'échantillonnage a une structure hiérarchique ou imbriquée: le traitement par lots est le niveau le plus élevé, le deuxième niveau est une tranche individuelle et le troisième niveau est le site sur la tranche.

La quantité totale de données générées par lot sera de 7 · 9 = 63 observations. Une approche pour analyser ces données serait de calculer la moyenne de tous ces points ainsi que leur écart type et d'utiliser ces résultats comme réponses pour chaque exécution.

L'analyse des données comme suggéré ci-dessus n'est pas absolument incorrect, mais cela perd des informations que l'on pourrait autrement obtenir. Par exemple, le site 1 sur la plaquette 1 est physiquement différent du site 1 sur la plaquette 2 ou sur toute autre plaquette. La même chose est vraie pour tous les sites sur l'une des plaquettes. De même, la plaquette 1 dans le cycle 1 est physiquement différente de la plaquette 1 dans le cycle 2, et ainsi de suite. Pour décrire cette situation, on dit que les sites sont imbriqués dans des plaquettes tandis que les plaquettes sont imbriquées dans des séries.

En raison de cette imbrication, il existe des restrictions sur la randomisation qui peut se produire dans l'expérience. Ce type de randomisation restreinte produit toujours des sources de variation imbriquées. Des exemples de variation imbriquée ou restreint discuté randomisation sur cette page sont en parcelles divisées et conceptions bande-terrain .

L'objectif d'une expérience avec ce type de plan d'échantillonnage est généralement de réduire la variabilité due aux sites sur les plaquettes et plaquettes au sein des séries (ou lots) du procédé. Les sites sur les plaquettes et les plaquettes au sein d'un lot deviennent des sources de variations indésirables et un chercheur cherche à rendre le système robuste à ces sources - en d'autres termes, on pourrait traiter les plaquettes et les sites comme des facteurs de bruit dans une telle expérience.

Parce que les plaquettes et les sites représentent des sources de variation indésirables et que l'un des objectifs est de réduire la sensibilité du processus à ces sources de variation, traiter les plaquettes et les sites comme des effets aléatoires dans l'analyse des données est une approche raisonnable. En d'autres termes, la variation imbriquée est souvent une autre façon de dire des effets aléatoires imbriqués ou des sources de bruit imbriquées. Si les facteurs «tranches» et «sites» sont traités comme des effets aléatoires, il est alors possible d'estimer une composante de variance due à chaque source de variation grâce à l' analyse des techniques de variance . Une fois que les estimations des composantes de la variance ont été obtenues, un enquêteur est alors en mesure de déterminer la plus grande source de variation dans le processus en cours d'expérimentation, et également de déterminer l'ampleur des autres sources de variation par rapport à la plus grande source.

Effets aléatoires imbriqués

Si une expérience ou un processus a une variation imbriquée, l'expérience ou le processus a plusieurs sources d' erreur aléatoire qui affectent sa sortie. Avoir des effets aléatoires imbriqués dans un modèle équivaut à avoir une variation imbriquée dans un modèle.

Conceptions de parcelles fractionnées

Les conceptions de parcelles fractionnées résultent d'un type particulier de randomisation restreinte au cours de l'expérience. Une expérience factorielle simple peut aboutir à un plan de type split-plot en raison de la manière dont l'expérience a été réellement exécutée.

Dans de nombreuses expériences industrielles, trois situations se produisent souvent:

  1. certains des facteurs d'intérêt peuvent être «difficiles à faire varier», tandis que les autres facteurs sont faciles à varier. En conséquence, l'ordre dans lequel les combinaisons de traitements pour l'expérience sont exécutées est déterminé par l'ordre de ces facteurs `` difficiles à varier ''.
  2. les unités expérimentales sont traitées ensemble comme un lot pour un ou plusieurs des facteurs dans une combinaison de traitement particulière
  3. les unités expérimentales sont traitées individuellement, les unes après les autres, pour la même combinaison de traitement sans réinitialiser les paramètres de facteur pour cette combinaison de traitement.

Exemples expérimentaux de split-plot

Une expérience exécutée dans l'une des trois situations ci-dessus aboutit généralement à un type de conception à parcelles séparées. Envisagez une expérience pour examiner la galvanoplastie d'aluminium (non aqueux) sur des bandes de cuivre. Les trois facteurs d'intérêt sont: le courant (A); température de la solution (T); et la concentration en solution de l'agent de placage (S). Le taux de placage est la réponse mesurée. Il y a un total de 16 bandes de cuivre disponibles pour l'expérience. Les combinaisons de traitements à exécuter (mises à l'échelle orthogonalement) sont énumérées ci-dessous dans l'ordre standard (c'est-à-dire qu'elles n'ont pas été randomisées):

Combinaisons de traitement à l'échelle orthogonale à partir d'un 2 3 factoriel complet
Actuel Température Concentration
−1 −1 −1
−1 −1 +1
−1 +1 −1
−1 +1 +1
+1 −1 −1
+1 −1 +1
+1 +1 −1
+1 +1 +1

Exemple: certains facteurs difficiles à varier

Envisagez d'exécuter l'expérience dans la première condition indiquée ci-dessus, la concentration de solution de facteur de l'agent de placage (S) étant difficile à varier. Étant donné que ce facteur est difficile à varier, l'expérimentateur souhaite randomiser les combinaisons de traitement afin que le facteur de concentration de la solution ait un nombre minimal de changements. En d'autres termes, la randomisation des cycles de traitement est quelque peu limitée par le niveau du facteur de concentration de la solution.

En conséquence, les combinaisons de traitement pourraient être randomisées de telle sorte que les cycles de traitement correspondant à un niveau de concentration (-1) soient exécutés en premier. Chaque bande de cuivre est plaquée individuellement, ce qui signifie qu'une seule bande à la fois est placée dans la solution pour une combinaison de traitement donnée. Une fois que les quatre essais au niveau bas de concentration de la solution ont été terminés, la solution est changée au niveau élevé de concentration (1), et les quatre essais restants de l'expérience sont effectués (où encore une fois, chaque bande est individuellement plaquée).

Une fois qu'une réplique complète de l'expérience a été terminée, une deuxième réplique est effectuée avec un ensemble de quatre bandes de cuivre traitées pour un niveau donné de concentration de solution avant de changer la concentration et de traiter les quatre bandes restantes. Notez que les niveaux des deux facteurs restants peuvent toujours être randomisés. En outre, le niveau de concentration qui est exécuté en premier dans les exécutions de réplication peut également être randomisé.

L'exécution de l'expérience de cette manière aboutit à une conception de tracé fractionné . La concentration de la solution est connue comme le facteur de tracé complet et les facteurs de sous- tracé sont le courant et la température de la solution.

Un plan de parcelle fractionnée a plus d'une unité expérimentale de taille . Dans cette expérience, une unité expérimentale de taille unique est une bande de cuivre individuelle. Les traitements ou facteurs appliqués aux bandelettes individuelles sont la température et le courant de la solution (ces facteurs ont été modifiés chaque fois qu'une nouvelle bandelette a été placée dans la solution). L'autre unité expérimentale ou de plus grande taille est un ensemble de quatre bandes de cuivre. Le traitement ou facteur appliqué à un ensemble de quatre bandelettes est la concentration de la solution (ce facteur a été modifié après le traitement de quatre bandelettes). L'unité expérimentale de plus petite taille est appelée unité expérimentale de sous- parcelle , tandis que l'unité expérimentale plus grande est appelée unité de parcelle entière .

Il existe 16 unités expérimentales de sous-parcelles pour cette expérience. La température et le courant de la solution sont les facteurs de sous-tracé de cette expérience. Il y a quatre unités expérimentales de parcelles entières dans cette expérience. La concentration de la solution est le facteur de la parcelle entière dans cette expérience. Puisqu'il existe deux tailles d'unités expérimentales, il y a deux termes d'erreur dans le modèle, l'un qui correspond à l'erreur de la parcelle entière ou à l'unité expérimentale de la parcelle entière et l'autre qui correspond à l'erreur de sous-parcelle ou à l'unité expérimentale de sous-parcelle.

La table ANOVA pour cette expérience ressemblerait, en partie, comme suit:

Tableau ANOVA partiel
La source DF
Réplication 1
Concentration 1
Erreur (tracé entier) = Rep × Conc 1
Température 1
Rep × Temp 1
Actuel 1
Rep × Actuel 1
Temp × Conc 1
Rep × Temp × Conc 1
Temp × courant 1
Rep × Temp × Courant 1
Courant × Conc 1
Rép × Courant × Conc 1
Temp × courant × Conc 1
Erreur (sous-tracé) = Rep × Temp × Current × Conc 1

Les trois premières sources proviennent du niveau de la parcelle entière, tandis que les 12 suivantes proviennent de la partie de la sous-parcelle. Un diagramme de probabilité normal des 12 estimations de termes de sous-parcelles pourrait être utilisé pour rechercher des termes statistiquement significatifs .

Exemple: traitement par lots

Envisagez d'exécuter l'expérience sous la deuxième condition énumérée ci-dessus (c'est-à-dire, un processus par lots) pour laquelle quatre bandes de cuivre sont placées dans la solution à la fois. Un niveau de courant spécifié peut être appliqué à une bande individuelle dans la solution. Les mêmes 16 combinaisons de traitement (une factorielle 2 3 répliquée ) sont exécutées comme dans le premier scénario. Cependant, la manière dont l'expérience est réalisée serait différente. Il existe quatre combinaisons de traitement de la température de la solution et de la concentration de la solution: (-1, -1), (-1, 1), (1, -1), (1, 1). L'expérimentateur choisit au hasard l'un de ces quatre traitements à mettre en place en premier. Quatre bandes de cuivre sont placées dans la solution. Deux des quatre bandes sont assignées au hasard au niveau de courant faible. Les deux bandes restantes sont affectées au niveau de courant élevé. Le placage est effectué et la réponse est mesurée. Une deuxième combinaison de traitement de température et de concentration est choisie et la même procédure est suivie. Ceci est fait pour les quatre combinaisons température / concentration.

L'exécution de l'expérience de cette manière aboutit également à une conception de parcelle fractionnée dans laquelle les facteurs de la parcelle entière sont désormais la concentration de la solution et la température de la solution, et le facteur de sous-parcelle est actuel.

Dans cette expérience, une unité expérimentale de taille unique est à nouveau une bande de cuivre individuelle. Le traitement ou le facteur qui a été appliqué aux bandelettes individuelles est courant (ce facteur a été changé à chaque fois pour une bandelette différente dans la solution). L'autre unité expérimentale ou de plus grande taille est à nouveau un ensemble de quatre bandes de cuivre. Les traitements ou facteurs appliqués à un ensemble de quatre bandelettes sont la concentration de la solution et la température de la solution (ces facteurs ont été modifiés après le traitement de quatre bandelettes).

L'unité expérimentale de plus petite taille est à nouveau appelée unité expérimentale de sous-parcelle. Il existe 16 unités expérimentales de sous-parcelles pour cette expérience. Le courant est le facteur de sous-parcelle dans cette expérience.

L'unité expérimentale de plus grande taille est l'unité expérimentale de la parcelle entière. Il y a quatre unités expérimentales de parcelles entières dans cette expérience et la concentration de la solution et la température de la solution sont l'ensemble des facteurs de parcelle dans cette expérience.

Il existe deux tailles d'unités expérimentales et il y a deux termes d'erreur dans le modèle: un qui correspond à l'erreur de la parcelle entière ou à l'unité expérimentale de la parcelle entière, et un qui correspond à l'erreur de sous-parcelle ou à l'unité expérimentale de sous-parcelle.

L'ANOVA pour cette expérience se présente, en partie, comme suit:

Tableau ANOVA partiel
La source DF
Concentration 1
Température 1
Erreur (tracé entier) = Conc × Temp 1
Actuel 1
Conc × courant 1
Temp × courant 1
Conc × Temp × Courant 1
Erreur (sous-tracé) 8

Les trois premières sources proviennent du niveau de la parcelle entière et les 5 suivantes proviennent du niveau de la sous-parcelle. Puisqu'il y a 8 degrés de liberté pour le terme d'erreur de sous-tracé, ce MSE peut être utilisé pour tester chaque effet qui implique du courant.

Exemple: unités expérimentales traitées individuellement

Envisagez d'exécuter l'expérience selon le troisième scénario répertorié ci-dessus. Il n'y a qu'une seule bande de cuivre dans la solution à la fois. Cependant, deux bandes, l'une au courant faible et l'autre au courant élevé, sont traitées l'une après l'autre avec le même réglage de température et de concentration. Une fois que deux bandes ont été traitées, la concentration est modifiée et la température est réinitialisée à une autre combinaison. Deux bandes sont à nouveau traitées, l'une après l'autre, sous ce réglage de température et de concentration. Ce processus se poursuit jusqu'à ce que les 16 bandes de cuivre aient été traitées.

L'exécution de l'expérience de cette manière aboutit également à une conception de parcelle partagée dans laquelle les facteurs de la parcelle entière sont à nouveau la concentration de la solution et la température de la solution et le facteur de sous-parcelle est actuel. Dans cette expérience, une unité expérimentale de taille unique est une bande de cuivre individuelle. Le traitement ou le facteur qui a été appliqué aux bandelettes individuelles est courant (ce facteur a été changé à chaque fois pour une bandelette différente dans la solution). L'autre unité expérimentale ou de plus grande taille est un ensemble de deux bandes de cuivre. Les traitements ou facteurs appliqués à une paire de deux bandelettes sont la concentration de la solution et la température de la solution (ces facteurs ont été modifiés après le traitement de deux bandelettes). L'unité expérimentale de plus petite taille est appelée unité expérimentale de sous-parcelle.

Il existe 16 unités expérimentales de sous-parcelles pour cette expérience. Le courant est le facteur de sous-parcelle de l'expérience. Il y a huit unités expérimentales de parcelles entières dans cette expérience. La concentration de la solution et la température de la solution sont les facteurs entiers du tracé. Il y a deux termes d'erreur dans le modèle, l'un qui correspond à l'erreur de la parcelle entière ou à l'unité expérimentale de la parcelle entière, et l'autre qui correspond à l'erreur de sous-parcelle ou à l'unité expérimentale de la sous-parcelle.

L'ANOVA pour cette (troisième) approche est, en partie, la suivante:

Tableau ANOVA partiel
La source DF
Concentration 1
Température 1
Conc * Temp 1
Erreur (tracé entier) 4
Actuel 1
Conc × courant 1
Temp × courant 1
Conc × Temp × Courant 1
Erreur (sous-tracé) 4

Les quatre premiers termes proviennent de l'analyse de la parcelle entière et les 5 termes suivants proviennent de l'analyse de la sous-parcelle. Notez que nous avons des termes d'erreur distincts pour l'ensemble du tracé et les effets du sous-tracé, chacun basé sur 4 degrés de liberté.

Comme on peut le voir à partir de ces trois scénarios, l'une des principales différences entre les plans de parcelles divisées et les plans factoriels simples est le nombre d'unités expérimentales de différentes tailles dans l'expérience. Les plans de parcelles fractionnées ont plus d'une unité expérimentale de taille, c'est-à-dire plus d'un terme d'erreur. Puisque ces plans impliquent différentes tailles d'unités expérimentales et différentes variances, les erreurs standard des diverses comparaisons moyennes impliquent une ou plusieurs des variances. Spécifier le modèle approprié pour un plan de parcelle fractionnée implique de pouvoir identifier chaque taille d'unité expérimentale. La façon dont une unité expérimentale est définie par rapport à la structure de conception (par exemple, une conception complètement aléatoire par rapport à une conception de bloc complète randomisée ) et la structure de traitement (par exemple, une factorielle 2 3 complète , une demi-fraction de résolution V, une structure de traitement avec un groupe témoin , etc.). En raison du fait d'avoir plus d'une unité expérimentale de taille, le modèle approprié utilisé pour analyser les plans de parcelles fractionnées est un modèle mixte .

Si les données d'une expérience sont analysées avec un seul terme d'erreur utilisé dans le modèle, des conclusions trompeuses et invalides peuvent être tirées des résultats.

Dessins en bandes

Semblable à une conception de parcelles fractionnées, une conception de bandes parcelles peut résulter lorsqu'un certain type de randomisation restreinte s'est produite au cours de l'expérience. Une conception factorielle simple peut aboutir à une conception en bande en fonction de la manière dont l'expérience a été menée. Les conceptions de strip-plot résultent souvent d'expériences menées sur deux ou plusieurs étapes du processus dans lesquelles chaque étape du processus est un processus par lots, c'est-à-dire que chaque combinaison de traitement de l'expérience nécessite plus d'une étape de traitement avec des unités expérimentales traitées ensemble à chaque processus. étape. Comme dans la conception de parcelles fractionnées, les conceptions de graphiques en bandes résultent lorsque la randomisation dans l'expérience a été restreinte d'une manière ou d'une autre. En raison de la randomisation restreinte qui se produit dans les conceptions de strip-plot, il existe plusieurs tailles d'unités expérimentales. Par conséquent, il existe différents termes d'erreur ou différentes variances d'erreur qui sont utilisés pour tester les facteurs d'intérêt dans la conception. Une conception traditionnelle de parcelles en bande comprend trois tailles d'unités expérimentales.

Exemple de strip-plot: deux étapes et trois variables factorielles

Prenons l'exemple suivant de l'industrie des semi-conducteurs. Une expérience nécessite une étape d'implantation et une étape de recuit. Aux étapes de recuit et d'implantation, il y a trois facteurs à tester. Le processus d'implantation accueille 12 plaquettes dans un lot, et l'implantation d'une seule plaquette dans un ensemble spécifié de conditions n'est pas pratique et ne représente pas une utilisation économique de l'implanteur. Le four de recuit peut traiter jusqu'à 100 plaquettes.

Les paramètres d'un plan factoriel à deux niveaux pour les trois facteurs de l'étape d'implantation sont indiqués (A, B, C), et un plan factoriel à deux niveaux pour les trois facteurs de l'étape de recuit est noté (D, E, F ). Des effets d'interaction entre les facteurs d'implantation et les facteurs de recuit sont également présents. Par conséquent, cette expérience contient trois tailles d'unités expérimentales, chacune ayant un terme d'erreur unique pour estimer la signification des effets.

Pour donner une signification physique réelle à chacune des unités expérimentales dans l'exemple ci-dessus, considérez chaque combinaison d'étapes d'implantation et de recuit comme une tranche individuelle. Un lot de huit plaquettes passe d'abord par l'étape d'implantation. La combinaison de traitements 3 dans les facteurs A, B et C est la première série de traitements implantaires. Ce traitement implantaire est appliqué aux huit plaquettes à la fois. Une fois le premier traitement implantaire terminé, un autre ensemble de huit plaquettes est implanté avec la combinaison de traitement 5 des facteurs A, B et C. Cela se poursuit jusqu'à ce que le dernier lot de huit plaquettes soit implanté avec la combinaison de traitement 6 des facteurs A, B et C. Une fois que toutes les huit combinaisons de traitement des facteurs d'implant ont été exécutées, l'étape de recuit commence. La première combinaison de traitement de recuit à exécuter est la combinaison de traitement 5 des facteurs D, E et F. Cette combinaison de traitement de recuit est appliquée à un ensemble de huit plaquettes, chacune de ces huit plaquettes provenant de l'une des huit combinaisons de traitement d'implant. Après recuit de ce premier lot de plaquettes, le deuxième traitement de recuit est appliqué à un second lot de huit plaquettes, ces huit plaquettes provenant de l'une de chacune des huit combinaisons de traitement implantaire. Cela se poursuit jusqu'à ce que le dernier lot de huit plaquettes ait été implanté avec une combinaison particulière de facteurs D, E et F.

L'exécution de l'expérience de cette manière aboutit à une conception de strip-plot avec trois tailles d'unités expérimentales. Un ensemble de huit plaquettes qui sont implantées ensemble est l'unité expérimentale pour les facteurs d'implantation A, B et C et pour toutes leurs interactions. Il existe huit unités expérimentales pour les facteurs d'implantation. Un ensemble différent de huit plaquettes est recuit ensemble. Cet ensemble différent de huit tranches est la deuxième unité expérimentale de taille et est l'unité expérimentale pour les facteurs de recuit D, E et F et pour toutes leurs interactions. L'unité expérimentale de troisième taille est une seule plaquette. Il s'agit de l'unité expérimentale pour tous les effets d'interaction entre les facteurs d'implantation et les facteurs de recuit.

En fait, la description ci-dessus de la conception du strip-plot représente un bloc ou une réplique de cette expérience. Si l'expérience ne contient aucune réplication et que le modèle de l'implant contient uniquement les effets principaux et les interactions à deux facteurs, le terme d'interaction à trois facteurs A * B * C (1 degré de liberté) fournit le terme d'erreur pour l'estimation des effets dans l'unité expérimentale d'implant. L'invocation d'un modèle similaire pour l'unité expérimentale de recuit produit le terme d'interaction à trois facteurs D * E * F pour le terme d'erreur (1 degré de liberté) pour les effets au sein de l'unité expérimentale de recuit.

Voir également

Les références

Lectures complémentaires

Pour une discussion plus détaillée de ces conceptions et des procédures d'analyse appropriées, voir:

  • Milliken, GA; Johnson, DE (1984). Analyse des données désordonnées . 1 . New York: Van Nostrand Reinhold.
  • Miller, A. (1997). "Configuration de Strip-Plot des factorielles fractionnaires". Technométrie . 39 (2): 153-161. doi : 10.2307 / 1270903 . JSTOR   1270903 .

Liens externes

 Cet article incorpore  du matériel du domaine public du site Web de l' Institut national des normes et de la technologie https://www.nist.gov .