Restrita randomização - Restricted randomization

Em estatística , a randomização restrita ocorre no planejamento de experimentos e, em particular, no contexto de experimentos randomizados e ensaios clínicos randomizados . A randomização restrita permite que alocações intuitivamente pobres de tratamentos para unidades experimentais sejam evitadas, enquanto mantém os benefícios teóricos da randomização. Por exemplo, em um ensaio clínico de um novo tratamento proposto para a obesidade em comparação com um controle, um experimentador gostaria de evitar os resultados da randomização em que o novo tratamento fosse alocado apenas para os pacientes mais pesados.

O conceito foi introduzido por Frank Yates (1948) e William J. Youden (1972) "como uma forma de evitar padrões espaciais inadequados de tratamentos em experimentos planejados".

Exemplo de dados aninhados

Considere um processo em lote que usa 7 wafers de monitor em cada execução. O plano também exige a medição de uma variável de resposta em cada wafer em cada um dos 9 locais. A organização do plano de amostragem tem uma estrutura hierárquica ou aninhada: a execução em lote é o nível superior, o segundo nível é um wafer individual e o terceiro nível é o local no wafer.

A quantidade total de dados gerados por lote será 7,9 = 63 observações. Uma abordagem para analisar esses dados seria calcular a média de todos esses pontos, bem como seu desvio padrão, e usar esses resultados como respostas para cada corrida.

Analisar os dados conforme sugerido acima não é absolutamente incorreto, mas fazer isso perde informações que poderiam ser obtidas de outra forma. Por exemplo, o local 1 no wafer 1 é fisicamente diferente do local 1 no wafer 2 ou em qualquer outro wafer. O mesmo é válido para qualquer um dos sites em qualquer um dos wafers. Da mesma forma, o wafer 1 na execução 1 é fisicamente diferente do wafer 1 na execução 2 e assim por diante. Para descrever essa situação, diz-se que os sites estão aninhados em wafers, enquanto os wafers estão aninhados em execuções.

Como consequência desse aninhamento, existem restrições à randomização que pode ocorrer no experimento. Este tipo de randomização restrita sempre produz fontes aninhadas de variação. Exemplos de variação aninhada ou randomização restrita discutido nesta página estão split-plot e tira-plot desenhos .

O objetivo de um experimento com este tipo de plano de amostragem é geralmente reduzir a variabilidade devido aos locais nos wafers e wafers dentro de execuções (ou lotes) no processo. Os locais nos wafers e os wafers dentro de um lote tornam-se fontes de variação indesejada e um investigador busca tornar o sistema robusto para essas fontes - em outras palavras, pode-se tratar os wafers e sites como fatores de ruído em tal experimento.

Como os wafers e os sites representam fontes indesejadas de variação e um dos objetivos é reduzir a sensibilidade do processo a essas fontes de variação, tratar wafers e sites como efeitos aleatórios na análise dos dados é uma abordagem razoável. Em outras palavras, a variação aninhada costuma ser outra maneira de dizer efeitos aleatórios aninhados ou fontes aninhadas de ruído. Se os fatores "wafers" e "sites" forem tratados como efeitos aleatórios, é possível estimar um componente de variância devido a cada fonte de variação por meio de técnicas de análise de variância . Uma vez que as estimativas dos componentes de variância tenham sido obtidas, um investigador é então capaz de determinar a maior fonte de variação no processo sob experimentação, e também determinar as magnitudes das outras fontes de variação em relação à maior fonte.

Efeitos aleatórios aninhados

Se um experimento ou processo tem variação aninhada, o experimento ou processo tem várias fontes de erros aleatórios que afetam sua saída. Ter efeitos aleatórios aninhados em um modelo é a mesma coisa que ter variação aninhada em um modelo.

Projetos de plotagem dividida

Os desenhos de parcelas divididas resultam quando um tipo particular de randomização restrita ocorre durante o experimento. Um experimento fatorial simples pode resultar em um projeto do tipo parcela dividida devido à maneira como o experimento foi realmente executado.

Em muitos experimentos industriais, três situações costumam ocorrer:

  1. alguns dos fatores de interesse podem ser 'difíceis de variar', enquanto os demais fatores são fáceis de variar. Como resultado, a ordem em que as combinações de tratamento para o experimento são executadas é determinada pela ordem desses fatores 'difíceis de variar'
  2. unidades experimentais são processadas juntas como um lote para um ou mais dos fatores em uma combinação de tratamento particular
  3. unidades experimentais são processadas individualmente, uma após a outra, para a mesma combinação de tratamento, sem redefinir as configurações de fator para essa combinação de tratamento.

Exemplos experimentais de split-plot

Um experimento executado em uma das três situações acima geralmente resulta em um tipo de desenho dividido em parcelas. Considere um experimento para examinar a galvanoplastia de alumínio (não aquoso) em tiras de cobre. Os três fatores de interesse são: atual (A); temperatura da solução (T); e a concentração da solução do agente de revestimento (S). A taxa de galvanização é a resposta medida. Há um total de 16 tiras de cobre disponíveis para o experimento. As combinações de tratamento a serem executadas (escalonadas ortogonalmente) estão listadas abaixo na ordem padrão (ou seja, não foram randomizadas):

Combinações de tratamento em escala ortogonal de um fatorial completo 2 3
Atual Temperatura Concentração
-1 -1 -1
-1 -1 +1
-1 +1 -1
-1 +1 +1
+1 -1 -1
+1 -1 +1
+1 +1 -1
+1 +1 +1

Exemplo: alguns fatores difíceis de variar

Considere executar o experimento sob a primeira condição listada acima, com a concentração da solução do fator do agente de galvanização (S) sendo difícil de variar. Uma vez que este fator é difícil de variar, o experimentador gostaria de randomizar as combinações de tratamento para que o fator de concentração da solução tenha um número mínimo de alterações. Em outras palavras, a randomização das execuções de tratamento é restrita um pouco pelo nível do fator de concentração da solução.

Como resultado, as combinações de tratamento podem ser randomizadas de modo que as execuções de tratamento correspondentes a um nível de concentração (-1) sejam executadas primeiro. Cada tira de cobre é revestida individualmente, o que significa que apenas uma tira de cada vez é colocada na solução para uma determinada combinação de tratamento. Uma vez que as quatro execuções no nível baixo de concentração da solução tenham sido concluídas, a solução é alterada para o nível alto de concentração (1) e as quatro execuções restantes do experimento são realizadas (onde, novamente, cada tira é individualmente banhada).

Uma vez que uma replicação completa do experimento foi concluída, uma segunda replicação é realizada com um conjunto de quatro tiras de cobre processadas para um determinado nível de concentração da solução antes de alterar a concentração e processar as quatro tiras restantes. Observe que os níveis para os dois fatores restantes ainda podem ser randomizados. Além disso, o nível de concentração que é executado primeiro nas execuções de replicação também pode ser randomizado.

Executar o experimento dessa forma resulta em um projeto de plotagem dividida . A concentração da solução é conhecida como o fator do gráfico inteiro e os fatores do subplot são a corrente e a temperatura da solução.

Um projeto de parcela dividida tem mais de uma unidade experimental de tamanho . Neste experimento, uma unidade experimental de tamanho é uma tira de cobre individual. Os tratamentos ou fatores que foram aplicados às tiras individuais são a temperatura da solução e a corrente (esses fatores foram alterados cada vez que uma nova tira foi colocada na solução). A outra unidade experimental de tamanho maior é um conjunto de quatro tiras de cobre. O tratamento ou fator que foi aplicado a um conjunto de quatro tiras é a concentração da solução (esse fator foi alterado depois que quatro tiras foram processadas). A unidade experimental de tamanho menor é chamada de unidade experimental de subtrama , enquanto a unidade experimental maior é chamada de unidade de parcela inteira .

Existem 16 unidades experimentais de subplot para este experimento. A temperatura e a corrente da solução são os fatores do subplot neste experimento. Existem quatro unidades experimentais de parcela inteira neste experimento. A concentração da solução é o fator do gráfico inteiro neste experimento. Uma vez que existem dois tamanhos de unidades experimentais, há dois termos de erro no modelo, um que corresponde ao erro de parcela inteira ou unidade experimental de parcela inteira e outro que corresponde ao erro de subparcela ou unidade experimental de subparcela.

A tabela ANOVA para este experimento ficaria, em parte, da seguinte maneira:

Tabela ANOVA parcial
Fonte DF
Replicação 1
Concentração 1
Erro (lote inteiro) = Rep × Conc 1
Temperatura 1
Rep × Temp 1
Atual 1
Rep × Atual 1
Temp × Conc 1
Rep × Temp × Conc 1
Temp × Corrente 1
Rep × Temp × Atual 1
Atual × Conc 1
Rep × Atual × Conc 1
Temp × Atual × Conc 1
Erro (subplot) = Rep × Temp × Atual × Conc 1

As primeiras três fontes são do nível da trama inteira, enquanto as 12 seguintes são da parte da subtrama. Um gráfico de probabilidade normal das 12 estimativas de termos do subplot pode ser usado para procurar termos estatisticamente significativos .

Exemplo: processo em lote

Considere executar o experimento sob a segunda condição listada acima (ou seja, um processo em lote) para o qual quatro tiras de cobre são colocadas na solução de uma vez. Um determinado nível de corrente pode ser aplicado a uma faixa individual dentro da solução. As mesmas 16 combinações de tratamento (um fatorial 2 3 replicado ) são executadas como no primeiro cenário. No entanto, a forma como o experimento é realizado seria diferente. Existem quatro combinações de tratamento de temperatura da solução e concentração da solução: (−1, −1), (−1, 1), (1, −1), (1, 1). O experimentador escolhe aleatoriamente um desses quatro tratamentos para configurar primeiro. Quatro tiras de cobre são colocadas na solução. Duas das quatro faixas são atribuídas aleatoriamente ao nível de baixa corrente. As duas faixas restantes são atribuídas ao nível de alta corrente. O revestimento é executado e a resposta é medida. Uma segunda combinação de tratamento de temperatura e concentração é escolhida e o mesmo procedimento é seguido. Isso é feito para todas as quatro combinações de temperatura / concentração.

Executar o experimento dessa forma também resulta em um projeto de gráfico dividido em que os fatores do gráfico inteiro são agora a concentração da solução e a temperatura da solução, e o fator do subplot é o atual.

Neste experimento, uma unidade experimental de tamanho é novamente uma tira de cobre individual. O tratamento ou fator que foi aplicado às tiras individuais é o atual (esse fator foi alterado a cada vez para uma tira diferente dentro da solução). A outra unidade experimental de tamanho maior é novamente um conjunto de quatro tiras de cobre. Os tratamentos ou fatores que foram aplicados a um conjunto de quatro tiras são a concentração da solução e a temperatura da solução (esses fatores foram alterados após o processamento de quatro tiras).

A unidade experimental de menor tamanho é novamente chamada de unidade experimental de subtrama. Existem 16 unidades experimentais de subplot para este experimento. Atual é o fator de subtrama neste experimento.

A unidade experimental de tamanho maior é a unidade experimental de parcela inteira. Existem quatro unidades experimentais de plotagem inteiras neste experimento e a concentração da solução e a temperatura da solução são os fatores de plotagem completos neste experimento.

Existem dois tamanhos de unidades experimentais e dois termos de erro no modelo: um que corresponde ao erro de parcela inteira ou unidade experimental de parcela inteira, e um que corresponde ao erro de subparcela ou unidade experimental de subparcela.

A ANOVA para este experimento parece, em parte, a seguinte:

Tabela ANOVA parcial
Fonte DF
Concentração 1
Temperatura 1
Erro (plotagem inteira) = Conc × Temp 1
Atual 1
Conc × Atual 1
Temp × Corrente 1
Conc × Temp × Current 1
Erro (subtrama) 8

As primeiras três fontes vêm do nível da trama inteira e as 5 seguintes vêm do nível da subtrama. Uma vez que há 8 graus de liberdade para o termo de erro do subplot, este MSE pode ser usado para testar cada efeito que envolve a corrente.

Exemplo: unidades experimentais processadas individualmente

Considere executar o experimento no terceiro cenário listado acima. Existe apenas uma tira de cobre na solução de cada vez. No entanto, duas tiras, uma na corrente baixa e outra na corrente alta, são processadas uma após a outra sob a mesma configuração de temperatura e concentração. Assim que as duas tiras forem processadas, a concentração é alterada e a temperatura é redefinida para outra combinação. Duas tiras são novamente processadas, uma após a outra, sob esta configuração de temperatura e concentração. Este processo continua até que todas as 16 tiras de cobre tenham sido processadas.

Executar o experimento dessa forma também resulta em um projeto de gráfico dividido em que os fatores do gráfico inteiro são novamente a concentração da solução e a temperatura da solução e o fator do subplot é o atual. Neste experimento, uma unidade experimental de tamanho é uma tira de cobre individual. O tratamento ou fator que foi aplicado às tiras individuais é o atual (esse fator foi alterado a cada vez para uma tira diferente dentro da solução). A outra unidade experimental, ou de tamanho maior, é um conjunto de duas tiras de cobre. Os tratamentos ou fatores que foram aplicados a um par de duas tiras são a concentração da solução e a temperatura da solução (esses fatores foram alterados após o processamento de duas tiras). A unidade experimental de menor tamanho é chamada de unidade experimental de subtrama.

Existem 16 unidades experimentais de subplot para este experimento. Atual é o fator da subtrama no experimento. Existem oito unidades experimentais de parcela inteira neste experimento. A concentração da solução e a temperatura da solução são todos os fatores do gráfico. Existem dois termos de erro no modelo, um que corresponde ao erro da parcela inteira ou unidade experimental da parcela inteira, e outro que corresponde ao erro da subparcela ou unidade experimental da subparcela.

A ANOVA para esta (terceira) abordagem é, em parte, a seguinte:

Tabela ANOVA parcial
Fonte DF
Concentração 1
Temperatura 1
Conc * Temp 1
Erro (lote inteiro) 4
Atual 1
Conc × Atual 1
Temp × Corrente 1
Conc × Temp × Current 1
Erro (subtrama) 4

Os primeiros quatro termos vêm da análise do gráfico inteiro e os próximos 5 termos vêm da análise do gráfico secundário. Observe que temos termos de erro separados para todo o gráfico e os efeitos do subplot, cada um baseado em 4 graus de liberdade.

Como pode ser visto a partir desses três cenários, uma das principais diferenças nos projetos de parcelas subdivididas em relação aos projetos fatoriais simples é o número de tamanhos diferentes de unidades experimentais no experimento. Projetos de gráfico dividido têm mais de uma unidade experimental de tamanho, ou seja, mais de um termo de erro. Uma vez que esses projetos envolvem diferentes tamanhos de unidades experimentais e diferentes variâncias, os erros padrão das várias comparações de médias envolvem uma ou mais das variâncias. Especificar o modelo apropriado para um projeto de parcela dividida envolve ser capaz de identificar cada tamanho de unidade experimental. A maneira como uma unidade experimental é definida em relação à estrutura do projeto (por exemplo, um projeto completamente aleatório versus um projeto de bloco completo aleatório ) e a estrutura de tratamento (por exemplo, um fatorial completo 2 3 , uma resolução V meia fração, um dois estrutura de tratamento forma com um grupo de controle , etc.). Como resultado de ter uma unidade experimental maior que um tamanho, o modelo apropriado usado para analisar projetos de plotagem dividida é um modelo misto .

Se os dados de um experimento são analisados ​​com apenas um termo de erro usado no modelo, conclusões enganosas e inválidas podem ser tiradas dos resultados.

Desenhos de strip-plot

Semelhante a um desenho de parcela dividida, um desenho de parcela de faixa pode resultar quando algum tipo de randomização restrita ocorreu durante o experimento. Um projeto fatorial simples pode resultar em um projeto strip-plot dependendo de como o experimento foi conduzido. Projetos de strip-plot frequentemente resultam de experimentos que são conduzidos em duas ou mais etapas do processo em que cada etapa do processo é um processo em lote, ou seja, completar cada combinação de tratamento do experimento requer mais de uma etapa de processamento com unidades experimentais processadas juntas em cada processo degrau. Como no projeto de plotagem dividida, os projetos de plotagem em faixas resultam quando a randomização no experimento foi restringida de alguma forma. Como resultado da randomização restrita que ocorre em desenhos de plotagem em faixas, existem vários tamanhos de unidades experimentais. Portanto, existem diferentes termos de erro ou diferentes variações de erro que são usados ​​para testar os fatores de interesse no design. Um desenho tradicional de strip-plot tem três tamanhos de unidades experimentais.

Exemplo de strip-plot: duas etapas e três variáveis ​​de fator

Considere o seguinte exemplo da indústria de semicondutores. Um experimento requer uma etapa de implante e uma etapa de recozimento. Tanto na etapa de recozimento quanto na de implante, há três fatores a serem testados. O processo de implante acomoda 12 wafers em um lote, e implantar um único wafer sob um conjunto especificado de condições não é prático nem representa o uso econômico do implantador. O forno de recozimento pode lidar com até 100 wafers.

As configurações para um projeto fatorial de dois níveis para os três fatores na etapa de implante são denotados (A, B, C), e um projeto fatorial de dois níveis para os três fatores na etapa de recozimento são denotados (D, E, F ) Também estão presentes os efeitos de interação entre os fatores de implante e os fatores de recozimento. Portanto, este experimento contém três tamanhos de unidades experimentais, cada uma com um termo de erro exclusivo para estimar a significância dos efeitos.

Para dar significado físico real a cada uma das unidades experimentais no exemplo acima, considere cada combinação de implante e etapas de recozimento como um wafer individual. Um lote de oito wafers passa primeiro pela etapa de implante. A combinação de tratamento 3 nos fatores A, B e C é a primeira execução de tratamento com implante. Este tratamento de implante é aplicado a todas as oito pastilhas de uma vez. Assim que o primeiro tratamento de implante for concluído, outro conjunto de oito wafers é implantado com a combinação de tratamento 5 dos fatores A, B e C. Isso continua até que o último lote de oito wafers seja implantado com a combinação de tratamento 6 dos fatores A, B e C. Uma vez que todas as oito combinações de tratamento dos fatores de implante tenham sido executadas, a etapa de recozimento começa. A primeira combinação de tratamento de recozimento a ser executada é a combinação de tratamento 5 dos fatores D, E e F. Esta combinação de tratamento de recozimento é aplicada a um conjunto de oito wafers, com cada um desses oito wafers vindo de uma das oito combinações de tratamento de implante. Após este primeiro lote de wafers ter sido recozido, o segundo tratamento de recozimento é aplicado a um segundo lote de oito wafers, com esses oito wafers vindo de uma de cada uma das oito combinações de tratamento de implante. Isso continua até que o último lote de oito wafers tenha sido implantado com uma combinação particular de fatores D, E e F.

Executar o experimento dessa forma resulta em um desenho strip-plot com três tamanhos de unidades experimentais. Um conjunto de oito wafers que são implantados juntos é a unidade experimental para os fatores de implante A, B e C e para todas as suas interações. Existem oito unidades experimentais para os fatores de implante. Um conjunto diferente de oito wafers é recozido. Este conjunto diferente de oito wafers é a unidade experimental de segundo tamanho e é a unidade experimental para os fatores de recozimento D, E e F e para todas as suas interações. A unidade experimental de terceiro tamanho é um único wafer. Esta é a unidade experimental para todos os efeitos de interação entre os fatores de implante e os fatores de recozimento.

Na verdade, a descrição acima do desenho do strip-plot representa um bloco ou uma réplica deste experimento. Se o experimento não contém replicação e o modelo para o implante contém apenas os efeitos principais e as interações de dois fatores, o termo de interação de três fatores A * B * C (1 grau de liberdade) fornece o termo de erro para a estimativa dos efeitos dentro a unidade experimental de implante. Invocar um modelo semelhante para a unidade experimental de recozimento produz o termo de interação de três fatores D * E * F para o termo de erro (1 grau de liberdade) para efeitos dentro da unidade experimental de recozimento.

Veja também

Referências

Leitura adicional

Para uma discussão mais detalhada desses projetos e os procedimentos de análise apropriados, consulte:

  • Milliken, GA; Johnson, DE (1984). Análise de dados bagunçados . 1 . Nova York: Van Nostrand Reinhold.
  • Miller, A. (1997). "Configuração Strip-Plot de Fatoriais Fracionários". Tecnometria . 39 (2): 153–161. doi : 10.2307 / 1270903 . JSTOR   1270903 .

links externos

 Este artigo incorpora  material em domínio público do Instituto Nacional de Padrões e Tecnologia website https://www.nist.gov .