Controlando para uma variável - Controlling for a variable
Em modelos causais , controlar uma variável significa categorizar os dados de acordo com os valores medidos da variável. Normalmente, isso é feito para que a variável não possa mais atuar como um fator de confusão , por exemplo, em um estudo observacional ou experimento .
Ao estimar o efeito das variáveis explicativas em um resultado por regressão , as variáveis controladas por são incluídas como entradas para separar seus efeitos das variáveis explicativas.
Uma limitação do controle de variáveis é que os caminhos dos fundos para fatores de confusão desconhecidos podem permanecer. O raciocínio contrafactual atenua a influência de fatores de confusão sem essa desvantagem.
Experimentos
Os experimentos tentam avaliar o efeito da manipulação de uma ou mais variáveis independentes em uma ou mais variáveis dependentes . Para garantir que o efeito medido não seja influenciado por fatores externos, outras variáveis devem ser mantidas constantes. As variáveis feitas para permanecerem constantes durante um experimento são chamadas de variáveis de controle .
Por exemplo, se um experimento ao ar livre fosse conduzido para comparar como diferentes designs de asas de um avião de papel (a variável independente) afetam o quão longe ele pode voar (a variável dependente), seria desejável garantir que o experimento seja conduzido às vezes quando o tempo é o mesmo, porque não se gostaria que o tempo afetasse o experimento. Neste caso, as variáveis de controle podem ser a velocidade do vento, direção e precipitação. Se o experimento foi conduzido quando estava ensolarado e sem vento, mas o tempo mudou, seria desejável adiar a conclusão do experimento até que as variáveis de controle (o vento e o nível de precipitação) fossem as mesmas de quando o experimento começou.
Em experimentos controlados de opções de tratamento médico em humanos, os pesquisadores designam indivíduos aleatoriamente a um grupo de tratamento ou grupo de controle . Isso é feito para reduzir o efeito de confusão de variáveis irrelevantes que não estão sendo estudadas, como o efeito placebo .
Estudos observacionais
Em um estudo observacional , os pesquisadores não têm controle sobre os valores das variáveis independentes, como quem recebe o tratamento. Em vez disso, eles devem controlar as variáveis usando estatísticas .
Os estudos observacionais são usados quando os experimentos controlados podem ser antiéticos ou impraticáveis. Por exemplo, se um pesquisador desejasse estudar o efeito do desemprego ( a variável independente ) sobre a saúde ( a variável dependente ), seria considerado antiético pelos conselhos de revisão institucional designar aleatoriamente alguns participantes para ter empregos e outros não. Em vez disso, o pesquisador terá que criar uma amostra que inclua algumas pessoas empregadas e algumas pessoas desempregadas. No entanto, pode haver fatores que afetam se alguém está empregado e quão saudável ele ou ela é. Parte de qualquer associação observada entre a variável independente (situação de emprego) e a variável dependente (saúde) pode ser devido a esses fatores externos espúrios , em vez de indicar uma ligação verdadeira entre eles. Isso pode ser problemático mesmo em uma amostra aleatória verdadeira . Ao controlar as variáveis estranhas, o pesquisador pode chegar mais perto de compreender o verdadeiro efeito da variável independente na variável dependente.
Neste contexto, as variáveis estranhas podem ser controladas por meio de regressão múltipla . A regressão usa como variáveis independentes não apenas aquela ou aquelas cujos efeitos sobre a variável dependente estão sendo estudados, mas também quaisquer potenciais variáveis de confusão, evitando assim o viés de variável omitida . "Variáveis de confusão" neste contexto significa outros fatores que não apenas influenciam a variável dependente (o resultado), mas também influenciam a variável independente principal .
Exemplo
Um estudo sobre se o envelhecimento afeta a satisfação com a vida de alguém . (Alguns pesquisadores percebem uma "forma de u": a satisfação com a vida parece diminuir primeiro e depois aumentar depois da meia-idade.) Para identificar as variáveis de controle necessárias aqui, pode-se perguntar que outras variáveis determinam não apenas a satisfação com a vida de alguém, mas também sua idade. Muitas outras variáveis determinam a satisfação com a vida. Mas nenhuma outra variável determina a idade de uma pessoa (desde que permaneça viva). (Todas as pessoas continuam envelhecendo, na mesma proporção, não importa quais sejam suas outras características.) Portanto, nenhuma variável de controle é necessária aqui.
Para determinar as variáveis de controle necessárias, pode ser útil construir um gráfico acíclico direcionado .
Veja também
Referências
Leitura adicional
- Freedman, David; Pisani, Robert; Purves, Roger (2007). Estatísticas . WW Norton & Company. ISBN 978-0393929720.