Controlando para uma variável - Controlling for a variable

Em modelos causais , controlar uma variável significa categorizar os dados de acordo com os valores medidos da variável. Normalmente, isso é feito para que a variável não possa mais atuar como um fator de confusão , por exemplo, em um estudo observacional ou experimento .

Ao estimar o efeito das variáveis ​​explicativas em um resultado por regressão , as variáveis ​​controladas por são incluídas como entradas para separar seus efeitos das variáveis ​​explicativas.

Uma limitação do controle de variáveis ​​é que os caminhos dos fundos para fatores de confusão desconhecidos podem permanecer. O raciocínio contrafactual atenua a influência de fatores de confusão sem essa desvantagem.

Experimentos

Os experimentos tentam avaliar o efeito da manipulação de uma ou mais variáveis ​​independentes em uma ou mais variáveis ​​dependentes . Para garantir que o efeito medido não seja influenciado por fatores externos, outras variáveis ​​devem ser mantidas constantes. As variáveis ​​feitas para permanecerem constantes durante um experimento são chamadas de variáveis ​​de controle .

Por exemplo, se um experimento ao ar livre fosse conduzido para comparar como diferentes designs de asas de um avião de papel (a variável independente) afetam o quão longe ele pode voar (a variável dependente), seria desejável garantir que o experimento seja conduzido às vezes quando o tempo é o mesmo, porque não se gostaria que o tempo afetasse o experimento. Neste caso, as variáveis ​​de controle podem ser a velocidade do vento, direção e precipitação. Se o experimento foi conduzido quando estava ensolarado e sem vento, mas o tempo mudou, seria desejável adiar a conclusão do experimento até que as variáveis ​​de controle (o vento e o nível de precipitação) fossem as mesmas de quando o experimento começou.

Em experimentos controlados de opções de tratamento médico em humanos, os pesquisadores designam indivíduos aleatoriamente a um grupo de tratamento ou grupo de controle . Isso é feito para reduzir o efeito de confusão de variáveis ​​irrelevantes que não estão sendo estudadas, como o efeito placebo .

Estudos observacionais

Em um estudo observacional , os pesquisadores não têm controle sobre os valores das variáveis ​​independentes, como quem recebe o tratamento. Em vez disso, eles devem controlar as variáveis ​​usando estatísticas .

Os estudos observacionais são usados ​​quando os experimentos controlados podem ser antiéticos ou impraticáveis. Por exemplo, se um pesquisador desejasse estudar o efeito do desemprego ( a variável independente ) sobre a saúde ( a variável dependente ), seria considerado antiético pelos conselhos de revisão institucional designar aleatoriamente alguns participantes para ter empregos e outros não. Em vez disso, o pesquisador terá que criar uma amostra que inclua algumas pessoas empregadas e algumas pessoas desempregadas. No entanto, pode haver fatores que afetam se alguém está empregado e quão saudável ele ou ela é. Parte de qualquer associação observada entre a variável independente (situação de emprego) e a variável dependente (saúde) pode ser devido a esses fatores externos espúrios , em vez de indicar uma ligação verdadeira entre eles. Isso pode ser problemático mesmo em uma amostra aleatória verdadeira . Ao controlar as variáveis ​​estranhas, o pesquisador pode chegar mais perto de compreender o verdadeiro efeito da variável independente na variável dependente.

Neste contexto, as variáveis ​​estranhas podem ser controladas por meio de regressão múltipla . A regressão usa como variáveis ​​independentes não apenas aquela ou aquelas cujos efeitos sobre a variável dependente estão sendo estudados, mas também quaisquer potenciais variáveis ​​de confusão, evitando assim o viés de variável omitida . "Variáveis ​​de confusão" neste contexto significa outros fatores que não apenas influenciam a variável dependente (o resultado), mas também influenciam a variável independente principal .

Exemplo

Um estudo sobre se o envelhecimento afeta a satisfação com a vida de alguém . (Alguns pesquisadores percebem uma "forma de u": a satisfação com a vida parece diminuir primeiro e depois aumentar depois da meia-idade.) Para identificar as variáveis ​​de controle necessárias aqui, pode-se perguntar que outras variáveis ​​determinam não apenas a satisfação com a vida de alguém, mas também sua idade. Muitas outras variáveis ​​determinam a satisfação com a vida. Mas nenhuma outra variável determina a idade de uma pessoa (desde que permaneça viva). (Todas as pessoas continuam envelhecendo, na mesma proporção, não importa quais sejam suas outras características.) Portanto, nenhuma variável de controle é necessária aqui.

Para determinar as variáveis ​​de controle necessárias, pode ser útil construir um gráfico acíclico direcionado .

Veja também

Referências

Leitura adicional