Diferença em diferenças - Difference in differences

Diferença em diferenças ( DID ou DD ) é uma técnica estatística usada em econometria e pesquisa quantitativa nas ciências sociais que tenta imitar um projeto de pesquisa experimental usando dados de estudo observacional , estudando o efeito diferencial de um tratamento em um 'grupo de tratamento' versus um ' grupo de controle ' em um experimento natural . Ele calcula o efeito de um tratamento (ou seja, uma variável explicativa ou uma variável independente ) em um resultado (ou seja, uma variável de resposta ou variável dependente ), comparando a mudança média ao longo do tempo na variável de resultado para o grupo de tratamento com a mudança média ao longo do tempo para o grupo de controle. Embora se pretenda mitigar os efeitos de fatores estranhos e viés de seleção , dependendo de como o grupo de tratamento é escolhido, este método ainda pode estar sujeito a certos vieses (por exemplo, regressão média , causalidade reversa e viés de variável omitida ).

Em contraste com uma estimativa de série temporal do efeito do tratamento nos indivíduos (que analisa as diferenças ao longo do tempo) ou uma estimativa transversal do efeito do tratamento (que mede a diferença entre os grupos de tratamento e controle), a diferença nas diferenças usa dados de painel para medir as diferenças, entre o grupo de tratamento e o grupo de controle, das mudanças na variável de resultado que ocorrem ao longo do tempo.

Definição geral

Ilustração de diferença em diferenças.png

A diferença nas diferenças requer dados medidos de um grupo de tratamento e um grupo de controle em dois ou mais períodos de tempo diferentes, especificamente pelo menos um período de tempo antes do "tratamento" e pelo menos um período de tempo após o "tratamento". No exemplo ilustrado, o resultado no grupo de tratamento é representado pela linha P e o resultado no grupo de controle é representado pela linha S. A variável de resultado (dependente) em ambos os grupos é medida no tempo 1, antes que qualquer grupo tenha recebeu o tratamento (ou seja, a variável independente ou explicativa), representado pelos pontos P 1 e S 1 . O grupo de tratamento então recebe ou experimenta o tratamento e ambos os grupos são medidos novamente no tempo 2. Nem toda a diferença entre os grupos de tratamento e controle no tempo 2 (ou seja, a diferença entre P 2 e S 2 ) pode ser explicada como sendo um efeito do tratamento, porque o grupo de tratamento e o grupo de controle não começaram no mesmo ponto no tempo 1. DID, portanto, calcula a diferença "normal" na variável de resultado entre os dois grupos (a diferença que ainda existiria se nenhum grupo experimentou o tratamento), representada pela linha pontilhada Q . (Observe que a inclinação de P 1 a Q é a mesma que a inclinação de S 1 a S 2. ) O efeito do tratamento é a diferença entre o resultado observado (P 2 ) e o resultado "normal" (a diferença entre P 2 e Q).

Definição formal

Considere o modelo

onde é a variável dependente para indivíduo e tempo , é o grupo ao qual pertence (ou seja, o grupo de tratamento ou de controle) e é a abreviação para a variável fictícia igual a 1 quando o evento descrito em é verdadeiro e 0 caso contrário. No gráfico de tempo versus por grupo, é a interceptação vertical do gráfico para e é a tendência de tempo compartilhada por ambos os grupos de acordo com a suposição de tendência paralela (consulte as premissas abaixo). é o efeito do tratamento e é o termo residual .

Considere a média da variável dependente e indicadores dummy por grupo e tempo:

e suponha, para simplificar, que e . Observe que não é aleatório; ele apenas codifica como os grupos e os períodos são rotulados. Então

O pressuposto de exogeneidade estrita, então, implica que

Sem perda de generalidade , assuma que é o grupo de tratamento e é o período posterior, então e , dando o estimador DID

que pode ser interpretado como o efeito do tratamento indicado por . Abaixo é mostrado como este estimador pode ser lido como um coeficiente em uma regressão de mínimos quadrados ordinária. O modelo descrito nesta seção é super parametrizado; para remediar isso, um dos coeficientes para as variáveis ​​dummy pode ser definido como 0, por exemplo, podemos definir .

Premissas

Ilustração da hipótese de tendência paralela

Todas as suposições do modelo OLS se aplicam igualmente ao DID. Além disso, DID requer uma suposição de tendência paralela . A suposição de tendência paralela diz que são iguais em e . Dado que a definição formal acima representa com precisão a realidade, essa suposição é válida automaticamente. No entanto, um modelo com pode muito bem ser mais realista. A fim de aumentar a probabilidade de manutenção do pressuposto de tendência paralela, uma abordagem diferença-em-diferença é frequentemente combinada com correspondência . Isso envolve a 'correspondência' de unidades de 'tratamento' conhecidas com unidades de 'controle' contrafactuais simuladas: unidades caracteristicamente equivalentes que não receberam tratamento. Ao definir a Variável de Resultado como uma diferença temporal (mudança no resultado observado entre os períodos pré e pós-tratamento), e Combinar várias unidades em uma grande amostra com base em histórias de pré-tratamento semelhantes, o ATE resultante (ou seja, o ATT: Tratamento Médio Efeito para o Tratado) fornece uma estimativa de diferença em diferença robusta dos efeitos do tratamento. Isso serve a dois propósitos estatísticos: em primeiro lugar, condicionado às covariáveis ​​de pré-tratamento, a suposição de tendências paralelas provavelmente se manterá; e em segundo lugar, esta abordagem reduz a dependência de suposições de ignorabilidade associadas necessárias para inferência válida.

Conforme ilustrado à direita, o efeito do tratamento é a diferença entre o valor observado de y e o que o valor de y teria sido com tendências paralelas, se não houvesse tratamento. O calcanhar de Aquiles do TDI é quando algo diferente do tratamento muda em um grupo, mas não no outro ao mesmo tempo que o tratamento, implicando em uma violação da suposição de tendência paralela.

Para garantir a precisão da estimativa DID, presume-se que a composição dos indivíduos dos dois grupos permaneça inalterada ao longo do tempo. Ao usar um modelo DID, vários problemas que podem comprometer os resultados, como autocorrelação e quedas de Ashenfelter , devem ser considerados e tratados.

Implementação

O método DID pode ser implementado de acordo com a tabela abaixo, onde a célula inferior direita é o estimador DID.

Diferença
Mudar

Executar uma análise de regressão dá o mesmo resultado. Considere o modelo OLS

onde é uma variável fictícia para o período, igual a quando , e é uma variável fictícia para associação ao grupo, igual a quando . A variável composta é uma variável fictícia que indica quando . Embora não seja mostrado rigorosamente aqui, esta é uma parametrização adequada da definição formal do modelo , além disso, verifica-se que as médias de grupo e período nessa seção se relacionam com as estimativas dos parâmetros do modelo como segue

onde significa médias condicionais calculadas na amostra, por exemplo, é o indicador para o período posterior, é um indicador para o grupo de controle. Para ver a relação entre esta notação e a seção anterior, considere como acima apenas uma observação por período de tempo para cada grupo, então

e assim por diante para outros valores de e , que é equivalente a

Mas esta é a expressão para o efeito do tratamento que foi dada na definição formal e na tabela acima.

Exemplo de Card e Krueger (1994)

Considere um dos mais famosos estudos de DID, o artigo de Card e Krueger sobre o salário mínimo em Nova Jersey , publicado em 1994. Card e Krueger compararam empregos no setor de fast food em Nova Jersey e na Pensilvânia , em fevereiro de 1992 e em novembro de 1992, depois de New Jersey, o salário mínimo subiu de $ 4,25 para $ 5,05 em abril de 1992. Observar uma mudança no emprego apenas em New Jersey, antes e depois do tratamento, deixaria de controlar as variáveis ​​omitidas , como clima e condições macroeconômicas da região. Ao incluir a Pensilvânia como controle em um modelo de diferença em diferenças, qualquer viés causado por variáveis ​​comuns a Nova Jersey e Pensilvânia é implicitamente controlado, mesmo quando essas variáveis ​​não são observadas. Supondo que Nova Jersey e Pensilvânia tenham tendências paralelas ao longo do tempo, a mudança no emprego da Pensilvânia pode ser interpretada como a mudança que Nova Jersey teria experimentado se não tivessem aumentado o salário mínimo e vice-versa. As evidências sugeriram que o aumento do salário mínimo não induziu uma redução no emprego em Nova Jersey, ao contrário do que algumas teorias econômicas poderiam sugerir. A tabela abaixo mostra as estimativas da Card & Krueger do efeito do tratamento sobre o emprego, medido como FTEs (ou equivalentes em tempo integral) . Card e Krueger estimam que o aumento de US $ 0,80 do salário mínimo em Nova Jersey levou a um aumento de 2,75 FTE no emprego.

Nova Jersey Pensilvânia Diferença
fevereiro 20,44 23,33 -2,89
novembro 21,03 21,17 -0,14
Mudar 0,59 -2,16 2,75

Veja também

Referências

Leitura adicional

links externos