Estimativa de variáveis ​​instrumentais - Instrumental variables estimation

Em estatística , econometria , epidemiologia e disciplinas relacionadas, o método de variáveis ​​instrumentais ( IV ) é usado para estimar relações causais quando experimentos controlados não são viáveis ​​ou quando um tratamento não é administrado com sucesso a todas as unidades em um experimento aleatório. Intuitivamente, os IVs são usados ​​quando uma variável explicativa de interesse é correlacionada com o termo de erro, caso em que mínimos quadrados ordinários e ANOVA fornecem resultados enviesados . Um instrumento válido induz mudanças na variável explicativa, mas não tem efeito independente na variável dependente, permitindo ao pesquisador descobrir o efeito causal da variável explicativa na variável dependente.

Os métodos de variáveis ​​instrumentais permitem uma estimativa consistente quando as variáveis ​​explicativas (covariáveis) são correlacionadas com os termos de erro em um modelo de regressão . Essa correlação pode ocorrer quando:

  1. mudanças na variável dependente mudam o valor de pelo menos uma das covariáveis (causação "reversa"),
  2. existem variáveis ​​omitidas que afetam as variáveis ​​dependentes e independentes, ou
  3. as covariáveis ​​estão sujeitas a erros de medição não aleatórios .

Variáveis ​​explicativas que sofrem de um ou mais desses problemas no contexto de uma regressão às vezes são chamadas de endógenas . Nessa situação, os mínimos quadrados ordinários produzem estimativas enviesadas e inconsistentes. No entanto, se um instrumento estiver disponível, estimativas consistentes ainda podem ser obtidas. Um instrumento é uma variável que não pertence à equação explicativa, mas está correlacionada com as variáveis ​​explicativas endógenas , condicionalmente ao valor de outras covariáveis.

Em modelos lineares, existem dois requisitos principais para o uso de IVs:

  • O instrumento deve ser correlacionado com as variáveis ​​explicativas endógenas, condicionalmente às demais covariáveis. Se essa correlação for forte, diz-se que o instrumento tem um primeiro estágio forte . Uma correlação fraca pode fornecer inferências enganosas sobre estimativas de parâmetros e erros padrão.
  • O instrumento não pode ser correlacionado com o termo de erro na equação explicativa, condicionalmente às demais covariáveis. Em outras palavras, o instrumento não pode sofrer do mesmo problema que a variável de previsão original. Se essa condição for atendida, o instrumento é considerado como satisfazendo a restrição de exclusão .

Introdução

O conceito de variáveis ​​instrumentais foi derivado pela primeira vez por Philip G. Wright , possivelmente em coautoria com seu filho Sewall Wright , no contexto de equações simultâneas em seu livro de 1928 The Tariff on Animal and Vegetable Oils . Em 1945, Olav Reiersøl aplicou a mesma abordagem no contexto de modelos de erros em variáveis em sua dissertação, dando ao método seu nome.

Embora as idéias por trás de IV se estendam a uma ampla classe de modelos, um contexto muito comum para IV é a regressão linear. Tradicionalmente, uma variável instrumental é definida como uma variável Z que está correlacionada com a variável independente X e não correlacionada com o "termo de erro" U na equação linear

é um vetor. é uma matriz, geralmente com uma coluna de uns e talvez com colunas adicionais para outras covariáveis. Considere como um instrumento pode ser recuperado. Lembre-se que MQO resolve para tal que (quando minimizar a soma dos erros quadrados, a condição de primeira ordem é exatamente .) Se o modelo verdadeiro acredita-se ter devido a qualquer das razões listadas acima, por exemplo, se houver uma variável omitida que afeta ambos e separadamente - então este procedimento OLS não produzirá o impacto causal de on . O OLS simplesmente escolherá o parâmetro que faz com que os erros resultantes pareçam não correlacionados com .

Considere, para simplificar, o caso de uma única variável. Suponha que estejamos considerando uma regressão com uma variável e uma constante (talvez nenhuma outra covariada seja necessária, ou talvez tenhamos eliminado quaisquer outras covariáveis ​​relevantes):

Nesse caso, o coeficiente do regressor de interesse é dado por . Substituindo por dá

onde é o que o vetor de coeficiente estimado seria se x não fosse correlacionado com u . Nesse caso, pode ser mostrado que é um estimador imparcial de If no modelo subjacente que acreditamos, então OLS fornece um coeficiente que não reflete o efeito causal subjacente de interesse. IV ajuda a corrigir esse problema, identificando os parâmetros não com base em se não está correlacionado com , mas com base em se outra variável não está correlacionada com . Se a teoria sugerir que está relacionado a (o primeiro estágio), mas não correlacionado com (a restrição de exclusão), então IV pode identificar o parâmetro causal de interesse onde o OLS falha. Como existem várias maneiras específicas de usar e derivar estimadores IV, mesmo no caso linear (IV, 2SLS, GMM), salvamos uma discussão adicional para a seção Estimativa abaixo.

Exemplo

Informalmente, na tentativa de avaliar o efeito causal de alguma variável X no outro Y , um instrumento é uma terceira variável Z que afecta Y única através do seu efeito em  X . Por exemplo, suponha que um pesquisador deseja estimar o efeito causal do tabagismo na saúde geral. A correlação entre saúde e fumo não significa que fumar causa problemas de saúde porque outras variáveis, como depressão, podem afetar a saúde e o fumo, ou porque a saúde pode afetar o fumo. É, na melhor das hipóteses, difícil e caro conduzir experimentos controlados sobre o status de fumante na população em geral. O pesquisador pode tentar estimar o efeito causal do tabagismo sobre a saúde a partir de dados observacionais, usando a alíquota de impostos para produtos de tabaco como um instrumento para fumar. A alíquota de imposto para produtos de tabaco é uma escolha razoável para um instrumento porque o pesquisador assume que ela só pode ser correlacionada com a saúde por meio de seu efeito sobre o tabagismo. Se o pesquisador descobrir que os impostos sobre o tabaco e o estado de saúde estão correlacionados, isso pode ser visto como uma evidência de que o fumo causa mudanças na saúde.

Angrist e Krueger (2001) apresentam um levantamento da história e dos usos de técnicas de variáveis ​​instrumentais.

Definição gráfica

É claro que as técnicas IV foram desenvolvidas em uma classe muito mais ampla de modelos não lineares. As definições gerais de variáveis ​​instrumentais, usando formalismo contrafactual e gráfico, foram fornecidas por Pearl (2000; p. 248). A definição gráfica requer que Z satisfaça as seguintes condições:

onde representa d -separation e representa o gráfico no qual todas as setas que entram em X são cortadas.

A definição contrafactual requer que Z satisfaça

onde Y x representa o valor que Y atingiria se X fosse x e representa independência.

Se houver co-variáveis adicionais W , em seguida, as definições acima são modificadas para que Z qualifica como um instrumento se os critérios fornecidos segurar condicionada W .

A essência da definição de Pearl é:

  1. As equações de interesse são "estruturais", não "regressão".
  2. O termo de erro U representa todos os fatores exógenos que afetam Y quando X é mantido constante.
  3. O instrumento Z deve ser independente de U.
  4. O instrumento Z não deve afetar Y quando X é mantido constante (restrição de exclusão).
  5. O instrumento Z não deve ser independente de X.

Essas condições não dependem da forma funcional específica das equações e, portanto, são aplicáveis ​​a equações não lineares, onde U pode ser não aditivo (consulte Análise não paramétrica). Eles também são aplicáveis ​​a um sistema de equações múltiplas, no qual X (e outros fatores) afetam Y por meio de várias variáveis ​​intermediárias. Uma variável instrumental não precisa ser uma causa de X ; um proxy de tal causa também pode ser usado, se satisfizer as condições 1–5. A restrição de exclusão (condição 4) é redundante; segue das condições 2 e 3.

Selecionando instrumentos adequados

Visto que U não é observado, o requisito de que Z seja independente de U não pode ser inferido a partir dos dados e, em vez disso, deve ser determinado a partir da estrutura do modelo, ou seja, o processo de geração de dados. Gráficos causais são uma representação desta estrutura, e a definição dada acima gráfica pode ser utilizada para determinar rapidamente se uma variável Z qualifica como uma variável instrumental dado um conjunto de co-variáveis W . Para ver como, considere o seguinte exemplo.

Suponha que desejamos estimar o efeito de um programa de tutoria universitária na média de notas ( GPA ). A relação entre frequentar o programa de tutoria e o GPA pode ser confundida por uma série de fatores. Os alunos que frequentam o programa de tutoria podem se preocupar mais com suas notas ou podem estar tendo dificuldades com seu trabalho. Essa confusão é ilustrada nas Figuras 1–3 à direita, através do arco bidirecional entre o Programa de Tutoria e o GPA. Se os alunos são atribuídos a dormitórios aleatoriamente, a proximidade do dormitório do aluno ao programa de tutoria é um candidato natural a ser uma variável instrumental.

No entanto, e se o programa de tutoria estiver localizado na biblioteca da faculdade? Nesse caso, a proximidade também pode fazer com que os alunos passem mais tempo na biblioteca, o que, por sua vez, melhora seu GPA (consulte a Figura 1). Usando o gráfico causal representado na Figura 2, vemos que Proximidade não se qualifica como uma variável instrumental porque está conectada ao GPA por meio do caminho Biblioteca de Proximidade Horas GPA em . No entanto, se controlarmos o Horário da Biblioteca adicionando-o como uma covariável, a Proximidade se tornará uma variável instrumental, uma vez que a Proximidade é separada do GPA dado o Horário da Biblioteca em .

Agora, suponha que notamos que a "habilidade natural" de um aluno afeta seu número de horas na biblioteca, bem como seu GPA, como na Figura 3. Usando o gráfico causal, vemos que Library Hours é um colisor e o condicionamento nele abre o caminho Biblioteca de Proximidade Horas GPA. Como resultado, a proximidade não pode ser usada como uma variável instrumental.

Finalmente, suponha que o Horário da Biblioteca não afete realmente o GPA porque os alunos que não estudam na biblioteca simplesmente estudam em outro lugar, como na Figura 4. Nesse caso, controlar o Horário da Biblioteca ainda abre um caminho espúrio de Proximidade para o GPA. No entanto, se não controlarmos o Horário da Biblioteca e removê-lo como uma covariável, Proximidade poderá ser usada novamente como uma variável instrumental.

Estimativa

Agora revisitamos e expandimos a mecânica do IV com mais detalhes. Suponha que os dados sejam gerados por um processo do formulário

Onde

  • i indexa observações,
  • é o i -ésimo valor da variável dependente,
  • é um vetor dos i- ésimos valores das variáveis ​​independentes e uma constante,
  • é o i -ésimo valor de um termo de erro não observado que representa todas as causas de outros que não , e
  • é um vetor de parâmetro não observado.

O vetor de parâmetro é o efeito causal de uma mudança de unidade em cada elemento de , mantendo todas as outras causas constantes. O objetivo econométrico é estimar . Para simplificar, suponha que os sorteios de e não sejam correlacionados e que sejam obtidos de distribuições com a mesma variância (ou seja, que os erros não sejam serialmente correlacionados e homocedásticos ).

Suponha também que um modelo de regressão nominalmente da mesma forma seja proposto. Dada uma amostra aleatória de T observações deste processo, o estimador de mínimos quadrados ordinários é

onde X , Y e e vectores de comprimento de coluna denotam T . Esta equação é semelhante à equação envolvida na introdução (esta é a versão matricial dessa equação). Quando X e e não estão correlacionados , sob certas condições de regularidade, o segundo termo tem um valor esperado condicional em X de zero e converge para zero no limite, então o estimador é imparcial e consistente. Quando X e as outras não medidas, as variáveis ​​causais colapsadas no termo e são correlacionadas, entretanto, o estimador OLS é geralmente enviesado e inconsistente para  β . Nesse caso, é válido usar as estimativas para prever os valores de y dados valores de X , mas a estimativa não recupera o efeito causal de X em  y .

Para recuperar o parâmetro subjacente , introduzimos um conjunto de variáveis Z que é altamente correlacionado com cada componente endógeno de X, mas (em nosso modelo subjacente) não está correlacionado com  e . Para simplificar, pode-se considerar que X é uma matriz T × 2 composta por uma coluna de constantes e uma variável endógena e Z como um T × 2 que consiste em uma coluna de constantes e uma variável instrumental. No entanto, esta técnica generaliza para X sendo uma matriz de uma constante e, digamos, 5 variáveis ​​endógenas, com Z sendo uma matriz composta de uma constante e 5 instrumentos. Na discussão a seguir, assumiremos que X é uma matriz T × K e deixaremos esse valor K não especificado. Um estimador em que X e Z são matrizes T × K é referido como recém-identificado .

Suponha que a relação entre cada componente endógeno x i e os instrumentos seja dada por

A especificação IV mais comum usa o seguinte estimador:

Esta especificação aborda o parâmetro verdadeiro conforme a amostra fica grande, desde que no modelo verdadeiro:

Enquanto no processo subjacente que gera os dados, o uso apropriado do estimador IV identificará este parâmetro. Isso funciona porque o IV resolve o parâmetro exclusivo que satisfaz e, portanto, atinge o verdadeiro parâmetro subjacente à medida que o tamanho da amostra aumenta.

Agora uma extensão: suponha que há mais instrumentos do que há co-variáveis na equação de interesse, de modo que Z é um T × M matriz com M> K . Isso geralmente é chamado de caso superidentificado . Nesse caso, o método generalizado dos momentos (GMM) pode ser usado. O estimador GMM IV é

onde se refere à matriz de projeção .

Essa expressão se reduz à primeira quando o número de instrumentos é igual ao número de covariáveis ​​na equação de interesse. O IV superidentificado é, portanto, uma generalização do IV recém-identificado.

Prova de que β GMM entra em colapso para β IV no caso recém-identificado

Desenvolvendo a expressão:

No caso just-identificado, temos tantos instrumentos como co-variáveis, de modo que a dimensão X é a mesma que a de  Z . Portanto, e são todas matrizes quadradas da mesma dimensão. Podemos expandir o inverso, utilizando o facto de que, para qualquer invertível n -by- n matrizes A e B , ( AB ) -1 = B -1 Uma -1 (ver matriz invertível # Propriedades ):

Referência: ver Davidson e Mackinnnon (1993)

Há um equivalente identificado sob- estimador para o caso em que m <k . Uma vez que os parâmetros são as soluções para um conjunto de equações lineares, um modelo subidentificado usando o conjunto de equações não tem uma solução única.

Interpretação como mínimos quadrados de dois estágios

Um método computacional que pode ser usado para calcular estimativas de IV são os mínimos quadrados de dois estágios (2SLS ou TSLS). No primeiro estágio, cada variável explicativa que é uma covariável endógena na equação de interesse é regredida em todas as variáveis ​​exógenas no modelo, incluindo ambas as covariáveis ​​exógenas na equação de interesse e os instrumentos excluídos. Os valores previstos dessas regressões são obtidos:

Etapa 1: retroceda cada coluna de X em Z , ( ):

e salve os valores previstos:

Na segunda etapa, a regressão de interesse é estimada normalmente, exceto que nesta etapa cada covariável endógena é substituída pelos valores previstos da primeira etapa:

Etapa 2: Regressar Y nos valores previstos da primeira etapa:

que dá

Este método só é válido em modelos lineares. Para covariáveis ​​endógenas categóricas, pode-se ficar tentado a usar um primeiro estágio diferente dos mínimos quadrados ordinários, como um modelo Probit para o primeiro estágio seguido por OLS para o segundo. Isso é comumente conhecido na literatura econométrica como a regressão proibida , porque as estimativas dos parâmetros IV do segundo estágio são consistentes apenas em casos especiais.

Prova: cálculo do estimador 2SLS

O estimador OLS habitual é: . Substituindo e observando que é uma matriz simétrica e idempotente , de modo que

O estimador resultante de é numericamente idêntico à expressão exibida acima. Uma pequena correção deve ser feita nos resíduos da soma dos quadrados no modelo ajustado de segundo estágio para que a matriz de covariância de seja calculada corretamente.

Análise não paramétrica

Quando a forma das equações estruturais é desconhecida, uma variável instrumental ainda pode ser definida por meio das equações:

onde e são duas funções arbitrárias e são independentes de . Ao contrário dos modelos lineares, no entanto, as medições de e não permitem a identificação do efeito médio causal da em , denotado ACE

Balke e Pearl [1997] derivaram limites estreitos no ACE e mostraram que eles podem fornecer informações valiosas sobre o sinal e o tamanho do ACE.

Na análise linear, não há teste para falsificar a suposição de que é instrumental em relação ao par . Este não é o caso quando é discreto. Pearl (2000) mostrou que, para todos e , a seguinte restrição, chamada de "Desigualdade Instrumental" deve ser mantida sempre que satisfizer as duas equações acima:

Interpretação sob heterogeneidade do efeito do tratamento

A exposição acima assume que o efeito causal de interesse não varia entre as observações, ou seja, que é uma constante. Geralmente, diferentes sujeitos responderão de maneiras diferentes às mudanças no "tratamento" x . Quando essa possibilidade é reconhecida, o efeito médio na população de uma mudança em x sobre y pode diferir do efeito em uma determinada subpopulação. Por exemplo, o efeito médio de um programa de treinamento profissional pode diferir substancialmente entre o grupo de pessoas que realmente recebe o treinamento e o grupo que opta por não receber treinamento. Por essas razões, os métodos IV invocam suposições implícitas sobre a resposta comportamental ou, mais geralmente, suposições sobre a correlação entre a resposta ao tratamento e a propensão para recebê-lo.

O estimador IV padrão pode recuperar os efeitos médios locais do tratamento (LATE) em vez dos efeitos médios do tratamento (ATE). Imbens e Angrist (1994) demonstram que a estimativa linear IV pode ser interpretada sob condições fracas como uma média ponderada dos efeitos da média local do tratamento, onde os pesos dependem da elasticidade do regressor endógeno às mudanças nas variáveis ​​instrumentais. Grosso modo, isso significa que o efeito de uma variável só é revelado para as subpopulações afetadas pelas mudanças observadas nos instrumentos, e que as subpopulações que mais respondem às mudanças nos instrumentos terão os maiores efeitos na magnitude da estimativa IV.

Por exemplo, se um pesquisador usa a presença de uma faculdade com concessão de terras como um instrumento para a educação universitária em uma regressão de ganhos, ela identifica o efeito da faculdade sobre os ganhos na subpopulação que obteria um diploma universitário se uma faculdade estivesse presente, mas que teria não obter um diploma se uma faculdade não estiver presente. Essa abordagem empírica não diz, sem suposições adicionais, nada ao pesquisador sobre o efeito da faculdade entre pessoas que sempre ou nunca obteriam um diploma universitário, independentemente da existência de uma faculdade local.

Problema de instrumentos fracos

Como Bound, Jaeger e Baker (1995) observam, um problema é causado pela seleção de instrumentos "fracos", instrumentos que são preditores fracos do preditor de pergunta endógena na equação do primeiro estágio. Nesse caso, a previsão do preditor da pergunta pelo instrumento será pobre e os valores previstos terão muito pouca variação. Consequentemente, é improvável que tenham muito sucesso em prever o resultado final quando são usados ​​para substituir o preditor de pergunta na equação do segundo estágio.

No contexto do exemplo de tabagismo e saúde discutido acima, os impostos sobre o tabaco são instrumentos fracos para fumar se o tabagismo for amplamente insensível às mudanças nos impostos. Se impostos mais altos não induzem as pessoas a parar de fumar (ou a não começar a fumar), então a variação nas taxas de impostos não nos diz nada sobre o efeito do fumo na saúde. Se os impostos afetam a saúde por meio de outros canais que não seu efeito sobre o fumo, os instrumentos são inválidos e a abordagem das variáveis ​​instrumentais pode gerar resultados enganosos. Por exemplo, lugares e horários com populações relativamente preocupadas com a saúde podem implementar altos impostos sobre o tabaco e exibir melhor saúde, mesmo mantendo constantes as taxas de fumo, então observaríamos uma correlação entre os impostos sobre a saúde e o tabaco, mesmo se fumar não tivesse efeito na saúde. Nesse caso, estaríamos errados ao inferir um efeito causal do tabagismo na saúde a partir da correlação observada entre os impostos sobre o tabaco e a saúde.

Testando instrumentos fracos

A força dos instrumentos pode ser avaliada diretamente porque tanto as covariáveis ​​endógenas quanto os instrumentos são observáveis. Uma regra prática comum para modelos com um regressor endógeno é: a estatística F contra o nulo de que os instrumentos excluídos são irrelevantes na regressão de primeiro estágio deve ser maior que 10.

Inferência estatística e teste de hipótese

Quando as co-variáveis são exógenos, as propriedades de pequena amostra do estimador OLS pode ser derivado de uma maneira simples por meio do cálculo momentos do estimador condicional em X . Quando algumas das covariáveis ​​são endógenas de modo que a estimação das variáveis ​​instrumentais seja implementada, expressões simples para os momentos do estimador não podem ser obtidas. Geralmente, os estimadores de variáveis ​​instrumentais têm apenas propriedades assintóticas desejáveis, não de amostra finita, e a inferência é baseada em aproximações assintóticas para a distribuição de amostragem do estimador. Mesmo quando os instrumentos não estão correlacionados com o erro na equação de interesse e quando os instrumentos não são fracos, as propriedades da amostra finita do estimador de variáveis ​​instrumentais podem ser pobres. Por exemplo, modelos exatamente identificados produzem estimadores de amostra finita sem momentos, então o estimador pode ser considerado nem tendencioso nem não tendencioso, o tamanho nominal das estatísticas de teste pode ser substancialmente distorcido e as estimativas podem comumente estar longe do valor verdadeiro do parâmetro.

Testando a restrição de exclusão

A suposição de que os instrumentos não estão correlacionados com o termo de erro na equação de interesse não é testável em modelos exatamente identificados. Se o modelo for superidentificado, há informações disponíveis que podem ser usadas para testar essa suposição. O teste mais comum dessas restrições de superidentificação , chamado de teste de Sargan -Hansen , é baseado na observação de que os resíduos não devem estar correlacionados com o conjunto de variáveis ​​exógenas se os instrumentos forem realmente exógenos. A estatística do teste Sargan-Hansen pode ser calculada como (o número de observações multiplicado pelo coeficiente de determinação ) da regressão OLS dos resíduos para o conjunto de variáveis ​​exógenas. Esta estatística será assintoticamente qui-quadrada com m  -  k graus de liberdade sob o nulo de que o termo de erro não está correlacionado com os instrumentos.

Aplicação a modelos de efeitos aleatórios e fixos

Nos modelos de efeitos aleatórios (RE) e efeitos fixos (FE) padrão para dados de painel , as variáveis ​​independentes são consideradas não correlacionadas com os termos de erro. Desde que haja instrumentos válidos, os métodos RE e FE estendem-se ao caso em que algumas das variáveis ​​explicativas podem ser endógenas. Como no cenário exógeno, o modelo RE com Variáveis ​​Instrumentais (REIV) requer suposições mais rigorosas do que o modelo FE com Variáveis ​​Instrumentais (FEIV), mas tende a ser mais eficiente em condições apropriadas.

Para corrigir ideias, considere o seguinte modelo:

onde é um efeito invariante no tempo específico da unidade não observado (chame-o de efeito não observado) e pode ser correlacionado com for s possivelmente diferente de t . Suponha que exista um conjunto de instrumentos válidos .

Na configuração REIV, as principais suposições incluem que não está correlacionado com , bem como para . Na verdade, para que o estimador REIV seja eficiente, são necessárias condições mais fortes do que a não correlação entre os instrumentos e o efeito não observado.

Por outro lado, o estimador FEIV requer apenas que os instrumentos sejam exógenos com termos de erro após o condicionamento do efeito não observado, isto é . A condição FEIV permite correlação arbitrária entre instrumentos e efeito não observado. No entanto, essa generalidade não vem de graça: variáveis ​​explicativas e instrumentais invariantes no tempo não são permitidas. Como no método FE usual, o estimador usa variáveis ​​degradadas pelo tempo para remover o efeito não observado. Portanto, o estimador FEIV seria de uso limitado se as variáveis ​​de interesse incluíssem aquelas invariantes no tempo.

A discussão acima tem paralelo ao caso exógeno dos modelos RE e FE. No caso exógeno, RE assume não correlação entre variáveis ​​explicativas e efeito não observado, e FE permite correlação arbitrária entre os dois. Semelhante ao caso padrão, o REIV tende a ser mais eficiente do que o FEIV, desde que as premissas apropriadas sejam mantidas.

Veja também

Referências

Leitura adicional

Bibliografia

  • Wooldridge, J. (1997): Quasi-Likelihood Methods for Count Data, Handbook of Applied Econometrics, Volume 2, ed. MH Pesaran e P. Schmidt, Oxford, Blackwell, pp. 352-406
  • Terza, JV (1998): "Estimating Count Models with Endogenous Switching: Sample Selection and Endogenous Treatment Effects." Journal of Econometrics (84), pp. 129-154
  • Wooldridge, J. (2002): "Econometric Analysis of Cross Section and Panel Data", MIT Press , Cambridge, Massachusetts.

links externos