Modelo probit multivariado - Multivariate probit model

Em estatística e econometria , o modelo probit multivariado é uma generalização do modelo probit usado para estimar vários resultados binários correlacionados em conjunto. Por exemplo, se acreditar que as decisões de enviar pelo menos uma criança para a escola pública e de votar a favor de um orçamento escolar estão correlacionadas (ambas as decisões são binárias), então o modelo probit multivariado seria apropriado para prever conjuntamente estes duas escolhas em uma base específica do indivíduo. JR Ashford e RR Sowden inicialmente propuseram uma abordagem para análise probit multivariada. Siddhartha Chib e Edward Greenberg estenderam essa ideia e também propuseram métodos de inferência baseados em simulação para o modelo probit multivariado que simplificou e generalizou a estimativa de parâmetros.

Exemplo: probit bivariada

No modelo probit comum, há apenas uma variável dependente binária e, portanto, apenas uma variável latente é usada. Em contraste, no modelo probit bivariado existem duas variáveis ​​dependentes binárias e , portanto, existem duas variáveis ​​latentes: e . Supõe-se que cada variável observada assume o valor 1 se e somente se sua variável latente contínua subjacente assume um valor positivo:

com

e

Ajustar o modelo probit bivariado envolve estimar os valores de e . Para fazer isso, a probabilidade do modelo deve ser maximizada . Essa probabilidade é

Substituindo as variáveis ​​latentes e nas funções de probabilidade e tomando logs dá

Após algumas reescritas, a função de probabilidade de log torna-se:

Note-se que é a função de distribuição cumulativa da distribuição normal bivariada . e na função log-verossimilhança as variáveis ​​observadas sendo iguais a um ou zero.

Probit multivariado

Para o caso geral, onde podemos tomar como escolhas e como indivíduos ou observações, a probabilidade de observar a escolha é

Onde e,

A função de log-verossimilhança neste caso seria

Exceto por tipicamente não há solução de forma fechada para as integrais na equação de log-verossimilhança. Em vez disso, os métodos de simulação podem ser usados ​​para simular as probabilidades de escolha. Métodos que usam amostragem de importância incluem o algoritmo GHK (Geweke, Hajivassilou, McFadden e Keane), AR (aceitar-rejeitar), método de Stern. Existem também abordagens MCMC para este problema, incluindo CRB (método de Chib com Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (kernel aceitar-rejeitar) e ASK (kernel de amostragem adaptável). Uma abordagem variacional escalando para grandes conjuntos de dados é proposta em Probit-LMM (Mandt, Wenzel, Nakajima et al.).

Referências

  1. ^ Ashford, JR; Sowden, RR (setembro de 1970). "Análise Multivariada Probit" . Citar diário requer |journal= ( ajuda )
  2. ^ Chib, Siddhartha; Greenberg, Edward (junho de 1998). "Análise de modelos probit multivariados" . Biometrika . 85 (2): 347–361. CiteSeerX   10.1.1.198.8541 . doi : 10.1093 / biomet / 85.2.347 - via Oxford Academic.
  3. ^ Hajivassiliou, Vassilis (1994). "Capítulo 40 Métodos de estimativa clássicos para modelos LDV usando simulação". Handbook of Econometrics . 4 : 2383–2441. doi : 10.1016 / S1573-4412 (05) 80009-1 . ISBN   9780444887665 .
  4. ^ Jeliazkov, Ivan (2010). "Perspectivas MCMC sobre estimativa de verossimilhança simulada". Avanços em Econometria . 26 : 3-39. doi : 10.1108 / S0731-9053 (2010) 0000026005 . ISBN   978-0-85724-149-8 .
  5. ^ Mandt, Stephan; Wenzel, Florian; Nakajima, Shinichi; John, Cunningham; Lippert, Christoph; Kloft, Marius (2017). "Modelo linear misto esparso probit" (PDF) . Aprendizado de máquina . 106 (9–10): 1–22. arXiv : 1507.04777 . doi : 10.1007 / s10994-017-5652-6 .

Leitura adicional

  • Greene, William H., Econometric Analysis , sétima edição, Prentice-Hall, 2012.