Probit multinomial - Multinomial probit

Em estatística e econometria , o modelo probit multinomial é uma generalização do modelo probit usado quando há várias categorias possíveis nas quais a variável dependente pode cair. Como tal, é uma alternativa ao modelo logit multinomial como um método de classificação multiclasse . Não deve ser confundido com o modelo probit multivariado , que é usado para modelar resultados binários correlacionados para mais de uma variável independente.

Especificação geral

Supõe-se que temos uma série de observações Y i , para i = 1 ... n , dos resultados de escolhas de múltiplas vias de uma distribuição categórica de tamanho m (há m escolhas possíveis). Junto com cada observação Y i é um conjunto de k valores observados x 1, i , ..., x k, i de variáveis ​​explicativas (também conhecidas como variáveis ​​independentes , variáveis ​​preditoras, características, etc.). Alguns exemplos:

  • Os resultados observados podem ser "tem doença A, tem doença B, tem doença C, não tem nenhuma das doenças" para um conjunto de doenças raras com sintomas semelhantes, e as variáveis ​​explicativas podem ser características dos pacientes considerados pertinentes (sexo , raça, idade, pressão arterial , índice de massa corporal , presença ou ausência de vários sintomas, etc.).
  • Os resultados observados são os votos de pessoas para um determinado partido ou candidato em uma eleição múltipla, e as variáveis ​​explicativas são as características demográficas de cada pessoa (por exemplo, sexo, raça, idade, renda, etc.).

O modelo probit multinomial é um modelo estatístico que pode ser usado para prever o resultado provável de um ensaio multi-way não observado, dadas as variáveis ​​explicativas associadas. No processo, o modelo tenta explicar o efeito relativo de diferentes variáveis ​​explicativas sobre os diferentes resultados.

Formalmente, os resultados Y i são descritos como sendo dados categoricamente distribuídos , em que cada valor de resultado h para a observação i ocorre com uma probabilidade não observada p i, h que é específica para a observação i em questão porque é determinada pelos valores de variáveis ​​explicativas associadas a essa observação. Isso é:

ou equivalente

para cada um dos m valores possíveis de h .

Modelo de variável latente

Probit multinomial é frequentemente escrito em termos de um modelo de variável latente :

Onde

Então

Isso é,

Observe que este modelo permite a correlação arbitrária entre as variáveis ​​de erro , de modo que não necessariamente respeita a independência de alternativas irrelevantes .

Quando é a matriz identidade (tal que não há correlação ou heterocedasticidade ), o modelo é denominado probit independente .

Estimativa

Para obter detalhes sobre como as equações são estimadas, consulte o artigo Modelo Probit .

Referências

  • Greene, William H. (2012). Econometric Analysis (Sétima ed.). Boston: Pearson Education. pp. 810–811. ISBN   978-0-273-75356-8 .