Probit multinomial - Multinomial probit
Parte de uma série sobre |
Análise de regressão |
---|
Modelos |
Estimativa |
fundo |
Em estatística e econometria , o modelo probit multinomial é uma generalização do modelo probit usado quando há várias categorias possíveis nas quais a variável dependente pode cair. Como tal, é uma alternativa ao modelo logit multinomial como um método de classificação multiclasse . Não deve ser confundido com o modelo probit multivariado , que é usado para modelar resultados binários correlacionados para mais de uma variável independente.
Especificação geral
Supõe-se que temos uma série de observações Y i , para i = 1 ... n , dos resultados de escolhas de múltiplas vias de uma distribuição categórica de tamanho m (há m escolhas possíveis). Junto com cada observação Y i é um conjunto de k valores observados x 1, i , ..., x k, i de variáveis explicativas (também conhecidas como variáveis independentes , variáveis preditoras, características, etc.). Alguns exemplos:
- Os resultados observados podem ser "tem doença A, tem doença B, tem doença C, não tem nenhuma das doenças" para um conjunto de doenças raras com sintomas semelhantes, e as variáveis explicativas podem ser características dos pacientes considerados pertinentes (sexo , raça, idade, pressão arterial , índice de massa corporal , presença ou ausência de vários sintomas, etc.).
- Os resultados observados são os votos de pessoas para um determinado partido ou candidato em uma eleição múltipla, e as variáveis explicativas são as características demográficas de cada pessoa (por exemplo, sexo, raça, idade, renda, etc.).
O modelo probit multinomial é um modelo estatístico que pode ser usado para prever o resultado provável de um ensaio multi-way não observado, dadas as variáveis explicativas associadas. No processo, o modelo tenta explicar o efeito relativo de diferentes variáveis explicativas sobre os diferentes resultados.
Formalmente, os resultados Y i são descritos como sendo dados categoricamente distribuídos , em que cada valor de resultado h para a observação i ocorre com uma probabilidade não observada p i, h que é específica para a observação i em questão porque é determinada pelos valores de variáveis explicativas associadas a essa observação. Isso é:
ou equivalente
para cada um dos m valores possíveis de h .
Modelo de variável latente
Probit multinomial é frequentemente escrito em termos de um modelo de variável latente :
Onde
Então
Isso é,
Observe que este modelo permite a correlação arbitrária entre as variáveis de erro , de modo que não necessariamente respeita a independência de alternativas irrelevantes .
Quando é a matriz identidade (tal que não há correlação ou heterocedasticidade ), o modelo é denominado probit independente .
Estimativa
Para obter detalhes sobre como as equações são estimadas, consulte o artigo Modelo Probit .
Referências
- Greene, William H. (2012). Econometric Analysis (Sétima ed.). Boston: Pearson Education. pp. 810–811. ISBN 978-0-273-75356-8 .