Logit ordenado - Ordered logit

Em estatística , o modelo logit ordenado (também regressão logística ordenada ou modelo de probabilidades proporcionais ) é um modelo de regressão ordinal - isto é, um modelo de regressão para variáveis ​​dependentes ordinais - primeiro considerado por Peter McCullagh . Por exemplo, se uma pergunta em uma pesquisa deve ser respondida por uma escolha entre "ruim", "razoável", "bom" e "excelente" , e o objetivo da análise é ver quão bem essa resposta pode ser prevista pelas respostas a outras questões, algumas das quais podem ser quantitativas, então a regressão logística ordenada pode ser usada. Pode ser pensado como uma extensão do modelo de regressão logística que se aplica a variáveis ​​dependentes dicotômicas , permitindo mais de duas categorias de resposta (ordenadas).

O modelo e a suposição de odds proporcionais

O modelo se aplica apenas a dados que atendem à suposição de probabilidades proporcionais , cujo significado pode ser exemplificado a seguir. Suponha que as proporções de membros da população estatística que responderiam "ruim", "regular", "bom", "muito bom" e "excelente" sejam respectivamente p 1 , p 2 , p 3 , p 4 , p 5 . Então, os logaritmos das probabilidades (não os logaritmos das probabilidades) de responder de certas maneiras são:

A suposição de probabilidades proporcionais é que o número adicionado a cada um desses logaritmos para obter o próximo é o mesmo em todos os casos. Em outras palavras, esses logaritmos formam uma seqüência aritmética. O modelo afirma que o número na última coluna da tabela - o número de vezes que esse logaritmo deve ser adicionado - é alguma combinação linear das outras variáveis ​​observadas.

Os coeficientes na combinação linear não podem ser estimados de forma consistente usando mínimos quadrados ordinários . Eles geralmente são estimados usando a probabilidade máxima . As estimativas de máxima verossimilhança são calculadas usando mínimos quadrados reponderados iterativamente .

Exemplos de várias categorias de respostas ordenadas incluem classificações de títulos, pesquisas de opinião com respostas que variam de "concordo totalmente" a "discordo totalmente", níveis de gastos do estado em programas governamentais (alto, médio ou baixo), o nível de cobertura de seguro escolhido (nenhum , parcial ou total) e situação de emprego (não empregado, empregado em tempo parcial ou totalmente empregado).

Suponha que o processo subjacente a ser caracterizado seja

onde está a variável dependente exata, mas não observada (talvez o nível exato de concordância com a afirmação proposta pelo pesquisador); é o vetor de variáveis ​​independentes, é o termo de erro e é o vetor de coeficientes de regressão que desejamos estimar. Além disso, suponha que, embora não possamos observar , podemos apenas observar as categorias de resposta

onde os parâmetros são os pontos finais impostos externamente das categorias observáveis. Então, a técnica de logit ordenado usará as observações em y , que são uma forma de dados censurados em y * , para ajustar o vetor de parâmetro .

Estimativa

Para obter detalhes sobre como a equação é estimada, consulte o artigo Regressão ordinal .

Veja também

Referências

Leitura adicional

links externos