Logit ordenado - Ordered logit

Em estatística , o modelo logit ordenado (também regressão logística ordenada ou modelo de probabilidades proporcionais ) é um modelo de regressão ordinal - isto é, um modelo de regressão para variáveis dependentes ordinais - primeiro considerado por Peter McCullagh . Por exemplo, se uma pergunta em uma pesquisa deve ser respondida por uma escolha entre "ruim", "razoável", "bom" e "excelente" , e o objetivo da análise é ver quão bem essa resposta pode ser prevista pelas respostas a outras questões, algumas das quais podem ser quantitativas, então a regressão logística ordenada pode ser usada. Pode ser pensado como uma extensão do modelo de regressão logística que se aplica a variáveis dependentes dicotômicas , permitindo mais de duas categorias de resposta (ordenadas).

O modelo e a suposição de odds proporcionais

O modelo se aplica apenas a dados que atendem à suposição de probabilidades proporcionais , cujo significado pode ser exemplificado a seguir. Suponha que as proporções de membros da população estatística que responderiam "ruim", "regular", "bom", "muito bom" e "excelente" sejam respectivamente p ₁ , p ₂ , p ₃ , p ₄ , p ₅ . Então, os logaritmos das probabilidades (não os logaritmos das probabilidades) de responder de certas maneiras são:

{\ displaystyle {\ begin {array} {rll} {\ text {poor}}, & \ log {\ frac {p_ {1}} {p_ {2} + p_ {3} + p_ {4} + p_ { 5}}}, & 0 \\ [8pt] {\ text {pobre ou regular}}, & \ log {\ frac {p_ {1} + p_ {2}} {p_ {3} + p_ {4} + p_ {5}}}, & 1 \\ [8pt] {\ text {pobre, justo ou bom}}, & \ log {\ frac {p_ {1} + p_ {2} + p_ {3}} {p_ { 4} + p_ {5}}}, & 2 \\ [8pt] {\ text {pobre, razoável, bom ou muito bom}}, & \ log {\ frac {p_ {1} + p_ {2} + p_ {3} + p_ {4}} {p_ {5}}}, & 3 \ end {array}}}

A suposição de probabilidades proporcionais é que o número adicionado a cada um desses logaritmos para obter o próximo é o mesmo em todos os casos. Em outras palavras, esses logaritmos formam uma seqüência aritmética. O modelo afirma que o número na última coluna da tabela - o número de vezes que esse logaritmo deve ser adicionado - é alguma combinação linear das outras variáveis observadas.

Os coeficientes na combinação linear não podem ser estimados de forma consistente usando mínimos quadrados ordinários . Eles geralmente são estimados usando a probabilidade máxima . As estimativas de máxima verossimilhança são calculadas usando mínimos quadrados reponderados iterativamente .

Exemplos de várias categorias de respostas ordenadas incluem classificações de títulos, pesquisas de opinião com respostas que variam de "concordo totalmente" a "discordo totalmente", níveis de gastos do estado em programas governamentais (alto, médio ou baixo), o nível de cobertura de seguro escolhido (nenhum , parcial ou total) e situação de emprego (não empregado, empregado em tempo parcial ou totalmente empregado).

Suponha que o processo subjacente a ser caracterizado seja

{\ displaystyle y ^ {*} = \ mathbf {x} ^ {\ mathsf {T}} \ beta + \ varepsilon, \,}

onde está a variável dependente exata, mas não observada (talvez o nível exato de concordância com a afirmação proposta pelo pesquisador); é o vetor de variáveis independentes, é o termo de erro e é o vetor de coeficientes de regressão que desejamos estimar. Além disso, suponha que, embora não possamos observar , podemos apenas observar as categorias de resposta ${\ displaystyle y ^ {*}}$ ${\ displaystyle \ mathbf {x}}$ ${\ displaystyle \ varepsilon}$ ${\ displaystyle \ beta}$ ${\ displaystyle y ^ {*}}$

{\ displaystyle y = {\ begin {cases} 0 & {\ text {if}} y ^ {*} \ leq \ mu _ {1}, \\ 1 & {\ text {if}} \ mu _ {1} < y ^ {*} \ leq \ mu _ {2}, \\ 2 & {\ text {if}} \ mu _ {2} <y ^ {*} \ leq \ mu _ {3}, \\\ vdots \ \ N & {\ text {if}} \ mu _ {N} <y ^ {*} \ end {cases}}}

onde os parâmetros são os pontos finais impostos externamente das categorias observáveis. Então, a técnica de logit ordenado usará as observações em y , que são uma forma de dados censurados em y * , para ajustar o vetor de parâmetro . ${\ displaystyle \ mu _ {i}}$ ${\ displaystyle \ beta}$

Estimativa

Para obter detalhes sobre como a equação é estimada, consulte o artigo Regressão ordinal .

Veja também

Referências

Leitura adicional

Gelman, Andrew; Hill, Jennifer (2007). Análise de dados usando modelos de regressão e multiníveis / hierárquicos . Nova York: Cambridge University Press. pp. 119–124. ISBN 978-0-521-68689-1 .
Hardin, James; Hilbe, Joseph (2007). Modelos Lineares Generalizados e Extensões (2ª ed.). College Station: Stata Press. ISBN 978-1-59718-014-6 .
Woodward, Mark (2005). Epidemiologia: Desenho de Estudo e Análise de Dados (2ª ed.). Chapman & Hall / CRC. ISBN 978-1-58488-415-6 .
Wooldridge, Jeffrey (2010). Análise econométrica de seção transversal e dados de painel (segunda edição). Cambridge: MIT Press. pp. 643–666. ISBN 978-0-262-23258-6 .

links externos

Simon, Steve (22/09/2004). "Tamanho da amostra para um resultado ordinal" . STATS - Tentativa de STeve para ensinar estatística . Página visitada em 22/08/2014 .
Rodríguez, Germán. "Modelos Logit solicitados" . Universidade de Princeton .

Languages

In other projects