Goodman e gama de Kruskal - Goodman and Kruskal's gamma

Em estatísticas , gama de Goodman e Kruskal é uma medida da correlação de ordem , isto é, a semelhança das ordenações de dados quando classificados por cada uma das quantidades. Ele mede a força de associação dos transversais tabulados dados quando ambas as variáveis são medidos pelo nível ordinal . Não faz nenhum ajuste para qualquer tamanho da mesa ou laços. Os valores variam de -1 (associação negativa 100%, ou inversão perfeita) a 1 (associação positiva 100%, ou de acordo perfeito). Um valor de zero indica ausência de associação.

Esta estatística (que é distinta da lambda de Goodman e Kruskal ) é nomeado após Leo Goodman e William Kruskal , que a propôs em uma série de trabalhos 1954-1972.

Definição

A estimativa de gama, L , depende de duas quantidades:

  • N s , o número de pares de casos classificados na mesma ordem em ambas as variáveis (número de pares concordantes ),
  • N d , o número de pares de casos classificados na ordem inversa em ambas as variáveis (número de pares invertidos),

onde "laços" (casos em que qualquer uma das duas variáveis ​​no par são iguais) são descartados. Então

Esta estatística pode ser considerado como o estimador da probabilidade máxima para a quantidade teórica , onde

e em que P s e P d são as probabilidades de que um par seleccionado aleatoriamente de observações vai colocar na mesma ou oposta fim, respectivamente, quando classificados por ambas as variáveis.

Os valores críticos para a estatística gama são por vezes encontrados por meio de uma aproximação, na qual um valor transformada, t da estatística é a que se refere a distribuição t de Student , onde

e onde n é o número de observações (não o número de pares):

Q de Yule

Um caso especial de gama de Goodman e Kruskal é Q do Natal, que é específico para matrizes de 2x2. Considere o seguinte tabela de contingência de eventos, onde cada valor é uma contagem da frequência de um evento:

sim Não totais
Positivo uma b um + b
Negativo c d c + d
totais um + c b + d n

Q de Yule é dada por:

Embora calculados da mesma forma como gama de Goodman e Kruskal, que tem uma interpretação mais ampla porque ligeiramente a distinção entre escalas nominais e ordinais torna-se uma questão de rotulagem arbitrário para distinções dicotómicos. Assim, se Q é positivo ou negativo depende meramente em que emparelhamentos o analista considera ser concordantes, mas é de outra maneira simétrica.

Veja também

Referências

Outras leituras

  • Sheskin, DJ (2007) The Handbook of Parametric e procedimentos estatísticos não paramétricos . Chapman & Hall / CRC, ISBN  9781584888147