Goodman e gama de Kruskal - Goodman and Kruskal's gamma
Em estatísticas , gama de Goodman e Kruskal é uma medida da correlação de ordem , isto é, a semelhança das ordenações de dados quando classificados por cada uma das quantidades. Ele mede a força de associação dos transversais tabulados dados quando ambas as variáveis são medidos pelo nível ordinal . Não faz nenhum ajuste para qualquer tamanho da mesa ou laços. Os valores variam de -1 (associação negativa 100%, ou inversão perfeita) a 1 (associação positiva 100%, ou de acordo perfeito). Um valor de zero indica ausência de associação.
Esta estatística (que é distinta da lambda de Goodman e Kruskal ) é nomeado após Leo Goodman e William Kruskal , que a propôs em uma série de trabalhos 1954-1972.
Definição
A estimativa de gama, L , depende de duas quantidades:
- N s , o número de pares de casos classificados na mesma ordem em ambas as variáveis (número de pares concordantes ),
- N d , o número de pares de casos classificados na ordem inversa em ambas as variáveis (número de pares invertidos),
onde "laços" (casos em que qualquer uma das duas variáveis no par são iguais) são descartados. Então
Esta estatística pode ser considerado como o estimador da probabilidade máxima para a quantidade teórica , onde
e em que P s e P d são as probabilidades de que um par seleccionado aleatoriamente de observações vai colocar na mesma ou oposta fim, respectivamente, quando classificados por ambas as variáveis.
Os valores críticos para a estatística gama são por vezes encontrados por meio de uma aproximação, na qual um valor transformada, t da estatística é a que se refere a distribuição t de Student , onde
e onde n é o número de observações (não o número de pares):
Q de Yule
Um caso especial de gama de Goodman e Kruskal é Q do Natal, que é específico para matrizes de 2x2. Considere o seguinte tabela de contingência de eventos, onde cada valor é uma contagem da frequência de um evento:
sim | Não | totais | |
---|---|---|---|
Positivo | uma | b | um + b |
Negativo | c | d | c + d |
totais | um + c | b + d | n |
Q de Yule é dada por:
Embora calculados da mesma forma como gama de Goodman e Kruskal, que tem uma interpretação mais ampla porque ligeiramente a distinção entre escalas nominais e ordinais torna-se uma questão de rotulagem arbitrário para distinções dicotómicos. Assim, se Q é positivo ou negativo depende meramente em que emparelhamentos o analista considera ser concordantes, mas é de outra maneira simétrica.
Veja também
- Kendall tau coeficiente de correlação
- lambda de Goodman e Kruskal
- Y de Natal , também conhecido como o coeficiente de coligação
Referências
Outras leituras
- Sheskin, DJ (2007) The Handbook of Parametric e procedimentos estatísticos não paramétricos . Chapman & Hall / CRC, ISBN 9781584888147