Coeficiente de correlação - Correlation coefficient

Um coeficiente de correlação é uma medida numérica de algum tipo de correlação , significando uma relação estatística entre duas variáveis . As variáveis ​​podem ser duas colunas de um determinado conjunto de dados de observações, geralmente chamado de amostra , ou dois componentes de uma variável aleatória multivariada com uma distribuição conhecida .

Existem vários tipos de coeficientes de correlação, cada um com sua própria definição e faixa própria de usabilidade e características. Todos eles assumem valores na faixa de -1 a +1, onde ± 1 indica a concordância mais forte possível e 0 a discordância mais forte possível. Como ferramentas de análise, os coeficientes de correlação apresentam certos problemas, incluindo a propensão de alguns tipos de serem distorcidos por outliers e a possibilidade de serem usados ​​incorretamente para inferir uma relação causal entre as variáveis ​​(para mais informações, consulte Correlação não implica causalidade ).

Tipos

Existem várias medidas diferentes para o grau de correlação nos dados, dependendo do tipo de dados: principalmente se os dados são uma medida, ordinal ou categórica.

Pearson

O coeficiente de correlação produto-momento de Pearson , também conhecido como r , R ou r de Pearson  , é uma medida da força e direção da relação linear entre duas variáveis ​​que é definida como a covariância das variáveis ​​dividida pelo produto de seu padrão desvios. Este é o tipo de coeficiente de correlação mais conhecido e mais comumente usado. Quando o termo "coeficiente de correlação" é usado sem qualificação adicional, geralmente se refere ao coeficiente de correlação momento-produto de Pearson.

Intra-classe

A correlação intraclasse (ICC) é uma estatística descritiva que pode ser usada quando as medidas quantitativas são feitas em unidades organizadas em grupos; descreve o quão fortemente as unidades no mesmo grupo se assemelham.

Classificação

A correlação de classificação é uma medida da relação entre as classificações de duas variáveis ​​ou duas classificações da mesma variável:

Tetracórico e policórico

O coeficiente de correlação policórica mede a associação entre duas variáveis ​​categóricas ordenadas. É tecnicamente definido como a estimativa do coeficiente de correlação de Pearson que se obteria se:

  1. As duas variáveis ​​foram medidas em uma escala contínua, em vez de como variáveis ​​de categoria ordenada.
  2. As duas variáveis ​​contínuas seguiram uma distribuição normal bivariada .

Quando ambas as variáveis ​​são dicotômicas em vez de categóricas ordenadas, o coeficiente de correlação policórico é denominado coeficiente de correlação tetracórica.

Veja também

Notas de rodapé

Referências