Análise de caminho (estatística) - Path analysis (statistics)

Em estatística , a análise de caminho é usada para descrever as dependências direcionadas entre um conjunto de variáveis. Isto inclui modelos equivalentes a qualquer forma de análise de regressão múltipla , análise factorial , análise de correlação canónica , análise discriminante , bem como as famílias mais gerais de modelos na análise multivariada de análises de variância e covariância ( MANOVA , ANOVA , ANCOVA ).

Além de ser pensada como uma forma de regressão múltipla com foco na causalidade, a análise de caminho pode ser vista como um caso especial de modelagem de equações estruturais (SEM) - aquele em que apenas indicadores únicos são empregados para cada uma das variáveis ​​no modelo causal . Ou seja, a análise de caminho é SEM com um modelo estrutural, mas nenhum modelo de medição. Outros termos usados ​​para se referir à análise de caminho incluem modelagem causal, análise de estruturas de covariância e modelos de variáveis ​​latentes .

A análise de trilha é considerada por Judea Pearl como um ancestral direto das técnicas de inferência causal .

História

A análise de trilha foi desenvolvida por volta de 1918 pelo geneticista Sewall Wright , que escreveu sobre ela de forma mais extensa na década de 1920. Desde então, tem sido aplicado a uma vasta gama de áreas de modelagem complexas, incluindo biologia , psicologia , sociologia e econometria .

Modelagem de caminho

Normalmente, os modelos de caminho consistem em variáveis ​​independentes e dependentes representadas graficamente por caixas ou retângulos. Variáveis ​​que são variáveis ​​independentes, e não variáveis ​​dependentes, são chamadas de 'exógenas'. Graficamente, essas caixas de variáveis ​​exógenas ficam nas bordas externas do modelo e têm apenas setas de uma cabeça saindo delas. Nenhuma seta de ponta única aponta para variáveis ​​exógenas. Variáveis ​​que são apenas variáveis ​​dependentes, ou são variáveis ​​independentes e dependentes, são denominadas 'endógenas'. Graficamente, as variáveis ​​endógenas têm pelo menos uma seta de uma ponta apontando para elas.

No modelo abaixo, as duas variáveis ​​exógenas (Ex 1 e Ex 2 ) são modeladas como sendo correlacionadas conforme representado pela seta dupla. Ambas as variáveis ​​têm efeitos diretos e indiretos (por meio de En 1 ) no En 2 (as duas variáveis ​​/ fatores dependentes ou 'endógenos'). Na maioria dos modelos do mundo real, as variáveis ​​endógenas também podem ser afetadas por variáveis ​​e fatores provenientes de fora do modelo (efeitos externos, incluindo erro de medição). Esses efeitos são representados pelo "e" ou termos de erro no modelo.

Exemplo de caminho.JPG

Usando as mesmas variáveis, modelos alternativos são concebíveis. Por exemplo, pode-se hipotetizar que Ex 1 tem apenas um efeito indireto sobre En 2 , excluindo a flecha de Ex 1 a En 2 ; e a probabilidade ou 'ajuste' desses dois modelos podem ser comparados estatisticamente.

Regras de rastreamento de caminho

Para calcular de forma válida a relação entre quaisquer duas caixas no diagrama, Wright (1934) propôs um conjunto simples de regras de rastreamento de caminho, para calcular a correlação entre duas variáveis. A correlação é igual à soma da contribuição de todas as vias pelas quais as duas variáveis ​​estão conectadas. A força de cada uma dessas vias contribuintes é calculada como o produto dos coeficientes da trajetória ao longo dessa via.

As regras para rastreamento de caminho são:

  1. Você pode rastrear uma seta para trás e para frente ao longo da próxima, ou para frente de uma variável para outra, mas nunca para frente e depois para trás. Outra maneira de pensar nessa regra é que você nunca pode passar de uma ponta de flecha para outra: cara-coroa, ou coroa-cabeça, não cara-cara.
  2. Você pode passar por cada variável apenas uma vez em uma determinada cadeia de caminhos.
  3. Não mais do que uma seta bidirecional pode ser incluída em cada cadeia de caminho.

Novamente, a correlação esperada devido a cada cadeia rastreada entre duas variáveis ​​é o produto dos coeficientes de caminho padronizados, e a correlação total esperada entre duas variáveis ​​é a soma dessas cadeias de caminho contribuintes.

NB : As regras de Wright pressupõem um modelo sem loops de feedback: o gráfico direcionado do modelo não deve conter ciclos , ou seja, é um gráfico acíclico direcionado , que foi extensivamente estudado no quadro de análise causal de Judea Pearl .

Traçado de caminho em modelos não padronizados

Se as variáveis ​​modeladas não foram padronizadas, uma regra adicional permite que as covariâncias esperadas sejam calculadas, desde que não existam caminhos conectando variáveis ​​dependentes a outras variáveis ​​dependentes.

O caso mais simples é obtido onde todas as variâncias residuais são modeladas explicitamente. Nesse caso, além das três regras acima, calcule as covariâncias esperadas por:

  1. Calcule o produto dos coeficientes em cada rota entre as variáveis ​​de interesse, rastreando para trás, mudando de direção em uma seta de duas pontas e, em seguida, rastreando para frente.
  2. Soma todas as rotas distintas, onde as vias são consideradas distintas se contiverem coeficientes diferentes, ou encontrar esses coeficientes em uma ordem diferente.

Onde as variâncias residuais não são explicitamente incluídas, ou como uma solução mais geral, em qualquer mudança de direção encontrada em uma rota (exceto nas setas de mão dupla), inclua a variância da variável no ponto de mudança. Ou seja, ao traçar um caminho de uma variável dependente para uma variável independente, inclua a variância da variável independente, exceto quando isso violaria a regra 1 acima (passando por pontas de flechas adjacentes: ou seja, quando a variável independente também se conecta a um duplo com ponta de seta conectando-o a outra variável independente). Ao derivar as variâncias (o que é necessário no caso em que não são modeladas explicitamente), o caminho de uma variável dependente para uma variável independente e vice-versa é contado apenas uma vez.

Veja também

Referências

links externos