Suposição estatística - Statistical assumption

A estatística , como todas as disciplinas matemáticas, não infere conclusões válidas do nada. Inferir conclusões interessantes sobre populações estatísticas reais quase sempre requer algumas suposições básicas. Essas suposições devem ser feitas com cuidado, porque suposições incorretas podem gerar conclusões totalmente imprecisas.

Aqui estão alguns exemplos de suposições estatísticas.

Independência das observações umas das outras (esta suposição é um erro especialmente comum).
Independência do erro observacional de potenciais efeitos de confusão .
Normalidade exata ou aproximada das observações (ou erros).
Linearidade de respostas graduadas a estímulos quantitativos, por exemplo, em regressão linear .

Classes de suposições

Existem duas abordagens para a inferência estatística : inferência baseada em modelos e inferência baseada em projeto . Ambas as abordagens contam com algum modelo estatístico para representar o processo de geração de dados. Na abordagem baseada em modelo, o modelo é considerado inicialmente desconhecido e um dos objetivos é selecionar um modelo apropriado para inferência. Na abordagem baseada em design, o modelo é considerado conhecido e um dos objetivos é garantir que os dados da amostra sejam selecionados aleatoriamente o suficiente para inferência.

As suposições estatísticas podem ser divididas em duas classes, dependendo de qual abordagem de inferência é usada.

Suposições baseadas em modelos. Isso inclui os três tipos a seguir:
- Suposições distributivas. Quando um modelo estatístico envolve termos relacionados a erros aleatórios , suposições podem ser feitas sobre a distribuição de probabilidade desses erros. Em alguns casos, a suposição distributiva está relacionada às próprias observações.
- Premissas estruturais. As relações estatísticas entre variáveis são freqüentemente modeladas equiparando uma variável a uma função de outra (ou várias outras), mais um erro aleatório . Os modelos freqüentemente envolvem fazer uma suposição estrutural sobre a forma do relacionamento funcional, por exemplo, como na regressão linear . Isso pode ser generalizado para modelos envolvendo relacionamentos entre variáveis latentes não observadas subjacentes .
- Suposições de variação cruzada. Essas suposições envolvem as distribuições de probabilidade conjuntas das próprias observações ou dos erros aleatórios em um modelo. Modelos simples podem incluir a suposição de que observações ou erros são estatisticamente independentes .
Suposições baseadas em design. Eles se relacionam com a forma como as observações foram coletadas e, muitas vezes, envolvem uma suposição de randomização durante a amostragem .

A abordagem baseada em modelo é a mais comumente usada em inferência estatística; a abordagem baseada em design é usada principalmente com amostragem de pesquisa . Com a abordagem baseada em modelo, todas as suposições são efetivamente codificadas no modelo.

Verificando suposições

Dado que a validade de qualquer conclusão tirada de uma inferência estatística depende da validade das suposições feitas, é claramente importante que essas suposições sejam revistas em algum estágio. Alguns casos - por exemplo, onde faltam dados - podem exigir que os pesquisadores julguem se uma suposição é razoável. Os pesquisadores podem expandir isso um pouco para considerar o efeito que um desvio das suposições pode produzir. Onde dados mais extensos estão disponíveis, vários tipos de procedimentos para validação de modelo estatístico estão disponíveis - por exemplo, para validação de modelo de regressão .

Veja também

Notas

^ Kruskall, 1988
^ Koch GG, Gillings DB (2006), "Inference, design-based vs. model-based", Encyclopedia of Statistical Sciences (editor-Kotz S.), Wiley-Interscience .
^ Cox, 2006, ch.9
^ de Gruijter et al., 2006, §2.2
^ McPherson, 1990, §3.4.1
^ McPherson, 1990, §3.3
^ de Gruijter et al., 2006, §2.2.1

Referências

Cox DR (2006), Principles of Statistical Inference , Cambridge University Press .
de Gruijter J., Brus D., Bierkens M., Knotters M. (2006), Sampling for Natural Resource Monitoring , Springer-Verlag .
Kruskal, William (dezembro de 1988). "Milagres e estatísticas: a suposição casual da independência (discurso presidencial ASA)". Journal of the American Statistical Association . 83 (404): 929–940. doi : 10.2307 / 2290117 . JSTOR 2290117 .
McPherson, G. (1990), Statistics in Scientific Investigation: Its Basis, Application and Interpretation , Springer-Verlag . ISBN 0-387-97137-8

[1] Kruskall, 1988

[2] Koch GG, Gillings DB (2006), "Inference, design-based vs. model-based", Encyclopedia of Statistical Sciences (editor-Kotz S.), Wiley-Interscience .

[3] Cox, 2006, ch.9

[4] Gruijter et al., 2006, §2.2

[5] McPherson, 1990, §3.4.1

[6] McPherson, 1990, §3.3

[7] Gruijter et al., 2006, §2.2.1

Languages

In other projects