Teste exato - Exact test

Em estatística , um teste exato (de significância) é um teste em que, se a hipótese nula for verdadeira, todas as suposições nas quais a derivação da distribuição da estatística de teste se baseia são atendidas. O uso de um teste exato fornece um teste de significância que mantém a taxa de erro Tipo I do teste ( ) no nível de significância desejado do teste. Por exemplo, um teste exato no nível de significância de , ao repetir o teste em muitas amostras onde a hipótese nula é verdadeira, será rejeitado na maioria das vezes. Isso se opõe a um teste aproximado em que a taxa de erro tipo I desejada é mantida apenas aproximadamente (ou seja: o teste pode rejeitar mais de 5% do tempo), enquanto esta aproximação pode ser feita o mais próximo do desejado, fazendo a amostra tamanho grande o suficiente.

Os testes exatos baseados em estatísticas de teste discretas podem ser testes conservadores, ou seja, sua taxa de rejeição real está abaixo do nível de significância nominal . Por exemplo, esse é o caso do teste exato de Fisher e também de sua alternativa mais poderosa, o teste de Boschloo . Se a estatística de teste for contínua, ela atingirá exatamente o nível de significância.

Testes paramétricos , tais como aqueles descritos em estatísticas exatas , são testes exatos quando os pressupostos paramétricos sejam plenamente cumpridos, mas na prática o uso do termo exato (significado) teste é reservada para aqueles testes que não repousam sobre hipóteses paramétricos - não testes paramétricos. No entanto, na prática, a maioria das implementações de software de teste não paramétrico usa algoritmos assintóticos para obter o valor de significância, o que torna a implementação do teste não exata.

Portanto, quando o resultado de uma análise estatística é considerado um “teste exato” ou um “ valor p exato ”, isso implica que o teste é definido sem suposições paramétricas e avaliado sem o uso de algoritmos aproximados. Em princípio, entretanto, também pode significar que um teste paramétrico foi empregado em uma situação onde todas as suposições paramétricas são totalmente atendidas, mas na maioria dos casos é impossível provar isso completamente em uma situação do mundo real. As exceções quando é certo que os testes paramétricos são exatos incluem testes baseados nas distribuições binomial ou de Poisson. Às vezes, o teste de permutação é usado como sinônimo de teste exato, mas embora todos os testes de permutação sejam testes exatos, nem todos os testes exatos são testes de permutação.

Formulação

A equação básica subjacente aos testes exatos é

Onde:

  • x é o resultado realmente observado,
  • Pr ( y ) é a probabilidade sob a hipótese nula de um resultado y potencialmente observado ,
  • T ( y ) é o valor da estatística de teste para um resultado y , com maiores valores de T representando casos que representam, de forma fictícia, maiores desvios da hipótese nula,

e onde a soma varia sobre todos os resultados y (incluindo o observado) que têm o mesmo valor da estatística de teste obtida para a amostra observada x , ou um maior.

Exemplo: teste qui-quadrado de Pearson versus um teste exato

Um exemplo simples da ocasião para esse conceito pode ser visto observando que o teste qui-quadrado de Pearson é um teste aproximado. Suponha que o teste qui-quadrado de Pearson seja usado para verificar se um dado de seis lados é "justo", ou seja, fornece cada um dos seis resultados com a mesma frequência. Se o dado for lançado n vezes, então se "espera" ver cada resultado n / 6 vezes. A estatística de teste é

onde X k é o número de vezes que o resultado k é observado. Se a hipótese nula de "justiça" for verdadeira, então a distribuição de probabilidade da estatística de teste pode ser feita tão próxima quanto desejada da distribuição qui-quadrada com 5 graus de liberdade, tornando o tamanho da amostra n grande o suficiente. Mas se n for pequeno, então as probabilidades baseadas em distribuições de qui-quadrado podem não ser aproximações muito próximas. Encontrar a probabilidade exata de que essa estatística de teste exceda um determinado valor requer a enumeração combinatória de todos os resultados do experimento que resultam em um valor tão grande da estatística de teste. Além disso, torna-se questionável se a mesma estatística de teste deve ser usada. Um teste de razão de verossimilhança pode ser preferido por ser mais poderoso , e a estatística de teste pode não ser uma função monótona da acima.

Exemplo: teste exato de Fisher

O teste exato de Fisher , baseado no trabalho de Ronald Fisher e EJG Pitman na década de 1930, é exato porque a distribuição da amostra (condicional nas marginais) é conhecida exatamente. Compare o teste qui-quadrado de Pearson , que (embora teste o mesmo nulo) não é exato porque a distribuição da estatística de teste é correta apenas assintoticamente.

Veja também

Referências

  • Ronald Fisher (1954) Métodos Estatísticos para Trabalhadores de Pesquisa . Oliver e Boyd.
  • Mehta, CR; Patel, NR (1998). "Inferência exata para dados categóricos". Em P. Armitage e T. Colton, eds., Encyclopedia of Biostatistics , Chichester: John Wiley, pp. 1411-1422. pré-impressão não publicada
  • Corcoran, CD; Senchaudhuri, P .; Mehta, CR; Patel, NR (2005). "Inferência exata para dados categóricos". Enciclopédia de Bioestatística . doi : 10.1002 / 0470011815.b2a10019 . ISBN 047084907X.