Estatística de teste - Test statistic
Uma estatística de teste é uma estatística (uma quantidade derivada da amostra ) usada em testes de hipóteses estatísticas . Um teste de hipótese é normalmente especificado em termos de uma estatística de teste, considerada como um resumo numérico de um conjunto de dados que reduz os dados a um valor que pode ser usado para realizar o teste de hipótese. Em geral, uma estatística de teste é selecionada ou definida de forma a quantificar, dentro dos dados observados, comportamentos que distinguiriam a hipótese nula da alternativa , onde tal alternativa é prescrita, ou que caracterizariam a hipótese nula se houver nenhuma hipótese alternativa explicitamente declarada.
Uma propriedade importante de uma estatística de teste é que a sua distribuição de amostragem sob a hipótese nula deve ser calculável, quer exatamente ou aproximadamente, o que permite p -Valores a ser calculado. Uma estatística de teste compartilha algumas das mesmas qualidades de uma estatística descritiva e muitas estatísticas podem ser usadas como estatísticas de teste e estatísticas descritivas. No entanto, uma estatística de teste destina-se especificamente ao uso em testes estatísticos, enquanto a principal qualidade de uma estatística descritiva é que ela é facilmente interpretável. Algumas estatísticas descritivas informativas, como o intervalo da amostra , não são boas estatísticas de teste, uma vez que é difícil determinar sua distribuição amostral.
Duas estatísticas de teste amplamente utilizados são a estatística t e o F-teste .
Exemplo
Suponha que a tarefa seja testar se uma moeda é justa (ou seja, tem probabilidades iguais de produzir uma cara ou uma cauda). Se a moeda for lançada 100 vezes e os resultados forem registrados, os dados brutos podem ser representados como uma sequência de 100 caras e coroas. Se houver interesse na probabilidade marginal de obter uma cauda, apenas o número T das 100 voltas que produziram uma cauda precisa ser registrado. Mas T também pode ser usado como uma estatística de teste de duas maneiras:
- a distribuição amostral exata de T sob a hipótese nula é a distribuição binomial com parâmetros 0,5 e 100.
- o valor de T pode ser comparado com seu valor esperado sob a hipótese nula de 50 e, uma vez que o tamanho da amostra é grande, uma distribuição normal pode ser usada como uma aproximação da distribuição de amostragem para T ou para a estatística de teste revisada T - 50
Usando uma dessas distribuições de amostragem, é possível calcular um valor p unilateral ou bicaudal para a hipótese nula de que a moeda é justa. Observe que a estatística de teste neste caso reduz um conjunto de 100 números a um único resumo numérico que pode ser usado para teste.
Estatísticas de teste comuns
Os testes de uma amostra são apropriados quando uma amostra está sendo comparada à população a partir de uma hipótese. As características da população são conhecidas pela teoria ou são calculadas a partir da população.
Testes de duas amostras são apropriados para comparar duas amostras, normalmente amostras experimentais e de controle de um experimento cientificamente controlado.
Os testes emparelhados são apropriados para comparar duas amostras onde é impossível controlar variáveis importantes. Em vez de comparar dois conjuntos, os membros são emparelhados entre as amostras, de modo que a diferença entre os membros se torna a amostra. Normalmente, a média das diferenças é então comparada a zero. O cenário de exemplo comum para quando um teste de diferença emparelhada é apropriado é quando um único conjunto de assuntos de teste tem algo aplicado a eles e o teste se destina a verificar um efeito.
Os testes Z são apropriados para comparar médias sob condições rigorosas em relação à normalidade e um desvio padrão conhecido.
Um teste t é apropriado para comparar médias sob condições relaxadas (menos é assumido).
Os testes de proporções são análogos aos testes de médias (a proporção de 50%).
Os testes de qui-quadrado usam os mesmos cálculos e a mesma distribuição de probabilidade para diferentes aplicações:
- Os testes de qui-quadrado para variância são usados para determinar se uma população normal tem uma variância especificada. A hipótese nula é que sim.
- Os testes de qui-quadrado de independência são usados para decidir se duas variáveis estão associadas ou são independentes. As variáveis são categóricas em vez de numéricas. Pode ser usado para decidir se o canhoto está correlacionado com a altura (ou não). A hipótese nula é que as variáveis são independentes. Os números usados no cálculo são as frequências de ocorrência observadas e esperadas (das tabelas de contingência ).
- Os testes de qualidade de ajuste do qui-quadrado são usados para determinar a adequação das curvas de ajuste aos dados. A hipótese nula é que o ajuste da curva é adequado. É comum determinar as formas das curvas para minimizar o erro quadrático médio, portanto, é apropriado que o cálculo de adequação soma os erros quadrados.
Os testes F (análise de variância, ANOVA) são comumente usados para decidir se os agrupamentos de dados por categoria são significativos. Se a variância das pontuações dos testes dos canhotos em uma classe for muito menor do que a variância de toda a classe, pode ser útil estudar os canhotos como um grupo. A hipótese nula é que duas variâncias são iguais - portanto, o agrupamento proposto não é significativo.
Na tabela abaixo, os símbolos usados são definidos na parte inferior da tabela. Muitos outros testes podem ser encontrados em outros artigos . Existem provas de que as estatísticas de teste são apropriadas.
Nome | Fórmula | Suposições ou notas | |||
---|---|---|---|---|---|
Teste z de uma amostra | (População normal ou n grande) e σ conhecido. ( z é a distância da média em relação ao desvio padrão da média ). Para distribuições não normais, é possível calcular uma proporção mínima de uma população que cai dentro de k desvios-padrão para qualquer k (ver: Desigualdade de Chebyshev ). |
||||
Teste z de duas amostras | População normal e observações independentes e σ 1 e σ 2 são conhecidos | ||||
Teste t de uma amostra |
|
(População normal ou n grande) e desconhecido | |||
Emparelhados t -teste |
|
(População normal de diferenças ou n grande) e desconhecido | |||
Teste t combinado de duas amostras , variâncias iguais |
|
(Populações normais ou n 1 + n 2 > 40) e observações independentes e σ 1 = σ 2 desconhecido | |||
Teste t não agrupado de duas amostras , variâncias desiguais ( teste t de Welch ) |
|
(Populações normais ou n 1 + n 2 > 40) e observações independentes e σ 1 ≠ σ 2 ambos desconhecidos | |||
Teste z de uma proporção | n . p 0 > 10 e n (1 - p 0 )> 10 e é uma SRS (Simple Random Sample), consulte as notas . | ||||
Teste z de duas proporções, agrupado para |
|
n 1 p 1 > 5 e n 1 (1 - p 1 )> 5 e n 2 p 2 > 5 e n 2 (1 - p 2 )> 5 e observações independentes, ver notas . | |||
Teste z de duas proporções, unpool para | n 1 p 1 > 5 e n 1 (1 - p 1 )> 5 e n 2 p 2 > 5 e n 2 (1 - p 2 )> 5 e observações independentes, ver notas . | ||||
Teste de qui-quadrado para variância |
df = n-1
• População normal |
||||
Teste de qui-quadrado para adequação |
df = k - 1 - # parâmetros estimados , e um deles deve ser válido.
• Todas as contagens esperadas são pelo menos 5. • Todas as contagens esperadas são> 1 e não mais que 20% das contagens esperadas são menores que 5 |
||||
Teste F de duas amostras para igualdade de variâncias | Populações normais organizam assim e rejeitam H 0 para |
||||
Teste t de regressão de | Rejeitar H 0 para * Subtrair 1 para interceptar; k termos contêm variáveis independentes.
|
||||
Em geral, o subscrito 0 indica um valor retirado da hipótese nula , H 0 , que deve ser usado tanto quanto possível na construção de sua estatística de teste. ... Definições de outros símbolos:
|
Veja também
- Distribuição nula
- Teste de razão de verossimilhança
- Lema de Neyman-Pearson
- = coeficiente de determinação
- Suficiência (estatísticas)