Estatística de teste - Test statistic

Uma estatística de teste é uma estatística (uma quantidade derivada da amostra ) usada em testes de hipóteses estatísticas . Um teste de hipótese é normalmente especificado em termos de uma estatística de teste, considerada como um resumo numérico de um conjunto de dados que reduz os dados a um valor que pode ser usado para realizar o teste de hipótese. Em geral, uma estatística de teste é selecionada ou definida de forma a quantificar, dentro dos dados observados, comportamentos que distinguiriam a hipótese nula da alternativa , onde tal alternativa é prescrita, ou que caracterizariam a hipótese nula se houver nenhuma hipótese alternativa explicitamente declarada.

Uma propriedade importante de uma estatística de teste é que a sua distribuição de amostragem sob a hipótese nula deve ser calculável, quer exatamente ou aproximadamente, o que permite p -Valores a ser calculado. Uma estatística de teste compartilha algumas das mesmas qualidades de uma estatística descritiva e muitas estatísticas podem ser usadas como estatísticas de teste e estatísticas descritivas. No entanto, uma estatística de teste destina-se especificamente ao uso em testes estatísticos, enquanto a principal qualidade de uma estatística descritiva é que ela é facilmente interpretável. Algumas estatísticas descritivas informativas, como o intervalo da amostra , não são boas estatísticas de teste, uma vez que é difícil determinar sua distribuição amostral.

Duas estatísticas de teste amplamente utilizados são a estatística t e o F-teste .

Exemplo

Suponha que a tarefa seja testar se uma moeda é justa (ou seja, tem probabilidades iguais de produzir uma cara ou uma cauda). Se a moeda for lançada 100 vezes e os resultados forem registrados, os dados brutos podem ser representados como uma sequência de 100 caras e coroas. Se houver interesse na probabilidade marginal de obter uma cauda, apenas o número T das 100 voltas que produziram uma cauda precisa ser registrado. Mas T também pode ser usado como uma estatística de teste de duas maneiras:

a distribuição amostral exata de T sob a hipótese nula é a distribuição binomial com parâmetros 0,5 e 100.
o valor de T pode ser comparado com seu valor esperado sob a hipótese nula de 50 e, uma vez que o tamanho da amostra é grande, uma distribuição normal pode ser usada como uma aproximação da distribuição de amostragem para T ou para a estatística de teste revisada T - 50

Usando uma dessas distribuições de amostragem, é possível calcular um valor p unilateral ou bicaudal para a hipótese nula de que a moeda é justa. Observe que a estatística de teste neste caso reduz um conjunto de 100 números a um único resumo numérico que pode ser usado para teste.

Estatísticas de teste comuns

Os testes de uma amostra são apropriados quando uma amostra está sendo comparada à população a partir de uma hipótese. As características da população são conhecidas pela teoria ou são calculadas a partir da população.

Testes de duas amostras são apropriados para comparar duas amostras, normalmente amostras experimentais e de controle de um experimento cientificamente controlado.

Os testes emparelhados são apropriados para comparar duas amostras onde é impossível controlar variáveis importantes. Em vez de comparar dois conjuntos, os membros são emparelhados entre as amostras, de modo que a diferença entre os membros se torna a amostra. Normalmente, a média das diferenças é então comparada a zero. O cenário de exemplo comum para quando um teste de diferença emparelhada é apropriado é quando um único conjunto de assuntos de teste tem algo aplicado a eles e o teste se destina a verificar um efeito.

Os testes Z são apropriados para comparar médias sob condições rigorosas em relação à normalidade e um desvio padrão conhecido.

Um teste t é apropriado para comparar médias sob condições relaxadas (menos é assumido).

Os testes de proporções são análogos aos testes de médias (a proporção de 50%).

Os testes de qui-quadrado usam os mesmos cálculos e a mesma distribuição de probabilidade para diferentes aplicações:

Os testes de qui-quadrado para variância são usados para determinar se uma população normal tem uma variância especificada. A hipótese nula é que sim.
Os testes de qui-quadrado de independência são usados para decidir se duas variáveis estão associadas ou são independentes. As variáveis são categóricas em vez de numéricas. Pode ser usado para decidir se o canhoto está correlacionado com a altura (ou não). A hipótese nula é que as variáveis são independentes. Os números usados no cálculo são as frequências de ocorrência observadas e esperadas (das tabelas de contingência ).
Os testes de qualidade de ajuste do qui-quadrado são usados para determinar a adequação das curvas de ajuste aos dados. A hipótese nula é que o ajuste da curva é adequado. É comum determinar as formas das curvas para minimizar o erro quadrático médio, portanto, é apropriado que o cálculo de adequação soma os erros quadrados.

Os testes F (análise de variância, ANOVA) são comumente usados para decidir se os agrupamentos de dados por categoria são significativos. Se a variância das pontuações dos testes dos canhotos em uma classe for muito menor do que a variância de toda a classe, pode ser útil estudar os canhotos como um grupo. A hipótese nula é que duas variâncias são iguais - portanto, o agrupamento proposto não é significativo.

Na tabela abaixo, os símbolos usados são definidos na parte inferior da tabela. Muitos outros testes podem ser encontrados em outros artigos . Existem provas de que as estatísticas de teste são apropriadas.

Nome

Fórmula

Suposições ou notas

Teste z de uma amostra

{\ displaystyle z = {\ frac {{\ overline {x}} - \ mu _ {0}} {({\ sigma} / {\ sqrt {n}})}}}

(População normal ou n grande) e σ conhecido.

( z é a distância da média em relação ao desvio padrão da média ). Para distribuições não normais, é possível calcular uma proporção mínima de uma população que cai dentro de k desvios-padrão para qualquer k (ver: Desigualdade de Chebyshev ).

Teste z de duas amostras

{\ displaystyle z = {\ frac {({\ overline {x}} _ {1} - {\ overline {x}} _ {2}) - d_ {0}} {\ sqrt {{\ frac {\ sigma _ {1} ^ {2}} {n_ {1}}} + {\ frac {\ sigma _ {2} ^ {2}} {n_ {2}}}}}}}

População normal e observações independentes e σ ₁ e σ ₂ são conhecidos

Teste t de uma amostra

{\ displaystyle t = {\ frac {{\ overline {x}} - \ mu _ {0}} {(s / {\ sqrt {n}})}},}

${\ displaystyle df = n-1 \}$

(População normal ou n grande) e desconhecido

{\ displaystyle \ sigma}

Emparelhados t -teste

{\ displaystyle t = {\ frac {{\ overline {d}} - d_ {0}} {(s_ {d} / {\ sqrt {n}})}},}

${\ displaystyle df = n-1 \}$

(População normal de diferenças ou n grande) e desconhecido

{\ displaystyle \ sigma}

Teste t combinado de duas amostras , variâncias iguais

{\ displaystyle t = {\ frac {({\ overline {x}} _ {1} - {\ overline {x}} _ {2}) - d_ {0}} {s_ {p} {\ sqrt {{ \ frac {1} {n_ {1}}} + {\ frac {1} {n_ {2}}}}}}},}

${\ displaystyle s_ {p} ^ {2} = {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2} -1) s_ {2} ^ {2}} {n_ {1} + n_ {2} -2}},}$
${\ displaystyle df = n_ {1} + n_ {2} -2 \}$

(Populações normais ou n ₁ + n ₂ > 40) e observações independentes e σ ₁ = σ ₂ desconhecido

Teste t não agrupado de duas amostras , variâncias desiguais ( teste t de Welch )

{\ displaystyle t = {\ frac {({\ overline {x}} _ {1} - {\ overline {x}} _ {2}) - d_ {0}} {\ sqrt {{\ frac {s_ { 1} ^ {2}} {n_ {1}}} + {\ frac {s_ {2} ^ {2}} {n_ {2}}}}}},}

${\ displaystyle df = {\ frac {\ left ({\ frac {s_ {1} ^ {2}} {n_ {1}}} + {\ frac {s_ {2} ^ {2}} {n_ {2 }}} \ right) ^ {2}} {{\ frac {\ left ({\ frac {s_ {1} ^ {2}} {n_ {1}}} \ right) ^ {2}} {n_ { 1} -1}} + {\ frac {\ left ({\ frac {s_ {2} ^ {2}} {n_ {2}}} \ right) ^ {2}} {n_ {2} -1} }}}}$

(Populações normais ou n ₁ + n ₂ > 40) e observações independentes e σ ₁ ≠ σ ₂ ambos desconhecidos

Teste z de uma proporção

{\ displaystyle z = {\ frac {{\ hat {p}} - p_ {0}} {\ sqrt {p_ {0} (1-p_ {0})}}} {\ sqrt {n}}}

n ^.p ₀ > 10 e n (1 - p ₀ )> 10 e é uma SRS (Simple Random Sample), consulte as notas .

Teste z de duas proporções, agrupado para

{\ displaystyle H_ {0} \ dois pontos p_ {1} = p_ {2}}

{\ displaystyle z = {\ frac {({\ hat {p}} _ {1} - {\ hat {p}} _ {2})} {\ sqrt {{\ hat {p}} (1- { \ hat {p}}) ({\ frac {1} {n_ {1}}} + {\ frac {1} {n_ {2}}})}}}}

${\ displaystyle {\ hat {p}} = {\ frac {x_ {1} + x_ {2}} {n_ {1} + n_ {2}}}}$

n ₁ p ₁ > 5 e n ₁ (1 - p ₁ )> 5 e n ₂ p ₂ > 5 e n ₂ (1 - p ₂ )> 5 e observações independentes, ver notas .

Teste z de duas proporções, unpool para

{\ displaystyle | d_ {0} |> 0}

{\ displaystyle z = {\ frac {({\ hat {p}} _ {1} - {\ hat {p}} _ {2}) - d_ {0}} {\ sqrt {{\ frac {{\ hat {p}} _ {1} (1 - {\ hat {p}} _ {1})} {n_ {1}}} + {\ frac {{\ hat {p}} _ {2} (1 - {\ hat {p}} _ {2})} {n_ {2}}}}}}}

n ₁ p ₁ > 5 e n ₁ (1 - p ₁ )> 5 e n ₂ p ₂ > 5 e n ₂ (1 - p ₂ )> 5 e observações independentes, ver notas .

Teste de qui-quadrado para variância

{\ displaystyle \ chi ^ {2} = (n-1) {\ frac {s ^ {2}} {\ sigma _ {0} ^ {2}}}}

df = n-1

• População normal

Teste de qui-quadrado para adequação

{\ displaystyle \ chi ^ {2} = \ sum ^ {k} {\ frac {({\ text {observado}} - {\ text {esperado}}) ^ {2}} {\ text {esperado}}} }

df = k - 1 - # parâmetros estimados , e um deles deve ser válido.

• Todas as contagens esperadas são pelo menos 5.

• Todas as contagens esperadas são> 1 e não mais que 20% das contagens esperadas são menores que 5

Teste F de duas amostras para igualdade de variâncias

{\ displaystyle F = {\ frac {s_ {1} ^ {2}} {s_ {2} ^ {2}}}}

Populações normais
organizam assim e rejeitam H ₀ para

{\ displaystyle s_ {1} ^ {2} \ geq s_ {2} ^ {2}}

{\ displaystyle F> F (\ alpha / 2, n_ {1} -1, n_ {2} -1)}

Teste t de regressão de

{\ displaystyle H_ {0} \ dois pontos R ^ {2} = 0.}

{\ displaystyle t = {\ sqrt {\ frac {R ^ {2} (nk-1 ^ {*})} {1-R ^ {2}}}}}

Rejeitar H ₀ para * Subtrair 1 para interceptar; k termos contêm variáveis independentes.

{\ displaystyle t> t (\ alpha / 2, nk-1 ^ {*})}

Em geral, o subscrito 0 indica um valor retirado da hipótese nula , H ₀ , que deve ser usado tanto quanto possível na construção de sua estatística de teste. ... Definições de outros símbolos:

${\ displaystyle \ alpha}$ , a probabilidade de erro Tipo I (rejeitar uma hipótese nula quando ela é de fato verdadeira)
${\ displaystyle n}$ = tamanho da amostra
${\ displaystyle n_ {1}}$ = amostra 1 tamanho
${\ displaystyle n_ {2}}$ = tamanho da amostra 2
${\ displaystyle {\ overline {x}}}$ = média da amostra
${\ displaystyle \ mu _ {0}}$ = média da população hipotética
${\ displaystyle \ mu _ {1}}$ = população 1 média
${\ displaystyle \ mu _ {2}}$ = população 2 média
${\ displaystyle \ sigma}$ = desvio padrão da população
${\ displaystyle \ sigma ^ {2}}$ = variação populacional
${\ displaystyle s}$ = desvio padrão da amostra
${\ displaystyle \ sum ^ {k}}$ = soma (de k números)

${\ displaystyle s ^ {2}}$ = variância da amostra
${\ displaystyle s_ {1}}$ = amostra 1 desvio padrão
${\ displaystyle s_ {2}}$ = amostra 2 desvio padrão
${\ displaystyle t}$ = estatística t
${\ displaystyle df}$ = graus de liberdade
${\ displaystyle {\ overline {d}}}$ = média da amostra de diferenças
${\ displaystyle d_ {0}}$ = diferença média da população hipotética
${\ displaystyle s_ {d}}$ = desvio padrão das diferenças
${\ displaystyle \ chi ^ {2}}$ = Estatística qui-quadrado

${\ displaystyle {\ hat {p}}}$ = x / n = proporção da amostra , a menos que especificado de outra forma
${\ displaystyle p_ {0}}$ = proporção hipotética da população
${\ displaystyle p_ {1}}$ = proporção 1
${\ displaystyle p_ {2}}$ = proporção 2
${\ displaystyle d_ {p}}$ = diferença hipotética em proporção
${\ displaystyle \ min \ {n_ {1}, n_ {2} \}}$ = mínimo de n ₁ e n ₂
${\ displaystyle x_ {1} = n_ {1} p_ {1}}$
${\ displaystyle x_ {2} = n_ {2} p_ {2}}$
${\ displaystyle F}$ = Estatística F

Veja também

Distribuição nula
Teste de razão de verossimilhança
Lema de Neyman-Pearson
${\ displaystyle R ^ {2}}$ = coeficiente de determinação
Suficiência (estatísticas)

Languages

In other projects

Estatística de teste - Test statistic

Conteúdo

Exemplo

Estatísticas de teste comuns

Veja também

Referências