Z -test - Z-test

Hipótese nula-reigon-eng.png

Um teste Z é qualquer teste estatístico para o qual a distribuição da estatística de teste sob a hipótese nula pode ser aproximada por uma distribuição normal . Os testes Z testam a média de uma distribuição. Para cada nível de significância no intervalo de confiança , o teste Z tem um único valor crítico (por exemplo, 1,96 para 5% bicaudal) o que o torna mais conveniente do que o teste t de Student cujos valores críticos são definidos pelo tamanho da amostra ( através dos graus de liberdade correspondentes ).

Aplicabilidade

Por causa do teorema do limite central , muitas estatísticas de teste são distribuídas aproximadamente normalmente para grandes amostras. Portanto, muitos testes estatísticos podem ser convenientemente realizados como testes Z aproximados se o tamanho da amostra for grande ou a variância da população for conhecida. Se a variância da população for desconhecida (e, portanto, deve ser estimada a partir da própria amostra) e o tamanho da amostra não for grande ( n <30), o teste t de Student pode ser mais apropriado.

Procedimento

Como realizar um teste Z quando T é uma estatística que é aproximadamente normalmente distribuída sob a hipótese nula é o seguinte:

Em primeiro lugar, calcular o valor esperado μ de T sob a hipótese nula, e obter uma estimativa s do desvio padrão de t .

Em segundo lugar, determine as propriedades de T  : uma ou duas caudas.

Para a hipótese nula H 0 : μ≥μ 0 vs hipótese alternativa H 1 : μ <μ 0 , é inferior / cauda esquerda (uma cauda).

Para a hipótese nula H 0 : μ≤μ 0 vs hipótese alternativa H 1 : μ> μ 0 , é cauda superior / direita (uma cauda).

Para a hipótese nula H 0 : μ = μ 0 vs hipótese alternativa H 1 : μ ≠ μ 0 , é bicaudal.

Terceiro, calcule a pontuação padrão  :

,

cujos valores de p unicaudais e bicaudais podem ser calculados como Φ ( Z ) (para testes de cauda inferior / esquerda), Φ (- Z ) (para testes de cauda superior / direita) e 2Φ (- | Z | ) (para testes bicaudais), em que Φ é a função de distribuição cumulativa normal padrão .

Use em testes de localização

  1. O termo " teste Z " é frequentemente usado para se referir especificamente ao teste de localização de uma amostra comparando a média de um conjunto de medições a uma determinada constante quando a variância da amostra é conhecida. Por exemplo, se os dados observados X 1 , ..., X n são (i) independentes, (ii) têm uma média comum μ, e (iii) têm uma variância comum σ 2 , então a média da amostra X tem média μ e variância .
  2. A hipótese nula é que o valor médio de X é um dado número µ 0 . Podemos usar X   como uma estatística de teste, rejeitando a hipótese nula se X  - μ 0 for grande.
  3. Para calcular a estatística padronizada , precisamos saber ou ter um valor aproximado para σ 2 , a partir do qual podemos calcular . Em algumas aplicações, σ 2 é conhecido, mas isso é incomum.
  4. Se o tamanho da amostra for moderado ou grande, podemos substituir a variância da amostra por σ 2 , fornecendo um teste de plug-in . O teste resultante não será um teste Z exato, uma vez que a incerteza na variância da amostra não é contabilizada - no entanto, será uma boa aproximação, a menos que o tamanho da amostra seja pequeno.
  5. Um teste t pode ser usado para explicar a incerteza na variância da amostra quando os dados são exatamente normais .
  6. Diferença entre o teste Z e o teste t: o teste Z é usado quando o tamanho da amostra é grande (n> 50) ou a variância da população é conhecida. O teste t é usado quando o tamanho da amostra é pequeno (n <50) e a variância da população é desconhecida.
  7. Não existe uma constante universal na qual o tamanho da amostra é geralmente considerado grande o suficiente para justificar o uso do teste de plug-in. Regras básicas típicas: o tamanho da amostra deve ser de 50 observações ou mais.
  8. Para tamanhos de amostra grandes, o procedimento de teste t fornece valores de p quase idênticos ao procedimento de teste Z.
  9. Outros testes de localização que podem ser realizados como testes Z são o teste de localização de duas amostras e o teste de diferença emparelhada .

Condições

Para que o teste Z seja aplicável, certas condições devem ser atendidas.

  • Os parâmetros de incômodo devem ser conhecidos ou estimados com alta precisão (um exemplo de um parâmetro de incômodo seria o desvio padrão em um teste de localização de uma amostra). Os testes Z se concentram em um único parâmetro e tratam todos os outros parâmetros desconhecidos como fixados em seus valores reais. Na prática, devido ao teorema de Slutsky , "conectar" estimativas consistentes de parâmetros incômodos pode ser justificado. No entanto, se o tamanho da amostra não for grande o suficiente para que essas estimativas sejam razoavelmente precisas, o teste Z pode não ter um bom desempenho.
  • A estatística de teste deve seguir uma distribuição normal . Geralmente, recorre-se ao teorema do limite central para justificar a suposição de que uma estatística de teste varia normalmente. Existem muitas pesquisas estatísticas sobre a questão de quando uma estatística de teste varia aproximadamente da normalidade. Se a variação da estatística de teste for fortemente não normal, um teste Z não deve ser usado.

Se as estimativas de parâmetros incômodos forem inseridas conforme discutido acima, é importante usar estimativas apropriadas para a forma como os dados foram amostrados . No caso especial de testes Z para o problema de localização de uma ou duas amostras, o desvio padrão da amostra usual só é apropriado se os dados foram coletados como uma amostra independente.

Em algumas situações, é possível conceber um teste que considere adequadamente a variação nas estimativas de plug-in dos parâmetros de incômodo. No caso de um e dois problemas de localização de amostra, um teste t faz isso.

Exemplo

Suponha que, em uma determinada região geográfica, a média e o desvio padrão das pontuações em um teste de leitura sejam 100 pontos e 12 pontos, respectivamente. Nosso interesse é nas pontuações de 55 alunos em uma escola particular que receberam uma pontuação média de 96. Podemos perguntar se essa pontuação média é significativamente mais baixa do que a média regional, ou seja, os alunos nesta escola são comparáveis ​​a um simples aleatório amostra de 55 alunos da região como um todo, ou suas notas são surpreendentemente baixas?

Primeiro calcule o erro padrão da média:

onde é o desvio padrão da população.

Em seguida, calcule a pontuação z , que é a distância da média da amostra à média da população em unidades do erro padrão:

Neste exemplo, tratamos a média e a variância da população como conhecidas, o que seria apropriado se todos os alunos da região fossem testados. Quando os parâmetros populacionais são desconhecidos, um teste t de Student deve ser realizado em seu lugar.

A pontuação média da sala de aula é 96, que é -2,47 unidades de erro padrão da média populacional de 100. Olhando o z- escore em uma tabela de probabilidade cumulativa de distribuição normal padrão , descobrimos que a probabilidade de observar um valor normal padrão abaixo -2,47 é aproximadamente 0,5 - 0,4932 = 0,0068. Este é o valor p unilateral para a hipótese nula de que os 55 alunos são comparáveis ​​a uma amostra aleatória simples da população de todos os participantes do teste. O valor p bilateral é aproximadamente 0,014 (duas vezes o valor p unilateral ).

Outra maneira de afirmar as coisas é que com probabilidade 1 - 0,014 = 0,986, uma amostra aleatória simples de 55 alunos teria uma pontuação média no teste dentro de 4 unidades da média da população. Também poderíamos dizer que, com 98,6% de confiança, rejeitamos a hipótese nula de que os 55 participantes do teste são comparáveis ​​a uma amostra aleatória simples da população de participantes.

O teste Z nos diz que os 55 alunos de interesse têm uma pontuação média incomumente baixa em comparação com a maioria das amostras aleatórias simples de tamanho semelhante da população de participantes. Uma deficiência desta análise é que ela não considera se o tamanho do efeito de 4 pontos é significativo. Se, em vez de uma sala de aula, considerássemos uma sub-região contendo 900 alunos com pontuação média de 99, seriam observados quase os mesmos z- escore e p- valor. Isso mostra que, se o tamanho da amostra for grande o suficiente, diferenças muito pequenas do valor nulo podem ser altamente significativas do ponto de vista estatístico. Consulte o teste de hipótese estatística para uma discussão mais aprofundada desse problema.

Testes Z, exceto testes de localização

Os testes de localização são os testes Z mais familiares . Outra classe de testes Z surge na estimativa de máxima verossimilhança dos parâmetros em um modelo estatístico paramétrico . As estimativas de probabilidade máxima são aproximadamente normais sob certas condições, e sua variância assintótica pode ser calculada em termos das informações de Fisher. A estimativa de máxima verossimilhança dividida por seu erro padrão pode ser usada como uma estatística de teste para a hipótese nula de que o valor populacional do parâmetro é igual a zero. De forma mais geral, se é a estimativa de máxima verossimilhança de um parâmetro θ, e θ 0 é o valor de θ sob a hipótese nula,

pode ser usado como uma estatística de teste Z.

Ao usar um teste Z para estimativas de probabilidade máxima, é importante estar ciente de que a aproximação normal pode ser pobre se o tamanho da amostra não for suficientemente grande. Embora não haja uma regra simples e universal determinando quão grande deve ser o tamanho da amostra para usar um teste Z , a simulação pode dar uma boa idéia se um teste Z é apropriado em uma determinada situação.

Os testes Z são empregados sempre que se pode argumentar que uma estatística de teste segue uma distribuição normal sob a hipótese nula de interesse. Muitas estatísticas de teste não paramétricas , como estatísticas U , são aproximadamente normais para tamanhos de amostra grandes o suficiente e, portanto, são frequentemente realizadas como testes Z.

Veja também

Referências

  • Sprinthall, RC (2011). Análise Estatística Básica (9ª ed.). Pearson Education. ISBN 978-0-205-05217-2.
  • Casella, G. , Berger, RL (2002). Inferência estatística . Duxbury Press. ISBN  0-534-24312-6 .
  • Douglas C.Montgomery, George C.Runger. (2014). Estatísticas aplicadas e probabilidade para engenheiros . (6ª ed.). John Wiley & Sons, inc. ISBN  9781118539712 , 9781118645062 .