Student t -Distribuição -Student's t-distribution

T de estudante
Função densidade de probabilidade
Student t pdf.svg
Função de distribuição cumulativa
Student t cdf.svg
Parâmetros graus de liberdade ( real )
Apoio, suporte
PDF
CDF


onde 2 F 1 é a função hipergeométrica
Quer dizer 0 para , caso contrário, indefinido
Mediana 0
Modo 0
Variância para , ∞ para , caso contrário, indefinido
Skewness 0 para , caso contrário, indefinido
Ex. curtose para , ∞ para , caso contrário, indefinido
Entropia

MGF Indefinido
CF

para

Em probabilidade e estatística , a distribuição t de Student (ou simplesmente a distribuição t ) é qualquer membro de uma família de distribuições de probabilidade contínuas que surgem ao estimar a média de uma população normalmente distribuída em situações onde o tamanho da amostra é pequeno e o da população o desvio padrão é desconhecido. Foi desenvolvido pelo estatístico inglês William Sealy Gosset sob o pseudônimo de "Student".

A distribuição t desempenha um papel em uma série de análises estatísticas amplamente utilizadas, incluindo o teste t de Student para avaliar a significância estatística da diferença entre duas médias de amostra, a construção de intervalos de confiança para a diferença entre duas médias populacionais e em análise de regressão . A distribuição t de Student também surge na análise bayesiana de dados de uma família normal.

Se tomarmos uma amostra de observações de uma distribuição normal , então a distribuição t com graus de liberdade pode ser definida como a distribuição da localização da média da amostra em relação à média verdadeira, dividida pelo desvio padrão da amostra, após multiplicar por o termo de padronização . Desta forma, a distribuição t pode ser usada para construir um intervalo de confiança para a média verdadeira.

A distribuição t é simétrica e em forma de sino, como a distribuição normal . No entanto, a distribuição t tem caudas mais pesadas, o que significa que é mais propensa a produzir valores que caem longe de sua média. Isso o torna útil para a compreensão do comportamento estatístico de certos tipos de razões de quantidades aleatórias, em que a variação do denominador é ampliada e pode produzir valores atípicos quando o denominador da razão cai perto de zero. A distribuição t de Student é um caso especial da distribuição hiperbólica generalizada .

História e etimologia

Estatístico William Sealy Gosset, conhecido como "Estudante"

Em estatística, a distribuição t foi derivada pela primeira vez como uma distribuição posterior em 1876 por Helmert e Lüroth . A distribuição t também apareceu em uma forma mais geral como distribuição de Pearson Tipo IV no artigo de Karl Pearson de 1895.

Na literatura de língua inglesa, a distribuição leva o nome do artigo de William Sealy Gosset de 1908 na Biometrika sob o pseudônimo de "Estudante". Gosset trabalhava na Cervejaria Guinness em Dublin, Irlanda , e estava interessado nos problemas de pequenas amostras - por exemplo, as propriedades químicas da cevada, onde os tamanhos das amostras podem ser tão pequenos quanto 3. Uma versão da origem do pseudônimo é que a de Gosset o empregador preferia que os funcionários usassem pseudônimos ao publicar artigos científicos em vez do nome real, então ele usou o nome "Estudante" para esconder sua identidade. Outra versão é que a Guinness não queria que seus concorrentes soubessem que eles estavam usando o teste- t para determinar a qualidade da matéria-prima.

O artigo de Gosset refere-se à distribuição como a "distribuição de frequência de desvios-padrão de amostras retiradas de uma população normal". Tornou-se conhecido por meio do trabalho de Ronald Fisher , que chamou a distribuição de "distribuição do aluno" e representou o valor do teste com a letra t .

Como a distribuição do aluno surge da amostragem

Vamos ser retirados da distribuição de forma independente e idêntica , ou seja, esta é uma amostra de tamanho de uma população normalmente distribuída com valor médio e variância esperados .

Deixar

seja a média da amostra e deixe

ser a variância da amostra ( corrigida por Bessel ). Então a variável aleatória

tem uma distribuição normal padrão (ou seja, normal com média esperada 0 e variância 1), e a variável aleatória

isto é, onde foi substituído por , tem uma distribuição t de Student com graus de liberdade. Uma vez que substituiu a única quantidade não observável nesta expressão , isso pode ser usado para derivar intervalos de confiança para O numerador e o denominador na expressão anterior são variáveis ​​aleatórias independentes, apesar de serem baseados na mesma amostra . Isso pode ser visto observando-se e lembrando que e são ambas combinações lineares do mesmo conjunto de variáveis ​​aleatórias normalmente distribuídas iid.

Definição

Função densidade de probabilidade

A distribuição t de Student tem a função de densidade de probabilidade dada por

onde é o número de graus de liberdade e é a função gama . Isso também pode ser escrito como

onde B é a função Beta . Em particular, para graus de liberdade com valores inteiros , temos:

Por acaso,

Por estranho,

A função de densidade de probabilidade é simétrica e sua forma geral se assemelha à forma de sino de uma variável normalmente distribuída com média 0 e variância 1, exceto que é um pouco menor e mais ampla. À medida que o número de graus de liberdade aumenta, a distribuição t se aproxima da distribuição normal com média 0 e variância 1. Por esse motivo, também é conhecido como parâmetro de normalidade.

As imagens a seguir mostram a densidade da distribuição t para valores crescentes de . A distribuição normal é mostrada como uma linha azul para comparação. Observe que a distribuição t (linha vermelha) se torna mais próxima da distribuição normal conforme aumenta.

Densidade da distribuição t (vermelho) para 1, 2, 3, 5, 10 e 30 graus de liberdade em comparação com a distribuição normal padrão (azul).
Parcelas anteriores mostradas em verde.
1df
1 grau de liberdade
2df
2 graus de liberdade
3df
3 graus de liberdade
5df
5 graus de liberdade
10df
10 graus de liberdade
30df
30 graus de liberdade

Função de distribuição cumulativa

A função de distribuição cumulativa pode ser escrita em termos de I , a função beta incompleta regularizada . Para t  > 0,

Onde

Outros valores seriam obtidos por simetria. Uma fórmula alternativa, válida para , é

onde 2 F 1 é um caso particular da função hipergeométrica .

Para obter informações sobre sua função de distribuição cumulativa inversa, consulte função de quantil § Distribuição t de Student .

Casos especiais

Certos valores de fornecem uma forma especialmente simples.

Função de distribuição:
Função de densidade:
Veja a distribuição de Cauchy
Função de distribuição:
Função de densidade:
Função de distribuição:
Função de densidade:
Função de distribuição:
Função de densidade:
Função de distribuição:
Função de densidade:
Função de distribuição:
Veja a função de erro
Função de densidade:
Veja a distribuição normal

Como surge a distribuição t

Distribuição de amostras

Sejam os números observados em uma amostra de uma população continuamente distribuída com valor esperado . A média da amostra e a variância da amostra são dadas por:

O valor t resultante é

A distribuição t com graus de liberdade é a distribuição amostral do valor t quando as amostras consistem em observações independentes distribuídas de forma idêntica de uma população normalmente distribuída . Assim, para fins de inferência, t é uma " quantidade central " útil no caso em que a média e a variância são parâmetros desconhecidos da população, no sentido de que o valor t tem então uma distribuição de probabilidade que não depende de nem .

Inferência bayesiana

Na estatística Bayesiana, uma distribuição t (em escala, deslocada) surge como a distribuição marginal da média desconhecida de uma distribuição normal, quando a dependência de uma variância desconhecida foi marginalizada:

onde representa os dados e representa qualquer outra informação que possa ter sido usada para criar o modelo. A distribuição é, portanto, a composição da distribuição condicional de dados dados e com a distribuição marginal de dados dados.

Com pontos de dados, se não informativos ou planos, a localização e a escala anteriores e podem ser considerados μ e σ 2 , então o teorema de Bayes fornece

uma distribuição normal e uma distribuição qui-quadrada inversa em escala , respectivamente, onde e

A marginalização integral torna-se assim

Isso pode ser avaliado substituindo , onde , dando

tão

Mas a integral z agora é uma integral Gamma padrão , que é avaliada como uma constante, deixando

Esta é uma forma de distribuição t com um escalonamento e deslocamento explícitos que serão explorados em mais detalhes em uma seção posterior. Pode estar relacionado à distribuição t padronizada pela substituição

A derivação acima foi apresentada para o caso de antecedentes não informativos para e ; mas será aparente que quaisquer antecedentes que levem a uma distribuição normal sendo composta com uma distribuição qui-quadrada inversa em escala levará a uma distribuição t com escala e deslocamento para , embora o parâmetro de escala correspondente a acima seja então influenciado por ambos as informações anteriores e os dados, em vez de apenas os dados acima.

Caracterização

Como a distribuição de uma estatística de teste

A distribuição t de Student com graus de liberdade pode ser definida como a distribuição da variável aleatória T com

Onde

Uma distribuição diferente é definida como aquela da variável aleatória definida, para uma dada constante μ, por

Esta variável aleatória tem um não central t -Distribuição com noncentrality parâmetro μ. Esta distribuição é importante em estudos do poder do teste t de Student .

Derivação

Suponha que X 1 , ..., X n sejam realizações independentes da variável aleatória normalmente distribuída X , que tem um valor esperado μ e variância σ 2 . Deixar

ser a média da amostra, e

ser uma estimativa imparcial da variância da amostra. Pode-se mostrar que a variável aleatória

tem uma distribuição qui-quadrada com graus de liberdade (pelo teorema de Cochran ). É prontamente mostrado que a quantidade

é normalmente distribuído com média 0 e variância 1, uma vez que a média da amostra é normalmente distribuída com média μ e variância σ 2 / n . Além disso, é possível mostrar que essas duas variáveis ​​aleatórias (a normalmente distribuída Z e a qui-quadrada distribuída V ) são independentes. Conseqüentemente, a quantidade essencial

que difere de Z em que o desvio padrão exato σ é substituído pela variável aleatória S n , tem uma distribuição t de Student conforme definido acima. Observe que a variância desconhecida da população σ 2 não aparece em T , uma vez que estava no numerador e no denominador, então ela foi cancelada. Gosset obteve intuitivamente a função de densidade de probabilidade declarada acima, com igual a n - 1, e Fisher provou isso em 1925.

A distribuição da estatística de teste T depende de , mas não de μ ou σ; a falta de dependência de μ e σ é o que torna a distribuição t importante tanto na teoria quanto na prática.

Como uma distribuição de entropia máxima

A distribuição t de Student é a distribuição de probabilidade máxima de entropia para uma variável aleatória X para a qual é fixa.

Propriedades

Momentos

Pois , os momentos brutos da distribuição t são

Momentos de ordem ou superiores não existem.

O termo para , k even, pode ser simplificado usando as propriedades da função gama para

Para uma distribuição t com graus de liberdade, o valor esperado é 0 se , e sua variância é se . A assimetria é 0 se e o excesso de curtose é se .

Amostragem Monte Carlo

Existem várias abordagens para construir amostras aleatórias a partir da distribuição t de Student. A questão depende se as amostras são exigidas em uma base autônoma ou devem ser construídas pela aplicação de uma função de quantil a amostras uniformes ; por exemplo, na base de aplicações multidimensionais da dependência de cópula . No caso de amostragem autônoma, uma extensão do método Box-Muller e sua forma polar é facilmente implantada. Ele tem o mérito de se aplicar igualmente bem a todos os graus de liberdade positivos reais , ν, enquanto muitos outros métodos candidatos falham se ν estiver próximo de zero.

Integral da função de densidade de probabilidade de Student e valor p

A função A ( t  |  ν ) é a integral da função densidade de probabilidade de Student, f ( t ) entre - t e t , para t ≥ 0. Portanto, dá a probabilidade de que um valor de t menor do que o calculado a partir dos dados observados seria ocorrer por acaso. Portanto, a função A ( t  |  ν ) pode ser usada para testar se a diferença entre as médias de dois conjuntos de dados é estatisticamente significativa, calculando o valor correspondente de t e a probabilidade de sua ocorrência se os dois conjuntos de dados fossem retirados da mesma população. Isso é usado em uma variedade de situações, particularmente em testes- t . Para a estatística t , com ν graus de liberdade, A ( t  |  ν ) é a probabilidade de que t seria menor que o valor observado se as duas médias fossem iguais (desde que a menor média seja subtraída da maior, de modo que t ≥ 0). Pode ser facilmente calculado a partir da função de distribuição cumulativa F ν ( t ) da distribuição t :

onde I x é a função beta incompleta regularizada ( ab ).

Para teste de hipótese estatística, esta função é usada para construir o valor p .

Distribuição t de Student generalizada

Em termos de parâmetro de escala ou

A distribuição t de Student pode ser generalizada para uma família de escala de localização de três parâmetros , introduzindo um parâmetro de localização e um parâmetro de escala , através da relação

ou

Isso significa que tem uma distribuição t de Student clássica com graus de liberdade.

A distribuição t de Student não padronizada resultante tem uma densidade definida por:

Aqui, se não corresponder a um desvio-padrão : isto não é o desvio padrão da dimensionado t de distribuição, o qual não pode ainda existir; nem é o desvio padrão da distribuição normal subjacente , que é desconhecido. simplesmente define a escala geral da distribuição. Na derivação bayesiana da distribuição marginal de uma média normal desconhecida acima, conforme usado aqui corresponde à quantidade , onde

.

De forma equivalente, a distribuição pode ser escrita em termos do quadrado deste parâmetro de escala:

Outras propriedades desta versão da distribuição são:

Esta distribuição resulta da composição de uma distribuição Gaussiana ( distribuição normal ) com média e variância desconhecida , com uma distribuição gama inversa colocada sobre a variância com os parâmetros e . Em outras palavras, a variável aleatória X é assumida como tendo uma distribuição Gaussiana com uma variância desconhecida distribuída como gama inversa, e então a variância é marginalizada (integrada para fora). A razão para a utilidade desta caracterização é que a distribuição gama inversa é a distribuição a priori conjugada da variância de uma distribuição gaussiana. Como resultado, a distribuição t de Student não padronizada surge naturalmente em muitos problemas de inferência bayesiana. Veja abaixo.

De forma equivalente, essa distribuição resulta da composição de uma distribuição gaussiana com uma distribuição qui-quadrada inversa em escala com parâmetros e . A distribuição qui-quadrada inversa escalada é exatamente a mesma distribuição que a distribuição gama inversa, mas com uma parametrização diferente, ou seja .

Em termos de parâmetro de escala inversa λ

Uma parametrização alternativa em termos de um parâmetro de escala inversa (análogo ao modo como a precisão é o recíproco da variância), definido pela relação . A densidade é então dada por:

Outras propriedades desta versão da distribuição são:

Esta distribuição resulta da composição de uma distribuição Gaussiana com média e precisão desconhecida (o recíproco da variância ), com uma distribuição gama colocada sobre a precisão com parâmetros e . Em outras palavras, a variável aleatória X é assumida como tendo uma distribuição normal com uma precisão desconhecida distribuída como gama, e então isso é marginalizado sobre a distribuição gama.

Distribuições relacionadas

  • Se tem uma distribuição t de Student com grau de liberdade, então X 2 tem uma distribuição F :
  • A não central t -Distribuição generaliza o t -Distribuição de incluir um parâmetro de localização. Ao contrário das distribuições t não padronizadas , as distribuições não centrais não são simétricas (a mediana não é igual ao modo).
  • O Student discreta t -Distribuição é definido pela sua função de massa de probabilidade de r sendo proporcional:
Aqui a , b , e k são parâmetros. Essa distribuição surge da construção de um sistema de distribuições discretas semelhante ao das distribuições de Pearson para distribuições contínuas.
  • Pode-se gerar Student t amostras tomando a razão de variáveis a partir da distribuição normal e a raiz quadrada do χ 2 -distribuição . Se usarmos em vez da distribuição normal, por exemplo, a distribuição Irwin-Hall , obteremos, de modo geral, uma distribuição simétrica de 4 parâmetros, que inclui a distribuição normal, uniforme , triangular , Student- t e Cauchy . Isso também é mais flexível do que algumas outras generalizações simétricas da distribuição normal.
  • t -distribution é uma instância de distribuições de razão

Usos

Em inferência estatística frequentista

A distribuição t de Student surge em uma variedade de problemas de estimativa estatística onde o objetivo é estimar um parâmetro desconhecido, como um valor médio, em um ambiente onde os dados são observados com erros aditivos . Se (como em quase todos os trabalhos estatísticos práticos) o desvio padrão populacional desses erros for desconhecido e tiver que ser estimado a partir dos dados, a distribuição t é freqüentemente usada para explicar a incerteza extra que resulta dessa estimativa. Na maioria desses problemas, se o desvio padrão dos erros fosse conhecido, uma distribuição normal seria usada em vez da distribuição t .

Os intervalos de confiança e os testes de hipótese são dois procedimentos estatísticos nos quais os quantis da distribuição amostral de uma estatística particular (por exemplo, o escore padrão ) são necessários. Em qualquer situação em que essa estatística seja uma função linear dos dados , dividida pela estimativa usual do desvio padrão, a quantidade resultante pode ser redimensionada e centralizada para seguir a distribuição t de Student. As análises estatísticas envolvendo médias, médias ponderadas e coeficientes de regressão levam a estatísticas com este formato.

Freqüentemente, os problemas dos livros didáticos tratam o desvio padrão da população como se fosse conhecido e, assim, evitam a necessidade de usar a distribuição t de Student. Esses problemas são geralmente de dois tipos: (1) aqueles em que o tamanho da amostra é tão grande que se pode tratar uma estimativa baseada em dados da variância como se fosse certa, e (2) aqueles que ilustram o raciocínio matemático, em que o problema de estimar o desvio padrão é temporariamente ignorado porque esse não é o ponto que o autor ou instrutor está explicando.

Testando hipóteses

Pode-se demonstrar que várias estatísticas têm distribuições t para amostras de tamanho moderado sob hipóteses nulas que são de interesse, de modo que a distribuição t forma a base para os testes de significância. Por exemplo, a distribuição do coeficiente de correlação de posto de Spearman ρ , no caso nulo (correlação zero), é bem aproximada pela distribuição t para tamanhos de amostra acima de cerca de 20.

Intervalos de confiança

Suponha que o número A seja escolhido de modo que

quando T tem uma distribuição t com n - 1 grau de liberdade. Por simetria, isso é o mesmo que dizer que A satisfaz

então A é o "percentil 95" desta distribuição de probabilidade, ou . Então

e isso é equivalente a

Portanto, o intervalo cujos pontos de extremidade são

é um intervalo de confiança de 90% para μ. Portanto, se encontrarmos a média de um conjunto de observações que podemos razoavelmente esperar ter uma distribuição normal, podemos usar a distribuição t para examinar se os limites de confiança nessa média incluem algum valor teoricamente previsto - como o valor previsto em uma hipótese nula .

É este resultado que é usado no de Student t -Testes : uma vez que a diferença entre as médias de amostras de duas distribuições normais é em si distribuídos normalmente, o t -Distribuição pode ser usado para examinar se essa diferença pode ser razoavelmente suposto ser zero .

Se os dados forem normalmente distribuídos, o limite de confiança superior (UCL) unilateral (1 - α ) da média pode ser calculado usando a seguinte equação:

O UCL resultante será o maior valor médio que ocorrerá para um determinado intervalo de confiança e tamanho da população. Em outras palavras, sendo a média do conjunto de observações, a probabilidade de que a média da distribuição seja inferior a UCL 1− α é igual ao nível de confiança 1 - α .

Intervalos de previsão

A distribuição t pode ser usada para construir um intervalo de predição para uma amostra não observada a partir de uma distribuição normal com média e variância desconhecidas.

Em estatísticas Bayesianas

A distribuição t de Student, especialmente em sua versão de três parâmetros (escala de localização), surge freqüentemente na estatística Bayesiana como resultado de sua conexão com a distribuição normal . Sempre que a variância de uma variável aleatória normalmente distribuída é desconhecida e um conjugado previamente colocado sobre ela que segue uma distribuição gama inversa , a distribuição marginal resultante da variável seguirá uma distribuição t de Student. Construções equivalentes com os mesmos resultados envolvem uma distribuição conjugada em escala-inversa-qui-quadrada sobre a variância, ou uma distribuição conjugada gama sobre a precisão . Se um prior impróprio proporcional a σ −2 é colocado sobre a variância, a distribuição t também surge. Este é o caso independentemente de se a média da variável normalmente distribuída é conhecida, é desconhecida distribuída de acordo com um conjugado normalmente distribuído a priori, ou é desconhecida distribuída de acordo com uma constante inadequada a priori.

Situações relacionadas que também produzem uma distribuição t são:

Modelagem paramétrica robusta

A distribuição t é freqüentemente usada como uma alternativa à distribuição normal como um modelo para dados, que geralmente tem caudas mais pesadas do que a distribuição normal permite; ver, por exemplo, Lange et al. A abordagem clássica era identificar outliers (por exemplo, usando o teste de Grubbs ) e excluí-los ou reduzi-los de alguma forma. No entanto, nem sempre é fácil identificar outliers (especialmente em dimensões altas ), e a distribuição t é uma escolha natural de modelo para esses dados e fornece uma abordagem paramétrica para estatísticas robustas .

Um relato bayesiano pode ser encontrado em Gelman et al. O parâmetro de graus de liberdade controla a curtose da distribuição e está correlacionado com o parâmetro de escala. A probabilidade pode ter múltiplos máximos locais e, como tal, muitas vezes é necessário fixar os graus de liberdade em um valor bastante baixo e estimar os outros parâmetros tomando isso como dado. Alguns autores relatam que valores entre 3 e 9 costumam ser boas escolhas. Venables e Ripley sugerem que um valor de 5 costuma ser uma boa escolha.

Processo t do aluno

Para necessidades práticas de regressão e previsão , foram introduzidos os processos t de Student , que são generalizações das distribuições t de Student para funções. Um processo t de Student é construído a partir das distribuições t de Student como um processo gaussiano é construído a partir das distribuições gaussianas . Para um processo gaussiano , todos os conjuntos de valores têm uma distribuição gaussiana multidimensional. Analogamente, é um processo t de Student em um intervalo se os valores correspondentes do processo ( ) têm uma distribuição t de Student multivariada conjunta . Esses processos são usados ​​para regressão, previsão, otimização Bayesiana e problemas relacionados. Para regressão multivariada e predição de multi-outputs, os processos t de Student multivariados são introduzidos e usados.

Tabela de valores selecionados

A tabela a seguir lista os valores para t -distribuições com ν graus de liberdade para uma faixa de regiões críticas unilaterais ou bilaterais . A primeira coluna é ν, as porcentagens no topo são os níveis de confiança e os números no corpo da tabela são os fatores descritos na seção sobre intervalos de confiança .

Observe que a última linha com ν infinito fornece pontos críticos para uma distribuição normal, uma vez que uma distribuição t com infinitos graus de liberdade é uma distribuição normal. (Consulte as distribuições relacionadas acima).

Unilateral 75% 80% 85% 90% 95% 97,5% 99% 99,5% 99,75% 99,9% 99,95%
Dupla face 50% 60% 70% 80% 90% 95% 98% 99% 99,5% 99,8% 99,9%
1 1,000 1,376 1.963 3.078 6,314 12,71 31,82 63,66 127,3 318,3 636,6
2 0,816 1.080 1.386 1,886 2.920 4.303 6,965 9,925 14.09 22,33 31,60
3 0,765 0,978 1.250 1.638 2.353 3.182 4.541 5,841 7,453 10,21 12,92
4 0,741 0,941 1.190 1.533 2.132 2.776 3,747 4.604 5.598 7,173 8,610
5 0,727 0,920 1,156 1,476 2.015 2.571 3.365 4.032 4.773 5,893 6,869
6 0,718 0,906 1,134 1.440 1.943 2.447 3.143 3,707 4.317 5,208 5,959
7 0,711 0,896 1,119 1.415 1.895 2.365 2,998 3.499 4.029 4,785 5,408
8 0,706 0,889 1,108 1.397 1.860 2,306 2.896 3.355 3.833 4,501 5.041
9 0,703 0,883 1.100 1.383 1.833 2.262 2.821 3.250 3,690 4.297 4.781
10 0,700 0,879 1.093 1,372 1.812 2.228 2.764 3,169 3,581 4.144 4.587
11 0,697 0,876 1.088 1.363 1.796 2,201 2.718 3,106 3.497 4.025 4,437
12 0,695 0,873 1.083 1.356 1.782 2,179 2.681 3.055 3.428 3.930 4.318
13 0,694 0,870 1.079 1.350 1.771 2,160 2.650 3.012 3.372 3.852 4,221
14 0,692 0,868 1.076 1,345 1.761 2,145 2.624 2.977 3.326 3,787 4.140
15 0,691 0,866 1.074 1.341 1,753 2,131 2.602 2.947 3.286 3,733 4.073
16 0,690 0,865 1.071 1.337 1,746 2.120 2.583 2.921 3.252 3.686 4.015
17 0,689 0,863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3,965
18 0,688 0,862 1.067 1,330 1.734 2,101 2.552 2.878 3.197 3,610 3,922
19 0,688 0,861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3,579 3.883
20 0,687 0,860 1.064 1,325 1.725 2.086 2.528 2.845 3.153 3,552 3.850
21 0,686 0,859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3,527 3.819
22 0,686 0,858 1.061 1.321 1.717 2.074 2.508 2.819 3,119 3,505 3.792
23 0,685 0,858 1.060 1,319 1.714 2.069 2.500 2,807 3.104 3.485 3,767
24 0,685 0,857 1.059 1,318 1.711 2.064 2.492 2.797 3.091 3.467 3,745
25 0,684 0,856 1.058 1.316 1,708 2.060 2.485 2.787 3.078 3.450 3,725
26 0,684 0,856 1.058 1,315 1,706 2.056 2.479 2.779 3.067 3.435 3,707
27 0,684 0,855 1.057 1,314 1,703 2.052 2.473 2.771 3.057 3.421 3,690
28 0,683 0,855 1.056 1,313 1.701 2.048 2.467 2.763 3.047 3.408 3,674
29 0,683 0,854 1.055 1,311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0,683 0,854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0,681 0,851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3,551
50 0,679 0,849 1.047 1.299 1.676 2,009 2.403 2.678 2.937 3.261 3.496
60 0,679 0,848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
80 0,678 0,846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
100 0,677 0,845 1.042 1.290 1.660 1,984 2,364 2.626 2.871 3.174 3,390
120 0,677 0,845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3,160 3,373
0,674 0,842 1.036 1.282 1.645 1.960 2.326 2.576 2,807 3.090 3.291
Unilateral 75% 80% 85% 90% 95% 97,5% 99% 99,5% 99,75% 99,9% 99,95%
Dupla face 50% 60% 70% 80% 90% 95% 98% 99% 99,5% 99,8% 99,9%

Calculando o intervalo de confiança

Digamos que temos uma amostra com tamanho 11, média da amostra 10 e variância da amostra 2. Para 90% de confiança com 10 graus de liberdade, o valor t unilateral da tabela é 1,372. Em seguida, com intervalo de confiança calculado a partir de

determinamos que, com 90% de confiança, temos uma média verdadeira abaixo

Em outras palavras, 90% das vezes que um limite superior é calculado por este método a partir de amostras particulares, esse limite superior excede a média verdadeira.

E com 90% de confiança, temos uma verdadeira média acima

Em outras palavras, 90% das vezes que um limite inferior é calculado por esse método a partir de amostras específicas, esse limite inferior fica abaixo da média verdadeira.

Para que com 80% de confiança (calculado de 100% - 2 × (1 - 90%) = 80%), temos uma média verdadeira dentro do intervalo

Dizer que 80% das vezes que os limites superior e inferior são calculados por este método a partir de uma determinada amostra, a verdadeira média está abaixo do limite superior e acima do limite inferior não é o mesmo que dizer que existe uma probabilidade de 80% de que a verdadeira média está entre um determinado par de limiares superior e inferior que foram calculados por este método; veja intervalo de confiança e falácia do promotor .

Hoje em dia, softwares estatísticos, como a linguagem de programação R , e funções disponíveis em muitos programas de planilhas computam os valores da distribuição t e seu inverso sem tabelas.

Veja também

Notas

Referências

links externos