Student t -Distribuição -Student's t-distribution
Função densidade de probabilidade
| |||
Função de distribuição cumulativa
| |||
Parâmetros | graus de liberdade ( real ) | ||
---|---|---|---|
Apoio, suporte | |||
CDF |
|
||
Quer dizer | 0 para , caso contrário, indefinido | ||
Mediana | 0 | ||
Modo | 0 | ||
Variância | para , ∞ para , caso contrário, indefinido | ||
Skewness | 0 para , caso contrário, indefinido | ||
Ex. curtose | para , ∞ para , caso contrário, indefinido | ||
Entropia |
|
||
MGF | Indefinido | ||
CF |
para |
Em probabilidade e estatística , a distribuição t de Student (ou simplesmente a distribuição t ) é qualquer membro de uma família de distribuições de probabilidade contínuas que surgem ao estimar a média de uma população normalmente distribuída em situações onde o tamanho da amostra é pequeno e o da população o desvio padrão é desconhecido. Foi desenvolvido pelo estatístico inglês William Sealy Gosset sob o pseudônimo de "Student".
A distribuição t desempenha um papel em uma série de análises estatísticas amplamente utilizadas, incluindo o teste t de Student para avaliar a significância estatística da diferença entre duas médias de amostra, a construção de intervalos de confiança para a diferença entre duas médias populacionais e em análise de regressão . A distribuição t de Student também surge na análise bayesiana de dados de uma família normal.
Se tomarmos uma amostra de observações de uma distribuição normal , então a distribuição t com graus de liberdade pode ser definida como a distribuição da localização da média da amostra em relação à média verdadeira, dividida pelo desvio padrão da amostra, após multiplicar por o termo de padronização . Desta forma, a distribuição t pode ser usada para construir um intervalo de confiança para a média verdadeira.
A distribuição t é simétrica e em forma de sino, como a distribuição normal . No entanto, a distribuição t tem caudas mais pesadas, o que significa que é mais propensa a produzir valores que caem longe de sua média. Isso o torna útil para a compreensão do comportamento estatístico de certos tipos de razões de quantidades aleatórias, em que a variação do denominador é ampliada e pode produzir valores atípicos quando o denominador da razão cai perto de zero. A distribuição t de Student é um caso especial da distribuição hiperbólica generalizada .
História e etimologia
Em estatística, a distribuição t foi derivada pela primeira vez como uma distribuição posterior em 1876 por Helmert e Lüroth . A distribuição t também apareceu em uma forma mais geral como distribuição de Pearson Tipo IV no artigo de Karl Pearson de 1895.
Na literatura de língua inglesa, a distribuição leva o nome do artigo de William Sealy Gosset de 1908 na Biometrika sob o pseudônimo de "Estudante". Gosset trabalhava na Cervejaria Guinness em Dublin, Irlanda , e estava interessado nos problemas de pequenas amostras - por exemplo, as propriedades químicas da cevada, onde os tamanhos das amostras podem ser tão pequenos quanto 3. Uma versão da origem do pseudônimo é que a de Gosset o empregador preferia que os funcionários usassem pseudônimos ao publicar artigos científicos em vez do nome real, então ele usou o nome "Estudante" para esconder sua identidade. Outra versão é que a Guinness não queria que seus concorrentes soubessem que eles estavam usando o teste- t para determinar a qualidade da matéria-prima.
O artigo de Gosset refere-se à distribuição como a "distribuição de frequência de desvios-padrão de amostras retiradas de uma população normal". Tornou-se conhecido por meio do trabalho de Ronald Fisher , que chamou a distribuição de "distribuição do aluno" e representou o valor do teste com a letra t .
Como a distribuição do aluno surge da amostragem
Vamos ser retirados da distribuição de forma independente e idêntica , ou seja, esta é uma amostra de tamanho de uma população normalmente distribuída com valor médio e variância esperados .
Deixar
seja a média da amostra e deixe
ser a variância da amostra ( corrigida por Bessel ). Então a variável aleatória
tem uma distribuição normal padrão (ou seja, normal com média esperada 0 e variância 1), e a variável aleatória
isto é, onde foi substituído por , tem uma distribuição t de Student com graus de liberdade. Uma vez que substituiu a única quantidade não observável nesta expressão , isso pode ser usado para derivar intervalos de confiança para O numerador e o denominador na expressão anterior são variáveis aleatórias independentes, apesar de serem baseados na mesma amostra . Isso pode ser visto observando-se e lembrando que e são ambas combinações lineares do mesmo conjunto de variáveis aleatórias normalmente distribuídas iid.
Definição
Função densidade de probabilidade
A distribuição t de Student tem a função de densidade de probabilidade dada por
onde é o número de graus de liberdade e é a função gama . Isso também pode ser escrito como
onde B é a função Beta . Em particular, para graus de liberdade com valores inteiros , temos:
Por acaso,
Por estranho,
A função de densidade de probabilidade é simétrica e sua forma geral se assemelha à forma de sino de uma variável normalmente distribuída com média 0 e variância 1, exceto que é um pouco menor e mais ampla. À medida que o número de graus de liberdade aumenta, a distribuição t se aproxima da distribuição normal com média 0 e variância 1. Por esse motivo, também é conhecido como parâmetro de normalidade.
As imagens a seguir mostram a densidade da distribuição t para valores crescentes de . A distribuição normal é mostrada como uma linha azul para comparação. Observe que a distribuição t (linha vermelha) se torna mais próxima da distribuição normal conforme aumenta.
Função de distribuição cumulativa
A função de distribuição cumulativa pode ser escrita em termos de I , a função beta incompleta regularizada . Para t > 0,
Onde
Outros valores seriam obtidos por simetria. Uma fórmula alternativa, válida para , é
onde 2 F 1 é um caso particular da função hipergeométrica .
Para obter informações sobre sua função de distribuição cumulativa inversa, consulte função de quantil § Distribuição t de Student .
Casos especiais
Certos valores de fornecem uma forma especialmente simples.
- Função de distribuição:
- Função de densidade:
- Veja a distribuição de Cauchy
- Função de distribuição:
- Função de densidade:
- Função de distribuição:
- Função de densidade:
- Função de distribuição:
- Função de densidade:
- Função de distribuição:
- Função de densidade:
- Função de distribuição:
- Veja a função de erro
- Função de densidade:
- Veja a distribuição normal
Como surge a distribuição t
Distribuição de amostras
Sejam os números observados em uma amostra de uma população continuamente distribuída com valor esperado . A média da amostra e a variância da amostra são dadas por:
O valor t resultante é
A distribuição t com graus de liberdade é a distribuição amostral do valor t quando as amostras consistem em observações independentes distribuídas de forma idêntica de uma população normalmente distribuída . Assim, para fins de inferência, t é uma " quantidade central " útil no caso em que a média e a variância são parâmetros desconhecidos da população, no sentido de que o valor t tem então uma distribuição de probabilidade que não depende de nem .
Inferência bayesiana
Na estatística Bayesiana, uma distribuição t (em escala, deslocada) surge como a distribuição marginal da média desconhecida de uma distribuição normal, quando a dependência de uma variância desconhecida foi marginalizada:
onde representa os dados e representa qualquer outra informação que possa ter sido usada para criar o modelo. A distribuição é, portanto, a composição da distribuição condicional de dados dados e com a distribuição marginal de dados dados.
Com pontos de dados, se não informativos ou planos, a localização e a escala anteriores e podem ser considerados μ e σ 2 , então o teorema de Bayes fornece
uma distribuição normal e uma distribuição qui-quadrada inversa em escala , respectivamente, onde e
A marginalização integral torna-se assim
Isso pode ser avaliado substituindo , onde , dando
tão
Mas a integral z agora é uma integral Gamma padrão , que é avaliada como uma constante, deixando
Esta é uma forma de distribuição t com um escalonamento e deslocamento explícitos que serão explorados em mais detalhes em uma seção posterior. Pode estar relacionado à distribuição t padronizada pela substituição
A derivação acima foi apresentada para o caso de antecedentes não informativos para e ; mas será aparente que quaisquer antecedentes que levem a uma distribuição normal sendo composta com uma distribuição qui-quadrada inversa em escala levará a uma distribuição t com escala e deslocamento para , embora o parâmetro de escala correspondente a acima seja então influenciado por ambos as informações anteriores e os dados, em vez de apenas os dados acima.
Caracterização
Como a distribuição de uma estatística de teste
A distribuição t de Student com graus de liberdade pode ser definida como a distribuição da variável aleatória T com
Onde
- Z é um padrão normal com valor esperado 0 e variância 1;
- V tem uma distribuição qui-quadrada com graus de liberdade ;
- Z e V são independentes ;
Uma distribuição diferente é definida como aquela da variável aleatória definida, para uma dada constante μ, por
Esta variável aleatória tem um não central t -Distribuição com noncentrality parâmetro μ. Esta distribuição é importante em estudos do poder do teste t de Student .
Derivação
Suponha que X 1 , ..., X n sejam realizações independentes da variável aleatória normalmente distribuída X , que tem um valor esperado μ e variância σ 2 . Deixar
ser a média da amostra, e
ser uma estimativa imparcial da variância da amostra. Pode-se mostrar que a variável aleatória
tem uma distribuição qui-quadrada com graus de liberdade (pelo teorema de Cochran ). É prontamente mostrado que a quantidade
é normalmente distribuído com média 0 e variância 1, uma vez que a média da amostra é normalmente distribuída com média μ e variância σ 2 / n . Além disso, é possível mostrar que essas duas variáveis aleatórias (a normalmente distribuída Z e a qui-quadrada distribuída V ) são independentes. Conseqüentemente, a quantidade essencial
que difere de Z em que o desvio padrão exato σ é substituído pela variável aleatória S n , tem uma distribuição t de Student conforme definido acima. Observe que a variância desconhecida da população σ 2 não aparece em T , uma vez que estava no numerador e no denominador, então ela foi cancelada. Gosset obteve intuitivamente a função de densidade de probabilidade declarada acima, com igual a n - 1, e Fisher provou isso em 1925.
A distribuição da estatística de teste T depende de , mas não de μ ou σ; a falta de dependência de μ e σ é o que torna a distribuição t importante tanto na teoria quanto na prática.
Como uma distribuição de entropia máxima
A distribuição t de Student é a distribuição de probabilidade máxima de entropia para uma variável aleatória X para a qual é fixa.
Propriedades
Momentos
Pois , os momentos brutos da distribuição t são
Momentos de ordem ou superiores não existem.
O termo para , k even, pode ser simplificado usando as propriedades da função gama para
Para uma distribuição t com graus de liberdade, o valor esperado é 0 se , e sua variância é se . A assimetria é 0 se e o excesso de curtose é se .
Amostragem Monte Carlo
Existem várias abordagens para construir amostras aleatórias a partir da distribuição t de Student. A questão depende se as amostras são exigidas em uma base autônoma ou devem ser construídas pela aplicação de uma função de quantil a amostras uniformes ; por exemplo, na base de aplicações multidimensionais da dependência de cópula . No caso de amostragem autônoma, uma extensão do método Box-Muller e sua forma polar é facilmente implantada. Ele tem o mérito de se aplicar igualmente bem a todos os graus de liberdade positivos reais , ν, enquanto muitos outros métodos candidatos falham se ν estiver próximo de zero.
Integral da função de densidade de probabilidade de Student e valor p
A função A ( t | ν ) é a integral da função densidade de probabilidade de Student, f ( t ) entre - t e t , para t ≥ 0. Portanto, dá a probabilidade de que um valor de t menor do que o calculado a partir dos dados observados seria ocorrer por acaso. Portanto, a função A ( t | ν ) pode ser usada para testar se a diferença entre as médias de dois conjuntos de dados é estatisticamente significativa, calculando o valor correspondente de t e a probabilidade de sua ocorrência se os dois conjuntos de dados fossem retirados da mesma população. Isso é usado em uma variedade de situações, particularmente em testes- t . Para a estatística t , com ν graus de liberdade, A ( t | ν ) é a probabilidade de que t seria menor que o valor observado se as duas médias fossem iguais (desde que a menor média seja subtraída da maior, de modo que t ≥ 0). Pode ser facilmente calculado a partir da função de distribuição cumulativa F ν ( t ) da distribuição t :
onde I x é a função beta incompleta regularizada ( a , b ).
Para teste de hipótese estatística, esta função é usada para construir o valor p .
Distribuição t de Student generalizada
Em termos de parâmetro de escala ou
A distribuição t de Student pode ser generalizada para uma família de escala de localização de três parâmetros , introduzindo um parâmetro de localização e um parâmetro de escala , através da relação
ou
Isso significa que tem uma distribuição t de Student clássica com graus de liberdade.
A distribuição t de Student não padronizada resultante tem uma densidade definida por:
Aqui, se não corresponder a um desvio-padrão : isto não é o desvio padrão da dimensionado t de distribuição, o qual não pode ainda existir; nem é o desvio padrão da distribuição normal subjacente , que é desconhecido. simplesmente define a escala geral da distribuição. Na derivação bayesiana da distribuição marginal de uma média normal desconhecida acima, conforme usado aqui corresponde à quantidade , onde
- .
De forma equivalente, a distribuição pode ser escrita em termos do quadrado deste parâmetro de escala:
Outras propriedades desta versão da distribuição são:
Esta distribuição resulta da composição de uma distribuição Gaussiana ( distribuição normal ) com média e variância desconhecida , com uma distribuição gama inversa colocada sobre a variância com os parâmetros e . Em outras palavras, a variável aleatória X é assumida como tendo uma distribuição Gaussiana com uma variância desconhecida distribuída como gama inversa, e então a variância é marginalizada (integrada para fora). A razão para a utilidade desta caracterização é que a distribuição gama inversa é a distribuição a priori conjugada da variância de uma distribuição gaussiana. Como resultado, a distribuição t de Student não padronizada surge naturalmente em muitos problemas de inferência bayesiana. Veja abaixo.
De forma equivalente, essa distribuição resulta da composição de uma distribuição gaussiana com uma distribuição qui-quadrada inversa em escala com parâmetros e . A distribuição qui-quadrada inversa escalada é exatamente a mesma distribuição que a distribuição gama inversa, mas com uma parametrização diferente, ou seja .
Em termos de parâmetro de escala inversa λ
Uma parametrização alternativa em termos de um parâmetro de escala inversa (análogo ao modo como a precisão é o recíproco da variância), definido pela relação . A densidade é então dada por:
Outras propriedades desta versão da distribuição são:
Esta distribuição resulta da composição de uma distribuição Gaussiana com média e precisão desconhecida (o recíproco da variância ), com uma distribuição gama colocada sobre a precisão com parâmetros e . Em outras palavras, a variável aleatória X é assumida como tendo uma distribuição normal com uma precisão desconhecida distribuída como gama, e então isso é marginalizado sobre a distribuição gama.
Distribuições relacionadas
- Se tem uma distribuição t de Student com grau de liberdade, então X 2 tem uma distribuição F :
- A não central t -Distribuição generaliza o t -Distribuição de incluir um parâmetro de localização. Ao contrário das distribuições t não padronizadas , as distribuições não centrais não são simétricas (a mediana não é igual ao modo).
- O Student discreta t -Distribuição é definido pela sua função de massa de probabilidade de r sendo proporcional:
- Aqui a , b , e k são parâmetros. Essa distribuição surge da construção de um sistema de distribuições discretas semelhante ao das distribuições de Pearson para distribuições contínuas.
- Pode-se gerar Student t amostras tomando a razão de variáveis a partir da distribuição normal e a raiz quadrada do χ 2 -distribuição . Se usarmos em vez da distribuição normal, por exemplo, a distribuição Irwin-Hall , obteremos, de modo geral, uma distribuição simétrica de 4 parâmetros, que inclui a distribuição normal, uniforme , triangular , Student- t e Cauchy . Isso também é mais flexível do que algumas outras generalizações simétricas da distribuição normal.
- t -distribution é uma instância de distribuições de razão
Usos
Em inferência estatística frequentista
A distribuição t de Student surge em uma variedade de problemas de estimativa estatística onde o objetivo é estimar um parâmetro desconhecido, como um valor médio, em um ambiente onde os dados são observados com erros aditivos . Se (como em quase todos os trabalhos estatísticos práticos) o desvio padrão populacional desses erros for desconhecido e tiver que ser estimado a partir dos dados, a distribuição t é freqüentemente usada para explicar a incerteza extra que resulta dessa estimativa. Na maioria desses problemas, se o desvio padrão dos erros fosse conhecido, uma distribuição normal seria usada em vez da distribuição t .
Os intervalos de confiança e os testes de hipótese são dois procedimentos estatísticos nos quais os quantis da distribuição amostral de uma estatística particular (por exemplo, o escore padrão ) são necessários. Em qualquer situação em que essa estatística seja uma função linear dos dados , dividida pela estimativa usual do desvio padrão, a quantidade resultante pode ser redimensionada e centralizada para seguir a distribuição t de Student. As análises estatísticas envolvendo médias, médias ponderadas e coeficientes de regressão levam a estatísticas com este formato.
Freqüentemente, os problemas dos livros didáticos tratam o desvio padrão da população como se fosse conhecido e, assim, evitam a necessidade de usar a distribuição t de Student. Esses problemas são geralmente de dois tipos: (1) aqueles em que o tamanho da amostra é tão grande que se pode tratar uma estimativa baseada em dados da variância como se fosse certa, e (2) aqueles que ilustram o raciocínio matemático, em que o problema de estimar o desvio padrão é temporariamente ignorado porque esse não é o ponto que o autor ou instrutor está explicando.
Testando hipóteses
Pode-se demonstrar que várias estatísticas têm distribuições t para amostras de tamanho moderado sob hipóteses nulas que são de interesse, de modo que a distribuição t forma a base para os testes de significância. Por exemplo, a distribuição do coeficiente de correlação de posto de Spearman ρ , no caso nulo (correlação zero), é bem aproximada pela distribuição t para tamanhos de amostra acima de cerca de 20.
Intervalos de confiança
Suponha que o número A seja escolhido de modo que
quando T tem uma distribuição t com n - 1 grau de liberdade. Por simetria, isso é o mesmo que dizer que A satisfaz
então A é o "percentil 95" desta distribuição de probabilidade, ou . Então
e isso é equivalente a
Portanto, o intervalo cujos pontos de extremidade são
é um intervalo de confiança de 90% para μ. Portanto, se encontrarmos a média de um conjunto de observações que podemos razoavelmente esperar ter uma distribuição normal, podemos usar a distribuição t para examinar se os limites de confiança nessa média incluem algum valor teoricamente previsto - como o valor previsto em uma hipótese nula .
É este resultado que é usado no de Student t -Testes : uma vez que a diferença entre as médias de amostras de duas distribuições normais é em si distribuídos normalmente, o t -Distribuição pode ser usado para examinar se essa diferença pode ser razoavelmente suposto ser zero .
Se os dados forem normalmente distribuídos, o limite de confiança superior (UCL) unilateral (1 - α ) da média pode ser calculado usando a seguinte equação:
O UCL resultante será o maior valor médio que ocorrerá para um determinado intervalo de confiança e tamanho da população. Em outras palavras, sendo a média do conjunto de observações, a probabilidade de que a média da distribuição seja inferior a UCL 1− α é igual ao nível de confiança 1 - α .
Intervalos de previsão
A distribuição t pode ser usada para construir um intervalo de predição para uma amostra não observada a partir de uma distribuição normal com média e variância desconhecidas.
Em estatísticas Bayesianas
A distribuição t de Student, especialmente em sua versão de três parâmetros (escala de localização), surge freqüentemente na estatística Bayesiana como resultado de sua conexão com a distribuição normal . Sempre que a variância de uma variável aleatória normalmente distribuída é desconhecida e um conjugado previamente colocado sobre ela que segue uma distribuição gama inversa , a distribuição marginal resultante da variável seguirá uma distribuição t de Student. Construções equivalentes com os mesmos resultados envolvem uma distribuição conjugada em escala-inversa-qui-quadrada sobre a variância, ou uma distribuição conjugada gama sobre a precisão . Se um prior impróprio proporcional a σ −2 é colocado sobre a variância, a distribuição t também surge. Este é o caso independentemente de se a média da variável normalmente distribuída é conhecida, é desconhecida distribuída de acordo com um conjugado normalmente distribuído a priori, ou é desconhecida distribuída de acordo com uma constante inadequada a priori.
Situações relacionadas que também produzem uma distribuição t são:
- A distribuição marginal posterior da média desconhecida de uma variável normalmente distribuída, com média anterior desconhecida e variância seguindo o modelo acima.
- A distribuição preditiva anterior e a distribuição preditiva posterior de um novo dado normalmente distribuído apontam quando uma série de pontos de dados normalmente distribuídos e independentes foram observados, com média e variância anteriores como no modelo acima.
Modelagem paramétrica robusta
A distribuição t é freqüentemente usada como uma alternativa à distribuição normal como um modelo para dados, que geralmente tem caudas mais pesadas do que a distribuição normal permite; ver, por exemplo, Lange et al. A abordagem clássica era identificar outliers (por exemplo, usando o teste de Grubbs ) e excluí-los ou reduzi-los de alguma forma. No entanto, nem sempre é fácil identificar outliers (especialmente em dimensões altas ), e a distribuição t é uma escolha natural de modelo para esses dados e fornece uma abordagem paramétrica para estatísticas robustas .
Um relato bayesiano pode ser encontrado em Gelman et al. O parâmetro de graus de liberdade controla a curtose da distribuição e está correlacionado com o parâmetro de escala. A probabilidade pode ter múltiplos máximos locais e, como tal, muitas vezes é necessário fixar os graus de liberdade em um valor bastante baixo e estimar os outros parâmetros tomando isso como dado. Alguns autores relatam que valores entre 3 e 9 costumam ser boas escolhas. Venables e Ripley sugerem que um valor de 5 costuma ser uma boa escolha.
Processo t do aluno
Para necessidades práticas de regressão e previsão , foram introduzidos os processos t de Student , que são generalizações das distribuições t de Student para funções. Um processo t de Student é construído a partir das distribuições t de Student como um processo gaussiano é construído a partir das distribuições gaussianas . Para um processo gaussiano , todos os conjuntos de valores têm uma distribuição gaussiana multidimensional. Analogamente, é um processo t de Student em um intervalo se os valores correspondentes do processo ( ) têm uma distribuição t de Student multivariada conjunta . Esses processos são usados para regressão, previsão, otimização Bayesiana e problemas relacionados. Para regressão multivariada e predição de multi-outputs, os processos t de Student multivariados são introduzidos e usados.
Tabela de valores selecionados
A tabela a seguir lista os valores para t -distribuições com ν graus de liberdade para uma faixa de regiões críticas unilaterais ou bilaterais . A primeira coluna é ν, as porcentagens no topo são os níveis de confiança e os números no corpo da tabela são os fatores descritos na seção sobre intervalos de confiança .
Observe que a última linha com ν infinito fornece pontos críticos para uma distribuição normal, uma vez que uma distribuição t com infinitos graus de liberdade é uma distribuição normal. (Consulte as distribuições relacionadas acima).
Unilateral | 75% | 80% | 85% | 90% | 95% | 97,5% | 99% | 99,5% | 99,75% | 99,9% | 99,95% |
---|---|---|---|---|---|---|---|---|---|---|---|
Dupla face | 50% | 60% | 70% | 80% | 90% | 95% | 98% | 99% | 99,5% | 99,8% | 99,9% |
1 | 1,000 | 1,376 | 1.963 | 3.078 | 6,314 | 12,71 | 31,82 | 63,66 | 127,3 | 318,3 | 636,6 |
2 | 0,816 | 1.080 | 1.386 | 1,886 | 2.920 | 4.303 | 6,965 | 9,925 | 14.09 | 22,33 | 31,60 |
3 | 0,765 | 0,978 | 1.250 | 1.638 | 2.353 | 3.182 | 4.541 | 5,841 | 7,453 | 10,21 | 12,92 |
4 | 0,741 | 0,941 | 1.190 | 1.533 | 2.132 | 2.776 | 3,747 | 4.604 | 5.598 | 7,173 | 8,610 |
5 | 0,727 | 0,920 | 1,156 | 1,476 | 2.015 | 2.571 | 3.365 | 4.032 | 4.773 | 5,893 | 6,869 |
6 | 0,718 | 0,906 | 1,134 | 1.440 | 1.943 | 2.447 | 3.143 | 3,707 | 4.317 | 5,208 | 5,959 |
7 | 0,711 | 0,896 | 1,119 | 1.415 | 1.895 | 2.365 | 2,998 | 3.499 | 4.029 | 4,785 | 5,408 |
8 | 0,706 | 0,889 | 1,108 | 1.397 | 1.860 | 2,306 | 2.896 | 3.355 | 3.833 | 4,501 | 5.041 |
9 | 0,703 | 0,883 | 1.100 | 1.383 | 1.833 | 2.262 | 2.821 | 3.250 | 3,690 | 4.297 | 4.781 |
10 | 0,700 | 0,879 | 1.093 | 1,372 | 1.812 | 2.228 | 2.764 | 3,169 | 3,581 | 4.144 | 4.587 |
11 | 0,697 | 0,876 | 1.088 | 1.363 | 1.796 | 2,201 | 2.718 | 3,106 | 3.497 | 4.025 | 4,437 |
12 | 0,695 | 0,873 | 1.083 | 1.356 | 1.782 | 2,179 | 2.681 | 3.055 | 3.428 | 3.930 | 4.318 |
13 | 0,694 | 0,870 | 1.079 | 1.350 | 1.771 | 2,160 | 2.650 | 3.012 | 3.372 | 3.852 | 4,221 |
14 | 0,692 | 0,868 | 1.076 | 1,345 | 1.761 | 2,145 | 2.624 | 2.977 | 3.326 | 3,787 | 4.140 |
15 | 0,691 | 0,866 | 1.074 | 1.341 | 1,753 | 2,131 | 2.602 | 2.947 | 3.286 | 3,733 | 4.073 |
16 | 0,690 | 0,865 | 1.071 | 1.337 | 1,746 | 2.120 | 2.583 | 2.921 | 3.252 | 3.686 | 4.015 |
17 | 0,689 | 0,863 | 1.069 | 1.333 | 1.740 | 2.110 | 2.567 | 2.898 | 3.222 | 3.646 | 3,965 |
18 | 0,688 | 0,862 | 1.067 | 1,330 | 1.734 | 2,101 | 2.552 | 2.878 | 3.197 | 3,610 | 3,922 |
19 | 0,688 | 0,861 | 1.066 | 1.328 | 1.729 | 2.093 | 2.539 | 2.861 | 3.174 | 3,579 | 3.883 |
20 | 0,687 | 0,860 | 1.064 | 1,325 | 1.725 | 2.086 | 2.528 | 2.845 | 3.153 | 3,552 | 3.850 |
21 | 0,686 | 0,859 | 1.063 | 1.323 | 1.721 | 2.080 | 2.518 | 2.831 | 3.135 | 3,527 | 3.819 |
22 | 0,686 | 0,858 | 1.061 | 1.321 | 1.717 | 2.074 | 2.508 | 2.819 | 3,119 | 3,505 | 3.792 |
23 | 0,685 | 0,858 | 1.060 | 1,319 | 1.714 | 2.069 | 2.500 | 2,807 | 3.104 | 3.485 | 3,767 |
24 | 0,685 | 0,857 | 1.059 | 1,318 | 1.711 | 2.064 | 2.492 | 2.797 | 3.091 | 3.467 | 3,745 |
25 | 0,684 | 0,856 | 1.058 | 1.316 | 1,708 | 2.060 | 2.485 | 2.787 | 3.078 | 3.450 | 3,725 |
26 | 0,684 | 0,856 | 1.058 | 1,315 | 1,706 | 2.056 | 2.479 | 2.779 | 3.067 | 3.435 | 3,707 |
27 | 0,684 | 0,855 | 1.057 | 1,314 | 1,703 | 2.052 | 2.473 | 2.771 | 3.057 | 3.421 | 3,690 |
28 | 0,683 | 0,855 | 1.056 | 1,313 | 1.701 | 2.048 | 2.467 | 2.763 | 3.047 | 3.408 | 3,674 |
29 | 0,683 | 0,854 | 1.055 | 1,311 | 1.699 | 2.045 | 2.462 | 2.756 | 3.038 | 3.396 | 3.659 |
30 | 0,683 | 0,854 | 1.055 | 1.310 | 1.697 | 2.042 | 2.457 | 2.750 | 3.030 | 3.385 | 3.646 |
40 | 0,681 | 0,851 | 1.050 | 1.303 | 1.684 | 2.021 | 2.423 | 2.704 | 2.971 | 3.307 | 3,551 |
50 | 0,679 | 0,849 | 1.047 | 1.299 | 1.676 | 2,009 | 2.403 | 2.678 | 2.937 | 3.261 | 3.496 |
60 | 0,679 | 0,848 | 1.045 | 1.296 | 1.671 | 2.000 | 2.390 | 2.660 | 2.915 | 3.232 | 3.460 |
80 | 0,678 | 0,846 | 1.043 | 1.292 | 1.664 | 1.990 | 2.374 | 2.639 | 2.887 | 3.195 | 3.416 |
100 | 0,677 | 0,845 | 1.042 | 1.290 | 1.660 | 1,984 | 2,364 | 2.626 | 2.871 | 3.174 | 3,390 |
120 | 0,677 | 0,845 | 1.041 | 1.289 | 1.658 | 1.980 | 2.358 | 2.617 | 2.860 | 3,160 | 3,373 |
∞ | 0,674 | 0,842 | 1.036 | 1.282 | 1.645 | 1.960 | 2.326 | 2.576 | 2,807 | 3.090 | 3.291 |
Unilateral | 75% | 80% | 85% | 90% | 95% | 97,5% | 99% | 99,5% | 99,75% | 99,9% | 99,95% |
Dupla face | 50% | 60% | 70% | 80% | 90% | 95% | 98% | 99% | 99,5% | 99,8% | 99,9% |
Calculando o intervalo de confiança
Digamos que temos uma amostra com tamanho 11, média da amostra 10 e variância da amostra 2. Para 90% de confiança com 10 graus de liberdade, o valor t unilateral da tabela é 1,372. Em seguida, com intervalo de confiança calculado a partir de
determinamos que, com 90% de confiança, temos uma média verdadeira abaixo
Em outras palavras, 90% das vezes que um limite superior é calculado por este método a partir de amostras particulares, esse limite superior excede a média verdadeira.
E com 90% de confiança, temos uma verdadeira média acima
Em outras palavras, 90% das vezes que um limite inferior é calculado por esse método a partir de amostras específicas, esse limite inferior fica abaixo da média verdadeira.
Para que com 80% de confiança (calculado de 100% - 2 × (1 - 90%) = 80%), temos uma média verdadeira dentro do intervalo
Dizer que 80% das vezes que os limites superior e inferior são calculados por este método a partir de uma determinada amostra, a verdadeira média está abaixo do limite superior e acima do limite inferior não é o mesmo que dizer que existe uma probabilidade de 80% de que a verdadeira média está entre um determinado par de limiares superior e inferior que foram calculados por este método; veja intervalo de confiança e falácia do promotor .
Hoje em dia, softwares estatísticos, como a linguagem de programação R , e funções disponíveis em muitos programas de planilhas computam os valores da distribuição t e seu inverso sem tabelas.
Veja também
- Z- tabela de distribuição
- Distribuição qui-quadrado
- Distribuição F
- Distribuição gama
- Folded- t e meia t distribuições
- Distribuição T -quared de Hotelling
- Distribuição multivariada de alunos
- t- estatístico
- Distribuição Tau , para resíduos estudantizados internamente
- Distribuição lambda de Wilks
- Distribuição de Wishart
- Distribuição normal
Notas
Referências
- Senn, S .; Richardson, W. (1994). "O primeiro t- teste". Estatística em Medicina . 13 (8): 785–803. doi : 10.1002 / sim.4780130802 . PMID 8047737 .
- Hogg RV , Craig AT (1978). Introdução à Estatística Matemática (4ª ed.). Nova York: Macmillan. ASIN B010WFO0SA .
- Venables, WN; Ripley, BD (2002). Estatísticas Aplicadas Modernas com S (Quarta ed.). Springer.
- Gelman, Andrew; John B. Carlin; Hal S. Stern; Donald B. Rubin (2003). Análise de dados bayesiana (segunda edição) . CRC / Chapman & Hall. ISBN 1-58488-388-X.
links externos
- "Distribuição de alunos" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
- Primeiros usos conhecidos de algumas das palavras da matemática (S) (observações sobre a história do termo "distribuição do aluno")
- Rouaud, M. (2013), Probability, Statistics and Estimation (PDF) (edição curta) Primeiros alunos na página 112.
- Distribuição t de aluno, ck12