Relações entre distribuições de probabilidade - Relationships among probability distributions
Em teoria de probabilidade e estatística , existem várias relações entre distribuições de probabilidade . Essas relações podem ser categorizadas nos seguintes grupos:
- Uma distribuição é um caso especial de outra com um espaço de parâmetros mais amplo
- Transforms (função de uma variável aleatória);
- Combinações (função de várias variáveis);
- Relações de aproximação (limite);
- Relações compostas (úteis para inferência bayesiana);
- Dualidade ;
- Priores conjugados .
Caso especial de parametrização de distribuição
- Uma distribuição binomial com parâmetros n = 1 e p é uma distribuição de Bernoulli com parâmetro p .
- Uma distribuição binomial negativa com parâmetros n = 1 e p é uma distribuição geométrica com parâmetro p .
- Uma distribuição gama com parâmetro de forma α = 1 e parâmetro de taxa β é uma distribuição exponencial com parâmetro de taxa β .
- Uma distribuição gama com parâmetro de forma α = v / 2 e parâmetro de taxa β = 1/2 é uma distribuição qui-quadrada com ν graus de liberdade .
- Uma distribuição qui-quadrada com 2 graus de liberdade ( k = 2) é uma distribuição exponencial com um valor médio de 2 (taxa λ = 1/2.)
- Uma distribuição Weibull com parâmetro de forma k = 1 e parâmetro de taxa β é uma distribuição exponencial com parâmetro de taxa β .
- Uma distribuição beta com parâmetros de forma α = β = 1 é uma distribuição uniforme contínua sobre os números reais de 0 a 1.
- Uma distribuição beta-binomial com parâmetro ne parâmetros de forma α = β = 1 é uma distribuição uniforme discreta sobre os inteiros de 0 a n .
- Uma distribuição t de Student com um grau de liberdade ( v = 1) é uma distribuição de Cauchy com parâmetro de localização x = 0 e parâmetro de escala γ = 1.
- Uma distribuição Burr com parâmetros c = 1 ek (e escala λ ) é uma distribuição Lomax com forma k (e escala λ .)
Transformada de uma variável
Múltiplo de uma variável aleatória
Multiplicar a variável por qualquer constante real positiva resulta em uma escala da distribuição original. Alguns são auto-replicantes, o que significa que a escala produz a mesma família de distribuições, embora com um parâmetro diferente: distribuição normal , distribuição gama , distribuição de Cauchy , distribuição exponencial , distribuição Erlang , distribuição Weibull , distribuição logística , distribuição de erro , lei de potência distribuição , distribuição de Rayleigh .
Exemplo:
- Se X for uma variável aleatória gama com parâmetros de forma e taxa ( α , β ), então Y = aX é uma variável aleatória gama com parâmetros ( α , β / a ).
- Se X for uma variável aleatória gama com parâmetros de forma e escala ( k , θ ), então Y = aX é uma variável aleatória gama com parâmetros ( k , aθ ).
Função linear de uma variável aleatória
A transformação afim ax + b produz uma realocação e dimensionamento da distribuição original. Os seguintes são auto-replicáveis: distribuição normal , distribuição de Cauchy , distribuição logística , distribuição de erro , distribuição de energia , distribuição de Rayleigh .
Exemplo:
- Se Z é uma variável aleatória normal com parâmetros ( μ = m , σ 2 = s 2 ), então X = aZ + b é uma variável aleatória normal com parâmetros ( μ = am + b , σ 2 = a 2 s 2 ).
Recíproca de uma variável aleatória
O recíproco 1 / X de uma variável aleatória X , é um membro da mesma família de distribuição de X , nos seguintes casos: distribuição de Cauchy , distribuição F , distribuição logística .
Exemplos:
- Se X é uma variável aleatória de Cauchy ( μ , σ ), então 1 / X é uma variável aleatória de Cauchy ( μ / C , σ / C ) onde C = μ 2 + σ 2 .
- Se X for uma variável aleatória F ( ν 1 , ν 2 ), então 1 / X é uma variável aleatória F ( ν 2 , ν 1 ).
Outros casos
Algumas distribuições são invariantes sob uma transformação específica.
Exemplo:
- Se X é uma variável aleatória beta ( α , β ), então (1 - X ) é uma variável aleatória beta ( β , α ).
- Se X é uma variável aleatória binomial ( n , p ), então ( n - X ) é uma variável aleatória binomial ( n , 1 - p ).
- Se X tem função de distribuição cumulativa F X , então o inverso da distribuição cumulativa F
X( X ) é uma variável aleatória uniforme padrão (0,1) - Se X é uma variável aleatória normal ( µ , σ 2 ), então e X é uma variável aleatória lognormal ( µ , σ 2 ).
- Por outro lado, se X é uma variável aleatória lognormal ( μ , σ 2 ), então log X é uma variável aleatória normal ( μ , σ 2 ).
- Se X é uma variável aleatória exponencial com média β , então X 1 / γ é uma variável aleatória Weibull ( γ , β ).
- O quadrado de uma variável aleatória normal padrão tem uma distribuição qui-quadrada com um grau de liberdade.
- Se X for uma variável aleatória t de Student com ν grau de liberdade, então X 2 é uma variável aleatória F (1, ν ).
- Se X for uma variável aleatória exponencial dupla com média 0 e escala λ , então | X | é uma variável aleatória exponencial com média λ .
- Uma variável aleatória geométrica é o piso de uma variável aleatória exponencial .
- Uma variável aleatória retangular é o piso de uma variável aleatória uniforme .
- Uma variável aleatória recíproca é o exponencial de uma variável aleatória uniforme .
Funções de várias variáveis
Soma das variáveis
A distribuição da soma das variáveis aleatórias independentes é a convolução de suas distribuições. Suponha que seja a soma de variáveis aleatórias independentes, cada uma com funções de massa de probabilidade . Então
tem
Se ela tiver uma distribuição da mesma família de distribuições das variáveis originais, essa família de distribuições é considerada fechada sob convolução .
Exemplos de tais distribuições univariadas são: distribuições normais , distribuições de Poisson , distribuição binomial (com probabilidade comum sucesso), distribuição binomial negativo (com probabilidade comum sucesso), distribuições gama (com comum parâmetro taxa ), distribuições do qui-quadrado , distribuições de Cauchy , hyperexponential distribuições .
Exemplos:
- Se X 1 e X 2 são variáveis aleatórias de Poisson com médias μ 1 e μ 2 respectivamente, então X 1 + X 2 é uma variável aleatória de Poisson com média μ 1 + μ 2 .
- A soma das variáveis aleatórias gama ( α i , β ) tem uma distribuição gama (Σ α i , β ).
- Se X 1 é uma variável aleatória Cauchy ( μ 1 , σ 1 ) e X 2 é Cauchy ( μ 2 , σ 2 ), então X 1 + X 2 é um Cauchy ( μ 1 + μ 2 , σ 1 + σ 2 ) variável aleatória.
- Se X 1 e X 2 são variáveis aleatórias qui-quadrado com ν 1 e ν 2 graus de liberdade respectivamente, então X 1 + X 2 é uma variável aleatória qui-quadrado com ν 1 + ν 2 graus de liberdade.
- Se X 1 for normal ( μ 1 , σ2
1) variável aleatória e X 2 é uma normal ( μ 2 , σ2
2) variável aleatória, então X 1 + X 2 é uma normal ( μ 1 + μ 2 , σ2
1+ σ2
2) variável aleatória. - A soma de N variáveis aleatórias qui-quadrado (1) tem uma distribuição qui-quadrada com N graus de liberdade.
Outras distribuições não são fechadas por convolução, mas sua soma tem uma distribuição conhecida:
- A soma de n variáveis aleatórias de Bernoulli (p) é uma variável aleatória binomial ( n , p ).
- A soma de n variáveis aleatórias geométricas com probabilidade de sucesso p é uma variável aleatória binomial negativa com parâmetros n e p .
- A soma de n variáveis aleatórias exponenciais ( β ) é uma variável aleatória gama ( n , β ). Como n é um número inteiro, a distribuição gama também é uma distribuição Erlang .
- A soma dos quadrados de N variáveis aleatórias normais padrão tem uma distribuição qui-quadrada com N graus de liberdade.
Produto de variáveis
O produto das variáveis aleatórias independentes X e Y pode pertencer à mesma família de distribuição que X e Y : distribuição de Bernoulli e distribuição log-normal .
Exemplo:
- Se X 1 e X 2 forem variáveis aleatórias log-normais independentes com parâmetros ( μ 1 , σ2
1) e ( μ 2 , σ2
2), respectivamente, então X 1 X 2 é uma variável aleatória log-normal com parâmetros ( μ 1 + μ 2 , σ2
1+ σ2
2)
Mínimo e máximo de variáveis aleatórias independentes
Para algumas distribuições, o valor mínimo de várias variáveis aleatórias independentes é um membro da mesma família, com parâmetros diferentes: distribuição de Bernoulli , distribuição geométrica , distribuição exponencial , distribuição de valores extremos , distribuição de Pareto , distribuição de Rayleigh , distribuição de Weibull .
Exemplos:
- Se X 1 e X 2 são variáveis aleatórias geométricas independentes com probabilidade de sucesso p 1 e p 2 respectivamente, então min ( X 1 , X 2 ) é uma variável aleatória geométrica com probabilidade de sucesso p = p 1 + p 2 - p 1 p 2 . A relação é mais simples se expressa em termos de probabilidade de falha: q = q 1 q 2 .
- Se X 1 e X 2 são variáveis aleatórias exponenciais independentes com taxa μ 1 e μ 2 respectivamente, então min ( X 1 , X 2 ) é uma variável aleatória exponencial com taxa μ = μ 1 + μ 2 .
Da mesma forma, as distribuições para as quais o valor máximo de várias variáveis aleatórias independentes é membro da mesma família de distribuição incluem: distribuição de Bernoulli , distribuição da lei de potência .
De outros
- Se X e Y são variáveis aleatórias normais padrão independentes , X / Y é uma variável aleatória de Cauchy (0,1).
- Se X 1 e X 2 são variáveis aleatórias qui-quadradas independentes com ν 1 e ν 2 graus de liberdade respectivamente, então ( X 1 / ν 1 ) / ( X 2 / ν 2 ) é um F ( ν 1 , ν 2 ) variável aleatória.
- Se X é uma variável aleatória normal padrão e U é uma variável aleatória qui-quadrada independente com ν graus de liberdade, então é uma variável aleatória t ( ν ) de Student .
- Se X 1 é uma variável aleatória gama ( α 1 , 1) e X 2 é uma variável aleatória gama independente (α 2 , 1), então X 1 / ( X 1 + X 2 ) é um beta ( α 1 , α 2 ) variável aleatória. Mais geralmente, se X 1 é uma variável aleatória gama ( α 1 , β 1 ) e X 2 é uma variável aleatória gama independente ( α 2 , β 2 ), então β 2 X 1 / ( β 2 X 1 + β 1 X 2 ) é uma variável aleatória beta ( α 1 , α 2 ).
- Se X e Y são variáveis aleatórias exponenciais independentes com média μ, então X - Y é uma variável aleatória exponencial dupla com média 0 e escala μ.
- Se X i são variáveis aleatórias de Bernoulli independentes, então sua paridade (XOR) é uma variável de Bernoulli descrita pelo lema de empilhamento .
Relações aproximadas (limite)
Meios de relacionamento aproximados ou limitados
- ou que a combinação de um número infinito de variáveis aleatórias iid tende a alguma distribuição,
- ou que o limite quando um parâmetro tende a algum valor se aproxima de uma distribuição diferente.
Combinação de variáveis aleatórias iid :
- Dadas certas condições, a soma (daí a média) de um número suficientemente grande de variáveis aleatórias iid, cada uma com média e variância finitas, será distribuída aproximadamente normalmente. Este é o teorema do limite central (CLT).
Caso especial de parametrização de distribuição:
- X é uma variável aleatória hipergeométrica ( m , N , n ). Se n e m são grandes em comparação com N e p = m / N não é próximo de 0 ou 1, então X tem aproximadamente uma distribuição Binomial ( n , p ).
- X é uma variável aleatória beta-binomial com parâmetros ( n , α , β ). Seja p = α / ( α + β ) e suponha que α + β seja grande, então X tem aproximadamente uma distribuição binomial ( n , p ).
- Se X for uma variável aleatória binomial ( n , p ) e se n for grande e np for pequeno, então X terá aproximadamente uma distribuição de Poisson ( np ).
- Se X for uma variável aleatória binomial negativa com r grande, P próximo a 1 e r (1 - P ) = λ , então X terá aproximadamente uma distribuição de Poisson com média λ .
Consequências da CLT:
- Se X for uma variável aleatória de Poisson com grande média, então para inteiros j e k , P ( j ≤ X ≤ k ) aproximadamente igual a P ( j - 1/2 ≤ Y ≤ k + 1/2) onde Y é um normal distribuição com a mesma média e variância como X .
- Se X for uma variável aleatória binomial ( n , p ) com grandes np e n (1 - p ), então para inteiros j e k , P ( j ≤ X ≤ k ) aproximadamente igual a P ( j - 1/2 ≤ Y ≤ k + 1/2) onde Y é uma variável aleatória normal com a mesma média e variância de X , ou seja, np e np (1 - p ).
- Se X é uma variável beta aleatória com parâmetros α e β iguais e grandes, então X tem aproximadamente uma distribuição normal com a mesma média e variância, ou seja, média α / ( α + β ) e variância αβ / (( α + β ) 2 ( α + β + 1)).
- Se X for uma variável aleatória gama ( α , β ) e o parâmetro de forma α for grande em relação ao parâmetro de escala β , então X terá aproximadamente uma variável aleatória normal com a mesma média e variância.
- Se X for uma variável aleatória t de Student com um grande número de graus de liberdade ν, então X terá aproximadamente uma distribuição normal padrão .
- Se X for uma variável aleatória F ( ν , ω ) com ω grande, então νX é aproximadamente distribuída como uma variável aleatória qui-quadrada com ν graus de liberdade.
Relações compostas (ou bayesianas)
Quando um ou mais parâmetro (s) de uma distribuição são variáveis aleatórias, a distribuição composta é a distribuição marginal da variável.
Exemplos:
- Se X | N é uma variável aleatória binomial ( N , p ), onde o parâmetro N é uma variável aleatória com distribuição binomial negativa ( m , r ), então X é distribuído como binomial negativo ( m , r / ( p + qr )) .
- Se X | N é uma variável aleatória binomial ( N , p ), onde o parâmetro N é uma variável aleatória com distribuição de Poisson ( μ ), então X é distribuído como Poisson ( μp ).
- Se X | μ é uma variável aleatória Poisson ( μ ) e o parâmetro μ é uma variável aleatória com distribuição gama ( m , θ ) (onde θ é o parâmetro de escala), então X é distribuído como um binômio negativo ( m , θ / (1 + θ) )), às vezes chamada de distribuição gama-Poisson .
Algumas distribuições foram especialmente nomeadas como compostos: distribuição beta-binomial , distribuição beta-Pascal , distribuição gama-normal .
Exemplos:
- Se X é uma variável aleatória Binomial ( n , p ) e o parâmetro p é uma variável aleatória com distribuição beta ( α , β ), então X é distribuído como um Beta-Binomial ( α , β , n ).
- Se X é uma variável aleatória binomial negativa ( m , p ) e o parâmetro p é uma variável aleatória com distribuição beta ( α , β ), então X é distribuído como um Beta-Pascal ( α , β , m ).
Veja também
Referências
links externos
- Gráfico interativo: Relações Univariadas de Distribuição
- ProbOnto - Ontologia e base de conhecimento de distribuições de probabilidade: ProbOnto
- O projeto Probability Distributome inclui calculadoras, simuladores, experimentos e navegadores para atualizações interdistribucionais e metadados de distribuição .