Distribuição estável - Stable distribution

Estábulo
Função densidade de probabilidade
Distribuições simétricas estáveis
Distribuições simétricas α- estáveis ​​com fator de escala unitário Distribuições estáveis ​​centradas enviesadas com fator de escala unitário
Distribuições estáveis ​​centradas enviesadas
Função de distribuição cumulativa
CDF's para distribuições simétricas α-estáveis
CDFs para distribuições simétricas α- estáveis CDFs para distribuições estáveis ​​centradas enviesadas
CDFs para distribuições de Lévy centradas e enviesadas
Parâmetros

α ∈ (0, 2] - parâmetro de estabilidade
β ∈ [−1, 1] - parâmetro de assimetria (observe que a assimetria é indefinida)
c ∈ (0, ∞) - parâmetro de escala

μ ∈ (−∞, ∞) - parâmetro de localização
Apoio, suporte

x ∈ [ μ , + ∞) se α <1 e β = 1

x ∈ (-∞, μ ] se α <1 e β = −1

xR caso contrário
PDF não expressável analiticamente, exceto para alguns valores de parâmetro
CDF não expressável analiticamente, exceto para certos valores de parâmetros
Quer dizer μ quando α > 1 , caso contrário, indefinido
Mediana μ quando β = 0 , caso contrário, não expressável analiticamente
Modo μ quando β = 0 , caso contrário, não expressável analiticamente
Variância 2 c 2 quando α = 2 , caso contrário, infinito
Skewness 0 quando α = 2 , caso contrário, indefinido
Ex. curtose 0 quando α = 2 , caso contrário, indefinido
Entropia não expressável analiticamente, exceto para certos valores de parâmetros
MGF quando , caso contrário, indefinido
CF


Onde

Na teoria da probabilidade , uma distribuição é considerada estável se uma combinação linear de duas variáveis ​​aleatórias independentes com esta distribuição tem a mesma distribuição, até os parâmetros de localização e escala . Uma variável aleatória é considerada estável se sua distribuição for estável. A família de distribuição estável também é algumas vezes chamada de distribuição Lévy alfa-estável , em homenagem a Paul Lévy , o primeiro matemático a estudá-la.

Dos quatro parâmetros que definem a família, a maior atenção foi focada no parâmetro de estabilidade, α (consulte o painel). Distribuições estáveis ​​têm 0 < α ≤ 2 , com o limite superior correspondendo à distribuição normal e α = 1 à distribuição de Cauchy . As distribuições têm variância indefinida para α <2 e média indefinida para α ≤ 1 . A importância das distribuições de probabilidade estáveis ​​é que elas são " atratores " para somas devidamente normalizadas de variáveis ​​aleatórias independentes e distribuídas de forma idêntica ( iid ). A distribuição normal define uma família de distribuições estáveis. Pelo teorema do limite central clássico, a soma devidamente normalizada de um conjunto de variáveis ​​aleatórias, cada uma com variância finita, tenderá a uma distribuição normal à medida que o número de variáveis ​​aumenta. Sem a suposição de variância finita, o limite pode ser uma distribuição estável que não é normal. Mandelbrot se referiu a essas distribuições como "distribuições paretianas estáveis", em homenagem a Vilfredo Pareto . Em particular, ele se referiu àquelas distorcidas ao máximo na direção positiva com 1 < α <2 como "distribuições de Pareto-Lévy", que ele considerou como melhores descrições dos preços de ações e commodities do que as distribuições normais.

Definição

Uma distribuição não degenerada é uma distribuição estável se satisfizer a seguinte propriedade:

Deixe que X 1 e X 2 cópias ser independente de uma variável aleatória X . Então X é dito para ser estável se por quaisquer constantes de um > 0 e b > 0 a variável aleatória aX 1 + bX 2 tem a mesma distribuição que cX + d para algumas constantes c > 0 e d . A distribuição é considerada estritamente estável se for mantida com d = 0 .

Como a distribuição normal , a distribuição de Cauchy e a distribuição de Lévy possuem a propriedade acima, segue-se que são casos especiais de distribuições estáveis.

Essas distribuições formam uma família de quatro parâmetros de distribuições de probabilidade contínuas parametrizadas por parâmetros de localização e escala μ e c , respectivamente, e dois parâmetros de forma β e α , correspondendo aproximadamente a medidas de assimetria e concentração, respectivamente (ver as figuras).

A função característica φ ( t ) de qualquer distribuição de probabilidade é apenas a transformada de Fourier de sua função de densidade de probabilidade f ( x ). A função densidade é, portanto, a transformada de Fourier inversa da função característica.

Embora a função de densidade de probabilidade para uma distribuição geral estável não possa ser escrita analiticamente, a função característica geral pode ser expressa analiticamente. Uma variável aleatória X é chamada de estável se sua função característica pode ser escrita como

onde sgn ( t ) é apenas o sinal de t e

μR é um parâmetro de deslocamento, β ∈ [−1, 1], chamado de parâmetro de assimetria , é uma medida de assimetria. Note que neste contexto a assimetria usual não está bem definida, já que para α <2 a distribuição não admite segundos momentos ou maiores , e a definição usual de assimetria é o terceiro momento central .

A razão pela qual isso dá uma distribuição estável é que a função característica para a soma de duas variáveis ​​aleatórias independentes é igual ao produto das duas funções características correspondentes. Adicionar duas variáveis ​​aleatórias de uma distribuição estável dá algo com os mesmos valores de α e β , mas possivelmente valores diferentes de μ e c .

Nem toda função é a função característica de uma distribuição de probabilidade legítima (isto é, aquela cuja função de distribuição cumulativa é real e vai de 0 a 1 sem diminuir), mas as funções características dadas acima serão legítimas, desde que os parâmetros estejam em seus gamas. O valor da função característica em algum valor t é o conjugado complexo de seu valor em - t, como deveria ser para que a função de distribuição de probabilidade seja real.

No caso mais simples β = 0 , a função característica é apenas uma função exponencial esticada ; a distribuição é simétrica em relação a μ e é referida como uma distribuição alfa-estável simétrica (Lévy) , frequentemente abreviada como SαS .

Quando α <1 e β = 1, a distribuição é suportada por [ μ , ∞).

O parâmetro c > 0 é um fator de escala que é uma medida da largura da distribuição, enquanto α é o expoente ou índice da distribuição e especifica o comportamento assintótico da distribuição.

Parametrizações

A definição acima é apenas uma das parametrizações em uso para distribuições estáveis; é o mais comum, mas não é contínuo nos parâmetros em α = 1 .

Uma parametrização contínua é

Onde:

Os intervalos de α e β são os mesmos de antes, γ (como c ) deve ser positivo e δ (como μ ) deve ser real.

Em qualquer parametrização, pode-se fazer uma transformação linear da variável aleatória para obter uma variável aleatória cuja densidade é . Na primeira parametrização, isso é feito definindo a nova variável:

Para a segunda parametrização, simplesmente usamos

não importa o que é α . Na primeira parametrização, se a média existe (ou seja, α > 1 ) então ela é igual a μ , enquanto na segunda parametrização, quando a média existe, ela é igual a

A distribuição

Uma distribuição estável é, portanto, especificada pelos quatro parâmetros acima. Pode ser mostrado que qualquer distribuição estável não degenerada tem uma função de densidade suave (infinitamente diferenciável). Se denota a densidade de X e Y é a soma das cópias independentes de X :

então Y tem a densidade com

O comportamento assintótico é descrito, para α <2, por:

onde Γ é a função Gamma (exceto quando α ≥ 1 e β = ± 1, a cauda não desaparece para a esquerda ou direita, respectivamente, de μ , embora a expressão acima seja 0). Este comportamento de " cauda pesada " faz com que a variância das distribuições estáveis ​​seja infinita para todos α <2. Esta propriedade é ilustrada nos gráficos log – log abaixo.

Quando α = 2, a distribuição é Gaussiano (ver abaixo), com as caudas para assimptóticas exp (- x 2 /4 c 2 ) / (2 c √π).

Distribuição estável unilateral e distribuição estável de contagem

Quando α <1 e β = 1, a distribuição é suportada por [ μ , ∞). Esta família é chamada de distribuição estável unilateral . Sua distribuição padrão (μ = 0) é definida como

, onde .

Deixe , sua função característica é . Assim, a forma integral de seu PDF é (nota :)

A integral de seno duplo é mais eficaz para muito pequenos .

Considere a soma de Lévy onde , então Y tem a densidade onde . Definido , chegamos à distribuição de contagem estável . Sua distribuição padrão é definida como

, onde e .

A distribuição de contagem estável é o conjugado anterior à distribuição estável unilateral. Sua família de escala de localização é definida como

, Em que , e .

É também uma distribuição unilateral suportada por . O parâmetro de localização é o local de corte, enquanto define sua escala.

Quando , é a distribuição de Lévy, que é uma distribuição gama inversa. Assim, é uma distribuição gama deslocada de forma 3/2 e escala ,

, Onde , .

Sua média é e seu desvio padrão é . É hipotetizado que o VIX é distribuído como com e (consulte a seção 7 de). Assim, a distribuição de contagem estável é a distribuição marginal de primeira ordem de um processo de volatilidade. Nesse contexto, é denominado “piso de volatilidade”.

Outra abordagem para derivar a distribuição de contagem estável é usar a transformada de Laplace da distribuição estável unilateral, (Seção 2.4 de)

, onde .

Vamos , e pode-se decompor a integral no lado esquerdo como uma distribuição de produto de uma distribuição de Laplace padrão e uma distribuição de contagem estável padrão,

, onde .

Isso é chamado de "decomposição lambda" (consulte a Seção 4 de), uma vez que o lado direito foi nomeado como "distribuição lambda simétrica" ​​nos trabalhos anteriores de Lihn. No entanto, ele tem vários nomes mais populares, como " distribuição de potência exponencial " ou "erro generalizado / distribuição normal", frequentemente referido quando α > 1.

O enésimo momento de é o -ésimo momento de , Todos os momentos positivos são finitos. Isso de certa forma resolve o problema espinhoso dos momentos divergentes na distribuição estável.

Propriedades

Distribuições estáveis ​​são fechadas sob convolução para um valor fixo de α . Visto que a convolução é equivalente à multiplicação da função transformada de Fourier, segue-se que o produto de duas funções características estáveis ​​com o mesmo α produzirá outra função característica. O produto de duas funções características estáveis ​​é dado por:

Uma vez que Φ não é uma função das variáveis μ , c ou β, segue-se que esses parâmetros para a função convolvida são dados por:

Em cada caso, pode ser mostrado que os parâmetros resultantes estão dentro dos intervalos necessários para uma distribuição estável.

Um teorema do limite central generalizado

Outra propriedade importante das distribuições estáveis ​​é o papel que desempenham em um teorema do limite central generalizado . O teorema do limite central afirma que a soma de um número de variáveis ​​aleatórias independentes e identicamente distribuídas (iid) com variâncias finitas diferentes de zero tenderá a uma distribuição normal à medida que o número de variáveis ​​aumenta.

Uma generalização devida a Gnedenko e Kolmogorov afirma que a soma de um número de variáveis ​​aleatórias com distribuições simétricas tendo caudas de lei de potência ( caudas paretianas ), diminuindo conforme onde (e, portanto, tendo variância infinita), tenderá a uma distribuição estável como o número de summands cresce. Se, então, a soma converge para uma distribuição estável com parâmetro de estabilidade igual a 2, ou seja, uma distribuição Gaussiana.

Existem outras possibilidades também. Por exemplo, se a função característica da variável aleatória é assintótica para t pequeno (positivo ou negativo), então podemos perguntar como t varia com n quando o valor da função característica para a soma de n tais variáveis ​​aleatórias é igual a um dado valoriza você :

Assumindo por enquanto que t → 0, tomamos o limite do acima como n → ∞ :

Portanto:

Isso mostra que é assintótico ao usar a equação anterior que temos

Isso implica que a soma dividida por

tem uma função característica cujo valor em algum t ′ vai para u (conforme n aumenta) quando Em outras palavras, a função característica converge pontualmente para e, portanto, pelo teorema da continuidade de Lévy a soma dividida por

converge em distribuição para a distribuição alfa-estável simétrica com parâmetro de estabilidade e parâmetro de escala 1.

Isso pode ser aplicado a uma variável aleatória cujas caudas diminuem como . Essa variável aleatória tem uma média, mas a variância é infinita. Vamos fazer a seguinte distribuição:

Podemos escrever isso como

Onde

Queremos encontrar os termos principais da expansão assintótica da função característica. A função característica da distribuição de probabilidade é então a função característica para f ( x ) é

e podemos calcular:

onde e são constantes. Portanto,

e de acordo com o que foi dito acima (e o fato de que a variância de f ( x ; 2,0,1,0) é 2), a soma de n instâncias desta variável aleatória, dividida por convergirá na distribuição para um Gaussiano distribuição com variância 1. Mas a variância em qualquer n particular ainda será infinita. Observe que a largura da distribuição limite cresce mais rápido do que no caso em que a variável aleatória tem uma variância finita (nesse caso, a largura cresce como a raiz quadrada de n ). A média , obtida pela divisão da soma por n , tende a um gaussiano cuja largura se aproxima de zero à medida que n aumenta, de acordo com a Lei dos grandes números .

Casos especiais

Gráfico log-log de PDFs de distribuição estável centrada simétrica mostrando o comportamento da lei de potência para x grande . O comportamento da lei de potência é evidenciado pela aparência em linha reta da PDF para x grande , com a inclinação igual a - ( α + 1). (A única exceção é para α = 2, em preto, que é uma distribuição normal.)
Gráfico log-log de PDFs de distribuição estáveis ​​centralizados enviesados ​​mostrando o comportamento da lei de potência para x grande . Mais uma vez, a inclinação das porções lineares é igual a - ( α + 1)

Não há solução analítica geral para a forma de f ( x ). Existem, no entanto, três casos especiais que podem ser expressos em termos de funções elementares, como pode ser visto pela inspeção da função característica :

  • Para α = 2, a distribuição se reduz a uma distribuição gaussiana com variância σ 2 = 2 c 2 e média μ ; o parâmetro de assimetria β não tem efeito.
  • Para α = 1 e β = 0, a distribuição se reduz a uma distribuição de Cauchy com parâmetro de escala ce parâmetro de deslocamento µ .
  • Para α = 1/2 e β = 1, a distribuição se reduz a uma distribuição de Lévy com parâmetro de escala ce parâmetro de deslocamento µ .

Observe que as três distribuições acima também estão conectadas, da seguinte maneira: Uma variável aleatória padrão de Cauchy pode ser vista como uma mistura de variáveis ​​aleatórias Gaussianas (todas com média zero), com a variância sendo extraída de uma distribuição padrão de Lévy. E, de fato, este é um caso especial de um teorema mais geral (ver pág. 59 de) que permite que qualquer distribuição alfa-estável simétrica seja vista desta forma (com o parâmetro alfa da distribuição da mistura igual a duas vezes o parâmetro alfa de a distribuição de mistura - e o parâmetro beta da distribuição de mistura sempre igual a um).

Uma expressão de forma fechada geral para PDFs estáveis ​​com valores racionais de α está disponível em termos de funções G de Meijer . As funções Fox H também podem ser usadas para expressar as funções de densidade de probabilidade estáveis. Para números racionais simples, a expressão de forma fechada é freqüentemente em termos de funções especiais menos complicadas . Várias expressões de forma fechada com expressões bastante simples em termos de funções especiais estão disponíveis. Na tabela abaixo, os PDFs expressos por funções elementares são indicados por um E e aqueles que são expressos por funções especiais são indicados por um s .

α
1/3 1/2 2/3 1 4/3 3/2 2
β 0 s s s E s s E
1 s E s s s

Alguns dos casos especiais são conhecidos por nomes específicos:

  • Para α = 1 e β = 1, a distribuição é uma distribuição de Landau que tem um uso específico em física com este nome.
  • Para α = 3/2 e β = 0, a distribuição se reduz a uma distribuição de Holtsmark com parâmetro de escala ce parâmetro de deslocamento µ .

Além disso, no limite, à medida que c se aproxima de zero ou α se aproxima de zero, a distribuição se aproxima de uma função delta de Dirac δ ( x  -  μ ) .

Representação da série

A distribuição estável pode ser reafirmada como a parte real de uma integral mais simples:

Expressando a segunda exponencial como uma série de Taylor , temos:

onde . Inverter a ordem de integração e somatório e realizar a integração resulta em:

que será válido para xμ e convergirá para os valores apropriados dos parâmetros. (Observe que o termo n = 0 que produz uma função delta em x - µ foi, portanto, descartado.) Expressar a primeira exponencial como uma série produzirá outra série em potências positivas de x - µ que geralmente é menos útil.

Para distribuição estável unilateral, a expansão da série acima precisa ser modificada, uma vez que e . Não há nenhuma parte real a somar. Em vez disso, a integral da função característica deve ser realizada no eixo negativo, o que produz:

Simulação de variáveis ​​estáveis

Simular sequências de variáveis ​​aleatórias estáveis ​​não é simples, uma vez que não há expressões analíticas para o inverso nem para o próprio CDF . Todas as abordagens padrão, como a rejeição ou os métodos de inversão, exigiriam cálculos tediosos. Uma solução muito mais elegante e eficiente foi proposta por Chambers, Mallows and Stuck (CMS), que notou que uma determinada fórmula integral gerou o seguinte algoritmo:

  • gerar uma variável aleatória uniformemente distribuída e uma variável aleatória exponencial independente com média 1;
  • para computação:
  • para computação:
Onde

Este algoritmo produz uma variável aleatória . Para uma prova detalhada, consulte.

Dadas as fórmulas para a simulação de uma variável aleatória estável padrão, podemos facilmente simular uma variável aleatória estável para todos os valores admissíveis dos parâmetros , , e usando a seguinte propriedade. Se então

é . Para (e ) o método CMS se reduz à conhecida transformação de Box-Muller para a geração de variáveis ​​aleatórias Gaussianas . Muitas outras abordagens foram propostas na literatura, incluindo a aplicação das expansões das séries de Bergström e LePage, ver e, respectivamente. No entanto, o método CMS é considerado o mais rápido e preciso.

Formulários

As distribuições estáveis ​​devem sua importância, tanto na teoria quanto na prática, à generalização do teorema do limite central para variáveis ​​aleatórias sem momentos de segunda (e possivelmente primeira) ordem e a auto-similaridade que a acompanha da família estável. Foi o aparente afastamento da normalidade, juntamente com a demanda por um modelo auto-semelhante para dados financeiros (ou seja, a forma da distribuição para as variações anuais dos preços dos ativos deve se assemelhar às variações dos preços diários ou mensais constituintes) que levou Benoît Mandelbrot a propor que os preços do algodão seguem uma distribuição alfa-estável com α igual a 1,7. As distribuições de Lévy são freqüentemente encontradas na análise de comportamento crítico e dados financeiros.

Eles também são encontrados na espectroscopia como uma expressão geral para uma linha espectral ampliada de pressão quase-estaticamente .

A distribuição de Lévy de eventos de tempo de espera de erupções solares (tempo entre eventos de erupções ) foi demonstrada para erupções solares de raios-X rígidos CGRO BATSE em dezembro de 2001. A análise da assinatura estatística de Lévy revelou que duas assinaturas de memória diferentes eram evidentes; um relacionado ao ciclo solar e o segundo cuja origem parece estar associada a uma localização ou combinação de efeitos localizados da região ativa solar.

Outros casos analíticos

Vários casos de distribuições estáveis ​​expressáveis ​​analiticamente são conhecidos. Deixe a distribuição estável ser expressa até então sabermos:

  • Deixe e denote os Integrais de Fresnel então:
sendo a última a distribuição Holtsmark .

Veja também

Notas

  • O programa STABLE para Windows está disponível na página da Web estável de John Nolan: http://www.robustanalysis.com/public/stable.html . Ele calcula a densidade (pdf), função de distribuição cumulativa (cdf) e quantis para uma distribuição geral estável e realiza estimativa de máxima verossimilhança de parâmetros estáveis ​​e algumas técnicas de análise exploratória de dados para avaliar o ajuste de um conjunto de dados.
  • libstable é uma implementação C para a distribuição Stable pdf, cdf, número aleatório, quantil e funções de ajuste (junto com um pacote de replicação de benchmark e um pacote R).
  • Pacote R 'stabledist' por Diethelm Wuertz, Martin Maechler e membros da equipe principal da Rmetrics. Calcula densidade, probabilidade, quantis e números aleatórios estáveis. Atualizado em 12 de setembro de 2016.

Referências