Distribuição Cauchy - Cauchy distribution

Cauchy
Função densidade de probabilidade
Função de densidade de probabilidade para a distribuição de Cauchy
A curva roxa é a distribuição padrão de Cauchy
Função de distribuição cumulativa
Função de distribuição cumulativa para a distribuição de Cauchy
Parâmetros escala de localização ( real ) (real)
Apoio, suporte
PDF
CDF
Quantil
Quer dizer Indefinido
Mediana
Modo
Variância Indefinido
Skewness Indefinido
Ex. curtose Indefinido
Entropia
MGF não existe
CF
Informação de Fisher

A distribuição de Cauchy , em homenagem a Augustin Cauchy , é uma distribuição de probabilidade contínua . Também é conhecida, especialmente entre os físicos , como distribuição de Lorentz (após Hendrik Lorentz ), distribuição de Cauchy-Lorentz , função de Lorentz (ian) ou distribuição de Breit-Wigner . A distribuição de Cauchy é a distribuição do intercepto x de um raio emitido com um ângulo uniformemente distribuído. É também a distribuição da razão de duas variáveis ​​aleatórias independentes normalmente distribuídas com média zero.

A distribuição de Cauchy é freqüentemente usada em estatísticas como o exemplo canônico de uma distribuição " patológica ", uma vez que tanto seu valor esperado quanto sua variância são indefinidos (mas veja § Explicação de momentos indefinidos abaixo). A distribuição de Cauchy não tem momentos finitos de ordem maiores ou iguais a um; apenas momentos absolutos fracionários existem. A distribuição de Cauchy não tem função geradora de momento .

Em matemática , está intimamente relacionado ao kernel de Poisson , que é a solução fundamental para a equação de Laplace no semiplano superior .

É uma das poucas distribuições que é estável e tem uma função de densidade de probabilidade que pode ser expressa analiticamente, sendo as outras a distribuição normal e a distribuição de Lévy .

História

Estimar a média e o desvio padrão por meio de amostras de uma distribuição de Cauchy (parte inferior) não converge com mais amostras, como na distribuição normal (parte superior). Pode haver saltos arbitrariamente grandes nas estimativas, conforme visto nos gráficos na parte inferior. (Clique para expandir)

Funções com a forma da função densidade da distribuição de Cauchy foram estudadas por matemáticos no século 17, mas em um contexto diferente e sob o título de bruxa de Agnesi . Apesar do nome, a primeira análise explícita das propriedades da distribuição de Cauchy foi publicada pelo matemático francês Poisson em 1824, com Cauchy apenas sendo associado a ela durante uma controvérsia acadêmica em 1853. Como tal, o nome da distribuição é um caso da Lei de Eponymy de Stigler . Poisson notou que se a média das observações seguindo tal distribuição fosse tomada, o erro médio não convergiu para nenhum número finito. Como tal, o uso de Laplace do teorema do limite central com tal distribuição era inapropriado, pois pressupunha uma média e variância finitas. Apesar disso, Poisson não considerou a questão importante, ao contrário de Bienaymé , que envolveria Cauchy em uma longa disputa sobre o assunto.

Caracterização

Função densidade de probabilidade

A distribuição de Cauchy tem a função de densidade de probabilidade (PDF)

onde é o parâmetro de localização , especificando a localização do pico da distribuição, e é o parâmetro de escala que especifica a meia largura na metade do máximo (HWHM), alternativamente é a largura total na metade do máximo (FWHM). também é igual à metade do intervalo interquartil e às vezes é chamado de erro provável . Augustin-Louis Cauchy explorou essa função de densidade em 1827 com um parâmetro de escala infinitesimal , definindo o que agora seria chamado de função delta de Dirac .

O valor máximo ou amplitude do PDF Cauchy é , localizado em .

Às vezes, é conveniente expressar o PDF em termos do parâmetro complexo

O caso especial quando e é chamado de distribuição de Cauchy padrão com a função de densidade de probabilidade

Na física, uma função Lorentziana de três parâmetros é frequentemente usada:

onde está a altura do pico. A função Lorentziana de três parâmetros indicada não é, em geral, uma função de densidade de probabilidade, uma vez que não se integra a 1, exceto no caso especial em que

Função de distribuição cumulativa

A função de distribuição cumulativa da distribuição de Cauchy é:

e a função quantil ( cdf inverso ) da distribuição de Cauchy é

Segue-se que o primeiro e o terceiro quartis são e, portanto, o intervalo interquartil é .

Para a distribuição padrão, a função de distribuição cumulativa simplifica a função arco tangente :

Entropia

A entropia da distribuição de Cauchy é dada por:

A derivada da função de quantil , a função de densidade de quantil, para a distribuição de Cauchy é:

A entropia diferencial de uma distribuição pode ser definida em termos de sua densidade de quantil, especificamente:

A distribuição de Cauchy é a distribuição de probabilidade máxima de entropia para uma variável aleatória para a qual

ou, alternativamente, para uma variável aleatória para a qual

Em sua forma padrão, é a distribuição de probabilidade máxima de entropia para uma variável aleatória para a qual

Divergência de Kullback-Leibler

A divergência de Kullback-Leibler entre duas distribuições de Cauchy tem a seguinte fórmula simétrica de forma fechada:

Qualquer divergência f entre duas distribuições de Cauchy é simétrica e pode ser expressa como uma função da divergência qui-quadrada. Expressões de forma fechada para a variação total , divergência de Jensen – Shannon , distância de Hellinger , etc. estão disponíveis.

Propriedades

A distribuição de Cauchy é um exemplo de distribuição que não possui média , variância ou momentos superiores definidos. Seu modo e mediana são bem definidos e são iguais a .

Quando e são duas variáveis ​​aleatórias normalmente distribuídas independentes com valor esperado 0 e variância 1, então a razão tem a distribuição de Cauchy padrão.

Se for uma matriz de covariância semidefinida positiva com entradas diagonais estritamente positivas, então para independente e identicamente distribuída e qualquer vetor aleatório independente de e tal que e (definindo uma distribuição categórica ) ela mantém que

Se forem variáveis ​​aleatórias independentes e distribuídas de forma idêntica , cada uma com uma distribuição de Cauchy padrão, a média da amostra terá a mesma distribuição de Cauchy padrão. Para ver se isso é verdade, calcule a função característica da média da amostra:

onde está a média da amostra. Este exemplo serve para mostrar que a condição de variância finita no teorema do limite central não pode ser descartada. É também um exemplo de uma versão mais generalizada do teorema do limite central que é característico de todas as distribuições estáveis , da qual a distribuição de Cauchy é um caso especial.

A distribuição de Cauchy é uma distribuição de probabilidade infinitamente divisível . É também uma distribuição estritamente estável .

Os coincide distribuição Cauchy padrão com o Student t -Distribuição com um grau de liberdade.

Como todas as distribuições estáveis, a família de escala de localização à qual a distribuição de Cauchy pertence é fechada sob transformações lineares com coeficientes reais . Além disso, a distribuição de Cauchy é fechada sob transformações fracionárias lineares com coeficientes reais. A esse respeito, consulte também a parametrização de McCullagh das distribuições de Cauchy .

Função característica

Vamos denotar uma variável aleatória distribuída de Cauchy. A função característica da distribuição de Cauchy é dada por

que é apenas a transformada de Fourier da densidade de probabilidade. A densidade de probabilidade original pode ser expressa em termos da função característica, essencialmente usando a transformada inversa de Fourier:

O n th momento de uma distribuição é o n th derivada da função característica avaliada em . Observe que a função característica não é diferenciável na origem: isso corresponde ao fato de que a distribuição de Cauchy não tem momentos bem definidos superiores ao momento zero.

Explicação de momentos indefinidos

Quer dizer

Se uma distribuição de probabilidade tem uma função de densidade , então a média, se existir, é dada por

Podemos avaliar essa integral imprópria bilateral calculando a soma de duas integrais impróprias unilaterais. Isso é,

para um número real arbitrário .

Para que a integral exista (mesmo como um valor infinito), pelo menos um dos termos nesta soma deve ser finito, ou ambos devem ser infinitos e ter o mesmo sinal. Mas no caso da distribuição de Cauchy, ambos os termos nesta soma (2) são infinitos e têm sinal oposto. Logo, (1) é indefinido e, portanto, a média também.

Observe que o valor principal de Cauchy da média da distribuição de Cauchy é

que é zero. Por outro lado, a integral relacionada

não é zero, como pode ser visto facilmente calculando a integral. Isso mostra novamente que a média (1) não pode existir.

Vários resultados na teoria da probabilidade sobre os valores esperados , como a lei forte dos grandes números , não são válidos para a distribuição de Cauchy.

Momentos menores

Os momentos absolutos para são definidos. Para nós temos

Momentos superiores

A distribuição de Cauchy não possui momentos finitos de nenhuma ordem. Alguns dos momentos brutos mais elevados existem e têm um valor infinito, por exemplo, o segundo momento bruto:

Reorganizando a fórmula, pode-se ver que o segundo momento é essencialmente a integral infinita de uma constante (aqui 1). Momentos brutos mais potentes também serão avaliados até o infinito. Momentos brutos de força ímpar, no entanto, são indefinidos, o que é distintamente diferente de existir com o valor do infinito. Os momentos brutos de potência ímpar são indefinidos porque seus valores são essencialmente equivalentes a, visto que as duas metades da integral divergem e têm sinais opostos. O primeiro momento bruto é o meio, que, sendo estranho, não existe. (Veja também a discussão acima sobre isso.) Isso, por sua vez, significa que todos os momentos centrais e momentos padronizados são indefinidos, uma vez que são todos baseados na média. A variância - que é o segundo momento central - é igualmente inexistente (apesar do fato de que o segundo momento bruto existe com o valor infinito).

Os resultados para os momentos mais altos seguem da desigualdade de Hölder , o que implica que os momentos mais altos (ou metades dos momentos) divergem se os mais baixos o fazem.

Momentos de distribuições truncadas

Considere a distribuição truncada definida pela restrição da distribuição de Cauchy padrão ao intervalo [−10 100 , 10 100 ] . Essa distribuição truncada tem todos os momentos (e o teorema do limite central se aplica a observações iid a partir dele); ainda assim, para quase todos os fins práticos, ele se comporta como uma distribuição de Cauchy.

Estimativa de parâmetros

Como os parâmetros da distribuição de Cauchy não correspondem a uma média e variância, tentar estimar os parâmetros da distribuição de Cauchy usando uma média de amostra e uma variância de amostra não terá sucesso. Por exemplo, se uma amostra iid de tamanho n for retirada de uma distribuição de Cauchy, pode-se calcular a média da amostra como:

Embora os valores da amostra se concentrem em torno do valor central , a média da amostra se tornará cada vez mais variável à medida que mais observações são feitas, devido ao aumento da probabilidade de encontrar pontos da amostra com um grande valor absoluto. Na verdade, a distribuição da média da amostra será igual à distribuição das próprias observações; ou seja, a média da amostra de uma grande amostra não é melhor (ou pior) um estimador de do que qualquer única observação da amostra. Da mesma forma, o cálculo da variância da amostra resultará em valores que aumentam à medida que mais observações são feitas.

Portanto, meios mais robustos de estimar o valor central e o parâmetro de escala são necessários. Um método simples é tomar o valor mediano da amostra como um estimador de e metade do intervalo interquartil da amostra como um estimador de . Outros métodos mais precisos e robustos foram desenvolvidos. Por exemplo, a média truncada dos 24% intermediários das estatísticas de pedido de amostra produz uma estimativa para isso é mais eficiente do que usar a mediana da amostra ou a média da amostra completa. No entanto, por causa das caudas grossas da distribuição de Cauchy, a eficiência do estimador diminui se mais de 24% da amostra for usada.

A probabilidade máxima também pode ser usada para estimar os parâmetros e . No entanto, isso tende a ser complicado pelo fato de que requer encontrar as raízes de um polinômio de alto grau, e pode haver várias raízes que representam máximos locais. Além disso, embora o estimador de máxima verossimilhança seja assintoticamente eficiente, é relativamente ineficiente para pequenas amostras. A função log-verossimilhança para a distribuição de Cauchy para o tamanho da amostra é:

Maximizar a função de probabilidade logarítmica em relação a e tomando a primeira derivada produz o seguinte sistema de equações:

Observe que

é uma função monótona e que a solução deve satisfazer

Resolver apenas para requer a resolução de um polinômio de grau , e resolver apenas para requer a resolução de um polinômio de grau . Portanto, seja resolvendo para um parâmetro ou para ambos os parâmetros simultaneamente, uma solução numérica em um computador é normalmente necessária. O benefício da estimativa de máxima verossimilhança é a eficiência assintótica; estimar usando a mediana da amostra é apenas cerca de 81% tão assintoticamente eficiente quanto estimar por máxima verossimilhança. A média da amostra truncada usando as estatísticas de ordem intermediária de 24% é cerca de 88% tão assintoticamente eficiente quanto um estimador de como a estimativa de máxima verossimilhança. Quando o método de Newton é usado para encontrar a solução para a estimativa de máxima verossimilhança, as estatísticas do pedido intermediário de 24% podem ser usadas como uma solução inicial para .

A forma pode ser estimada usando a mediana dos valores absolutos, já que para as variáveis ​​de Cauchy do local 0 , o parâmetro de forma.

Distribuição multivariada de Cauchy

Diz-se que um vetor aleatório tem a distribuição multivariada de Cauchy se toda combinação linear de seus componentes tiver uma distribuição de Cauchy. Ou seja, para qualquer vetor constante , a variável aleatória deve ter uma distribuição de Cauchy univariada. A função característica de uma distribuição multivariada de Cauchy é dada por:

onde e são funções reais com uma função homogênea de um grau e uma função homogênea positiva de um grau. Mais formalmente:

para todos .

Um exemplo de distribuição bivariada de Cauchy pode ser dado por:

Observe que, neste exemplo, embora não haja um análogo a uma matriz de covariância, e não sejam estatisticamente independentes .

Também podemos escrever esta fórmula para variáveis ​​complexas. Então, a função de densidade de probabilidade do cauchy complexo é:

Analogamente à densidade univariada, a densidade de Cauchy multidimensional também se relaciona com a distribuição multivariada de Student . Eles são equivalentes quando o parâmetro de graus de liberdade é igual a um. A densidade de uma distribuição de dimensão de Student com um grau de liberdade torna-se:

As propriedades e os detalhes dessa densidade podem ser obtidos tomando-a como um caso particular da densidade multivariada de Student.

Propriedades de transformação

  • Se então
  • Se e for independente, então e
  • Se então
  • Parametrização de McCullagh das distribuições de Cauchy : Expressando uma distribuição de Cauchy em termos de um parâmetro complexo , defina para média . Se então:

onde , , e são números reais.

  • Usando a mesma convenção acima, se :
onde está a distribuição circular de Cauchy .

Medida Lévy

A distribuição de Cauchy é a distribuição estável do índice 1. A representação Lévy-Khintchine de tal distribuição estável do parâmetro é dada, por:

Onde

e pode ser expresso explicitamente. No caso da distribuição de Cauchy, um tem .

Esta última representação é uma consequência da fórmula

Distribuições relacionadas

  • Distribuição t de aluno
  • distribuição t de Student não padronizada
  • Se independente, então
  • Se então
  • Se então
  • Se então
  • A distribuição de Cauchy é um caso limite de uma distribuição de Pearson do tipo 4
  • A distribuição de Cauchy é um caso especial de uma distribuição Pearson do tipo 7.
  • A distribuição de Cauchy é uma distribuição estável : se , então .
  • A distribuição de Cauchy é um limite singular de uma distribuição hiperbólica
  • A distribuição de Cauchy envolvida , assumindo valores em um círculo, é derivada da distribuição de Cauchy envolvendo-a ao redor do círculo.
  • Se , e, em seguida . Para distribuições meio-Cauchy, a relação é mantida por configuração .

Distribuição Relativística Breit-Wigner

Na física nuclear e de partículas , o perfil de energia de uma ressonância é descrito pela distribuição relativística de Breit-Wigner , enquanto a distribuição de Cauchy é a distribuição (não relativística) de Breit-Wigner.

Ocorrência e aplicações

  • Na espectroscopia , a distribuição de Cauchy descreve a forma das linhas espectrais que estão sujeitas a um alargamento homogêneo em que todos os átomos interagem da mesma maneira com a faixa de frequência contida na forma da linha. Muitos mecanismos causam um alargamento homogêneo, principalmente o alargamento por colisão . O alargamento ao longo da vida ou natural também dá origem a uma forma de linha descrita pela distribuição de Cauchy.
  • Aplicações da distribuição de Cauchy ou sua transformação podem ser encontradas em campos que trabalham com crescimento exponencial. Um artigo de 1958 de White derivou a estatística de teste para estimadores de para a equação e onde o estimador de máxima verossimilhança é encontrado usando mínimos quadrados ordinários mostrou que a distribuição amostral da estatística é a distribuição de Cauchy.
Distribuição de Cauchy cumulativa ajustada para chuvas máximas de um dia usando CumFreq , consulte também ajuste de distribuição
  • A distribuição de Cauchy é freqüentemente a distribuição de observações para objetos que estão girando. A referência clássica para isso é chamada de problema do farol de Gull e, como na seção anterior, de distribuição Breit-Wigner na física de partículas.
  • Em hidrologia, a distribuição de Cauchy é aplicada a eventos extremos, como chuvas máximas anuais de um dia e vazões de rios. A imagem azul ilustra um exemplo de ajuste da distribuição de Cauchy às chuvas mensais máximas de um dia, mostrando também o cinturão de confiança de 90% com base na distribuição binomial . Os dados de precipitação são representados por posições de plotagem como parte da análise de frequência cumulativa .
  • A expressão para a parte imaginária da permissividade elétrica complexa de acordo com o modelo de Lorentz é uma distribuição de Cauchy.
  • Como uma distribuição adicional para modelar caudas gordas em finanças computacionais , as distribuições de Cauchy podem ser usadas para modelar VAR ( valor em risco ), produzindo uma probabilidade muito maior de risco extremo do que a distribuição gaussiana .

Veja também

Referências

links externos