Distribuição Cauchy - Cauchy distribution
Função densidade de probabilidade
A curva roxa é a distribuição padrão de Cauchy | |||
Função de distribuição cumulativa
| |||
Parâmetros |
escala de localização ( real ) (real) |
||
---|---|---|---|
Apoio, suporte | |||
CDF | |||
Quantil | |||
Quer dizer | Indefinido | ||
Mediana | |||
Modo | |||
Variância | Indefinido | ||
Skewness | Indefinido | ||
Ex. curtose | Indefinido | ||
Entropia | |||
MGF | não existe | ||
CF | |||
Informação de Fisher |
A distribuição de Cauchy , em homenagem a Augustin Cauchy , é uma distribuição de probabilidade contínua . Também é conhecida, especialmente entre os físicos , como distribuição de Lorentz (após Hendrik Lorentz ), distribuição de Cauchy-Lorentz , função de Lorentz (ian) ou distribuição de Breit-Wigner . A distribuição de Cauchy é a distribuição do intercepto x de um raio emitido com um ângulo uniformemente distribuído. É também a distribuição da razão de duas variáveis aleatórias independentes normalmente distribuídas com média zero.
A distribuição de Cauchy é freqüentemente usada em estatísticas como o exemplo canônico de uma distribuição " patológica ", uma vez que tanto seu valor esperado quanto sua variância são indefinidos (mas veja § Explicação de momentos indefinidos abaixo). A distribuição de Cauchy não tem momentos finitos de ordem maiores ou iguais a um; apenas momentos absolutos fracionários existem. A distribuição de Cauchy não tem função geradora de momento .
Em matemática , está intimamente relacionado ao kernel de Poisson , que é a solução fundamental para a equação de Laplace no semiplano superior .
É uma das poucas distribuições que é estável e tem uma função de densidade de probabilidade que pode ser expressa analiticamente, sendo as outras a distribuição normal e a distribuição de Lévy .
História
Funções com a forma da função densidade da distribuição de Cauchy foram estudadas por matemáticos no século 17, mas em um contexto diferente e sob o título de bruxa de Agnesi . Apesar do nome, a primeira análise explícita das propriedades da distribuição de Cauchy foi publicada pelo matemático francês Poisson em 1824, com Cauchy apenas sendo associado a ela durante uma controvérsia acadêmica em 1853. Como tal, o nome da distribuição é um caso da Lei de Eponymy de Stigler . Poisson notou que se a média das observações seguindo tal distribuição fosse tomada, o erro médio não convergiu para nenhum número finito. Como tal, o uso de Laplace do teorema do limite central com tal distribuição era inapropriado, pois pressupunha uma média e variância finitas. Apesar disso, Poisson não considerou a questão importante, ao contrário de Bienaymé , que envolveria Cauchy em uma longa disputa sobre o assunto.
Caracterização
Função densidade de probabilidade
A distribuição de Cauchy tem a função de densidade de probabilidade (PDF)
onde é o parâmetro de localização , especificando a localização do pico da distribuição, e é o parâmetro de escala que especifica a meia largura na metade do máximo (HWHM), alternativamente é a largura total na metade do máximo (FWHM). também é igual à metade do intervalo interquartil e às vezes é chamado de erro provável . Augustin-Louis Cauchy explorou essa função de densidade em 1827 com um parâmetro de escala infinitesimal , definindo o que agora seria chamado de função delta de Dirac .
O valor máximo ou amplitude do PDF Cauchy é , localizado em .
Às vezes, é conveniente expressar o PDF em termos do parâmetro complexo
O caso especial quando e é chamado de distribuição de Cauchy padrão com a função de densidade de probabilidade
Na física, uma função Lorentziana de três parâmetros é frequentemente usada:
onde está a altura do pico. A função Lorentziana de três parâmetros indicada não é, em geral, uma função de densidade de probabilidade, uma vez que não se integra a 1, exceto no caso especial em que
Função de distribuição cumulativa
A função de distribuição cumulativa da distribuição de Cauchy é:
e a função quantil ( cdf inverso ) da distribuição de Cauchy é
Segue-se que o primeiro e o terceiro quartis são e, portanto, o intervalo interquartil é .
Para a distribuição padrão, a função de distribuição cumulativa simplifica a função arco tangente :
Entropia
A entropia da distribuição de Cauchy é dada por:
A derivada da função de quantil , a função de densidade de quantil, para a distribuição de Cauchy é:
A entropia diferencial de uma distribuição pode ser definida em termos de sua densidade de quantil, especificamente:
A distribuição de Cauchy é a distribuição de probabilidade máxima de entropia para uma variável aleatória para a qual
ou, alternativamente, para uma variável aleatória para a qual
Em sua forma padrão, é a distribuição de probabilidade máxima de entropia para uma variável aleatória para a qual
Divergência de Kullback-Leibler
A divergência de Kullback-Leibler entre duas distribuições de Cauchy tem a seguinte fórmula simétrica de forma fechada:
Qualquer divergência f entre duas distribuições de Cauchy é simétrica e pode ser expressa como uma função da divergência qui-quadrada. Expressões de forma fechada para a variação total , divergência de Jensen – Shannon , distância de Hellinger , etc. estão disponíveis.
Propriedades
A distribuição de Cauchy é um exemplo de distribuição que não possui média , variância ou momentos superiores definidos. Seu modo e mediana são bem definidos e são iguais a .
Quando e são duas variáveis aleatórias normalmente distribuídas independentes com valor esperado 0 e variância 1, então a razão tem a distribuição de Cauchy padrão.
Se for uma matriz de covariância semidefinida positiva com entradas diagonais estritamente positivas, então para independente e identicamente distribuída e qualquer vetor aleatório independente de e tal que e (definindo uma distribuição categórica ) ela mantém que
Se forem variáveis aleatórias independentes e distribuídas de forma idêntica , cada uma com uma distribuição de Cauchy padrão, a média da amostra terá a mesma distribuição de Cauchy padrão. Para ver se isso é verdade, calcule a função característica da média da amostra:
onde está a média da amostra. Este exemplo serve para mostrar que a condição de variância finita no teorema do limite central não pode ser descartada. É também um exemplo de uma versão mais generalizada do teorema do limite central que é característico de todas as distribuições estáveis , da qual a distribuição de Cauchy é um caso especial.
A distribuição de Cauchy é uma distribuição de probabilidade infinitamente divisível . É também uma distribuição estritamente estável .
Os coincide distribuição Cauchy padrão com o Student t -Distribuição com um grau de liberdade.
Como todas as distribuições estáveis, a família de escala de localização à qual a distribuição de Cauchy pertence é fechada sob transformações lineares com coeficientes reais . Além disso, a distribuição de Cauchy é fechada sob transformações fracionárias lineares com coeficientes reais. A esse respeito, consulte também a parametrização de McCullagh das distribuições de Cauchy .
Função característica
Vamos denotar uma variável aleatória distribuída de Cauchy. A função característica da distribuição de Cauchy é dada por
que é apenas a transformada de Fourier da densidade de probabilidade. A densidade de probabilidade original pode ser expressa em termos da função característica, essencialmente usando a transformada inversa de Fourier:
O n th momento de uma distribuição é o n th derivada da função característica avaliada em . Observe que a função característica não é diferenciável na origem: isso corresponde ao fato de que a distribuição de Cauchy não tem momentos bem definidos superiores ao momento zero.
Explicação de momentos indefinidos
Quer dizer
Se uma distribuição de probabilidade tem uma função de densidade , então a média, se existir, é dada por
Podemos avaliar essa integral imprópria bilateral calculando a soma de duas integrais impróprias unilaterais. Isso é,
para um número real arbitrário .
Para que a integral exista (mesmo como um valor infinito), pelo menos um dos termos nesta soma deve ser finito, ou ambos devem ser infinitos e ter o mesmo sinal. Mas no caso da distribuição de Cauchy, ambos os termos nesta soma (2) são infinitos e têm sinal oposto. Logo, (1) é indefinido e, portanto, a média também.
Observe que o valor principal de Cauchy da média da distribuição de Cauchy é
que é zero. Por outro lado, a integral relacionada
não é zero, como pode ser visto facilmente calculando a integral. Isso mostra novamente que a média (1) não pode existir.
Vários resultados na teoria da probabilidade sobre os valores esperados , como a lei forte dos grandes números , não são válidos para a distribuição de Cauchy.
Momentos menores
Os momentos absolutos para são definidos. Para nós temos
Momentos superiores
A distribuição de Cauchy não possui momentos finitos de nenhuma ordem. Alguns dos momentos brutos mais elevados existem e têm um valor infinito, por exemplo, o segundo momento bruto:
Reorganizando a fórmula, pode-se ver que o segundo momento é essencialmente a integral infinita de uma constante (aqui 1). Momentos brutos mais potentes também serão avaliados até o infinito. Momentos brutos de força ímpar, no entanto, são indefinidos, o que é distintamente diferente de existir com o valor do infinito. Os momentos brutos de potência ímpar são indefinidos porque seus valores são essencialmente equivalentes a, visto que as duas metades da integral divergem e têm sinais opostos. O primeiro momento bruto é o meio, que, sendo estranho, não existe. (Veja também a discussão acima sobre isso.) Isso, por sua vez, significa que todos os momentos centrais e momentos padronizados são indefinidos, uma vez que são todos baseados na média. A variância - que é o segundo momento central - é igualmente inexistente (apesar do fato de que o segundo momento bruto existe com o valor infinito).
Os resultados para os momentos mais altos seguem da desigualdade de Hölder , o que implica que os momentos mais altos (ou metades dos momentos) divergem se os mais baixos o fazem.
Momentos de distribuições truncadas
Considere a distribuição truncada definida pela restrição da distribuição de Cauchy padrão ao intervalo [−10 100 , 10 100 ] . Essa distribuição truncada tem todos os momentos (e o teorema do limite central se aplica a observações iid a partir dele); ainda assim, para quase todos os fins práticos, ele se comporta como uma distribuição de Cauchy.
Estimativa de parâmetros
Como os parâmetros da distribuição de Cauchy não correspondem a uma média e variância, tentar estimar os parâmetros da distribuição de Cauchy usando uma média de amostra e uma variância de amostra não terá sucesso. Por exemplo, se uma amostra iid de tamanho n for retirada de uma distribuição de Cauchy, pode-se calcular a média da amostra como:
Embora os valores da amostra se concentrem em torno do valor central , a média da amostra se tornará cada vez mais variável à medida que mais observações são feitas, devido ao aumento da probabilidade de encontrar pontos da amostra com um grande valor absoluto. Na verdade, a distribuição da média da amostra será igual à distribuição das próprias observações; ou seja, a média da amostra de uma grande amostra não é melhor (ou pior) um estimador de do que qualquer única observação da amostra. Da mesma forma, o cálculo da variância da amostra resultará em valores que aumentam à medida que mais observações são feitas.
Portanto, meios mais robustos de estimar o valor central e o parâmetro de escala são necessários. Um método simples é tomar o valor mediano da amostra como um estimador de e metade do intervalo interquartil da amostra como um estimador de . Outros métodos mais precisos e robustos foram desenvolvidos. Por exemplo, a média truncada dos 24% intermediários das estatísticas de pedido de amostra produz uma estimativa para isso é mais eficiente do que usar a mediana da amostra ou a média da amostra completa. No entanto, por causa das caudas grossas da distribuição de Cauchy, a eficiência do estimador diminui se mais de 24% da amostra for usada.
A probabilidade máxima também pode ser usada para estimar os parâmetros e . No entanto, isso tende a ser complicado pelo fato de que requer encontrar as raízes de um polinômio de alto grau, e pode haver várias raízes que representam máximos locais. Além disso, embora o estimador de máxima verossimilhança seja assintoticamente eficiente, é relativamente ineficiente para pequenas amostras. A função log-verossimilhança para a distribuição de Cauchy para o tamanho da amostra é:
Maximizar a função de probabilidade logarítmica em relação a e tomando a primeira derivada produz o seguinte sistema de equações:
Observe que
é uma função monótona e que a solução deve satisfazer
Resolver apenas para requer a resolução de um polinômio de grau , e resolver apenas para requer a resolução de um polinômio de grau . Portanto, seja resolvendo para um parâmetro ou para ambos os parâmetros simultaneamente, uma solução numérica em um computador é normalmente necessária. O benefício da estimativa de máxima verossimilhança é a eficiência assintótica; estimar usando a mediana da amostra é apenas cerca de 81% tão assintoticamente eficiente quanto estimar por máxima verossimilhança. A média da amostra truncada usando as estatísticas de ordem intermediária de 24% é cerca de 88% tão assintoticamente eficiente quanto um estimador de como a estimativa de máxima verossimilhança. Quando o método de Newton é usado para encontrar a solução para a estimativa de máxima verossimilhança, as estatísticas do pedido intermediário de 24% podem ser usadas como uma solução inicial para .
A forma pode ser estimada usando a mediana dos valores absolutos, já que para as variáveis de Cauchy do local 0 , o parâmetro de forma.
Distribuição multivariada de Cauchy
Diz-se que um vetor aleatório tem a distribuição multivariada de Cauchy se toda combinação linear de seus componentes tiver uma distribuição de Cauchy. Ou seja, para qualquer vetor constante , a variável aleatória deve ter uma distribuição de Cauchy univariada. A função característica de uma distribuição multivariada de Cauchy é dada por:
onde e são funções reais com uma função homogênea de um grau e uma função homogênea positiva de um grau. Mais formalmente:
para todos .
Um exemplo de distribuição bivariada de Cauchy pode ser dado por:
Observe que, neste exemplo, embora não haja um análogo a uma matriz de covariância, e não sejam estatisticamente independentes .
Também podemos escrever esta fórmula para variáveis complexas. Então, a função de densidade de probabilidade do cauchy complexo é:
Analogamente à densidade univariada, a densidade de Cauchy multidimensional também se relaciona com a distribuição multivariada de Student . Eles são equivalentes quando o parâmetro de graus de liberdade é igual a um. A densidade de uma distribuição de dimensão de Student com um grau de liberdade torna-se:
As propriedades e os detalhes dessa densidade podem ser obtidos tomando-a como um caso particular da densidade multivariada de Student.
Propriedades de transformação
- Se então
- Se e for independente, então e
- Se então
- Parametrização de McCullagh das distribuições de Cauchy : Expressando uma distribuição de Cauchy em termos de um parâmetro complexo , defina para média . Se então:
onde , , e são números reais.
- Usando a mesma convenção acima, se :
- onde está a distribuição circular de Cauchy .
Medida Lévy
A distribuição de Cauchy é a distribuição estável do índice 1. A representação Lévy-Khintchine de tal distribuição estável do parâmetro é dada, por:
Onde
e pode ser expresso explicitamente. No caso da distribuição de Cauchy, um tem .
Esta última representação é uma consequência da fórmula
Distribuições relacionadas
- Distribuição t de aluno
- distribuição t de Student não padronizada
- Se independente, então
- Se então
- Se então
- Se então
- A distribuição de Cauchy é um caso limite de uma distribuição de Pearson do tipo 4
- A distribuição de Cauchy é um caso especial de uma distribuição Pearson do tipo 7.
- A distribuição de Cauchy é uma distribuição estável : se , então .
- A distribuição de Cauchy é um limite singular de uma distribuição hiperbólica
- A distribuição de Cauchy envolvida , assumindo valores em um círculo, é derivada da distribuição de Cauchy envolvendo-a ao redor do círculo.
- Se , e, em seguida . Para distribuições meio-Cauchy, a relação é mantida por configuração .
Distribuição Relativística Breit-Wigner
Na física nuclear e de partículas , o perfil de energia de uma ressonância é descrito pela distribuição relativística de Breit-Wigner , enquanto a distribuição de Cauchy é a distribuição (não relativística) de Breit-Wigner.
Ocorrência e aplicações
- Na espectroscopia , a distribuição de Cauchy descreve a forma das linhas espectrais que estão sujeitas a um alargamento homogêneo em que todos os átomos interagem da mesma maneira com a faixa de frequência contida na forma da linha. Muitos mecanismos causam um alargamento homogêneo, principalmente o alargamento por colisão . O alargamento ao longo da vida ou natural também dá origem a uma forma de linha descrita pela distribuição de Cauchy.
- Aplicações da distribuição de Cauchy ou sua transformação podem ser encontradas em campos que trabalham com crescimento exponencial. Um artigo de 1958 de White derivou a estatística de teste para estimadores de para a equação e onde o estimador de máxima verossimilhança é encontrado usando mínimos quadrados ordinários mostrou que a distribuição amostral da estatística é a distribuição de Cauchy.
- A distribuição de Cauchy é freqüentemente a distribuição de observações para objetos que estão girando. A referência clássica para isso é chamada de problema do farol de Gull e, como na seção anterior, de distribuição Breit-Wigner na física de partículas.
- Em hidrologia, a distribuição de Cauchy é aplicada a eventos extremos, como chuvas máximas anuais de um dia e vazões de rios. A imagem azul ilustra um exemplo de ajuste da distribuição de Cauchy às chuvas mensais máximas de um dia, mostrando também o cinturão de confiança de 90% com base na distribuição binomial . Os dados de precipitação são representados por posições de plotagem como parte da análise de frequência cumulativa .
- A expressão para a parte imaginária da permissividade elétrica complexa de acordo com o modelo de Lorentz é uma distribuição de Cauchy.
- Como uma distribuição adicional para modelar caudas gordas em finanças computacionais , as distribuições de Cauchy podem ser usadas para modelar VAR ( valor em risco ), produzindo uma probabilidade muito maior de risco extremo do que a distribuição gaussiana .
Veja também
- Voo de Lévy e processo de Lévy
- Distribuição de Laplace , a transformada de Fourier da distribuição de Cauchy
- Processo de Cauchy
- Processo estável
- Distribuição de barra
Referências
links externos
- "Distribuição de Cauchy" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
- Usos anteriores: A entrada na distribuição de Cauchy contém algumas informações históricas.
- Weisstein, Eric W. "Distribuição Cauchy" . MathWorld .
- GNU Scientific Library - Manual de Referência
- Razões de variáveis normais por George Marsaglia