Mediana - Median

Encontrar a mediana em conjuntos de dados com um número ímpar e par de valores

Em estatística e teoria da probabilidade , a mediana é o valor que separa a metade superior da metade inferior de uma amostra de dados , uma população ou uma distribuição de probabilidade . Para um conjunto de dados , pode ser considerado como o valor "médio". A característica básica da mediana na descrição de dados em comparação com a média (muitas vezes simplesmente descrita como a "média") é que ela não é distorcida por uma pequena proporção de valores extremamente grandes ou pequenos e, portanto, fornece uma melhor representação de um "típico " valor. A renda mediana , por exemplo, pode ser a melhor maneira de sugerir o que é uma renda "típica", porque a distribuição de renda pode ser muito distorcida. A mediana é de importância central em estatísticas robustas , pois é a estatística mais resistente , tendo um ponto de decomposição de 50%: desde que não mais da metade dos dados estejam contaminados, a mediana não é um resultado arbitrariamente grande ou pequeno.

Conjunto de dados finitos de números

A mediana de uma lista finita de números é o número "médio", quando esses números são listados do menor ao maior.

Se o conjunto de dados tem um número ímpar de observações, o do meio é selecionado. Por exemplo, a seguinte lista de sete números,

1, 3, 3, 6 , 7, 8, 9

tem a mediana de 6 , que é o quarto valor.

Em geral, para um conjunto de elementos, isso pode ser escrito como:

Um conjunto de um número par de observações não tem valor médio distinto e a mediana é geralmente definida como a média aritmética dos dois valores médios. Por exemplo, o conjunto de dados

1, 2, 3, 4, 5 , 6, 8, 9

tem um valor médio de 4,5 , ou seja . (Em termos mais técnicos, isso interpreta a mediana como o intervalo médio totalmente aparado ). Com esta convenção, a mediana pode ser definida da seguinte forma (para número par de observações):

Comparação de médias comuns de valores [1, 2, 2, 3, 4, 7, 9]
Modelo Descrição Exemplo Resultado
Média aritmética Soma dos valores de um conjunto de dados dividido pelo número de valores: (1 + 2 + 2 + 3 + 4 + 7 + 9) / 7 4
Mediana Valor médio separando as metades maior e menor de um conjunto de dados 1, 2, 2, 3 , 4, 7, 9 3
Modo Valor mais frequente em um conjunto de dados 1, 2 , 2 , 3, 4, 7, 9 2

Definição formal

Formalmente, uma mediana de uma população é qualquer valor tal que no máximo metade da população seja menor do que a mediana proposta e no máximo a metade seja maior do que a mediana proposta. Como visto acima, as medianas podem não ser únicas. Se cada conjunto contém menos da metade da população, então parte da população é exatamente igual à mediana única.

A mediana é bem definida para quaisquer dados ordenados (unidimensionais) e é independente de qualquer métrica de distância . A mediana pode então ser aplicada a classes classificadas, mas não numéricas (por exemplo, calcular uma nota mediana quando os alunos são avaliados de A a F), embora o resultado possa estar no meio do caminho entre as classes se houver um número par de casos.

Uma mediana geométrica , por outro lado, é definida em qualquer número de dimensões. Um conceito relacionado, em que o resultado é forçado a corresponder a um membro da amostra, é o medóide .

Não há amplamente aceito notação padrão para a média, mas alguns autores representam a mediana de uma variável x quer como x ou como μ 1/2 vezes também M . Em qualquer um desses casos, o uso desses ou de outros símbolos para a mediana precisa ser explicitamente definido quando são introduzidos.

A mediana é um caso especial de outras maneiras de resumir os valores típicos associados a uma distribuição estatística : é o 2º quartil , o 5º decil e o 50º percentil .

Usos

A mediana pode ser usada como uma medida de localização quando atribuímos importância reduzida a valores extremos, normalmente porque uma distribuição é distorcida , valores extremos não são conhecidos ou outliers não são confiáveis, ou seja, podem ser erros de medição / transcrição.

Por exemplo, considere o multiset

1, 2, 2, 2, 3, 14.

A mediana é 2 neste caso (assim como a moda ), e pode ser vista como uma indicação melhor do centro do que a média aritmética de 4, que é maior do que todos os valores, exceto um. No entanto, a relação empírica amplamente citada de que a média é deslocada "mais para dentro da cauda" de uma distribuição do que a mediana geralmente não é verdadeira. No máximo, pode-se dizer que as duas estatísticas não podem estar "muito distantes" uma da outra; ver § Desigualdades relacionando médias e medianas abaixo.

Como uma mediana é baseada nos dados intermediários de um conjunto, não é necessário saber o valor dos resultados extremos para calculá-lo. Por exemplo, em um teste de psicologia que investiga o tempo necessário para resolver um problema, se um pequeno número de pessoas não conseguiu resolver o problema no tempo determinado, uma mediana ainda pode ser calculada.

Como a mediana é simples de entender e fácil de calcular, além de ser uma aproximação robusta da média , a mediana é uma estatística de resumo popular em estatísticas descritivas . Neste contexto, existem várias opções para uma medida de variabilidade : o intervalo , o intervalo interquartil , o desvio médio absoluto e o desvio absoluto mediano .

Para fins práticos, diferentes medidas de localização e dispersão são frequentemente comparadas com base em quão bem os valores populacionais correspondentes podem ser estimados a partir de uma amostra de dados. A mediana, estimada usando a mediana da amostra, tem boas propriedades a esse respeito. Embora geralmente não seja ótimo se uma determinada distribuição da população for assumida, suas propriedades são sempre razoavelmente boas. Por exemplo, uma comparação da eficiência dos estimadores candidatos mostra que a média da amostra é mais eficiente estatisticamente quando - e somente quando - os dados não são contaminados por dados de distribuições de cauda pesada ou de misturas de distribuições. Mesmo assim, a mediana tem uma eficiência de 64% em comparação com a média de variância mínima (para grandes amostras normais), o que significa que a variância da mediana será ~ 50% maior do que a variância da média.

Distribuições de probabilidade

Visualização geométrica do modo, mediana e média de uma função de densidade de probabilidade arbitrária

Para qualquer distribuição de probabilidade real avaliada com função de distribuição cumulativa F , uma mediana é definida como qualquer número real  m que satisfaça as desigualdades  

.

Um fraseado equivalente usa uma variável aleatória X distribuída de acordo com F :

Observe que esta definição não requer que X tenha uma distribuição absolutamente contínua (que tem uma função de densidade de probabilidade ƒ ), nem requer uma discreta . No primeiro caso, as desigualdades podem ser aumentadas para igualdade: uma mediana satisfaz

.

Qualquer distribuição de probabilidade em R tem pelo menos uma mediana, mas em casos patológicos pode haver mais de uma mediana: se F for constante 1/2 em um intervalo (de modo que ƒ = 0 lá), então qualquer valor desse intervalo é um mediana.

Médias de distribuições particulares

As medianas de certos tipos de distribuições podem ser facilmente calculadas a partir de seus parâmetros; além disso, eles existem mesmo para algumas distribuições sem uma média bem definida, como a distribuição de Cauchy :

Populações

Propriedade de otimização

O erro médio absoluto de uma variável real c em relação à variável aleatória  X é

Desde que a distribuição de probabilidade de X é tal que existe a expectativa de cima, então m é um número médio de X , se e somente se m é um minimizador do erro médio absoluto com respeito a X . Em particular, m é uma mediana da amostra se e somente se m minimiza a média aritmética dos desvios absolutos.

Mais geralmente, uma mediana é definida como um mínimo de

conforme discutido abaixo na seção sobre medianas multivariadas (especificamente, a mediana espacial ).

Esta definição da mediana baseada na otimização é útil na análise de dados estatísticos, por exemplo, em agrupamento de k- medianas .

Desigualdade relacionando médias e medianas

Comparação da média , mediana e modo de duas distribuições log-normais com diferentes assimetrias

Se a distribuição tiver variância finita, a distância entre a mediana e a média é limitada por um desvio padrão .

Este limite foi provado por Mallows, que usou a desigualdade de Jensen duas vezes, como segue. Usando | · | para o valor absoluto , temos

A primeira e a terceira desigualdades vêm da desigualdade de Jensen aplicada à função de valor absoluto e à função quadrada, que são convexas. A segunda desigualdade vem do fato de que uma mediana minimiza a função de desvio absoluto .

A prova de Mallows pode ser generalizada para obter uma versão multivariada da desigualdade simplesmente substituindo o valor absoluto por uma norma :

onde m é uma mediana espacial , ou seja, um minimizador da função. A mediana espacial é única quando a dimensão do conjunto de dados é dois ou mais.

Uma prova alternativa usa a desigualdade de Chebyshev unilateral; ele aparece em uma desigualdade nos parâmetros de localização e escala . Essa fórmula também segue diretamente da desigualdade de Cantelli .

Distribuições unimodais

Para o caso de distribuições unimodais , pode-se obter um limite mais nítido na distância entre a mediana e a média:

.

Uma relação semelhante é mantida entre a mediana e a moda:

Desigualdade de Jensen para medianas

A desigualdade de Jensen afirma que para qualquer variável aleatória X com uma expectativa finita E [ X ] e para qualquer função convexa f

Essa desigualdade também se generaliza para a mediana. Dizemos uma função f: ℝ → ℝ é uma função C se, para qualquer t ,

é um intervalo fechado (permitindo os casos degenerados de um único ponto ou de um conjunto vazio ). Cada função C é convexa, mas o inverso não é válido. Se f é uma função C, então

Se as medianas não forem únicas, a afirmação vale para o suprema correspondente.

Medianas para amostras

A mediana da amostra

Cálculo eficiente da mediana da amostra

Embora a classificação de comparação n itens exija Ω ( n log n ) operações, os algoritmos de seleção podem calcular o k -ésimo menor de n itens com apenas Θ ( n ) operações. Isso inclui a mediana, que é a n/2a estatística de ordem (ou para um número par de amostras, a média aritmética das duas estatísticas de ordem do meio).

Os algoritmos de seleção ainda têm a desvantagem de exigir memória Ω ( n ) , ou seja, eles precisam ter a amostra completa (ou uma porção de tamanho linear dela) na memória. Como isso, assim como o requisito de tempo linear, pode ser proibitivo, vários procedimentos de estimativa para a mediana foram desenvolvidos. Uma regra simples é a mediana de três regras, que estima a mediana como a mediana de uma subamostra de três elementos; isso é comumente usado como uma sub-rotina no algoritmo de classificação quicksort , que usa uma estimativa da mediana de sua entrada. Um estimador mais robusto é o ninther de Tukey , que é a mediana de três regras aplicadas com recursão limitada: se A for a amostra disposta como uma matriz , e

med3 ( A ) = mediana ( A [1], A [n/2], A [ n ]) ,

então

ninther ( A ) = med3 (med3 ( A [1 ...1/3n ]), med3 ( A [1/3n ...2/3n ]), med3 ( A [2/3n ... n ]))

O remedian é um estimador da mediana que requer tempo linear, mas memória sublinear , operando em uma única passagem sobre a amostra.

Distribuição de amostras

As distribuições da média e da mediana da amostra foram determinadas por Laplace . A distribuição da mediana da amostra de uma população com uma função de densidade é assintoticamente normal com média e variância

onde é a mediana e é o tamanho da amostra. Uma prova moderna segue abaixo. O resultado de Laplace é agora entendido como um caso especial da distribuição assintótica de quantis arbitrários .

Para amostras normais, a densidade é , portanto, para amostras grandes, a variância da mediana é igual (consulte também a seção # Eficiência abaixo).

Derivação da distribuição assintótica

Consideramos o tamanho da amostra um número ímpar e assumimos nossa variável contínua; a fórmula para o caso de variáveis ​​discretas é dada abaixo em § Densidade local empírica . A amostra pode ser resumido como "abaixo mediano", "em média", e "acima mediano", o que corresponde a uma distribuição de probabilidades trinómio com , e . Para uma variável contínua, a probabilidade de múltiplos valores de amostra serem exatamente iguais à mediana é 0, então pode-se calcular a densidade de no ponto diretamente da distribuição trinomial:

.

Agora apresentamos a função beta. Para argumentos inteiros e , isso pode ser expresso como . Além disso, lembre-se disso . Usar essas relações e definir ambos e igual a permite que a última expressão seja escrita como

Conseqüentemente, a função de densidade da mediana é uma distribuição beta simétrica impulsionada por . Sua média, como seria de se esperar, é 0,5 e sua variância é . Pela regra da cadeia , a variação correspondente da mediana da amostra é

.

O adicional de 2 é insignificante no limite .

Densidade local empírica

Na prática, as funções e muitas vezes não são conhecidas ou presumidas. No entanto, eles podem ser estimados a partir de uma distribuição de frequência observada. Nesta seção, damos um exemplo. Considere a seguinte tabela, representando uma amostra de 3.800 (valores discretos) observações:

v 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
f (v) 0,000 0,008 0,010 0,013 0,083 0,108 0,328 0,220 0,202 0,023 0,005
F (v) 0,000 0,008 0,018 0,031 0,114 0,222 0,550 0,770 0,972 0,995 1,000

Como as observações têm valores discretos, construir a distribuição exata da mediana não é uma tradução imediata da expressão acima para ; pode-se (e normalmente tem) várias instâncias da mediana em sua amostra. Portanto, devemos somar todas essas possibilidades:

Aqui, i é o número de pontos estritamente menor que a mediana ek o número estritamente maior.

Usando essas preliminares, é possível investigar o efeito do tamanho da amostra sobre os erros padrão da média e mediana. A média observada é 3,16, a mediana bruta observada é 3 e a mediana interpolada observada é 3,174. A tabela a seguir fornece algumas estatísticas de comparação.

Tamanho da amostra
Estatística
3 9 15 21
Valor esperado da mediana 3.198 3.191 3.174 3.161
Erro padrão da mediana (fórmula acima) 0,482 0,305 0,257 0,239
Erro padrão da mediana (aproximação assintótica) 0,879 0,508 0,393 0,332
Erro padrão da média 0,421 0,243 0,188 0,159

O valor esperado da mediana cai ligeiramente à medida que o tamanho da amostra aumenta, enquanto, como seria de se esperar, os erros padrão tanto da mediana quanto da média são proporcionais à raiz quadrada inversa do tamanho da amostra. A aproximação assintótica erra pelo lado da cautela ao superestimar o erro padrão.

Estimativa de variação de dados de amostra

O valor de - o valor assintótico de onde é a mediana da população - foi estudado por vários autores. O método jackknife padrão "deletar um" produz resultados inconsistentes . Uma alternativa - o método "deletar k" - em que aumenta com o tamanho da amostra tem se mostrado assintoticamente consistente. Este método pode ser caro do ponto de vista computacional para grandes conjuntos de dados. Uma estimativa de bootstrap é conhecida por ser consistente, mas converge muito lentamente ( ordem de ). Outros métodos foram propostos, mas seu comportamento pode diferir entre amostras grandes e pequenas.

Eficiência

A eficiência da mediana da amostra, medida como a razão entre a variância da média e a variância da mediana, depende do tamanho da amostra e da distribuição da população subjacente. Para uma amostra de tamanho da distribuição normal , a eficiência para N grande é

A eficiência tende tanto para o infinito.

Em outras palavras, a variância relativa da mediana será , ou 57% maior do que a variância da média - o erro padrão relativo da mediana será , ou 25% maior do que o erro padrão da média , (consulte também a seção # Distribuição de amostragem acima.).

Outros estimadores

Para distribuições univariadas que são simétricas em torno de uma mediana, o estimador de Hodges-Lehmann é um estimador robusto e altamente eficiente da mediana da população.

Se os dados são representados por um modelo estatístico que especifica uma família particular de distribuições de probabilidade , então as estimativas da mediana podem ser obtidas ajustando essa família de distribuições de probabilidade aos dados e calculando a mediana teórica da distribuição ajustada. A interpolação de Pareto é uma aplicação disso quando se assume que a população tem uma distribuição de Pareto .

Mediana multivariada

Anteriormente, este artigo discutiu a mediana univariada, quando a amostra ou população possuía uma dimensão. Quando a dimensão é dois ou superior, existem vários conceitos que estendem a definição da mediana univariada; cada uma dessas medianas multivariadas concorda com a mediana univariada quando a dimensão é exatamente uma.

Mediana marginal

A mediana marginal é definida para vetores definidos em relação a um conjunto fixo de coordenadas. Uma mediana marginal é definida como o vetor cujos componentes são medianas univariadas. A mediana marginal é fácil de calcular e suas propriedades foram estudadas por Puri e Sen.

Mediana geométrica

A mediana geométrica de um conjunto discreto de pontos amostrais em um espaço euclidiano é o ponto que minimiza a soma das distâncias aos pontos amostrais.

Em contraste com a mediana marginal, a mediana geométrica é equivariante em relação às transformações de similaridade euclidiana , como translações e rotações .

Mediana em todas as direções

Se as medianas marginais de todos os sistemas de coordenadas coincidirem, sua localização comum pode ser denominada "mediana em todas as direções". Este conceito é relevante para a teoria da votação devido ao teorema do eleitor mediano . Quando existe, a mediana em todas as direções coincide com a mediana geométrica (pelo menos para distribuições discretas).

Ponto central

Uma generalização alternativa da mediana em dimensões superiores é o ponto central .

Outros conceitos relacionados à mediana

Mediana interpolada

Ao lidar com uma variável discreta, às vezes é útil considerar os valores observados como pontos médios de intervalos contínuos subjacentes. Um exemplo disso é a escala Likert, na qual as opiniões ou preferências são expressas em uma escala com um determinado número de respostas possíveis. Se a escala consistir em inteiros positivos, uma observação de 3 pode ser considerada como representando o intervalo de 2,50 a 3,50. É possível estimar a mediana da variável subjacente. Se, digamos, 22% das observações são de valor 2 ou abaixo e 55,0% são de 3 ou abaixo (então 33% têm o valor 3), então a mediana é 3, uma vez que a mediana é o menor valor de para o qual é maior da metade. Mas a mediana interpolada está em algum lugar entre 2,50 e 3,50. Primeiro, adicionamos metade da largura do intervalo à mediana para obter o limite superior do intervalo da mediana. Em seguida, subtraímos a proporção da largura do intervalo que é igual à proporção de 33% que está acima da marca de 50%. Em outras palavras, dividimos a largura do intervalo proporcionalmente ao número de observações. Nesse caso, os 33% são divididos em 28% abaixo da mediana e 5% acima dela, portanto, subtraímos 5/33 da largura do intervalo do limite superior de 3,50 para obter uma mediana interpolada de 3,35. Mais formalmente, se os valores forem conhecidos, a mediana interpolada pode ser calculada a partir de

Alternativamente, se em uma amostra observada houver pontuações acima da categoria mediana, pontuações nela e pontuações abaixo dela, então a mediana interpolada é dada por

Pseudo-mediana

Para distribuições univariadas que são simétricas em torno de uma mediana, o estimador de Hodges-Lehmann é um estimador robusto e altamente eficiente da mediana da população; para distribuições não simétricas, o estimador de Hodges-Lehmann é um estimador robusto e altamente eficiente da pseudo-mediana populacional , que é a mediana de uma distribuição simetrizada e que está próxima da mediana populacional. O estimador de Hodges-Lehmann foi generalizado para distribuições multivariadas.

Variantes de regressão

O estimador de Theil-Sen é um método para regressão linear robusta com base na descoberta de medianas de inclinações .

Filtro mediano

No contexto do processamento de imagens raster monocromáticas, há um tipo de ruído, conhecido como ruído de sal e pimenta , quando cada pixel torna-se independentemente preto (com alguma probabilidade pequena) ou branco (com alguma probabilidade pequena) e permanece inalterado de outra forma (com probabilidade próxima de 1). Uma imagem construída com valores medianos de vizinhanças (como quadrados 3 × 3) pode efetivamente reduzir o ruído neste caso.

Análise de cluster

Na análise de cluster , o algoritmo de agrupamento de k-medianas fornece uma maneira de definir clusters, em que o critério de maximizar a distância entre as médias do cluster que é usado no agrupamento de k-médias é substituído pela maximização da distância entre as medianas do cluster.

Linha mediana-mediana

Este é um método de regressão robusta. A ideia remonta a Wald em 1940, que sugeriu dividir um conjunto de dados bivariados em duas metades dependendo do valor do parâmetro independente : a metade esquerda com valores menores que a mediana e a metade direita com valores maiores que a mediana. Ele sugeriu pegar as médias das variáveis dependentes e independentes das metades esquerda e direita e estimar a inclinação da linha que une esses dois pontos. A linha pode então ser ajustada para caber na maioria dos pontos no conjunto de dados.

Nair e Shrivastava em 1942 sugeriram uma ideia semelhante, mas, em vez disso, defenderam a divisão da amostra em três partes iguais antes de calcular as médias das subamostras. Brown e Mood em 1951 propuseram a ideia de usar as medianas de duas subamostras em vez dos meios. Tukey combinou essas ideias e recomendou dividir a amostra em três subamostras de tamanhos iguais e estimar a linha com base nas medianas das subamostras.

Estimadores não tendenciosos à mediana

Qualquer estimador médio não enviesado minimiza o risco ( perda esperada ) com respeito à função de perda de erro quadrático , conforme observado por Gauss . Um estimador não tendencioso de mediana minimiza o risco com respeito à função de perda de desvio absoluto , conforme observado por Laplace . Outras funções de perda são usadas na teoria estatística , particularmente em estatísticas robustas .

A teoria dos estimadores não tendenciosos da mediana foi revivida por George W. Brown em 1947:

Uma estimativa de um parâmetro unidimensional θ será considerada sem viés mediano se, para θ fixo, a mediana da distribuição da estimativa estiver no valor θ; ou seja, a estimativa subestima com a mesma frequência que superestima. Este requisito parece, para a maioria dos propósitos, realizar tanto quanto o requisito imparcial à média e tem a propriedade adicional de ser invariante sob a transformação um-para-um.

-  página 584

Outras propriedades dos estimadores não tendenciosos à mediana foram relatadas. Os estimadores não tendenciosos à mediana são invariantes sob transformações um-para-um .

Existem métodos de construção de estimadores sem tendência à mediana que são ótimos (em um sentido análogo à propriedade de variância mínima para estimadores sem tendência à média). Essas construções existem para distribuições de probabilidade com funções de verossimilhança monótonas . Um desses procedimentos é análogo ao procedimento de Rao-Blackwell para estimadores imparciais à média: o procedimento é válido para uma classe menor de distribuições de probabilidade do que o procedimento de Rao-Blackwell, mas para uma classe maior de funções de perda .

História

Pesquisadores científicos no antigo oriente próximo parecem não ter usado estatísticas resumidas completamente, em vez de escolher valores que ofereciam consistência máxima com uma teoria mais ampla que integrava uma ampla variedade de fenômenos. Dentro da comunidade acadêmica mediterrânea (e, mais tarde, europeia), estatísticas como a média são fundamentalmente um desenvolvimento medieval e do início da modernidade. (A história da mediana fora da Europa e de seus predecessores permanece relativamente não estudada.)

A ideia da mediana apareceu no século 13 no Talmud , a fim de analisar razoavelmente avaliações divergentes . No entanto, o conceito não se espalhou para a comunidade científica mais ampla.

Em vez disso, o ancestral mais próximo do mediano moderno é o mid-range , inventado por Al-Biruni . A transmissão do trabalho de Al-Biruni para estudiosos posteriores não é clara. Al-Biruni aplicou sua técnica para avaliar metais, mas, depois de publicar seu trabalho, a maioria dos avaliadores ainda adotou o valor mais desfavorável de seus resultados, para que não parecessem trapacear . No entanto, o aumento da navegação no mar durante a Era dos Descobrimentos significava que os navegadores dos navios tinham cada vez mais que tentar determinar a latitude em clima desfavorável contra costas hostis, levando a um interesse renovado em estatísticas resumidas. Quer seja redescoberto ou inventado de forma independente, o mid-range é recomendado para navegadores náuticos nas "Instruções para a Viagem de Raleigh à Guiana, 1595" de Harriot.

A ideia da mediana pode ter aparecido pela primeira vez no livro Certaine Errors in Navigation, de Edward Wright , de 1599, em uma seção sobre navegação por bússola . Wright estava relutante em descartar os valores medidos e pode ter sentido que a mediana - incorporando uma proporção maior do conjunto de dados do que o intervalo médio - era mais provável de ser correta. No entanto, Wright não deu exemplos do uso de sua técnica, tornando difícil verificar que ele descreveu a noção moderna de mediana. A mediana (no contexto da probabilidade) certamente apareceu na correspondência de Christiaan Huygens , mas como exemplo de estatística inadequada para a prática atuarial .

A recomendação mais antiga da mediana data de 1757, quando Roger Joseph Boscovich desenvolveu um método de regressão baseado na norma L 1 e, portanto, implicitamente na mediana. Em 1774, Laplace tornou esse desejo explícito: ele sugeriu que a mediana fosse usada como o estimador padrão do valor de um PDF posterior . O critério específico foi minimizar a magnitude esperada do erro; onde está a estimativa e é o valor verdadeiro. Para tanto, Laplace determinou as distribuições da média e da mediana da amostra no início do século XIX. Porém, uma década depois, Gauss e Legendre desenvolveram o método dos mínimos quadrados , que minimiza para obter a média. No contexto da regressão, a inovação de Gauss e Legendre oferece computação muito mais fácil. Consequentemente, a proposta de Laplaces foi geralmente rejeitada até o surgimento dos dispositivos de computação 150 anos depois (e ainda é um algoritmo relativamente incomum).

Antoine Augustin Cournot em 1843 foi o primeiro a usar o termo mediana ( valeur médiane ) para o valor que divide uma distribuição de probabilidade em duas metades iguais. Gustav Theodor Fechner usou a mediana ( Centralwerth ) em fenômenos sociológicos e psicológicos. Anteriormente, ele havia sido usado apenas em astronomia e campos relacionados. Gustav Fechner popularizou a mediana na análise formal de dados, embora tivesse sido usada anteriormente por Laplace, e a mediana apareceu em um livro de FY Edgeworth . Francis Galton usou o termo em inglês median em 1881, tendo usado anteriormente os termos valor mais médio em 1869 e o meio em 1880.

Os estatísticos encorajaram o uso de medianas intensamente ao longo do século 19 por sua clareza intuitiva e facilidade de computação manual. No entanto, a noção de mediana não se presta à teoria dos momentos superiores tão bem quanto a média aritmética , e é muito mais difícil de calcular por computador. Como resultado, a mediana foi constantemente suplantada como uma noção de média genérica pela média aritmética durante o século XX.

Veja também

Notas

Referências

links externos

Este artigo incorpora material do Median de uma distribuição no PlanetMath , que está licenciado sob a licença Creative Commons Atribuição / Compartilhamento pela mesma Licença .