Estatística qui-quadrada reduzida - Reduced chi-squared statistic

Em estatística , a estatística qui-quadrado reduzida é amplamente usada em testes de qualidade de ajuste . É também conhecido como desvio médio quadrático ponderado ( MSWD ) em datação isotópica e variância de peso unitário no contexto de mínimos quadrados ponderados .

Sua raiz quadrada é chamada de regressão o erro padrão , erro padrão da regressão , ou erro padrão da equação (ver Mínimos Quadrados Ordinários # Redução qui-quadrado )

Definição

É definido como qui-quadrado por grau de liberdade :

onde o qui-quadrado é uma soma ponderada dos desvios quadrados :

com entradas: variância , observações S , e os dados calculados C . O grau de liberdade ,, é igual ao número de observações n menos o número de parâmetros ajustados m .

Em mínimos quadrados ponderados , a definição é muitas vezes escrita em notação de matriz como

onde r é o vetor de resíduos e W é a matriz de ponderação, o inverso da matriz de covariância de entrada (diagonal) das observações. Se W não for diagonal, então os mínimos quadrados generalizados se aplicam.

Em mínimos quadrados ordinários , a definição simplifica para:

onde o numerador é a soma residual dos quadrados (RSS).

Discussão

Como regra geral, quando a variância do erro de medição é conhecida a priori , a indica um ajuste de modelo insatisfatório. A indica que o ajuste não capturou totalmente os dados (ou que a variância do erro foi subestimada). Em princípio, um valor de cerca de indica que a extensão da correspondência entre observações e estimativas está de acordo com a variância do erro. A indica que o modelo está "sobreajustando" os dados: ou o modelo está ajustando o ruído de maneira inadequada ou a variância do erro foi superestimada.

Quando a variância do erro de medição é apenas parcialmente conhecida, o qui-quadrado reduzido pode servir como uma correção estimada a posteriori , consulte a média aritmética ponderada # Correção para super ou subdispersão .

Formulários

Geocronologia

Em geocronologia , o MSWD é uma medida de qualidade de ajuste que leva em consideração a importância relativa da reprodutibilidade interna e externa, com uso mais comum em datação isotópica.

Em geral, quando:

MSWD = 1 se os dados de idade se ajustam a uma distribuição normal univariada no espaço t (para a idade média aritmética ) ou log ( t ) (para a idade média geométrica ), ou se os dados de composição se ajustam a uma distribuição normal bivariada em [log ( U / He ), log ( Th / He)] - espaço (para a idade central).

MSWD <1 se a dispersão observada for menor do que a prevista pelas incertezas analíticas. Nesse caso, os dados são ditos "subdispersos", indicando que as incertezas analíticas foram superestimadas.

MSWD> 1 se a dispersão observada exceder aquela prevista pelas incertezas analíticas. Nesse caso, os dados são considerados "sobredispersos". Esta situação é a regra e não a exceção na geocronologia (U-Th) / He, indicando uma compreensão incompleta do sistema isotópico. Várias razões foram propostas para explicar a superdispersão de dados (U-Th) / He, incluindo distribuições U-Th desigualmente distribuídas e danos por radiação.

Freqüentemente, o geocronólogo determinará uma série de medições de idade em uma única amostra, com o valor medido tendo uma ponderação e um erro associado para cada determinação de idade. Quanto à ponderação, pode-se ponderar todas as idades medidas igualmente, ou ponderá-las pela proporção da amostra que representam. Por exemplo, se dois terços da amostra foram usados ​​para a primeira medição e um terço para a segunda e última medição, então pode-se ponderar a primeira medição duas vezes mais que a segunda.

A média aritmética das determinações de idade é

mas esse valor pode ser enganoso, a menos que cada determinação da idade seja de igual importância.

Quando cada valor medido pode ser assumido como tendo a mesma ponderação ou significância, os estimadores tendenciosos e não tendenciosos (ou " amostra " e "população", respectivamente) da variância são calculados da seguinte forma:

O desvio padrão é a raiz quadrada da variância.

Quando as determinações individuais de uma idade não são de igual importância, é melhor usar uma média ponderada para obter uma idade "média", como segue:

O estimador ponderado enviesado de variância pode ser mostrado como

que pode ser calculado como

O estimador ponderado imparcial da variância da amostra pode ser calculado da seguinte forma:

Novamente, o desvio padrão correspondente é a raiz quadrada da variância.

O estimador ponderado imparcial da variância da amostra também pode ser calculado em tempo real da seguinte forma:

O quadrado médio não ponderado dos desvios ponderados (MSWD não ponderado) pode então ser calculado, como segue:

Por analogia, o quadrado médio ponderado dos desvios ponderados (MSWD ponderado) pode ser calculado da seguinte forma:

Análise Rasch

Na análise de dados com base no Modelo Rasch , a estatística Qui-quadrado reduzido é chamada de estatística Quadrado médio de Outfit, e a estatística Qui-quadrado reduzido ponderada por informações é chamada estatística quadrada Média Infit.

Referências