Estatística qui-quadrada reduzida - Reduced chi-squared statistic
Em estatística , a estatística qui-quadrado reduzida é amplamente usada em testes de qualidade de ajuste . É também conhecido como desvio médio quadrático ponderado ( MSWD ) em datação isotópica e variância de peso unitário no contexto de mínimos quadrados ponderados .
Sua raiz quadrada é chamada de regressão o erro padrão , erro padrão da regressão , ou erro padrão da equação (ver Mínimos Quadrados Ordinários # Redução qui-quadrado )
Definição
É definido como qui-quadrado por grau de liberdade :
onde o qui-quadrado é uma soma ponderada dos desvios quadrados :
com entradas: variância , observações S , e os dados calculados C . O grau de liberdade ,, é igual ao número de observações n menos o número de parâmetros ajustados m .
Em mínimos quadrados ponderados , a definição é muitas vezes escrita em notação de matriz como
onde r é o vetor de resíduos e W é a matriz de ponderação, o inverso da matriz de covariância de entrada (diagonal) das observações. Se W não for diagonal, então os mínimos quadrados generalizados se aplicam.
Em mínimos quadrados ordinários , a definição simplifica para:
onde o numerador é a soma residual dos quadrados (RSS).
Discussão
Como regra geral, quando a variância do erro de medição é conhecida a priori , a indica um ajuste de modelo insatisfatório. A indica que o ajuste não capturou totalmente os dados (ou que a variância do erro foi subestimada). Em princípio, um valor de cerca de indica que a extensão da correspondência entre observações e estimativas está de acordo com a variância do erro. A indica que o modelo está "sobreajustando" os dados: ou o modelo está ajustando o ruído de maneira inadequada ou a variância do erro foi superestimada.
Quando a variância do erro de medição é apenas parcialmente conhecida, o qui-quadrado reduzido pode servir como uma correção estimada a posteriori , consulte a média aritmética ponderada # Correção para super ou subdispersão .
Formulários
Geocronologia
Em geocronologia , o MSWD é uma medida de qualidade de ajuste que leva em consideração a importância relativa da reprodutibilidade interna e externa, com uso mais comum em datação isotópica.
Em geral, quando:
MSWD = 1 se os dados de idade se ajustam a uma distribuição normal univariada no espaço t (para a idade média aritmética ) ou log ( t ) (para a idade média geométrica ), ou se os dados de composição se ajustam a uma distribuição normal bivariada em [log ( U / He ), log ( Th / He)] - espaço (para a idade central).
MSWD <1 se a dispersão observada for menor do que a prevista pelas incertezas analíticas. Nesse caso, os dados são ditos "subdispersos", indicando que as incertezas analíticas foram superestimadas.
MSWD> 1 se a dispersão observada exceder aquela prevista pelas incertezas analíticas. Nesse caso, os dados são considerados "sobredispersos". Esta situação é a regra e não a exceção na geocronologia (U-Th) / He, indicando uma compreensão incompleta do sistema isotópico. Várias razões foram propostas para explicar a superdispersão de dados (U-Th) / He, incluindo distribuições U-Th desigualmente distribuídas e danos por radiação.
Freqüentemente, o geocronólogo determinará uma série de medições de idade em uma única amostra, com o valor medido tendo uma ponderação e um erro associado para cada determinação de idade. Quanto à ponderação, pode-se ponderar todas as idades medidas igualmente, ou ponderá-las pela proporção da amostra que representam. Por exemplo, se dois terços da amostra foram usados para a primeira medição e um terço para a segunda e última medição, então pode-se ponderar a primeira medição duas vezes mais que a segunda.
A média aritmética das determinações de idade é
mas esse valor pode ser enganoso, a menos que cada determinação da idade seja de igual importância.
Quando cada valor medido pode ser assumido como tendo a mesma ponderação ou significância, os estimadores tendenciosos e não tendenciosos (ou " amostra " e "população", respectivamente) da variância são calculados da seguinte forma:
O desvio padrão é a raiz quadrada da variância.
Quando as determinações individuais de uma idade não são de igual importância, é melhor usar uma média ponderada para obter uma idade "média", como segue:
O estimador ponderado enviesado de variância pode ser mostrado como
que pode ser calculado como
O estimador ponderado imparcial da variância da amostra pode ser calculado da seguinte forma:
Novamente, o desvio padrão correspondente é a raiz quadrada da variância.
O estimador ponderado imparcial da variância da amostra também pode ser calculado em tempo real da seguinte forma:
O quadrado médio não ponderado dos desvios ponderados (MSWD não ponderado) pode então ser calculado, como segue:
Por analogia, o quadrado médio ponderado dos desvios ponderados (MSWD ponderado) pode ser calculado da seguinte forma:
Análise Rasch
Na análise de dados com base no Modelo Rasch , a estatística Qui-quadrado reduzido é chamada de estatística Quadrado médio de Outfit, e a estatística Qui-quadrado reduzido ponderada por informações é chamada estatística quadrada Média Infit.