Soma residual dos quadrados - Residual sum of squares

Em estatística , a soma dos quadrados dos resíduos ( RSS ), também conhecida como a soma dos resíduos quadrados ( SSR ) ou a soma dos quadrados da estimativa dos erros ( SSE ), é a soma dos quadrados dos resíduos (desvios previstos dos valores empíricos reais De dados). É uma medida da discrepância entre os dados e um modelo de estimativa, como uma regressão linear . Um pequeno RSS indica um ajuste perfeito do modelo aos dados. É usado como um critério de otimalidade na seleção de parâmetros e seleção de modelos .

Em geral, soma total dos quadrados = soma explicada dos quadrados + soma residual dos quadrados. Para uma prova disso no caso de mínimos quadrados ordinários multivariados (OLS), consulte particionamento no modelo geral de OLS .

Uma variável explicativa

Em um modelo com uma única variável explicativa, o RSS é dado por:

onde y i é o i ésimo valor da variável a ser prevista, x i é o i ésimo valor da variável explicativa e é o valor predito de y i (também denominado ). Numa simples linear padrão modelo de regressão , , onde e são coeficientes , Y e X são o regressando e o regressor , respectivamente, e ε é o termo de erro . A soma dos quadrados dos resíduos é a soma dos quadrados de ; isso é

onde é o valor estimado do termo constante e é o valor estimado do coeficiente de inclinação .

Expressão de matriz para a soma residual dos quadrados de OLS

O modelo de regressão geral com n observações e k explicadores, o primeiro dos quais é um vetor unitário constante cujo coeficiente é a interceptação da regressão, é

onde y é um vetor n × 1 de observações de variáveis ​​dependentes, cada coluna da matriz n × k X é um vetor de observações em um dos k explicadores, é um vetor k × 1 de coeficientes verdadeiros e e é um n × 1 vetor dos verdadeiros erros subjacentes. O estimador de mínimos quadrados ordinários para é

O vetor residual = ; então a soma residual dos quadrados é:

,

(equivalente ao quadrado da norma de resíduos). Na íntegra:

,

onde H é a matriz hat , ou a matriz de projeção em regressão linear.

Relação com a correlação momento-produto de Pearson

A linha de regressão de mínimos quadrados é dada por

,

onde e , onde e

Portanto,

Onde

A correlação momento-produto de Pearson é dada por , portanto,

Veja também

Referências

  • Draper, NR; Smith, H. (1998). Análise de regressão aplicada (3ª ed.). John Wiley. ISBN 0-471-17082-8.