Soma residual dos quadrados - Residual sum of squares
Medida estatística da discrepância entre os dados e um modelo de estimativa
Em estatística , a soma dos quadrados dos resíduos ( RSS ), também conhecida como a soma dos resíduos quadrados ( SSR ) ou a soma dos quadrados da estimativa dos erros ( SSE ), é a soma dos quadrados dos resíduos (desvios previstos dos valores empíricos reais De dados). É uma medida da discrepância entre os dados e um modelo de estimativa, como uma regressão linear . Um pequeno RSS indica um ajuste perfeito do modelo aos dados. É usado como um critério de otimalidade na seleção de parâmetros e seleção de modelos .
Em um modelo com uma única variável explicativa, o RSS é dado por:
onde y i é o i ésimo valor da variável a ser prevista, x i é o i ésimo valor da variável explicativa e é o valor predito de y i (também denominado ). Numa simples linear padrão modelo de regressão , , onde e são coeficientes , Y e X são o regressando e o regressor , respectivamente, e ε é o termo de erro . A soma dos quadrados dos resíduos é a soma dos quadrados de ; isso é
onde é o valor estimado do termo constante e é o valor estimado do coeficiente de inclinação .
Expressão de matriz para a soma residual dos quadrados de OLS
O modelo de regressão geral com n observações e k explicadores, o primeiro dos quais é um vetor unitário constante cujo coeficiente é a interceptação da regressão, é
onde y é um vetor n × 1 de observações de variáveis dependentes, cada coluna da matriz n × k X é um vetor de observações em um dos k explicadores, é um vetor k × 1 de coeficientes verdadeiros e e é um n × 1 vetor dos verdadeiros erros subjacentes. O estimador de mínimos quadrados ordinários para é
O vetor residual = ; então a soma residual dos quadrados é:
,
(equivalente ao quadrado da norma de resíduos). Na íntegra:
,
onde H é a matriz hat , ou a matriz de projeção em regressão linear.
Relação com a correlação momento-produto de Pearson