Validação de regressão - Regression validation

Em estatística , a validação de regressão é o processo de decidir se os resultados numéricos que quantificam as relações hipotetizadas entre as variáveis, obtidos da análise de regressão , são aceitáveis ​​como descrições dos dados. O processo de validação pode envolver a análise da qualidade do ajuste da regressão, analisando se os resíduos da regressão são aleatórios e verificando se o desempenho preditivo do modelo se deteriora substancialmente quando aplicado a dados que não foram usados ​​na estimativa do modelo.

Qualidade de ajuste

Uma medida de qualidade de ajuste é o R 2 ( coeficiente de determinação ), que em mínimos quadrados ordinários com uma interceptação varia entre 0 e 1. No entanto, um R 2 próximo de 1 não garante que o modelo se ajuste bem aos dados: como O quarteto de Anscombe mostra que um R 2 alto pode ocorrer na presença de uma especificação incorreta da forma funcional de um relacionamento ou na presença de outliers que distorcem o relacionamento verdadeiro.

Um problema com o R 2 como uma medida de validade do modelo é que ele sempre pode ser aumentado adicionando mais variáveis ​​ao modelo, exceto no caso improvável de que as variáveis ​​adicionais não estejam exatamente correlacionadas com a variável dependente na amostra de dados sendo usada. Este problema pode ser evitado fazendo um teste F da significância estatística do aumento no R 2 ou, em vez disso, usando o R 2 ajustado .

Análise de resíduos

Os resíduos de um modelo ajustado são as diferenças entre as respostas observadas em cada combinação de valores das variáveis ​​explicativas e a previsão correspondente da resposta calculada usando a função de regressão. Matematicamente, a definição do resíduo para a i ésima observação no conjunto de dados é escrita

com y i denotando a i ésima resposta no conjunto de dados ex i o vetor de variáveis ​​explicativas, cada conjunto com os valores correspondentes encontrados na i ésima observação no conjunto de dados.

Se o ajuste do modelo aos dados estivesse correto, os resíduos se aproximariam dos erros aleatórios que tornam a relação entre as variáveis ​​explicativas e a variável resposta uma relação estatística. Portanto, se os resíduos parecem se comportar de maneira aleatória, isso sugere que o modelo se ajusta bem aos dados. Por outro lado, se a estrutura não aleatória for evidente nos resíduos, é um sinal claro de que o modelo se ajusta mal aos dados. A próxima seção detalha os tipos de gráficos a serem usados ​​para testar diferentes aspectos de um modelo e fornece as interpretações corretas dos diferentes resultados que podem ser observados para cada tipo de gráfico.

Análise gráfica de resíduos

Uma maneira básica, embora não quantitativamente precisa, de verificar se há problemas que tornam um modelo inadequado é conduzir um exame visual dos resíduos (as previsões erradas dos dados usados ​​na quantificação do modelo) para procurar desvios óbvios da aleatoriedade. Se um exame visual sugere, por exemplo, a possível presença de heteroscedasticidade (uma relação entre a variância dos erros do modelo e o tamanho das observações de uma variável independente), então testes estatísticos podem ser realizados para confirmar ou rejeitar esse palpite; se for confirmado, diferentes procedimentos de modelagem são necessários.

Diferentes tipos de gráficos dos resíduos de um modelo ajustado fornecem informações sobre a adequação de diferentes aspectos do modelo.

  1. suficiência da parte funcional do modelo: gráficos de dispersão de resíduos versus preditores
  2. variação não constante entre os dados: gráficos de dispersão de resíduos versus preditores; para dados coletados ao longo do tempo, também traça os resíduos em relação ao tempo
  3. deriva nos erros (dados coletados ao longo do tempo): execute gráficos da resposta e erros em relação ao tempo
  4. independência de erros: lag plot
  5. normalidade dos erros: histograma e gráfico de probabilidade normal

Os métodos gráficos têm uma vantagem sobre os métodos numéricos para validação de modelo porque ilustram prontamente uma ampla gama de aspectos complexos da relação entre o modelo e os dados.

Análise quantitativa de resíduos

Os métodos numéricos também desempenham um papel importante na validação do modelo. Por exemplo, o teste de falta de ajuste para avaliar a correção da parte funcional do modelo pode ajudar na interpretação de um gráfico residual limítrofe. Uma situação comum quando os métodos de validação numérica têm precedência sobre os métodos gráficos é quando o número de parâmetros sendo estimados é relativamente próximo ao tamanho do conjunto de dados. Nesta situação, os gráficos de resíduos são frequentemente difíceis de interpretar devido às restrições nos resíduos impostas pela estimativa dos parâmetros desconhecidos. Uma área em que isso normalmente acontece é em aplicativos de otimização usando experimentos projetados . A regressão logística com dados binários é outra área em que a análise gráfica de resíduos pode ser difícil.

A correlação serial dos resíduos pode indicar uma especificação incorreta do modelo e pode ser verificada com a estatística Durbin-Watson . O problema da heteroscedasticidade pode ser verificado de várias maneiras .

Avaliação fora da amostra

A validação cruzada é o processo de avaliar como os resultados de uma análise estatística serão generalizados para um conjunto de dados independente. Se o modelo foi estimado sobre alguns, mas não todos, os dados disponíveis, então o modelo usando os parâmetros estimados pode ser usado para prever os dados retidos. Se, por exemplo, o erro quadrático médio fora da amostra , também conhecido como erro quadrático médio de predição , for substancialmente maior do que o erro quadrático médio dentro da amostra, isso é um sinal de deficiência no modelo.

Um desenvolvimento nas estatísticas médicas é o uso de técnicas de validação cruzada fora da amostra na meta-análise. Ele forma a base da estatística de validação, Vn , que é usada para testar a validade estatística das estimativas de resumo de meta-análise. Essencialmente, ele mede um tipo de erro de predição normalizado e sua distribuição é uma combinação linear de variáveis χ 2 de grau 1.

Veja também

Referências

Leitura adicional

links externos

 Este artigo incorpora  material em domínio público do Instituto Nacional de Padrões e Tecnologia website https://www.nist.gov .