Ajuste de curva - Curve fitting

Ajuste de uma curva ruidosa por um modelo de pico assimétrico, com um processo iterativo ( algoritmo de Gauss-Newton com fator de amortecimento variável α).
Acima: dados brutos e modelo.
Abaixo: evolução da soma normalizada dos quadrados dos erros.

O ajuste de curva é o processo de construção de uma curva , ou função matemática , que tem o melhor ajuste para uma série de pontos de dados , possivelmente sujeito a restrições. O ajuste da curva pode envolver interpolação , onde um ajuste exato aos dados é necessário, ou suavização , na qual uma função "suave" é construída que se ajusta aproximadamente aos dados. Um tópico relacionado é a análise de regressão , que se concentra mais em questões de inferência estatística , como quanta incerteza está presente em uma curva que se ajusta aos dados observados com erros aleatórios. As curvas ajustadas podem ser usadas como um auxílio para a visualização de dados, para inferir valores de uma função onde nenhum dado está disponível e para resumir as relações entre duas ou mais variáveis. A extrapolação se refere ao uso de uma curva ajustada além da faixa dos dados observados e está sujeita a um grau de incerteza, pois pode refletir o método usado para construir a curva tanto quanto reflete os dados observados.

Ajustando funções a pontos de dados

Mais comumente, um se ajusta a uma função da forma y = f ( x ) .

Ajustando linhas e funções polinomiais a pontos de dados

Curvas polinomiais ajustando-se a uma função seno
Pontos de ajuste de curvas polinomiais gerados com uma função seno. A linha pontilhada preta é os dados "verdadeiros", a linha vermelha é um polinômio de primeiro grau , a linha verde é de segundo grau , a linha laranja é de terceiro grau e a linha azul é de quarto grau.

A equação polinomial de primeiro grau

é uma linha com inclinação a . Uma linha conectará quaisquer dois pontos, portanto, uma equação polinomial de primeiro grau é um ajuste exato através de quaisquer dois pontos com coordenadas x distintas.

Se a ordem da equação for aumentada para um polinômio de segundo grau, os seguintes resultados:

Isso ajustará exatamente uma curva simples a três pontos.

Se a ordem da equação for aumentada para um polinômio de terceiro grau, o seguinte é obtido:

Isso caberá exatamente em quatro pontos.

Uma declaração mais geral seria dizer que ela se encaixa exatamente em quatro restrições . Cada restrição pode ser um ponto, ângulo ou curvatura (que é o inverso do raio de um círculo osculante ). Restrições de ângulo e curvatura são geralmente adicionadas às extremidades de uma curva e, em tais casos, são chamadas de condições finais . Condições finais idênticas são freqüentemente usadas para garantir uma transição suave entre as curvas polinomiais contidas em uma única spline . Restrições de ordem superior, como "a mudança na taxa de curvatura", também podem ser adicionadas. Isso, por exemplo, seria útil no projeto de trevo de rodovia para entender a taxa de variação das forças aplicadas a um carro (ver puxão ), conforme ele segue o trevo, e para definir limites de velocidade razoáveis, de acordo.

A equação polinomial de primeiro grau também pode ser um ajuste exato para um único ponto e um ângulo, enquanto a equação polinomial de terceiro grau também pode ser um ajuste exato para dois pontos, uma restrição de ângulo e uma restrição de curvatura. Muitas outras combinações de restrições são possíveis para estes e para equações polinomiais de ordem superior.

Se houver mais de n  + 1 restrições ( n sendo o grau do polinômio), a curva polinomial ainda pode ser executada por essas restrições. Um ajuste exato para todas as restrições não é certo (mas pode acontecer, por exemplo, no caso de um polinômio de primeiro grau que se ajusta exatamente a três pontos colineares ). Em geral, entretanto, algum método é necessário para avaliar cada aproximação. O método dos mínimos quadrados é uma forma de comparar os desvios.

Existem várias razões dadas para obter um ajuste aproximado quando é possível simplesmente aumentar o grau da equação polinomial e obter uma correspondência exata:

  • Mesmo que exista uma correspondência exata, isso não significa necessariamente que ela possa ser facilmente descoberta. Dependendo do algoritmo usado, pode haver um caso divergente, em que o ajuste exato não pode ser calculado, ou pode levar muito tempo do computador para encontrar a solução. Esta situação pode exigir uma solução aproximada.
  • O efeito de tirar a média de pontos de dados questionáveis ​​em uma amostra, em vez de distorcer a curva para ajustá-los exatamente, pode ser desejável.
  • Fenômeno de Runge : polinômios de alta ordem podem ser altamente oscilatórios. Se uma curva atravessa dois pontos A e B , seria esperado que a curva iria correr um pouco perto do ponto médio de A e B , bem. Isso pode não acontecer com curvas polinomiais de alta ordem; eles podem até ter valores muito grandes em magnitude positiva ou negativa . Com polinômios de ordem inferior, é mais provável que a curva caia perto do ponto médio (é até garantido que percorra exatamente o ponto médio em um polinômio de primeiro grau).
  • Os polinômios de ordem inferior tendem a ser suaves e as curvas de polinômios de ordem superior tendem a ser "irregulares". Para definir isso com mais precisão, o número máximo de pontos de inflexão possíveis em uma curva polinomial é n-2 , onde n é a ordem da equação polinomial. Um ponto de inflexão é um local na curva onde muda de um raio positivo para negativo. Também podemos dizer que é aqui que ocorre a transição de "reter a água" para "derramar água". Observe que é apenas "possível" que polinômios de alta ordem sejam irregulares; elas também podem ser suaves, mas não há garantia disso, ao contrário das curvas polinomiais de ordem inferior. Um polinômio de décimo quinto grau pode ter, no máximo, treze pontos de inflexão, mas também pode ter onze, ou nove ou qualquer número ímpar até um. (Polinômios com graus pares podem ter qualquer número par de pontos de inflexão de n  - 2 até zero.)

O grau da curva polinomial sendo maior do que o necessário para um ajuste exato é indesejável por todas as razões listadas anteriormente para polinômios de alta ordem, mas também leva a um caso em que há um número infinito de soluções. Por exemplo, um polinômio de primeiro grau (uma linha) restrito por apenas um único ponto, em vez dos dois usuais, forneceria um número infinito de soluções. Isso levanta o problema de como comparar e escolher apenas uma solução, o que pode ser um problema para software e também para humanos. Por esse motivo, geralmente é melhor escolher o grau mais baixo possível para uma correspondência exata em todas as restrições, e talvez um grau ainda mais baixo, se um ajuste aproximado for aceitável.

Relação entre o rendimento do trigo e a salinidade do solo

Ajustando outras funções aos pontos de dados

Outros tipos de curvas, como funções trigonométricas (como seno e cosseno), também podem ser usados, em certos casos.

Na espectroscopia, os dados podem ser ajustados com Gaussian , Lorentzian , Voigt e funções relacionadas.

Na agricultura, a função sigmóide logística invertida (curva S) é usada para descrever a relação entre o rendimento da cultura e os fatores de crescimento. A figura azul foi feita por uma regressão sigmóide de dados medidos em terras agrícolas. Pode-se ver que inicialmente, ou seja, com baixa salinidade do solo, o rendimento da cultura reduz lentamente com o aumento da salinidade do solo, enquanto a partir daí a diminuição progride mais rapidamente.

Ajuste algébrico versus ajuste geométrico para curvas

Para análise algébrica de dados, "ajuste" geralmente significa tentar encontrar a curva que minimiza o deslocamento vertical ( eixo y ) de um ponto da curva (por exemplo, mínimos quadrados ordinários ). No entanto, para aplicações gráficas e de imagem, o ajuste geométrico visa fornecer o melhor ajuste visual; o que geralmente significa tentar minimizar a distância ortogonal à curva (por exemplo, o total de mínimos quadrados ) ou, de outra forma, incluir os dois eixos de deslocamento de um ponto da curva. Os ajustes geométricos não são populares porque geralmente requerem cálculos não lineares e / ou iterativos, embora tenham a vantagem de um resultado mais estético e geometricamente preciso.

Ajustando curvas planas a pontos de dados

Se uma função da forma não pode ser postulada, ainda se pode tentar ajustar uma curva plana .

Outros tipos de curvas, como seções cônicas (arcos circulares, elípticos, parabólicos e hiperbólicos) ou funções trigonométricas (como seno e cosseno), também podem ser usados, em certos casos. Por exemplo, as trajetórias de objetos sob a influência da gravidade seguem um caminho parabólico, quando a resistência do ar é ignorada. Conseqüentemente, a correspondência de pontos de dados de trajetória com uma curva parabólica faria sentido. As marés seguem padrões sinusoidais, portanto, os pontos de dados das marés devem ser combinados com uma onda senoidal ou a soma de duas ondas senoidais de períodos diferentes, se os efeitos da Lua e do Sol forem considerados.

Para uma curva paramétrica , é eficaz ajustar cada uma de suas coordenadas como uma função separada do comprimento do arco ; assumindo que os pontos de dados podem ser ordenados, a distância da corda pode ser usada.

Ajustando um círculo por ajuste geométrico

Ajuste do círculo com o método Coope, os pontos que descrevem um arco do círculo, centro (1; 1), raio 4.
diferentes modelos de montagem elíptica
Ajuste de elipse minimizando a distância algébrica (método de Fitzgibbon).

Coope aborda o problema de tentar encontrar o melhor ajuste visual do círculo para um conjunto de pontos de dados 2D. O método elegantemente transforma o problema normalmente não linear em um problema linear que pode ser resolvido sem o uso de métodos numéricos iterativos e, portanto, é muito mais rápido do que as técnicas anteriores.

Ajustando uma elipse por ajuste geométrico

A técnica acima é estendida para elipses gerais adicionando uma etapa não linear, resultando em um método que é rápido, mas encontra elipses visualmente agradáveis ​​de orientação e deslocamento arbitrários.

Superfícies de encaixe

Observe que, embora esta discussão tenha sido em termos de curvas 2D, muito dessa lógica também se estende a superfícies 3D, cada patch das quais é definido por uma rede de curvas em duas direções paramétricas, normalmente chamadas u e v . Uma superfície pode ser composta por um ou mais remendos de superfície em cada direção.

Programas

Muitos pacotes estatísticos , como R e software numérico , como o gnuplot , GNU Scientific Library , MLAB , Maple , MATLAB , Scilab , Mathematica , GNU Octave e SciPy incluem comandos para fazer o ajuste de curvas em uma variedade de cenários. Existem também programas escritos especificamente para fazer o ajuste de curvas; eles podem ser encontrados nas listas de programas de análise estatística e numérica , bem como na Categoria: Regressão e software de ajuste de curva .

Veja também

Referências

Leitura adicional

  • N. Chernov (2010), Circular and linear regression: Fitting circles and lines by least quadrados , Chapman & Hall / CRC, Monographs on Statistics and Applied Probability, Volume 117 (256 pp.). [2]