Ponderação de distância inversa - Inverse distance weighting

Ponderação de distância inversa ( IDW ) é um tipo de método determinístico para interpolação multivariada com um conjunto conhecido de pontos espalhados. Os valores atribuídos a pontos desconhecidos são calculados com uma média ponderada dos valores disponíveis nos pontos conhecidos.

O nome dado a este tipo de método foi motivado pela média ponderada aplicada, uma vez que recorre ao inverso da distância a cada ponto conhecido ("quantidade de proximidade") para atribuir pesos.

Definição do problema

O resultado esperado é uma atribuição discreta da função desconhecida em uma região de estudo:

onde fica a região de estudo.

O conjunto de pontos de dados conhecidos pode ser descrito como uma lista de tuplas :

A função é ser "suave" (contínua e uma vez diferenciável), ser exata ( ) e atender às expectativas intuitivas do usuário sobre o fenômeno sob investigação. Além disso, a função deve ser adequada para uma aplicação de computador a um custo razoável (hoje em dia, uma implementação básica provavelmente fará uso de recursos paralelos ).

Método de Shepard

Referência histórica

No Laboratório de Harvard para Computação Gráfica e Análise Espacial, a partir de 1965, uma coleção variada de cientistas convergiu para repensar, entre outras coisas, o que hoje chamamos de sistemas de informação geográfica .

A força motriz por trás do Laboratório, Howard Fisher, concebeu um programa de mapeamento por computador aprimorado que chamou de SYMAP, que, desde o início, Fisher queria melhorar a interpolação. Ele mostrou aos calouros da Harvard College seu trabalho no SYMAP, e muitos deles participaram de eventos do Laboratório. Um calouro, Donald Shepard, decidiu revisar a interpolação no SYMAP, resultando em seu famoso artigo de 1968.

O algoritmo de Shepard também foi influenciado pela abordagem teórica de William Warntz e outros do laboratório que trabalharam com análise espacial. Ele conduziu uma série de experimentos com o expoente da distância, decidindo por algo mais próximo do modelo gravitacional (expoente de -2). Shepard implementou não apenas a ponderação de distância inversa básica, mas também permitiu barreiras (permeáveis ​​e absolutas) para a interpolação.

Outros centros de pesquisa estavam trabalhando em interpolação nesta época, particularmente a Universidade de Kansas e seu programa SURFACE II. Mesmo assim, os recursos do SYMAP eram de última geração, embora tenham sido programados por um aluno de graduação.

Forma básica

Interpolação de Shepard para diferentes parâmetros de potência p , a partir de pontos dispersos na superfície

Uma forma geral de encontrar um valor interpolado em um determinado ponto com base em amostras para usar IDW é uma função de interpolação:

Onde

é uma função de ponderação IDW simples, conforme definido por Shepard, x denota um ponto interpolado (arbitrário), x i é um ponto de interpolação (conhecido), é uma determinada distância ( operador métrico ) do ponto conhecido x i ao ponto desconhecido x , N é o número total de pontos conhecidos usados ​​na interpolação e é um número real positivo, chamado de parâmetro de potência.

Aqui, o peso diminui à medida que a distância aumenta dos pontos interpolados. Valores maiores de atribuem maior influência aos valores mais próximos do ponto interpolado, com o resultado se transformando em um mosaico de ladrilhos (um diagrama de Voronoi ) com valor interpolado quase constante para grandes valores de p . Para duas dimensões, os parâmetros de potência fazem com que os valores interpolados sejam dominados por pontos distantes, uma vez que com uma densidade de pontos de dados e pontos vizinhos entre distâncias a , o peso somado é de aproximadamente

que diverge para e . Para dimensões M , o mesmo argumento é válido para . Para a escolha do valor de p , pode-se considerar o grau de suavização desejado na interpolação, a densidade e distribuição das amostras sendo interpoladas, e a distância máxima na qual uma amostra individual pode influenciar as vizinhas.

O método de Shepard é uma consequência da minimização de um funcional relacionado a uma medida de desvios entre tuplas de pontos de interpolação { x , u } e i tuplas de pontos interpolados { x i , u i }, definidos como:

derivado da condição de minimização:

O método pode ser facilmente estendido a outros espaços dimensionais e é de fato uma generalização da aproximação de Lagrange em espaços multidimensionais. Uma versão modificada do algoritmo projetado para interpolação trivial foi desenvolvida por Robert J. Renka e está disponível no Netlib como algoritmo 661 na biblioteca de toms.

Exemplo em 1 dimensão

Interpolação de Shepard em 1 dimensão, a partir de 4 pontos espalhados e usando p = 2

Métrica Łukaszyk – Karmowski

Ainda outra modificação do método de Shepard foi proposta por Łukaszyk também em aplicações à mecânica experimental. A função de ponderação proposta tinha a forma

onde é a métrica Łukaszyk – Karmowski escolhida também em relação às distribuições de probabilidade de erro estatístico de medição dos pontos interpolados.

Método de Shepard modificado

Outra modificação do método de Shepard calcula o valor interpolado usando apenas os vizinhos mais próximos dentro da esfera R (em vez da amostra completa). Os pesos são ligeiramente modificados neste caso:

Quando combinado com uma estrutura de busca espacial rápida (como kd-tree ), torna-se um método de interpolação N log N eficiente , adequado para problemas de grande escala.

Referências

  1. ^ Chrisman, Nicholas. "História do Harvard Laboratory for Computer Graphics: a Poster Exhibit" (PDF) .
  2. ^ a b Shepard, Donald (1968). "Uma função de interpolação bidimensional para dados com espaçamento irregular". Proceedings of the 1968 ACM National Conference . pp. 517–524. doi : 10.1145 / 800186.810616 .
  3. ^ Łukaszyk, S. (2004). “Um novo conceito de métrica de probabilidade e suas aplicações na aproximação de conjuntos de dados dispersos”. Mecânica Computacional . 33 (4): 299–304. doi : 10.1007 / s00466-003-0532-2 .

Veja também