Convolução - Convolution

Comparação visual de convolução, correlação cruzada e autocorrelação . Para as operações envolvendo a função f , e assumindo que a altura de f seja 1,0, o valor do resultado em 5 pontos diferentes é indicado pela área sombreada abaixo de cada ponto. Além disso, a simetria de f é a razão e são idênticas neste exemplo.

Em matemática (em particular, análise funcional ), a convolução é uma operação matemática em duas funções ( f e g ) que produz uma terceira função ( ) que expressa como a forma de uma é modificado pela outra. O termo convolução se refere à função de resultado e ao processo de computá-la. É definido como a integral do produto das duas funções depois que uma é revertida e deslocada. A integral é avaliada para todos os valores de deslocamento, produzindo a função de convolução.

Algumas características da convolução são semelhantes à correlação cruzada : para funções de valor real, de uma variável contínua ou discreta, ela difere da correlação cruzada ( ) apenas porque f ( x ) ou g ( x ) é refletido sobre o y -eixo; portanto, é uma correlação cruzada de f ( x ) e g (- x ) , ou f (- x ) e g ( x ) . Para funções de valor complexo, o operador de correlação cruzada é o adjunto do operador de convolução.

A convolução tem aplicações que incluem probabilidade , estatística , acústica , espectroscopia , processamento de sinal e processamento de imagem , engenharia , física , visão computacional e equações diferenciais .

A convolução pode ser definida para funções no espaço euclidiano e outros grupos . Por exemplo, funções periódicas , como a transformação de Fourier de tempo discreto , podem ser definidas em um círculo e convolvidas por convolução periódica . (Consulte a linha 18 em DTFT § Properties .) Uma convolução discreta pode ser definida para funções no conjunto de inteiros .

As generalizações de convolução têm aplicações no campo da análise numérica e álgebra linear numérica e no projeto e implementação de filtros de resposta a impulso finito no processamento de sinais.

O cálculo do inverso da operação de convolução é conhecido como deconvolução .

Definição

A convolução de f e g é escrito f * g , denotando o operador com o símbolo * . É definido como a integral do produto das duas funções depois que uma é revertida e deslocada. Como tal, é um tipo particular de transformação integral :

Uma definição equivalente é (ver comutatividade ):

Embora o símbolo t seja usado acima, ele não precisa representar o domínio do tempo. Mas, nesse contexto, a fórmula de convolução pode ser descrita como a área sob a função f ( τ ) ponderada pela função g (- τ ) deslocada pela quantidade t . À medida que t muda, a função de ponderação g ( t - τ ) enfatiza diferentes partes da função de entrada f ( τ ) .

Para funções f , g suportadas apenas em [0, ∞) (ou seja, zero para argumentos negativos), os limites de integração podem ser truncados, resultando em:

Para a formulação multidimensional da convolução, consulte o domínio de definição (abaixo).

Notação

Uma convenção comum de notação de engenharia é:

que deve ser interpretado com cuidado para evitar confusão. Por exemplo, f ( t ) ∗ g ( t - t 0 ) é equivalente a ( fg ) ( t - t 0 ) , mas f ( t - t 0 ) ∗ g ( t - t 0 ) é de fato equivalente a ( fg ) ( t - 2 t 0 ) .

Derivações

A convolução descreve a saída (em termos de entrada) de uma importante classe de operações conhecida como linear invariante no tempo (LTI). Consulte a teoria do sistema LTI para obter uma derivação da convolução como resultado das restrições LTI. Em termos das transformadas de Fourier da entrada e saída de uma operação LTI, nenhum novo componente de frequência é criado. Os existentes são apenas modificados (amplitude e / ou fase). Em outras palavras, a transformação de saída é o produto pontual da transformação de entrada com uma terceira transformação (conhecida como função de transferência ). Veja o teorema da convolução para uma derivação dessa propriedade de convolução. Por outro lado, a convolução pode ser derivada como a transformada de Fourier inversa do produto pontual de duas transformadas de Fourier.

Explicação visual

  1. Expresse cada função em termos de uma variável fictícia
  2. Reflita uma das funções: →
  3. Adicione um deslocamento de tempo, t , que permite deslizar ao longo do eixo.
  4. Comece t em −∞ e deslize-o totalmente para + ∞ . Onde quer que as duas funções se cruzem, encontre a integral de seu produto. Em outras palavras, no tempo t , calcule a área sob a função ponderada pela função de ponderação

A forma de onda resultante (não mostrada aqui) é a convolução das funções f e g .

Se f ( t ) é um impulso unitário , o resultado desse processo é simplesmente g ( t ) . Formalmente:

Convolution3.svg
Neste exemplo, o "pulso" de cor vermelha é uma função par, portanto a convolução é equivalente à correlação. Um instantâneo deste "filme" mostra funções e (em azul) para algum valor de parâmetro que é arbitrariamente definido como a distância do eixo ao centro do pulso vermelho. A quantidade de amarelo é a área do produto calculada pela integral de convolução / correlação. O filme é criado alterando e recalculando continuamente o integral. O resultado (mostrado em preto) é uma função de, mas é plotado no mesmo eixo para conveniência e comparação. Convolução do sinal de caixa com si mesmo2.gif
Nesta representação, poderia representar a resposta de um circuito RC a um pulso estreito que ocorre em Em outras palavras, se o resultado da convolução for justo Mas quando é o pulso mais largo (em vermelho), a resposta é uma versão "manchada" de Ele começa em porque definimos como a distância do eixo ao centro do pulso largo (em vez da borda de ataque). Convolução da função pontiaguda com box2.gif

Desenvolvimentos históricos

Um dos primeiros usos da integral de convolução apareceu na derivação de D'Alembert do teorema de Taylor em Recherches sur différents points importants du système du monde, publicado em 1754.

Além disso, uma expressão do tipo:

é usado por Sylvestre François Lacroix na página 505 de seu livro intitulado Tratado sobre diferenças e série , que é o último dos 3 volumes da série enciclopédica: Traité du calcul différentiel et du calcul intégral , Chez Courcier, Paris, 1797-1800. Logo depois disso, as operações de convolução aparecem nas obras de Pierre Simon Laplace , Jean-Baptiste Joseph Fourier , Siméon Denis Poisson e outros. O próprio termo não se tornou amplamente utilizado até os anos 1950 ou 1960. Antes de que foi, por vezes, conhecido como Faltung (cujos meios dobráveis em alemão ), produto da composição , integrante sobreposição , e integrante de Carson . No entanto, ele aparece já em 1903, embora a definição seja bastante desconhecida em usos mais antigos.

A operação:

é um caso particular de produtos de composição considerados pelo matemático italiano Vito Volterra em 1913.

Convolução circular

Quando uma função g T é periódica, com período T , então para funções, f , tal que fg T existe, a convolução também é periódica e idêntica a:

onde t 0 é uma escolha arbitrária. O somatório é denominado somatório periódico da função f .

Quando g T é uma soma periódica de outra função, g , então fg T é conhecido como uma convolução circular ou cíclica de f e g .

E se o somatório periódica acima é substituído por f T , a operação é chamada um periódica convolução de f o t e g t .

Convolução discreta

Para funções de valor complexo f , g definidas no conjunto Z de inteiros, a convolução discreta de f e g é dada por:

ou equivalentemente (ver comutatividade ) por:

A convolução de duas sequências finitas é definida pela extensão das sequências para funções com suporte finito no conjunto de inteiros. Quando as sequências são os coeficientes de dois polinômios , então os coeficientes do produto comum dos dois polinômios são a convolução das duas sequências originais. Isso é conhecido como o produto de Cauchy dos coeficientes das sequências.

Assim, quando g tem suporte finito no conjunto (representando, por exemplo, uma resposta de impulso finita ), uma soma finita pode ser usada:

Convolução discreta circular

Quando uma função g N é periódica, com período N , então para funções, f , tal que fg N existe, a convolução também é periódica e idêntica a:

A soma em k é chamada de soma periódica da função f .

Se g N é uma soma periódica de outra função, g , então fg N é conhecido como uma convolução circular de f e g .

Quando as durações diferentes de zero de f e g são limitadas ao intervalo [0, N - 1]fg N se reduz a estas formas comuns:

 

 

 

 

( Eq.1 )

A notação ( f * N g ) para cíclico convolução denota convolução sobre o grupo cíclico de inteiros módulo N .

A convolução circular surge mais frequentemente no contexto de convolução rápida com um algoritmo de transformada rápida de Fourier (FFT).

Algoritmos de convolução rápida

Em muitas situações, convoluções discretas podem ser convertidas em circulares de modo que as transformações rápidas com uma propriedade de convolução possam ser usadas para implementar o cálculo. Por exemplo, a convolução de sequências de dígitos é a operação de kernel na multiplicação de números de vários dígitos, que pode, portanto, ser implementada de forma eficiente com técnicas de transformação ( Knuth 1997 , §4.3.3.C; von zur Gathen & Gerhard 2003 , §8.2).

A Eq.1 requer N operações aritméticas por valor de saída e N 2 operações para N saídas. Isso pode ser reduzido significativamente com qualquer um dos vários algoritmos rápidos. O processamento digital de sinais e outras aplicações normalmente usam algoritmos de convolução rápida para reduzir o custo da convolução para acomplexidadeO ( N log N ).

Os algoritmos de convolução rápida mais comuns usam algoritmos de transformada rápida de Fourier (FFT) por meio do teorema da convolução circular . Especificamente, a convolução circular de duas sequências de comprimento finito é encontrada tomando uma FFT de cada sequência, multiplicando pontualmente e, em seguida, executando uma FFT inversa. As convoluções do tipo definido acima são então eficientemente implementadas usando essa técnica em conjunto com a extensão zero e / ou descartando porções da saída. Outros algoritmos de convolução rápida, como o algoritmo Schönhage-Strassen ou a transformada de Mersenne, usam transformadas rápidas de Fourier em outros anéis .

Se uma sequência for muito mais longa do que a outra, a extensão zero da sequência mais curta e a convolução circular rápida não é o método mais eficiente computacionalmente disponível. Em vez disso, decompor a sequência mais longa em blocos e convolver cada bloco permite algoritmos mais rápidos, como o método overlap-save e o método overlap-add . Um método de convolução híbrido que combina algoritmos de bloco e FIR permite uma latência de entrada-saída zero que é útil para cálculos de convolução em tempo real.

Domínio de definição

A convolução de duas funções de valor complexo em R d é ela própria uma função de valor complexo em R d , definida por:

e é bem definida somente se f e g decaimento de maneira suficientemente rápida no infinito, para o integrante de existir. As condições para a existência da convolução podem ser complicadas, uma vez que uma explosão em g no infinito pode ser facilmente compensada por um declínio suficientemente rápido em f . A questão da existência, portanto, pode envolver diferentes condições em f e g :

Funções com suporte compacto

Se f e g são compactamente suportado funções continuas , então a sua convoluo existente, e é também suportada de forma compacta e contínua ( Hörmander 1983 , Capítulo 1). De maneira mais geral, se uma das funções (digamos f ) for compactamente suportada e a outra for localmente integrável , então a convolução fg é bem definida e contínua.

Convolução de f e g é também bem definida quando ambas as funções são localmente quadrado integrável em R e suportado num intervalo da forma [ a , + ∞) (ou ambos suportados [-∞, um ] ).

Funções integráveis

A convolução de f e g existe se f e g são ambos funções integráveis Lebesgue em L 1 ( R d ) , e, neste caso, f * g também é integrável ( Stein & Weiss, 1971 , Teorema 1,3). Isso é uma consequência do teorema de Tonelli . Isso também é verdadeiro para funções em L 1 , sob a convolução discreta ou, mais geralmente, para a convolução em qualquer grupo .

Da mesma forma, se fL 1 ( R d ) e   gL p ( R d ) onde 1 ≤ p ≤ ∞ , então   fgL p ( R d ), e

No caso particular p = 1 , isto mostra que L 1 é uma álgebra Banach sob a convolução (e igualdade dos dois lados se mantém f e g são não-negativo quase em toda a parte).

De maneira mais geral, a desigualdade de Young implica que a convolução é um mapa bilinear contínuo entre espaços L p adequados . Especificamente, se 1 ≤ p , q , r ≤ ∞ satisfaça:

então

de modo que a convolução é um mapeamento bilinear contínuo de L p × L q a L r . A desigualdade de Young para convolução também é verdadeira em outros contextos (grupo de círculo, convolução em Z ). A desigualdade anterior não é nítida na linha real: quando 1 < p , q , r <∞ , existe uma constante B p , q <1 tal que:

O valor ótimo de B p , q foi descoberto em 1975 e de forma independente em 1976, veja a desigualdade de Brascamp-Lieb .

Uma estimativa mais forte é verdadeira, desde que 1 < p , q , r <∞ :

onde está a norma L q fraca . A convolução também define um mapa contínuo bilinear para , devido à fraca desigualdade de Young:

Funções de decadência rápida

Além de funções com suporte compacto e funções integráveis, funções que têm decaimento suficientemente rápido no infinito também podem ser convolvidas. Uma característica importante da convolução é que se f e g decaem rapidamente, então fg também decai rapidamente. Em particular, se f e g são diminuindo rapidamente funções , então também o é a convolução f * g . Combinado com o fato de que convolução comuta com diferenciação (veja #Properties ), segue-se que a classe de funções de Schwartz é fechada sob convolução ( Stein & Weiss 1971 , Teorema 3.3).

Distribuições

Em algumas circunstâncias, é possível definir a convolução de uma função com uma distribuição ou de duas distribuições. Se f é uma função compactamente suportada e g é uma distribuição, então fg é uma função suave definida por uma fórmula de distribuição análoga a

De forma mais geral, é possível estender a definição da convolução de uma maneira única para que a lei associativa

permanece válido no caso em que f é uma distribuição eg uma distribuição compactamente suportada ( Hörmander 1983 , §4.2).

Medidas

A convolução de quaisquer duas medidas de Borel μ e ν de variação limitada é a medida definida por ( Rudin 1962 )

Em particular,

onde é um conjunto mensurável e é a função de indicador de .

Isso está de acordo com a convolução definida acima quando μ e ν são considerados como distribuições, bem como a convolução das funções L 1 quando μ e ν são absolutamente contínuos em relação à medida de Lebesgue.

A convolução das medidas também satisfaz a seguinte versão da desigualdade de Young

onde a norma é a variação total de uma medida. Como o espaço de medidas de variação limitada é um espaço de Banach , a convolução de medidas pode ser tratada com métodos padrão de análise funcional que podem não se aplicar à convolução de distribuições.

Propriedades

Propriedades algébricas

A convolução define um produto no espaço linear de funções integráveis. Este produto satisfaz as seguintes propriedades algébricas, que formalmente significam que o espaço de funções integráveis ​​com o produto dado pela convolução é uma álgebra associativa comutativa sem identidade ( Strichartz 1994 , §3.3). Outros espaços lineares de funções, como o espaço de funções contínuas de suporte compacto, são fechados sob a convolução e, portanto, também formam álgebras associativas comutativas.

Comutatividade
Prova: Por definição:
A seguir, alterando a variável de integração para o resultado.
Associatividade
Prova: Isso decorre do uso do teorema de Fubini (isto é, integrais duplos podem ser avaliados como integrais iterados em qualquer ordem).
Distributividade
Prova: Isso decorre da linearidade da integral.
Associatividade com multiplicação escalar
para qualquer número real (ou complexo) .
Identidade multiplicativa
Nenhuma álgebra de funções possui uma identidade para a convolução. A falta de identidade normalmente não é um grande inconveniente, uma vez que a maioria das coleções de funções nas quais a convolução é realizada podem ser convolvidas com uma distribuição delta (um impulso unitário, centrado em zero) ou, pelo menos (como é o caso de L 1 ) admitir aproximações à identidade . O espaço linear de distribuições compactamente suportadas, entretanto, admite uma identidade sob a convolução. Especificamente,
onde δ é a distribuição delta.
Elemento inverso
Algumas distribuições S têm um elemento inverso S −1 para a convolução que então deve satisfazer
a partir da qual uma fórmula explícita para S −1 pode ser obtida.
O conjunto de distribuições invertíveis forma um grupo abeliano sob a convolução.
Conjugação complexa
Relação com diferenciação
Prova:
Relacionamento com integração
Se e então

Integração

Se f e g são funções integráveis, em seguida, o integrante da sua convolução em todo o espaço é simplesmente obtido como o produto de suas integrais:

Isso decorre do teorema de Fubini . O mesmo resultado é válido se f e g são considerados apenas para ser funções mensuráveis não-negativos, por teorema de Tonelli .

Diferenciação

No caso de uma variável,

onde d / dx é a derivada . De forma mais geral, no caso de funções de várias variáveis, uma fórmula análoga é válida para a derivada parcial :

Uma consequência desta situação é que a convolução pode ser visto como uma operação de "alisamento": a convolução de f e g é diferenciável tantas vezes quanto f e g são, no total.

Estas identidades mantenha sob a condição exacta que f e g são absolutamente integrável e pelo menos um deles tem um absolutamente integrável (L 1 ) derivado fraco, como consequência da desigualdade de convolução de Young . Por exemplo, quando f é continuamente diferenciável com suporte compacto eg é uma função arbitrária localmente integrável,

Essas identidades também se aplicam de forma muito mais ampla no sentido de distribuições temperadas se uma de f ou g for uma distribuição temperada de decréscimo rápido , uma distribuição temperada compactamente suportada ou uma função de Schwartz e a outra for uma distribuição temperada. Por outro lado, duas funções integráveis ​​positivas e infinitamente diferenciáveis ​​podem ter uma convolução contínua em lugar nenhum.

No caso discreto, o operador de diferença D f ( n ) = f ( n + 1) - f ( n ) satisfaz uma relação análoga:

Teorema de convolução

O teorema da convolução afirma que

onde denota a transformada de Fourier de , e é uma constante que depende da normalização específica da transformada de Fourier. Versões deste teorema também conter para a transformar Laplace , Transformada de Laplace bilateral , Z-transform e Mellin transformam .

Por outro lado, se for a matriz da transformada de Fourier , então

,

onde está o produto de divisão de face , denota o produto Kronecker , denota o produto Hadamard (este resultado é uma evolução das propriedades do esboço de contagem ).

Equivariância translacional

A convolução comuta com traduções, o que significa que

onde τ x f é a tradução da função f por x definida por

Se f é uma função de Schwartz , então τ x f é a convolução com uma função delta de Dirac traduzida τ x f = fτ x δ . Assim, a invariância de translação da convolução das funções de Schwartz é uma consequência da associatividade da convolução.

Além disso, sob certas condições, a convolução é a operação invariante de tradução mais geral. Falando informalmente, o seguinte é válido

Suponha que S seja um operador linear limitado agindo sobre funções que comutam com translações: S ( τ x f ) = τ x ( Sf ) para todo x . Então S é dado como convolução com uma função (ou distribuição) g S ; isto é Sf = g Sf .

Assim, algumas operações invariantes de tradução podem ser representadas como convolução. As convoluções desempenham um papel importante no estudo de sistemas invariantes no tempo e , especialmente , na teoria do sistema LTI . O que representa a função g S é a resposta ao impulso da transformação S .

Uma versão mais precisa do teorema citado acima requer a especificação da classe de funções na qual a convolução é definida e também requer a suposição de que S deve ser um operador linear contínuo com respeito à topologia apropriada . Sabe-se, por exemplo, que todo operador linear contínuo invariante à translação contínua em L 1 é a convolução com medida de Borel finita . Mais geralmente, todo operador linear contínuo invariante de translação contínua em L p para 1 ≤ p <∞ é a convolução com uma distribuição temperada cuja transformada de Fourier é limitada. A saber, todos eles são dados por multiplicadores de Fourier limitados .

Convoluções em grupos

Se G é um grupo adequado dotado de uma medida λ, e se f e g são funções integráveis reais ou complexas de valor em G , então podemos definir sua convolução por

Não é comutativo em geral. Em casos típicos de interesse, G é um grupo topológico localmente compacto de Hausdorff e λ é uma medida de Haar (à esquerda) . Nesse caso, a menos que G seja unimodular , a convolução definida desta forma não é a mesma que . A preferência de um sobre o outro é feita de modo que a convolução com uma função fixa g comute com a translação à esquerda no grupo:

Além disso, a convenção também é necessária para que haja consistência com a definição de convolução de medidas apresentada a seguir. No entanto, com uma medida de Haar à direita em vez de à esquerda, a última integral tem preferência sobre a primeira.

Em grupos abelianos localmente compactos , uma versão do teorema da convolução é válida: a transformada de Fourier de uma convolução é o produto pontual das transformadas de Fourier. O grupo de círculo T com a medida de Lebesgue é um exemplo imediato. Para um g fixo em L 1 ( T ), temos o seguinte operador familiar agindo no espaço de Hilbert L 2 ( T ):

O operador T é compacto . Um cálculo direto mostra que seu T * adjacente é convolução com

Pela propriedade de comutatividade citada acima, T é normal : T * T = TT *. Além disso, T comuta com os operadores de tradução. Considere a família S de operadores que consiste em todas essas convoluções e os operadores de tradução. Então S é uma família de operadores normais que se deslocam diariamente. De acordo com a teoria espectral , existe uma base ortonormal { h k } que diagonaliza S simultaneamente . Isso caracteriza as convoluções no círculo. Especificamente, temos

que são precisamente os caracteres de T . Cada convolução é um operador de multiplicação compacto nesta base. Isso pode ser visto como uma versão do teorema da convolução discutido acima.

Um exemplo discreto é um grupo cíclico finito de ordem n . Os operadores de convolução são aqui representados por matrizes circulantes e podem ser diagonalizados pela transformada discreta de Fourier .

Um resultado semelhante é válido para grupos compactos (não necessariamente abelianos): os coeficientes da matriz de representações unitárias de dimensão finita formam uma base ortonormal em L 2 pelo teorema de Peter-Weyl , e um análogo do teorema da convolução continua a ser, junto com muitos outros aspectos da análise harmônica que dependem da transformada de Fourier.

Convolução de medidas

Seja G um grupo topológico (escrito multiplicativamente). Se μ e ν são medidas de Borel finitas em G , então sua convolução μν é definida como a medida pushforward da ação do grupo e pode ser escrita como

para cada subconjunto mensurável E de L . A convolução também é uma medida finita, cuja variação total satisfaz

No caso em que G é localmente compacto com (esquerda-) medida Haar λ, e μ e ν são absolutamente contínuos em relação a λ, de modo que cada um tem uma função de densidade , então a convolução μ ∗ ν também é absolutamente contínua, e sua função de densidade é apenas a convolução das duas funções de densidade separadas.

Se μ e ν são medidas de probabilidade no grupo topológico ( R , +), então a convolução μν é a distribuição de probabilidade da soma X + Y de duas variáveis ​​aleatórias independentes X e Y cujas respectivas distribuições são μ e ν.

Bialgebras

Seja ( X , Δ, ∇, ε , η ) uma bialgebra com comultiplicação Δ, multiplicação ∇, unidade η e contagem ε . A convolução é um produto definido na álgebra do endomorfismo End ( X ) como segue. Seja φ , ψ ∈ End ( X ), ou seja, φ , ψ : XX são funções que respeitam toda a estrutura algébrica de X , então a convolução φψ é definida como a composição

A convolução aparece notavelmente na definição de álgebras de Hopf ( Kassel 1995 , §III.3). Uma bialgebra é uma álgebra de Hopf se e somente se tiver um antípoda: um endomorfismo S tal que

Formulários

O desfoque gaussiano pode ser usado para obter uma imagem digital em tons de cinza suave de uma impressão em meio - tom .

Convolução e operações relacionadas são encontradas em muitas aplicações em ciências, engenharia e matemática.

Veja também

Notas

Referências

Leitura adicional

links externos