Gradiente - Gradient

O gradiente, representado pelas setas azuis, denota a direção da maior mudança de uma função escalar. Os valores da função são representados em escala de cinza e aumentam em valor de branco (baixo) para escuro (alto).

No cálculo vetorial , o gradiente de uma função diferenciável de valor escalar f de várias variáveis é o campo vetorial (ou função de valor vetorial ) cujo valor em um ponto é o vetor cujas componentes são as derivadas parciais de at . Isto é, pois , seu gradiente é definido no ponto no espaço n- dimensional como o vetor:

O símbolo nabla , escrito como um triângulo invertido e pronunciado "del", denota o operador diferencial do vetor .

O vetor gradiente pode ser interpretado como a "direção e taxa de aumento mais rápido". Se o gradiente de uma função é diferente de zero em um ponto p , a direção do gradiente é a direção em que a função aumenta mais rapidamente de p , e a magnitude do gradiente é a taxa de aumento nessa direção, o maior derivada direcional absoluta . Além disso, o gradiente é o vetor zero em um ponto se e somente se for um ponto estacionário (onde a derivada desaparece). O gradiente, portanto, desempenha um papel fundamental na teoria da otimização , onde é usado para maximizar uma função pela subida do gradiente .

O gradiente é dual para a derivada total : o valor do gradiente em um ponto é um vetor tangente - um vetor em cada ponto; enquanto o valor da derivada em um ponto é um vetor co tangente - uma função linear em vetores. Eles estão relacionados porque o produto escalar do gradiente de f em um ponto p com outro vetor tangente v é igual à derivada direcional de f em p da função ao longo de v ; isto é ,. O gradiente admite múltiplas generalizações para funções mais gerais em variedades ; veja § Generalizações .

Motivação

O gradiente da função 2D f ( x , y ) = xe - ( x 2 + y 2 ) é traçado como setas azuis sobre o gráfico de pseudocolor da função.

Considere uma sala onde a temperatura é dada por um campo escalar , T , então em cada ponto ( x , y , z ) a temperatura é T ( x , y , z ) , independente do tempo. Em cada ponto da sala, o gradiente de T naquele ponto mostrará a direção em que a temperatura sobe mais rapidamente, afastando-se de ( x , y , z ) . A magnitude do gradiente determinará a rapidez com que a temperatura sobe nessa direção.

Considere uma superfície cuja altura acima do nível do mar no ponto ( x , y ) seja H ( x , y ) . O gradiente de H num ponto representa um vector que aponta plano na direcção da inclinação mais acentuada ou grau naquele ponto. A inclinação da inclinação naquele ponto é dada pela magnitude do vetor gradiente.

O gradiente também pode ser usado para medir como um campo escalar muda em outras direções, ao invés de apenas na direção de maior mudança, tomando um produto escalar . Suponha que a inclinação mais acentuada em uma colina seja de 40%. Uma estrada que vai diretamente para cima tem uma inclinação de 40%, mas uma estrada que vai ao redor da colina em um ângulo terá uma inclinação mais rasa. Por exemplo, se a estrada está em um ângulo de 60 ° da direção de subida (quando ambas as direções são projetadas no plano horizontal), então a inclinação ao longo da estrada será o produto escalar entre o vetor gradiente e um vetor unitário ao longo da estrada , ou seja, 40% vezes o cosseno de 60 °, ou 20%.

De forma mais geral, se a função de altura da colina H é diferenciável , então o gradiente de H pontilhado com um vetor unitário fornece a inclinação da colina na direção do vetor, a derivada direcional de H ao longo do vetor unitário.

Notação

O gradiente de uma função no ponto geralmente é escrito como . Também pode ser denotado por qualquer um dos seguintes:

  •  : para enfatizar a natureza vetorial do resultado.
  • grad f
  • e  : notação de Einstein .

Definição

O gradiente da função f ( x , y ) = - (cos 2 x + cos 2 y ) 2 representado como um campo vetorial projetado no plano inferior.

O gradiente (ou campo vetorial gradiente) de uma função escalar f ( x 1 , x 2 , x 3 ,…, x n ) é denotado f ou f onde ( nabla ) denota o operador diferencial vetorial , del . A notação grad f também é comumente usada para representar o gradiente. O gradiente de f é definido como o campo vetorial único cujo produto escalar com qualquer vetor v em cada ponto x é a derivada direcional de f ao longo de v . Isso é,

Formalmente, o gradiente é dual para a derivada; veja a relação com a derivada .

Quando uma função também depende de um parâmetro como o tempo, o gradiente geralmente se refere apenas ao vetor de suas derivadas espaciais (consulte Gradiente espacial ).

A magnitude e a direção do vetor gradiente são independentes da representação de coordenadas particular .

Coordenadas cartesianas

No sistema de coordenadas cartesianas tridimensional com uma métrica euclidiana , o gradiente, se existir, é dado por:

onde i , j , k são os vetores unitários padrão nas direções das coordenadas x , y e z , respectivamente. Por exemplo, o gradiente da função

é

Em algumas aplicações, é comum representar o gradiente como um vetor linha ou vetor coluna de seus componentes em um sistema de coordenadas retangulares; este artigo segue a convenção do gradiente sendo um vetor coluna, enquanto a derivada é um vetor linha.

Coordenadas cilíndricas e esféricas

Em coordenadas cilíndricas com uma métrica euclidiana, o gradiente é dado por:

onde ρ é a distância axial, φ é o ângulo azimutal ou azimutal, z é a coordenada axial e e ρ , e φ e e z são vetores unitários apontando ao longo das direções das coordenadas.

Em coordenadas esféricas , o gradiente é dado por:

onde r é a distância radial, φ é o ângulo azimutal e θ é o ângulo polar e e r , e θ e e φ são novamente vetores unitários locais apontando nas direções das coordenadas (isto é, a base covariante normalizada ).

Para o gradiente em outros sistemas de coordenadas ortogonais , consulte Coordenadas ortogonais (operadores diferenciais em três dimensões) .

Coordenadas gerais

Consideramos coordenadas gerais , que escrevemos como x 1 ,…, x i ,…, x n , onde n é o número de dimensões do domínio. Aqui, o índice superior se refere à posição na lista da coordenada ou componente, então x 2 se refere ao segundo componente - não à quantidade x ao quadrado. A variável de índice i refere-se a um elemento arbitrário x i . Usando a notação de Einstein , o gradiente pode ser escrito como:

(Observe que seu dual é ),

onde e referem-se às bases covariantes e contravariantes locais não normalizadas respectivamente, é o tensor métrico inverso , e a convenção de soma de Einstein implica a soma sobre i e j .

Se as coordenadas são ortogonais, podemos facilmente expressar o gradiente (e o diferencial ) em termos das bases normalizadas, às quais nos referimos como e , usando os fatores de escala (também conhecidos como coeficientes de Lamé )  :

(e ),

onde não podemos usar a notação de Einstein, pois é impossível evitar a repetição de mais de dois índices. Apesar do uso de índices superiores e inferiores, , , e são nem contravariant nem covariante.

A última expressão avalia as expressões fornecidas acima para coordenadas cilíndricas e esféricas.

Relacionamento com derivado

Relação com derivada total

O gradiente está intimamente relacionado à derivada total ( diferencial total ) : eles são transpostos ( duais ) entre si. Usando a convenção de que os vetores em são representados por vetores de coluna , e que covetores (mapas lineares ) são representados por vetores de linha , o gradiente e a derivada são expressos como um vetor de coluna e linha, respectivamente, com os mesmos componentes, mas transpondo cada um de outros:

Embora ambos tenham os mesmos componentes, eles diferem no tipo de objeto matemático que representam: em cada ponto, a derivada é um vetor cotangente , uma forma linear ( covetor ) que expressa o quanto a saída (escalar) muda para um determinado infinitesimal mudança na entrada (vetorial), enquanto em cada ponto, o gradiente é um vetor tangente , que representa uma mudança infinitesimal na entrada (vetorial). Nos símbolos, o gradiente é um elemento do espaço tangente em um ponto , enquanto a derivada é um mapa do espaço tangente para os números reais ,. Os espaços tangentes em cada ponto de podem ser identificados "naturalmente" com o próprio espaço vetorial e, da mesma forma, o espaço cotangente em cada ponto pode ser identificado naturalmente com o espaço vetorial dual de covetores; assim, o valor do gradiente em um ponto pode ser considerado um vetor no original , não apenas um vetor tangente.

Computacionalmente, dado um vetor tangente, o vetor pode ser multiplicado pela derivada (como matrizes), que é igual a tomar o produto escalar com o gradiente:

Diferencial ou derivado (exterior)

A melhor aproximação linear para uma função diferenciável

em um ponto x em R n é um mapa linear de R n a R que é freqüentemente denotado por df x ou Df ( x ) e chamado de diferencial ou derivada total de f em x . A função df , que mapeia x para df x , é chamada de diferencial total ou derivada externa de f e é um exemplo de forma diferencial 1 .

Assim como a derivada de uma função de uma única variável representa a inclinação da tangente ao gráfico da função, a derivada direcional de uma função em várias variáveis ​​representa a inclinação do hiperplano tangente na direção do vetor.

O gradiente está relacionado ao diferencial pela fórmula

para qualquer vR n , onde é o produto escalar : tomar o produto escalar de um vetor com o gradiente é o mesmo que tirar a derivada direcional ao longo do vetor.

Se R n é visto como o espaço de (dimensão n ) vetores coluna (de números reais), então pode-se considerar df como o vetor linha com componentes

de modo que df x ( v ) é dado pela multiplicação de matrizes . Assumindo a métrica euclidiana padrão em R n , o gradiente é então o vetor de coluna correspondente, ou seja,

Aproximação linear para uma função

A melhor aproximação linear para uma função pode ser expressa em termos de gradiente, em vez de derivada. O gradiente de uma função f do espaço euclidiano R n para R em qualquer ponto x 0 em R n caracteriza a melhor aproximação linear para f em x 0 . A aproximação é a seguinte:

para x próximo de x 0 , onde (∇ f  ) x 0 é o gradiente de f calculado em x 0 , e o ponto denota o produto escalar em R n . Essa equação é equivalente aos dois primeiros termos na expansão multivariável da série de Taylor de f em x 0 .

Relacionamento com derivado de Fréchet

Seja U um conjunto aberto em R n . Se a função f  : UR é diferenciável, então a diferencial de f é a derivada de Fréchet de f . Assim, f é uma função de U para o espaço R n tal que

onde · é o produto escalar.

Como consequência, as propriedades usuais da derivada são válidas para o gradiente, embora o gradiente não seja uma derivada em si, mas sim dual para a derivada:

Linearidade

O gradiente é linear no sentido em que se f e g são duas funções reais diferenciáveis no ponto umR n , e α e β são duas constantes, então αf + βg é diferenciável em um , e além disso

Regra do produto

Se f e g são funções reais diferenciáveis num ponto de umR n , em seguida, a regra do produto afirma que o produto fg é diferenciável em um , e

Regra da corrente

Suponha que f  : AR é uma função de valor real definida em um subconjunto A de R n , e que f é diferenciável em um ponto a . Existem duas formas de regra da cadeia que se aplicam ao gradiente. Primeiro, suponha que a função g seja uma curva paramétrica ; ou seja, uma função g  : IR n mapeia um subconjunto IR em R n . Se g é diferenciável em um ponto cI tal que g ( c ) = a , então

onde ∘ é o operador de composição : (  f  ∘  g ) ( x ) = f ( g ( x )) .

De forma mais geral, se em vez disso, IR k , então o seguinte é válido:

onde ( Dg ) T denota a matriz Jacobiana transposta .

Para a segunda forma da regra da cadeia, suponhamos que h  : IR é uma função real em um subconjunto I de R , e que h é diferenciável no ponto f ( um ) ∈ eu . Então

Outras propriedades e aplicações

Conjuntos de níveis

Uma superfície nivelada, ou isosuperfície , é o conjunto de todos os pontos onde alguma função tem um determinado valor.

Se f é diferenciável, então o produto escalar (∇ f  ) xv do gradiente em um ponto x com um vetor v dá a derivada direcional de f em x na direção v . Segue-se que, neste caso, o gradiente de f é ortogonal aos conjuntos de nível de f . Por exemplo, uma superfície nivelada no espaço tridimensional é definida por uma equação da forma F ( x , y , z ) = c . O gradiente de F é normal à superfície.

Mais geralmente, qualquer hipersuperfície embutida em uma variedade Riemanniana pode ser eliminada por uma equação da forma F ( P ) = 0 de modo que dF não é zero em lugar nenhum. O gradiente de F é então normal para a hipersuperfície.

Da mesma forma, uma hipersuperfície algébrica afim pode ser definida por uma equação F ( x 1 , ..., x n ) = 0 , onde F é um polinômio. O gradiente de F é zero em um ponto singular da hipersuperfície (esta é a definição de um ponto singular). Em um ponto não singular, é um vetor normal diferente de zero.

Campos de vetores conservativos e o teorema do gradiente

O gradiente de uma função é chamado de campo de gradiente. Um campo gradiente (contínuo) é sempre um campo vetorial conservador : sua integral de linha ao longo de qualquer caminho depende apenas dos pontos finais do caminho e pode ser avaliada pelo teorema do gradiente (o teorema fundamental do cálculo para integrais de linha). Por outro lado, um campo vetorial conservativo (contínuo) é sempre o gradiente de uma função.

Generalizações

Jacobiano

A matriz Jacobiana é a generalização do gradiente para funções de valor vetorial de várias variáveis ​​e mapas diferenciáveis entre espaços euclidianos ou, mais geralmente, variedades . Uma outra generalização para uma função entre espaços de Banach é a derivada de Fréchet .

Suponha que f  : ℝ n → ℝ m seja uma função tal que cada uma de suas derivadas parciais de primeira ordem existam em n . Então a matriz Jacobiana de f é definida como uma matriz m × n , denotada por ou simplesmente . A ( i , j ) ésima entrada é . Explicitamente

Gradiente de um campo vetorial

Uma vez que a derivada total de um campo vetorial é um mapeamento linear de vetores para vetores, é uma quantidade tensorial .

Em coordenadas retangulares, o gradiente de um campo vetorial f = (  f 1 , f 2 , f 3 ) é definido por:

(onde a notação de soma de Einstein é usada e o produto tensorial dos vetores e i e e k é um tensor diádico do tipo (2,0)). No geral, esta expressão é igual à transposta da matriz Jacobiana:

Em coordenadas curvilíneas, ou mais geralmente em uma variedade curva , o gradiente envolve símbolos de Christoffel :

onde g jk são os componentes do tensor métrico inverso e o e i são os vetores de base coordenada.

Expresso de forma mais invariável, o gradiente de um campo vetorial f pode ser definido pela conexão de Levi-Civita e pelo tensor métrico:

onde c é a conexão.

Variedades Riemannianas

Para qualquer função suave f em uma variedade Riemanniana ( M , g ) , o gradiente de f é o campo vetorial f tal que para qualquer campo vetorial X ,

isso é,

em que g X (,) indica o produto interior de vectores tangente em X definido pela métrica g e X f é a função que recebe qualquer ponto xM para o derivado direccional de f na direcção X , avaliada em x . Em outras palavras, em um gráfico de coordenadas φ de um subconjunto aberto de M para um subconjunto aberto de R n , (∂ X f  ) ( x ) é dado por:

onde X j denota o j ésimo componente de X neste gráfico de coordenadas.

Portanto, a forma local do gradiente assume a forma:

Generalizando o caso M = R n , o gradiente de uma função está relacionado à sua derivada exterior, uma vez que

Mais precisamente, o gradiente f é o campo vetorial associado à forma diferencial 1 df usando o isomorfismo musical

(chamado de "agudo") definido pela métrica g . A relação entre a derivada externa e o gradiente de uma função em R n é um caso especial disso, em que a métrica é a métrica plana dada pelo produto escalar.

Veja também

Notas

Referências

  • Bachman, David (2007), Advanced Calculus Demystified , Nova York: McGraw-Hill , ISBN 978-0-07-148121-2
  • Beauregard, Raymond A .; Fraleigh, John B. (1973), A First Course In Linear Algebra: with Optional Introduction to Groups, Rings, and Fields , Boston: Houghton Mifflin Company , ISBN 0-395-14017-X
  • Downing, Douglas, Ph.D. (2010), Barron's EZ Calculus , Nova York: Barron's , ISBN 978-0-7641-4461-5
  • Dubrovin, BA; Fomenko, AT; Novikov, SP (1991). Geometria Moderna - Métodos e Aplicações: Parte I: A Geometria de Superfícies, Grupos de Transformação e Campos . Textos de Pós-Graduação em Matemática (2ª ed.). Springer. ISBN 978-0-387-97663-1.
  • Harper, Charlie (1976), Introdução à Física Matemática , New Jersey: Prentice-Hall , ISBN 0-13-487538-9
  • Kreyszig, Erwin (1972), Advanced Engineering Mathematics (3ª ed.), Nova York: Wiley , ISBN 0-471-50728-8
  • "McGraw Hill Encyclopedia of Science & Technology". McGraw-Hill Encyclopedia of Science & Technology (10ª ed.). Nova York: McGraw-Hill . 2007. ISBN 978-0-07-144143-8.
  • Moise, Edwin E. (1967), Calculus: Complete , Reading: Addison-Wesley
  • Protter, Murray H .; Morrey, Jr., Charles B. (1970), College Calculus with Analytic Geometry (2ª ed.), Reading: Addison-Wesley , LCCN  76087042
  • Schey, HM (1992). Div, Grad, Curl e All That (2ª ed.). WW Norton. ISBN 0-393-96251-2. OCLC  25048561 .
  • Stoker, JJ (1969), Differential Geometry , New York: Wiley , ISBN 0-471-82825-4
  • Swokowski, Earl W .; Olinick, Michael; Pence, Dennis; Cole, Jeffery A. (1994), Calculus (6ª ed.), Boston: PWS Publishing Company, ISBN 0-534-93624-5

Leitura adicional

  • Korn, Theresa M .; Korn, Granino Arthur (2000). Manual matemático para cientistas e engenheiros: definições, teoremas e fórmulas para referência e revisão . Publicações de Dover. pp. 157–160. ISBN 0-486-41147-8. OCLC  43864234 .

links externos