Gradiente - Gradient
No cálculo vetorial , o gradiente de uma função diferenciável de valor escalar f de várias variáveis é o campo vetorial (ou função de valor vetorial ) cujo valor em um ponto é o vetor cujas componentes são as derivadas parciais de at . Isto é, pois , seu gradiente é definido no ponto no espaço n- dimensional como o vetor:
O símbolo nabla , escrito como um triângulo invertido e pronunciado "del", denota o operador diferencial do vetor .
O vetor gradiente pode ser interpretado como a "direção e taxa de aumento mais rápido". Se o gradiente de uma função é diferente de zero em um ponto p , a direção do gradiente é a direção em que a função aumenta mais rapidamente de p , e a magnitude do gradiente é a taxa de aumento nessa direção, o maior derivada direcional absoluta . Além disso, o gradiente é o vetor zero em um ponto se e somente se for um ponto estacionário (onde a derivada desaparece). O gradiente, portanto, desempenha um papel fundamental na teoria da otimização , onde é usado para maximizar uma função pela subida do gradiente .
O gradiente é dual para a derivada total : o valor do gradiente em um ponto é um vetor tangente - um vetor em cada ponto; enquanto o valor da derivada em um ponto é um vetor co tangente - uma função linear em vetores. Eles estão relacionados porque o produto escalar do gradiente de f em um ponto p com outro vetor tangente v é igual à derivada direcional de f em p da função ao longo de v ; isto é ,. O gradiente admite múltiplas generalizações para funções mais gerais em variedades ; veja § Generalizações .
Motivação
Considere uma sala onde a temperatura é dada por um campo escalar , T , então em cada ponto ( x , y , z ) a temperatura é T ( x , y , z ) , independente do tempo. Em cada ponto da sala, o gradiente de T naquele ponto mostrará a direção em que a temperatura sobe mais rapidamente, afastando-se de ( x , y , z ) . A magnitude do gradiente determinará a rapidez com que a temperatura sobe nessa direção.
Considere uma superfície cuja altura acima do nível do mar no ponto ( x , y ) seja H ( x , y ) . O gradiente de H num ponto representa um vector que aponta plano na direcção da inclinação mais acentuada ou grau naquele ponto. A inclinação da inclinação naquele ponto é dada pela magnitude do vetor gradiente.
O gradiente também pode ser usado para medir como um campo escalar muda em outras direções, ao invés de apenas na direção de maior mudança, tomando um produto escalar . Suponha que a inclinação mais acentuada em uma colina seja de 40%. Uma estrada que vai diretamente para cima tem uma inclinação de 40%, mas uma estrada que vai ao redor da colina em um ângulo terá uma inclinação mais rasa. Por exemplo, se a estrada está em um ângulo de 60 ° da direção de subida (quando ambas as direções são projetadas no plano horizontal), então a inclinação ao longo da estrada será o produto escalar entre o vetor gradiente e um vetor unitário ao longo da estrada , ou seja, 40% vezes o cosseno de 60 °, ou 20%.
De forma mais geral, se a função de altura da colina H é diferenciável , então o gradiente de H pontilhado com um vetor unitário fornece a inclinação da colina na direção do vetor, a derivada direcional de H ao longo do vetor unitário.
Notação
O gradiente de uma função no ponto geralmente é escrito como . Também pode ser denotado por qualquer um dos seguintes:
- : para enfatizar a natureza vetorial do resultado.
- grad f
- e : notação de Einstein .
Definição
O gradiente (ou campo vetorial gradiente) de uma função escalar f ( x 1 , x 2 , x 3 ,…, x n ) é denotado ∇ f ou ∇ → f onde ∇ ( nabla ) denota o operador diferencial vetorial , del . A notação grad f também é comumente usada para representar o gradiente. O gradiente de f é definido como o campo vetorial único cujo produto escalar com qualquer vetor v em cada ponto x é a derivada direcional de f ao longo de v . Isso é,
Formalmente, o gradiente é dual para a derivada; veja a relação com a derivada .
Quando uma função também depende de um parâmetro como o tempo, o gradiente geralmente se refere apenas ao vetor de suas derivadas espaciais (consulte Gradiente espacial ).
A magnitude e a direção do vetor gradiente são independentes da representação de coordenadas particular .
Coordenadas cartesianas
No sistema de coordenadas cartesianas tridimensional com uma métrica euclidiana , o gradiente, se existir, é dado por:
onde i , j , k são os vetores unitários padrão nas direções das coordenadas x , y e z , respectivamente. Por exemplo, o gradiente da função
é
Em algumas aplicações, é comum representar o gradiente como um vetor linha ou vetor coluna de seus componentes em um sistema de coordenadas retangulares; este artigo segue a convenção do gradiente sendo um vetor coluna, enquanto a derivada é um vetor linha.
Coordenadas cilíndricas e esféricas
Em coordenadas cilíndricas com uma métrica euclidiana, o gradiente é dado por:
onde ρ é a distância axial, φ é o ângulo azimutal ou azimutal, z é a coordenada axial e e ρ , e φ e e z são vetores unitários apontando ao longo das direções das coordenadas.
Em coordenadas esféricas , o gradiente é dado por:
onde r é a distância radial, φ é o ângulo azimutal e θ é o ângulo polar e e r , e θ e e φ são novamente vetores unitários locais apontando nas direções das coordenadas (isto é, a base covariante normalizada ).
Para o gradiente em outros sistemas de coordenadas ortogonais , consulte Coordenadas ortogonais (operadores diferenciais em três dimensões) .
Coordenadas gerais
Consideramos coordenadas gerais , que escrevemos como x 1 ,…, x i ,…, x n , onde n é o número de dimensões do domínio. Aqui, o índice superior se refere à posição na lista da coordenada ou componente, então x 2 se refere ao segundo componente - não à quantidade x ao quadrado. A variável de índice i refere-se a um elemento arbitrário x i . Usando a notação de Einstein , o gradiente pode ser escrito como:
- (Observe que seu dual é ),
onde e referem-se às bases covariantes e contravariantes locais não normalizadas respectivamente, é o tensor métrico inverso , e a convenção de soma de Einstein implica a soma sobre i e j .
Se as coordenadas são ortogonais, podemos facilmente expressar o gradiente (e o diferencial ) em termos das bases normalizadas, às quais nos referimos como e , usando os fatores de escala (também conhecidos como coeficientes de Lamé ) :
- (e ),
onde não podemos usar a notação de Einstein, pois é impossível evitar a repetição de mais de dois índices. Apesar do uso de índices superiores e inferiores, , , e são nem contravariant nem covariante.
A última expressão avalia as expressões fornecidas acima para coordenadas cilíndricas e esféricas.
Relacionamento com derivado
Parte de uma série de artigos sobre |
Cálculo |
---|
Relação com derivada total
O gradiente está intimamente relacionado à derivada total ( diferencial total ) : eles são transpostos ( duais ) entre si. Usando a convenção de que os vetores em são representados por vetores de coluna , e que covetores (mapas lineares ) são representados por vetores de linha , o gradiente e a derivada são expressos como um vetor de coluna e linha, respectivamente, com os mesmos componentes, mas transpondo cada um de outros:
Embora ambos tenham os mesmos componentes, eles diferem no tipo de objeto matemático que representam: em cada ponto, a derivada é um vetor cotangente , uma forma linear ( covetor ) que expressa o quanto a saída (escalar) muda para um determinado infinitesimal mudança na entrada (vetorial), enquanto em cada ponto, o gradiente é um vetor tangente , que representa uma mudança infinitesimal na entrada (vetorial). Nos símbolos, o gradiente é um elemento do espaço tangente em um ponto , enquanto a derivada é um mapa do espaço tangente para os números reais ,. Os espaços tangentes em cada ponto de podem ser identificados "naturalmente" com o próprio espaço vetorial e, da mesma forma, o espaço cotangente em cada ponto pode ser identificado naturalmente com o espaço vetorial dual de covetores; assim, o valor do gradiente em um ponto pode ser considerado um vetor no original , não apenas um vetor tangente.
Computacionalmente, dado um vetor tangente, o vetor pode ser multiplicado pela derivada (como matrizes), que é igual a tomar o produto escalar com o gradiente:
Diferencial ou derivado (exterior)
A melhor aproximação linear para uma função diferenciável
em um ponto x em R n é um mapa linear de R n a R que é freqüentemente denotado por df x ou Df ( x ) e chamado de diferencial ou derivada total de f em x . A função df , que mapeia x para df x , é chamada de diferencial total ou derivada externa de f e é um exemplo de forma diferencial 1 .
Assim como a derivada de uma função de uma única variável representa a inclinação da tangente ao gráfico da função, a derivada direcional de uma função em várias variáveis representa a inclinação do hiperplano tangente na direção do vetor.
O gradiente está relacionado ao diferencial pela fórmula
para qualquer v ∈ R n , onde é o produto escalar : tomar o produto escalar de um vetor com o gradiente é o mesmo que tirar a derivada direcional ao longo do vetor.
Se R n é visto como o espaço de (dimensão n ) vetores coluna (de números reais), então pode-se considerar df como o vetor linha com componentes
de modo que df x ( v ) é dado pela multiplicação de matrizes . Assumindo a métrica euclidiana padrão em R n , o gradiente é então o vetor de coluna correspondente, ou seja,
Aproximação linear para uma função
A melhor aproximação linear para uma função pode ser expressa em termos de gradiente, em vez de derivada. O gradiente de uma função f do espaço euclidiano R n para R em qualquer ponto x 0 em R n caracteriza a melhor aproximação linear para f em x 0 . A aproximação é a seguinte:
para x próximo de x 0 , onde (∇ f ) x 0 é o gradiente de f calculado em x 0 , e o ponto denota o produto escalar em R n . Essa equação é equivalente aos dois primeiros termos na expansão multivariável da série de Taylor de f em x 0 .
Relacionamento com derivado de Fréchet
Seja U um conjunto aberto em R n . Se a função f : U → R é diferenciável, então a diferencial de f é a derivada de Fréchet de f . Assim, ∇ f é uma função de U para o espaço R n tal que
onde · é o produto escalar.
Como consequência, as propriedades usuais da derivada são válidas para o gradiente, embora o gradiente não seja uma derivada em si, mas sim dual para a derivada:
O gradiente é linear no sentido em que se f e g são duas funções reais diferenciáveis no ponto um ∈ R n , e α e β são duas constantes, então αf + βg é diferenciável em um , e além disso
Se f e g são funções reais diferenciáveis num ponto de um ∈ R n , em seguida, a regra do produto afirma que o produto fg é diferenciável em um , e
Suponha que f : A → R é uma função de valor real definida em um subconjunto A de R n , e que f é diferenciável em um ponto a . Existem duas formas de regra da cadeia que se aplicam ao gradiente. Primeiro, suponha que a função g seja uma curva paramétrica ; ou seja, uma função g : I → R n mapeia um subconjunto I ⊂ R em R n . Se g é diferenciável em um ponto c ∈ I tal que g ( c ) = a , então
onde ∘ é o operador de composição : ( f ∘ g ) ( x ) = f ( g ( x )) .
De forma mais geral, se em vez disso, I ⊂ R k , então o seguinte é válido:
onde ( Dg ) T denota a matriz Jacobiana transposta .
Para a segunda forma da regra da cadeia, suponhamos que h : I → R é uma função real em um subconjunto I de R , e que h é diferenciável no ponto f ( um ) ∈ eu . Então
Outras propriedades e aplicações
Conjuntos de níveis
Uma superfície nivelada, ou isosuperfície , é o conjunto de todos os pontos onde alguma função tem um determinado valor.
Se f é diferenciável, então o produto escalar (∇ f ) x ⋅ v do gradiente em um ponto x com um vetor v dá a derivada direcional de f em x na direção v . Segue-se que, neste caso, o gradiente de f é ortogonal aos conjuntos de nível de f . Por exemplo, uma superfície nivelada no espaço tridimensional é definida por uma equação da forma F ( x , y , z ) = c . O gradiente de F é normal à superfície.
Mais geralmente, qualquer hipersuperfície embutida em uma variedade Riemanniana pode ser eliminada por uma equação da forma F ( P ) = 0 de modo que dF não é zero em lugar nenhum. O gradiente de F é então normal para a hipersuperfície.
Da mesma forma, uma hipersuperfície algébrica afim pode ser definida por uma equação F ( x 1 , ..., x n ) = 0 , onde F é um polinômio. O gradiente de F é zero em um ponto singular da hipersuperfície (esta é a definição de um ponto singular). Em um ponto não singular, é um vetor normal diferente de zero.
Campos de vetores conservativos e o teorema do gradiente
O gradiente de uma função é chamado de campo de gradiente. Um campo gradiente (contínuo) é sempre um campo vetorial conservador : sua integral de linha ao longo de qualquer caminho depende apenas dos pontos finais do caminho e pode ser avaliada pelo teorema do gradiente (o teorema fundamental do cálculo para integrais de linha). Por outro lado, um campo vetorial conservativo (contínuo) é sempre o gradiente de uma função.
Generalizações
Jacobiano
A matriz Jacobiana é a generalização do gradiente para funções de valor vetorial de várias variáveis e mapas diferenciáveis entre espaços euclidianos ou, mais geralmente, variedades . Uma outra generalização para uma função entre espaços de Banach é a derivada de Fréchet .
Suponha que f : ℝ n → ℝ m seja uma função tal que cada uma de suas derivadas parciais de primeira ordem existam em ℝ n . Então a matriz Jacobiana de f é definida como uma matriz m × n , denotada por ou simplesmente . A ( i , j ) ésima entrada é . Explicitamente
Gradiente de um campo vetorial
Uma vez que a derivada total de um campo vetorial é um mapeamento linear de vetores para vetores, é uma quantidade tensorial .
Em coordenadas retangulares, o gradiente de um campo vetorial f = ( f 1 , f 2 , f 3 ) é definido por:
(onde a notação de soma de Einstein é usada e o produto tensorial dos vetores e i e e k é um tensor diádico do tipo (2,0)). No geral, esta expressão é igual à transposta da matriz Jacobiana:
Em coordenadas curvilíneas, ou mais geralmente em uma variedade curva , o gradiente envolve símbolos de Christoffel :
onde g jk são os componentes do tensor métrico inverso e o e i são os vetores de base coordenada.
Expresso de forma mais invariável, o gradiente de um campo vetorial f pode ser definido pela conexão de Levi-Civita e pelo tensor métrico:
onde ∇ c é a conexão.
Variedades Riemannianas
Para qualquer função suave f em uma variedade Riemanniana ( M , g ) , o gradiente de f é o campo vetorial ∇ f tal que para qualquer campo vetorial X ,
isso é,
em que g X (,) indica o produto interior de vectores tangente em X definido pela métrica g e ∂ X f é a função que recebe qualquer ponto x ∈ M para o derivado direccional de f na direcção X , avaliada em x . Em outras palavras, em um gráfico de coordenadas φ de um subconjunto aberto de M para um subconjunto aberto de R n , (∂ X f ) ( x ) é dado por:
onde X j denota o j ésimo componente de X neste gráfico de coordenadas.
Portanto, a forma local do gradiente assume a forma:
Generalizando o caso M = R n , o gradiente de uma função está relacionado à sua derivada exterior, uma vez que
Mais precisamente, o gradiente ∇ f é o campo vetorial associado à forma diferencial 1 df usando o isomorfismo musical
(chamado de "agudo") definido pela métrica g . A relação entre a derivada externa e o gradiente de uma função em R n é um caso especial disso, em que a métrica é a métrica plana dada pelo produto escalar.
Veja também
Notas
Referências
- Bachman, David (2007), Advanced Calculus Demystified , Nova York: McGraw-Hill , ISBN 978-0-07-148121-2
- Beauregard, Raymond A .; Fraleigh, John B. (1973), A First Course In Linear Algebra: with Optional Introduction to Groups, Rings, and Fields , Boston: Houghton Mifflin Company , ISBN 0-395-14017-X
- Downing, Douglas, Ph.D. (2010), Barron's EZ Calculus , Nova York: Barron's , ISBN 978-0-7641-4461-5
- Dubrovin, BA; Fomenko, AT; Novikov, SP (1991). Geometria Moderna - Métodos e Aplicações: Parte I: A Geometria de Superfícies, Grupos de Transformação e Campos . Textos de Pós-Graduação em Matemática (2ª ed.). Springer. ISBN 978-0-387-97663-1.
- Harper, Charlie (1976), Introdução à Física Matemática , New Jersey: Prentice-Hall , ISBN 0-13-487538-9
- Kreyszig, Erwin (1972), Advanced Engineering Mathematics (3ª ed.), Nova York: Wiley , ISBN 0-471-50728-8
- "McGraw Hill Encyclopedia of Science & Technology". McGraw-Hill Encyclopedia of Science & Technology (10ª ed.). Nova York: McGraw-Hill . 2007. ISBN 978-0-07-144143-8.
- Moise, Edwin E. (1967), Calculus: Complete , Reading: Addison-Wesley
- Protter, Murray H .; Morrey, Jr., Charles B. (1970), College Calculus with Analytic Geometry (2ª ed.), Reading: Addison-Wesley , LCCN 76087042
- Schey, HM (1992). Div, Grad, Curl e All That (2ª ed.). WW Norton. ISBN 0-393-96251-2. OCLC 25048561 .
- Stoker, JJ (1969), Differential Geometry , New York: Wiley , ISBN 0-471-82825-4
- Swokowski, Earl W .; Olinick, Michael; Pence, Dennis; Cole, Jeffery A. (1994), Calculus (6ª ed.), Boston: PWS Publishing Company, ISBN 0-534-93624-5
Leitura adicional
- Korn, Theresa M .; Korn, Granino Arthur (2000). Manual matemático para cientistas e engenheiros: definições, teoremas e fórmulas para referência e revisão . Publicações de Dover. pp. 157–160. ISBN 0-486-41147-8. OCLC 43864234 .
links externos
- "Gradiente" . Khan Academy .
- Kuptsov, LP (2001) [1994], "Gradient" , Encyclopedia of Mathematics , EMS Press.
- Weisstein, Eric W. "Gradient" . MathWorld .