Teorema de Cayley-Hamilton - Cayley–Hamilton theorem

Arthur Cayley , FRS (1821-1895) é amplamente considerado o principal matemático puro da Grã-Bretanha do século XIX. Cayley em 1848 foi a Dublin para assistir a palestras sobre quatérnios de Hamilton, seu descobridor. Mais tarde, Cayley o impressionou por ser o segundo a publicar um trabalho sobre eles. Cayley provou o teorema para matrizes de dimensão 3 e menos, publicando a prova para o caso bidimensional. Quanto n × n matrizes, Cayley afirmou: “..., eu não considerou necessário para realizar o trabalho de uma prova formal do teorema no caso geral de uma matriz de qualquer grau”.
William Rowan Hamilton (1805–1865), físico irlandês, astrônomo e matemático, primeiro membro estrangeiro da American National Academy of Sciences . Embora mantendo uma posição oposta sobre como a geometria deve ser estudada, Hamilton sempre manteve as melhores relações com Cayley.

Hamilton provou que para uma função linear de quatérnios existe uma certa equação, dependendo da função linear, que é satisfeita pela própria função linear.

Na álgebra linear , o teorema de Cayley-Hamilton (em homenagem aos matemáticos Arthur Cayley e William Rowan Hamilton ) afirma que toda matriz quadrada sobre um anel comutativo (como o campo real ou complexo ) satisfaz sua própria equação característica .

Se A é um dado n × n matriz e eu n  é o n x n matriz de identidade , em seguida, o polinómio característico de um é definido como , onde Det é o determinante operação e λ é uma variável para um escalar elemento do anel de base. Uma vez que as entradas da matriz são polinómios em (linear ou constante) λ , o determinante também é um n ordem -ésimo mônico polinomial em λ , pode-se criar um polinómio análogo na matriz A em vez da variável escalar λ , definidos como A O teorema de Cayley-Hamilton afirma que esta expressão polinomial é igual à matriz zero , o que significa isso . O teorema permite que um n para ser expresso como uma combinação linear das competências da matriz inferior de um . Quando o anel é um campo, o teorema de Cayley-Hamilton é equivalente à afirmação de que o polinômio mínimo de uma matriz quadrada divide seu polinômio característico. O teorema foi provado pela primeira vez em 1853 em termos de inversos de funções lineares de quatérnios , um anel não comutativo , por Hamilton. Isso corresponde ao caso especial de certas matrizes 4 × 4 reais ou 2 × 2 complexas. O teorema é válido para matrizes quaterniônicas gerais. Cayley em 1858 declarou isso para matrizes 3 × 3 e menores, mas publicou apenas uma prova para o caso 2 × 2 . O caso geral foi provado pela primeira vez por Ferdinand Frobenius em 1878.

Exemplos

Matrizes 1 × 1

Para uma matriz 1 × 1 A  = ( a 1,1 ) , o polinômio característico é dado por p (λ) =  λ  -  a , e então p ( A ) = ( a ) -  a 1,1  = 0 é trivial.

Matrizes 2 × 2

Como um exemplo concreto, vamos

Seu polinômio característico é dado por

O teorema de Cayley-Hamilton afirma que, se definirmos

então

Podemos verificar por computação que, de fato,

Para uma matriz 2 × 2 genérica ,

o polinômio característico é dado por p ( λ ) =  λ 2  - ( a  +  d ) λ  + ( ad  -  bc ) , então o teorema de Cayley-Hamilton afirma que

o que de fato é sempre o caso, evidente pela elaboração das entradas de A 2 .

Prova








Formulários

Matriz determinante e inversa

Para uma matriz invertível n × n geral A , ou seja, uma com determinante diferente de zero, A −1 pode, portanto, ser escrita como uma expressão polinomial de ( n  - 1) -ésima ordem em A : Como indicado, o teorema de Cayley-Hamilton equivale ao identidade

Os coeficientes c i são dadas por os polinómios simétricos elementares dos valores próprios de uma . Usando identidades de Newton , os polinômios simétricos elementares podem, por sua vez, ser expressos em termos de polinômios simétricos de soma de potência dos autovalores:

onde tr ( A k ) é o traço da matriz A k . Assim, podemos expressar c i em termos do traço de poderes A .

Em geral, a fórmula para os coeficientes c i é dada em termos de polinômios de Bell exponenciais completos como

Em particular, o determinante de A é igual a (-1) n c 0 . Assim, o determinante pode ser escrito como a identidade do rastreamento :

Da mesma forma, o polinômio característico pode ser escrito como

e, multiplicando ambos os lados por A −1 (note - (- 1) n = (−1) n −1 ), alguém é levado a uma expressão para o inverso de A como uma identidade de traço,

Outro método para obter esses coeficientes c k para uma matriz n × n geral , desde que nenhuma raiz seja zero, depende da seguinte expressão alternativa para o determinante ,

Portanto, em virtude da série Mercator ,

onde o exponencial precisa ser expandido para a ordem λ - n , uma vez que p ( λ ) é da ordem n , as potências negativas líquidas de λ desaparecem automaticamente pelo teorema C – H. (Mais uma vez, isso exige um anel contendo os números racionais.) Diferenciação desta expressão relativamente à λ permite expressar os coeficientes do polinómio característica geral para n como determinantes de m x m matrizes,

Exemplos

Por exemplo, os primeiros polinômios de Bell são B 0 = 1, B 1 ( x 1 ) = x 1 , B 2 ( x 1 , x 2 ) = x2
1
+ x 2
e B 3 ( x 1 , x 2 , x 3 ) = x3
1
+ 3 x 1 x 2 + x 3
.

Usando-os para especificar os coeficientes c i do polinômio característico de uma matriz 2 × 2 , resulta

O coeficiente c 0 dá o determinante da matriz 2 × 2 , c 1 menos seu traço, enquanto seu inverso é dado por

É evidente a partir da fórmula geral para c n-k , expressa em termos de polinômios de Bell, que as expressões

sempre dar os coeficientes c n -1 de λ n -1 e c n -2 de λ n -2 no polinomial característica de qualquer n × n matriz, respectivamente. Assim, para uma matriz A 3 × 3 , a declaração do teorema de Cayley-Hamilton também pode ser escrita como

onde o lado direito designa uma matriz 3 × 3 com todas as entradas reduzidas a zero. Da mesma forma, este determinante no caso n  = 3 , é agora

Essa expressão fornece o negativo do coeficiente c n −3 de λ n −3 no caso geral, conforme visto abaixo.

Da mesma forma, pode-se escrever para uma matriz A 4 × 4 ,

onde, agora, o determinante é c n −4 ,

e assim por diante para matrizes maiores. As expressões cada vez mais complexas para os coeficientes c k podem ser deduzidas das identidades de Newton ou do algoritmo Faddeev-LeVerrier .

n poder -ésimo de matriz

O teorema de Cayley-Hamilton sempre fornece uma relação entre as potências de A (embora nem sempre a mais simples), o que permite simplificar expressões envolvendo tais potências e avaliá-las sem ter que calcular a potência A n ou quaisquer potências superiores de A .

Como exemplo, para o teorema dá

Então, para calcular A 4 , observe

Da mesma forma,

Observe que conseguimos escrever a potência da matriz como a soma de dois termos. Na verdade, a potência da matriz de qualquer ordem k pode ser escrita como uma matriz polinomial de grau no máximo n - 1 , onde n é o tamanho de uma matriz quadrada. Este é um caso em que o teorema de Cayley-Hamilton pode ser usado para expressar uma função de matriz, que discutiremos a seguir de forma sistemática.

Funções de matriz

Dada uma função analítica

e o polinômio característico p ( x ) de grau n de uma matriz A n × n , a função pode ser expressa usando divisão longa como

onde q ( x ) é algum polinômio quociente er ( x ) é um polinômio remanescente tal que 0 ≤ deg r ( x ) < n .

Pelo teorema de Cayley-Hamilton, substituindo x pela matriz Ap ( A ) = 0 , então temos

Assim, a função analítica da matriz A pode ser expressa como um polinômio da matriz de grau menor que n .

Deixe o polinômio restante ser

Uma vez que p ( λ ) = 0 , avaliando a função f ( x ) nos n valores próprios de A , resulta

Isso equivale a um sistema de n equações lineares, que podem ser resolvidas para determinar os coeficientes c i . Assim, um tem

Quando os autovalores são repetidos, ou seja, λ i = λ j para algum i ≠ j , duas ou mais equações são idênticas; e, portanto, as equações lineares não podem ser resolvidas exclusivamente. Para tais casos, para um autovalor λ com multiplicidade m , as primeiras m - 1 derivadas de p (x) desaparecem no autovalor. Isso leva às soluções adicionais m - 1 linearmente independentes

que, combinada com outras, produz as n equações necessárias para resolver para c i .

Encontrar um polinômio que passa pelos pontos ( λ i , f ( λ i )) é essencialmente um problema de interpolação , e pode ser resolvido usando técnicas de interpolação de Lagrange ou Newton , levando à fórmula de Sylvester .

Por exemplo, suponha que a tarefa seja encontrar a representação polinomial de

O polinômio característico é p ( x ) = ( x - 1) ( x - 3) = x 2 - 4 x + 3 , e os valores próprios são λ = 1, 3 . Seja r ( x ) = c 0 + c 1 x . Avaliando f ( λ) = r ( λ ) nos autovalores, obtém-se duas equações lineares, e t = c 0 + c 1 e e 3 t = c 0 + 3 c 1 .

Resolver as equações resulta em c 0 = (3 e t - e 3 t ) / 2 e c 1 = ( e 3 t - e t ) / 2 . Assim, segue-se que

Se, em vez disso, a função fosse f ( A ) = sin At , então os coeficientes teriam sido c 0 = (3 sin t - sin 3 t ) / 2 e c 1 = (sin 3 t - sin t ) / 2 ; portanto

Como outro exemplo, ao considerar

então, o polinômio característico é p ( x ) = x 2 + 1 , e os autovalores são λ = ± i .

Como antes, avaliar a função nos autovalores nos dá as equações lineares e it = c 0 + ic 1 e e - it = c 0 - ic 1 ; a solução de que dá, c 0 = ( e -la + e - lo ) / 2 = cos t e c 1 = ( e -la - e - lo ) / 2 I = sen t . Assim, para este caso,

que é uma matriz de rotação .

Exemplos padrão de tal uso são o mapa exponencial da álgebra de Lie de um grupo de Lie de matriz no grupo. É dado por uma matriz exponencial ,

Essas expressões são conhecidas há muito tempo por SU (2) ,

onde os σ são as matrizes de Pauli e para SO (3) ,

que é a fórmula de rotação de Rodrigues . Para a notação, consulte o grupo de rotação SO (3) #A nota sobre álgebra de Lie .

Mais recentemente, surgiram expressões para outros grupos, como o grupo de Lorentz SO (3, 1) , O (4, 2) e SU (2, 2) , bem como GL ( n , R ) . O grupo O (4, 2) é o grupo conforme do espaço-tempo , SU (2, 2) sua tampa simplesmente conectada (para ser mais preciso, a tampa simplesmente conectada do componente conectado SO + (4, 2) de O (4, 2) ). As expressões obtidas aplicam-se à representação padrão desses grupos. Eles exigem conhecimento de (alguns dos) valores próprios da matriz para exponenciar. Para SU (2) (e portanto para SO (3) ), expressões fechadas foram obtidas para todas as representações irredutíveis, ou seja, de qualquer spin.

Ferdinand Georg Frobenius (1849–1917), matemático alemão. Seus principais interesses eram funções elípticas , equações diferenciais e, posteriormente , teoria dos grupos .
Em 1878, ele deu a primeira prova completa do teorema de Cayley-Hamilton.

Teoria dos números algébricos

O teorema de Cayley-Hamilton é uma ferramenta eficaz para calcular o polinômio mínimo de inteiros algébricos. Por exemplo, dada uma extensão finita de e um inteiro algébrico que é uma combinação linear diferente de zero de , podemos calcular o polinômio mínimo de encontrando uma matriz que representa a transformação -linear

Se chamarmos isso de matriz de transformação , então podemos encontrar o polinômio mínimo aplicando o teorema de Cayley-Hamilton a .

Provas

O teorema de Cayley-Hamilton é uma consequência imediata da existência da forma normal de Jordan para matrizes sobre campos algebricamente fechados . Nesta seção, as provas diretas são apresentadas.

Como os exemplos acima mostram, a obtenção do mapa do teorema de Cayley-Hamilton para um n × n matriz

requer duas etapas: primeiro, os coeficientes c i do polinômio característico são determinados pelo desenvolvimento como um polinômio em t do determinante

e, em seguida, os coeficientes são usados de uma combinação linear das competências de um que é equiparada à n × n matriz nula:

O lado esquerdo pode ser trabalhado para um n × n matriz cujas entradas são (enormes) expressões polinomiais no conjunto de entrada de um i , j de A , de modo que o Cayley-Hamilton teorema indica que cada uma destas N 2 expressões iguais 0 . Para qualquer valor fixo de n , essas identidades podem ser obtidas por manipulações algébricas tediosas, mas diretas. Nenhum desses cálculos, entretanto, pode mostrar por que o teorema de Cayley-Hamilton deve ser válido para matrizes de todos os tamanhos possíveis n , então uma prova uniforme para todos os n é necessária.

Preliminares

Se um vetor v de tamanho n é um autovetor de A com autovalor λ , em outras palavras, se Av = λv , então

que é o vetor nulo uma vez que p ( λ ) = 0 (os autovalores de A são precisamente as raízes de p ( t ) ). Isso vale para todos os autovalores possíveis λ , então as duas matrizes equacionadas pelo teorema certamente fornecem o mesmo resultado (nulo) quando aplicado a qualquer autovetor. Agora, se A admite uma base de autovetores, em outras palavras, se A é diagonalizável , então o teorema de Cayley-Hamilton deve valer para A , uma vez que duas matrizes que fornecem os mesmos valores quando aplicadas a cada elemento de uma base devem ser iguais.

produto dos valores próprios de

Considere agora a função que mapeia matrizes para matrizes dadas pela fórmula , isto é, que pega uma matriz e a conecta em seu próprio polinômio característico. Nem todas as matrizes são diagonalizáveis, mas para matrizes com coeficientes complexos, muitas delas são: o conjunto de matrizes quadradas complexas diagonalizáveis ​​de um determinado tamanho é denso no conjunto de todas essas matrizes quadradas (para uma matriz ser diagonalizável é suficiente, por exemplo, que seu polinômio característico não tem raízes múltiplas). Agora, visto como uma função (uma vez que as matrizes têm entradas), vemos que essa função é contínua . Isso é verdade porque as entradas da imagem de uma matriz são dadas por polinômios nas entradas da matriz. Desde a

e como o conjunto é denso, por continuidade essa função deve mapear todo o conjunto de matrizes para a matriz zero. Portanto, o teorema de Cayley-Hamilton é verdadeiro para números complexos e deve, portanto, valer para matrizes - ou - avaliadas.

Embora isso forneça uma prova válida, o argumento não é muito satisfatório, uma vez que as identidades representadas pelo teorema não dependem de forma alguma da natureza da matriz (diagonalizável ou não), nem do tipo de entradas permitidas (para matrizes com entradas reais, as diagonalizáveis ​​não formam um conjunto denso, e parece estranho que alguém teria que considerar matrizes complexas para ver que o teorema de Cayley-Hamilton vale para elas). Devemos, portanto, considerar agora apenas os argumentos que provam o teorema diretamente para qualquer matriz usando apenas manipulações algébricas; estes também têm a vantagem de trabalhar para matrizes com entradas em qualquer anel comutativo .

Há uma grande variedade de tais provas do teorema de Cayley-Hamilton, das quais várias serão apresentadas aqui. Eles variam na quantidade de noções algébricas abstratas necessárias para compreender a prova. As provas mais simples usam apenas as noções necessárias para formular o teorema (matrizes, polinômios com entradas numéricas, determinantes), mas envolvem cálculos técnicos que tornam um tanto misterioso o fato de que levam precisamente à conclusão correta. É possível evitar tais detalhes, mas ao preço de envolver noções algébricas mais sutis: polinômios com coeficientes em um anel não comutativo ou matrizes com tipos incomuns de entradas.

Matrizes de adjugado

Todas as provas abaixo usar a noção do adjugate matriz adj ( M ) de um n × n matriz M , a transposta da sua matriz de co-factor .

Esta é uma matriz cujos coeficientes são dados por expressões polinomiais nos coeficientes de M (na verdade, por certos ( n  - 1) × ( n  - 1) determinantes), de tal forma que as seguintes relações fundamentais se mantêm,

Essas relações são uma consequência direta das propriedades básicas dos determinantes: a avaliação da entrada ( i , j ) do produto da matriz à esquerda dá a expansão pela coluna j do determinante da matriz obtido de M substituindo a coluna i por a cópia da coluna j , que é det ( M ) se i = j e zero em caso contrário; o produto da matriz à direita é semelhante, mas para expansões por linhas.

Sendo uma consequência apenas da manipulação de expressões algébricas, essas relações são válidas para matrizes com entradas em qualquer anel comutativo (a comutatividade deve ser assumida para que os determinantes sejam definidos em primeiro lugar). É importante observar isso aqui, porque essas relações serão aplicadas a seguir para matrizes com entradas não numéricas, como polinômios.

Uma prova algébrica direta

Esta prova usa exatamente o tipo de objetos necessários para formular o teorema de Cayley-Hamilton: matrizes com polinômios como entradas. A matriz t I n - A cujo determinante é o polinômio característico de A é tal matriz, e uma vez que os polinômios formam um anel comutativo, ela tem um adjunto

Então, de acordo com a relação fundamental direita do adjunto, tem-se

Uma vez que B também é uma matriz com polinômios em t como entradas, pode-se, para cada i , coletar os coeficientes de t i em cada entrada para formar uma matriz B i de números, de modo que um tenha

(A forma como as entradas de B são definidas deixa claro que não ocorrem potências superiores a t n −1 ). Embora pareça um polinômio com matrizes como coeficientes, não devemos considerar tal noção; é apenas uma maneira de escrever uma matriz com entradas polinomiais como uma combinação linear de n matrizes constantes, e o coeficiente t i foi escrito à esquerda da matriz para enfatizar esse ponto de vista.

Agora, pode-se expandir o produto da matriz em nossa equação por bilinearidade

Escrita

obtém-se uma igualdade de duas matrizes com entradas polinomiais, escritas como combinações lineares de matrizes constantes com potências de t como coeficientes.

Tal igualdade pode ser mantida apenas se em qualquer posição da matriz a entrada que é multiplicada por uma dada potência t i for a mesma em ambos os lados; segue-se que as matrizes constantes com coeficiente t i em ambas as expressões devem ser iguais. Escrevendo essas equações para i de n até 0, encontramos

Finalmente, multiplique a equação dos coeficientes de t i da esquerda por A i e some:

Os lados esquerdos formam uma soma telescópica e se cancelam completamente; os lados direitos somam :

Isso completa a prova.

Uma prova usando polinômios com coeficientes de matriz

Esta prova é semelhante à primeira, mas tenta dar sentido à noção de polinômio com coeficientes de matriz que foi sugerida pelas expressões ocorridas naquela prova. Isso requer um cuidado considerável, uma vez que é um tanto incomum considerar polinômios com coeficientes em um anel não comutativo, e nem todo raciocínio válido para polinômios comutativos pode ser aplicado neste cenário.

Notavelmente, embora a aritmética de polinômios sobre um anel comutativo modele a aritmética de funções polinomiais , este não é o caso sobre um anel não comutativo (na verdade, não há noção óbvia de função polinomial neste caso que é fechada sob multiplicação). Assim, ao considerar polinômios em t com coeficientes de matriz, a variável t não deve ser pensada como uma "desconhecida", mas como um símbolo formal que deve ser manipulado de acordo com determinadas regras; em particular, não se pode simplesmente definir t para um valor específico.

Let Ser o anel de matrizes com entradas em algum anel R (como os números reais ou complexos) que tem A como um elemento. Matrizes com polinômios de coeficientes em t , tais como ou seu adjunto B na primeira prova, são elementos de .

Ao coletar potências semelhantes de t , tais matrizes podem ser escritas como "polinômios" em t com matrizes constantes como coeficientes; escreva para o conjunto de tais polinômios. Uma vez que este conjunto está em bijeção com , define-se as operações aritméticas nele correspondentemente, em particular a multiplicação é dada por

respeitar a ordem das matrizes de coeficientes dos dois operandos; obviamente, isso dá uma multiplicação não comutativa.

Assim, a identidade

da primeira prova pode ser vista como uma que envolve uma multiplicação de elementos em .

Nesse ponto, é tentador simplesmente definir t igual à matriz A , o que torna o primeiro fator à esquerda igual à matriz nula e o lado direito igual a p ( A ) ; no entanto, esta não é uma operação permitida quando os coeficientes não comutam. É possível definir um "mapa de avaliação à direita" ev A  : M [ t ] → M , que substitui cada t i pela potência da matriz A i de A , onde se estipula que a potência deve ser sempre multiplicada à direita ao coeficiente correspondente.

Mas este mapa não é um homomorfismo de anel: a avaliação correta de um produto difere em geral do produto das avaliações corretas. Isto é assim porque a multiplicação de polinómios com coeficientes da matriz faz multiplicação não modelo de expressão contendo incógnitas: um produto é definido supondo que t comuta com N , mas isto pode falhar se t é substituído pela matriz Uma .

Pode-se contornar essa dificuldade na situação particular em questão, uma vez que o mapa de avaliação à direita acima se torna um homomorfismo de anel se a matriz A estiver no centro do anel de coeficientes, de modo que comute com todos os coeficientes dos polinômios (o argumento que prova isso é direto, exatamente porque comutar t com coeficientes agora se justifica após a avaliação).

Agora, A não é sempre no centro de M , mas podemos substituir M com um anel menor desde que contém todos os coeficientes dos polinômios em questão: , A , e os coeficientes do polinômio B . A escolha óbvia para tal subanel é o centralizador Z de A , o subanel de todas as matrizes que comutam com A ; por definição Um está localizado no centro de Z .

Esse centralizador obviamente contém , e A , mas é preciso mostrar que ele contém as matrizes . Para fazer isso, combina-se as duas relações fundamentais para adjugados, escrevendo o adjugado B como um polinômio:

Equacionar os coeficientes mostra que, para cada i , temos A B i = B i A conforme desejado. Tendo encontrado a configuração adequada em que ev A é de fato um homomorfismo de anéis, pode-se completar a prova como sugerido acima:

Isso completa a prova.

Uma síntese das duas primeiras provas

Na primeira prova, foi possível determinar os coeficientes B i de B com base na relação fundamental direita apenas para o adjunto. Na verdade, as primeiras n equações derivadas podem ser interpretadas como determinando o quociente B da divisão euclidiana do polinômio p ( t ) I n à esquerda pelo polinômio mônico I n t - A , enquanto a equação final expressa o fato de que o o resto é zero. Essa divisão é realizada no anel de polinômios com coeficientes da matriz. Com efeito, até mesmo ao longo de um anel não-conmutativo, divisão euclidiana por um mônico polinómio P é definido, e sempre produz um quociente único e restante com a mesma condição grau como no caso conmutativo, desde que seja especificado em que um lado pretende P para ser um fator (aqui isso está à esquerda).

Para ver que o quociente e o resto são únicos (que é a parte importante da afirmação aqui), é suficiente escrever como e observar que, uma vez que P é mônico, P (Q − Q ') não pode ter um grau menor que o de P , a menos que Q = Q ' .

Mas o dividendo p ( t ) I n e o divisor I n t - A usados ​​aqui estão ambos no subanel ( R [ A ]) [ t ] , onde R [ A ] é o subanel do anel da matriz M ( n , R ) gerado por um : o R extensão -linear de todas as potências de Uma . Portanto, a divisão euclidiana pode de fato ser realizada dentro daquele anel polinomial comutativo , e é claro que dá então o mesmo quociente B e resto 0 como no anel maior; em particular, isso mostra que B de fato está em ( R [ A ]) [ t ] .

Mas, nesta configuração comutativa, é válido definir t para A na equação

em outras palavras, para aplicar o mapa de avaliação

que é um homomorfismo de anel, dando

assim como na segunda prova, conforme desejado.

Além de provar o teorema, o argumento acima nos diz que os coeficientes B i de B são polinômios em A , enquanto a partir da segunda prova sabíamos apenas que eles se encontram no centralizador Z de A ; em geral Z é um subanel maior que R [ A ] , e não necessariamente comutativo. Em particular, o termo constante B 0 = adj (- A ) reside em R [ A ] . Como A é uma matriz quadrada arbitrária, isso prova que adj ( A ) sempre pode ser expresso como um polinômio em A (com coeficientes que dependem de A ) .

De fato, as equações encontradas na primeira prova permitem expressar sucessivamente como polinômios em A , o que leva à identidade

válidas para todos n × n matrizes, onde

É o polinómio característico de um .

Observe que essa identidade também implica a afirmação do teorema de Cayley-Hamilton: pode-se mover adj (- A ) para o lado direito, multiplicar a equação resultante (à esquerda ou à direita) por A e usar o fato de que

Uma prova usando matrizes de endomorfismos

Como foi mencionado acima, a matriz de p ( A ), em comunicação do teorema é obtido por primeira avaliação do determinante e, em seguida, substituindo a matriz A para T ; fazer essa substituição na matriz antes de avaliar o determinante não é significativo. No entanto, é possível dar uma interpretação onde p ( A ) é obtido diretamente como o valor de um determinado determinante, mas isso requer uma configuração mais complicada, uma de matrizes sobre um anel em que se pode interpretar ambas as entradas de A , e todo o próprio A. Pode-se tomar para isso o anel M ( n , R ) de n × n matrizes sobre R , onde a entrada é realizada como , e A como ele mesmo. Mas considerar matrizes com matrizes como entradas pode causar confusão com matrizes de bloco , o que não é pretendido, pois isso dá a noção errada de determinante (lembre-se de que o determinante de uma matriz é definido como uma soma dos produtos de suas entradas, e no caso de uma matriz de bloco geralmente não é o mesmo que a soma correspondente dos produtos de seus blocos!). É mais claro distinguir A do endomorfismo φ de um espaço vetorial n- dimensional V (ou R- módulo livre se R não for um campo) definido por ele em uma base , e tomar matrizes sobre o anel End ( V ) de todos esses endomorfismos. Então φ ∈ End ( V ) é uma possível entrada de matriz, enquanto A designa o elemento de M ( n , End ( V )) cuja entrada i , j é endomorfismo de multiplicação escalar por ; da mesma forma será interpretado como elemento de M ( n , End ( V )). No entanto, uma vez que End ( V ) não é um anel comutativo, nenhum determinante é definido em M ( n , End ( V )); isso só pode ser feito para matrizes sobre um subanel comutativo de End ( V ). Agora, todas as entradas da matriz estão no subanel R [ φ ] gerado pela identidade e φ , que é comutativo. Em seguida, um mapa determinante M ( n , R [ φ ]) → R [ φ ] é definido e avalia o valor p ( φ ) do polinômio característico de A em φ (isso é válido independentemente da relação entre A e φ ) ; o teorema de Cayley-Hamilton afirma que p ( φ ) é o endomorfismo nulo.

Desta forma, a seguinte prova pode ser obtida daquela de (Atiyah & MacDonald  1969 , Prop. 2.4) (que na verdade é a declaração mais geral relacionada ao lema de Nakayama ; toma-se como ideal nessa proposição o anel inteiro R ) O fato de A ser a matriz de φ na base e 1 , ..., e n significa que

Pode-se interpretá-los como n componentes de uma equação em V n , cujos membros podem ser escritos usando o produto matriz-vetor M ( n , End ( V )) × V nV n que é definido como de costume, mas com entradas individuais ψ ∈ Fim ( V ) ev em V sendo "multiplicado" pela formação ; isto dá:

onde é o elemento cujo componente i é e i (em outras palavras é a base e 1 , ..., e n de V escrita como uma coluna de vetores). Escrevendo esta equação como

reconhece-se a transposta da matriz considerada acima, e seu determinante (como elemento de M ( n , R [ φ ])) também é p ( φ ). Para derivar desta equação que p ( φ ) = 0 ∈ End ( V ), multiplica-se à esquerda pela matriz adjugada de , que é definida no anel da matriz M ( n , R [ φ ]), dando

a associatividade da multiplicação matriz-matriz e matriz-vetor usada na primeira etapa é uma propriedade puramente formal dessas operações, independente da natureza das entradas. Agora o componente i desta equação diz que p ( φ ) ( e i ) = 0 ∈ V ; assim, p ( φ ) desaparece em todos e i , e como esses elementos geram V , segue-se que p ( φ ) = 0 ∈ Fim ( V ), completando a prova.

Um fato adicional que segue dessa prova é que a matriz A cujo polinômio característico é considerado não precisa ser idêntica ao valor φ substituído naquele polinômio; basta que φ seja um endomorfismo de V satisfazendo as equações iniciais

para alguma sequência de elementos e 1 , ..., e n que geram V (cujo espaço pode ter dimensão menor que n , ou caso o anel R não seja um campo, pode não ser um módulo livre ).

Uma "prova" falsa: p ( A ) = det ( AI n  -  A ) = det ( A  -  A ) = 0

Um argumento persistente elementar, mas incorreto para o teorema é "simplesmente" tomar a definição

e substitua A por λ , obtendo

Existem muitas maneiras de ver por que esse argumento está errado. Primeiro, no teorema de Cayley-Hamilton, p ( A ) é uma matriz n × n . No entanto, o lado direito da equação acima é o valor de um determinante, que é um escalar . Portanto, eles não podem ser equacionados a menos que n  = 1 (ou seja, A é apenas um escalar). Em segundo lugar, na expressão , a variável λ realmente ocorre nas entradas diagonais da matriz . Para ilustrar, considere o polinômio característico no exemplo anterior novamente:

Se alguém substituir toda a matriz A por λ nessas posições, obtém-se

em que a expressão "matriz" simplesmente não é válida. Observe, no entanto, que se múltiplos escalares de matrizes de identidade em vez de escalares forem subtraídos acima, ou seja, se a substituição for realizada como

então o determinante é de fato zero, mas a matriz expandida em questão não avalia como ; nem pode seu determinante (um escalar) ser comparado a p ( A ) (uma matriz). Portanto, o argumento que ainda não se aplica.

Na verdade, se tal argumento for válido, ele também deve ser válido quando outras formas multilineares em vez de determinante forem usadas. Por exemplo, se considerarmos a função permanente e definirmos , então pelo mesmo argumento, devemos ser capazes de "provar" que q ( A ) = 0. Mas esta afirmação está comprovadamente errada. No caso bidimensional, por exemplo, a permanente de uma matriz é dada por

Então, para a matriz A no exemplo anterior,

No entanto, pode-se verificar que

Uma das provas para o teorema de Cayley-Hamilton acima tem alguma semelhança com o argumento de que . Ao introduzir uma matriz com coeficientes não numéricos, pode-se realmente deixar A viver dentro de uma entrada de matriz, mas então não é igual a A , e a conclusão é alcançada de forma diferente.

Provas usando métodos de álgebra abstrata

Propriedades básicas das derivações de Hasse-Schmidt na álgebra exterior de algum módulo B M (supostamente livre e de classificação finita) foram usadas por Gatto & Salehyan (2016 , §4) para provar o teorema de Cayley-Hamilton. Veja também Gatto & Scherbak (2015) .

Abstração e generalizações

As provas acima mostram que o teorema de Cayley-Hamilton vale para matrizes com entradas em qualquer anel comutativo R , e que p ( φ ) = 0 valerá sempre que φ for um endomorfismo de um módulo R gerado pelos elementos e 1 , ..., e n que satisfaz

Esta versão mais geral do teorema é a fonte do célebre lema de Nakayama em álgebra comutativa e geometria algébrica.

Veja também

Observações

Notas

Referências

links externos