Projeção (álgebra linear) - Projection (linear algebra)

A transformação P é a projeção ortogonal na linha m .

Na álgebra linear e na análise funcional , uma projeção é uma transformação linear de um espaço vetorial para ela mesma . Ou seja, sempre que for aplicado duas vezes a qualquer valor, dá o mesmo resultado como se fosse aplicado uma vez ( idempotente ). Ele deixa sua imagem inalterada. Embora abstrata , esta definição de "projeção" formaliza e generaliza a ideia de projeção gráfica . Também se pode considerar o efeito de uma projeção em um objeto geométrico examinando o efeito da projeção em pontos do objeto. ${\ displaystyle P}$ ${\ displaystyle P ^ {2} = P}$ ${\ displaystyle P}$

Definições

Uma projeção em um espaço vetorial é um operador linear desse tipo . ${\ displaystyle V}$ ${\ displaystyle P: V \ a V}$ ${\ displaystyle P ^ {2} = P}$

Quando tem um produto interno e está completo (ou seja, quando é um espaço de Hilbert ), o conceito de ortogonalidade pode ser usado. Uma projeção em um espaço de Hilbert é chamada de projeção ortogonal se for satisfatória para todos . Uma projeção em um espaço de Hilbert que não é ortogonal é chamada de projeção oblíqua . ${\ displaystyle V}$ ${\ displaystyle V}$ ${\ displaystyle P}$ ${\ displaystyle V}$ ${\ displaystyle \ langle P \ mathbf {x}, \ mathbf {y} \ rangle = \ langle \ mathbf {x}, P \ mathbf {y} \ rangle}$ ${\ displaystyle \ mathbf {x}, \ mathbf {y} \ in V}$

Matriz de projeção

No caso de dimensão finita, uma matriz quadrada é chamada de matriz de projeção se for igual ao seu quadrado, ou seja, se . ${\ displaystyle P}$ ${\ displaystyle P ^ {2} = P}$
Uma matriz quadrada é chamada de matriz de projeção ortogonal se for uma matriz real e, respectivamente, para uma matriz complexa, onde denota a transposta de e denota a transposta adjunta ou hermitiana de . ${\ displaystyle P}$ ${\ displaystyle P ^ {2} = P = P ^ {\ mathrm {T}}}$ ${\ displaystyle P ^ {2} = P = P ^ {*}}$ ${\ displaystyle P ^ {\ mathrm {T}}}$ ${\ displaystyle P}$ ${\ displaystyle P ^ {*}}$ ${\ displaystyle P}$
Uma matriz de projeção que não é uma matriz de projeção ortogonal é chamada de matriz de projeção oblíqua .

Os valores próprios de uma matriz de projeção devem ser 0 ou 1.

Exemplos

Projeção ortogonal

Por exemplo, a função que mapeia o ponto no espaço tridimensional ao ponto é uma projeção ortogonal no plano xy . Esta função é representada pela matriz ${\ displaystyle (x, y, z)}$ ${\ displaystyle \ mathbb {R} ^ {3}}$ ${\ displaystyle (x, y, 0)}$

{\ displaystyle P = {\ begin {bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \ end {bmatrix}}.}

A ação desta matriz em um vetor arbitrário é

{\ displaystyle P {\ begin {bmatrix} x \\ y \\ z \ end {bmatrix}} = {\ begin {bmatrix} x \\ y \\ 0 \ end {bmatrix}}.}

Para ver que é de fato uma projeção, ou seja, calculamos ${\ displaystyle P}$ ${\ displaystyle P = P ^ {2}}$

{\ displaystyle P ^ {2} {\ begin {bmatrix} x \\ y \\ z \ end {bmatrix}} = P {\ begin {bmatrix} x \\ y \\ 0 \ end {bmatrix}} = { \ begin {bmatrix} x \\ y \\ 0 \ end {bmatrix}} = P {\ begin {bmatrix} x \\ y \\ z \ end {bmatrix}}}

.

Observar isso mostra que a projeção é uma projeção ortogonal. ${\ displaystyle P ^ {\ mathrm {T}} = P}$

Projeção oblíqua

Um exemplo simples de uma projeção não ortogonal (oblíqua) (para definição veja abaixo) é

{\ displaystyle P = {\ begin {bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}}.}

Via multiplicação de matrizes , vê-se que

{\ displaystyle P ^ {2} = {\ begin {bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}} {\ begin {bmatrix} 0 & 0 \\\ alpha & 1 \ end {bmatrix}} = {\ begin { bmatriz} 0 & 0 \\\ alpha & 1 \ end {bmatrix}} = P.}

provar que é de fato uma projeção. ${\ displaystyle P}$

A projeção é ortogonal se e somente se porque somente então . ${\ displaystyle P}$ ${\ displaystyle \ alpha = 0}$ ${\ displaystyle P ^ {\ mathrm {T}} = P}$

Propriedades e classificação

A transformação T é a projeção ao longo de k em m . O intervalo de T é m e o espaço nulo é k .

Idempotência

Por definição, uma projeção é idempotente (isto é ). ${\ displaystyle P}$ ${\ displaystyle P ^ {2} = P}$

Complementaridade de alcance e kernel

Let Ser um espaço vetorial de dimensão finita e ser uma projeção sobre . Suponha que os subespaços e sejam o intervalo e o kernel de, respectivamente. Então tem as seguintes propriedades: ${\ displaystyle W}$ ${\ displaystyle P}$ ${\ displaystyle W}$ ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle P}$ ${\ displaystyle P}$

${\ displaystyle P}$ é o operador de identidade em ${\ displaystyle I}$ ${\ displaystyle U}$
${\ displaystyle \ forall \ mathbf {x} \ in U: P \ mathbf {x} = \ mathbf {x}}$ .
Temos uma soma direta . Cada vetor pode ser decomposto exclusivamente como com e , e onde . ${\ displaystyle W = U \ oplus V}$ ${\ displaystyle \ mathbf {x} \ in W}$ ${\ displaystyle \ mathbf {x} = \ mathbf {u} + \ mathbf {v}}$ ${\ displaystyle \ mathbf {u} = P \ mathbf {x}}$ ${\ displaystyle \ mathbf {v} = \ mathbf {x} -P \ mathbf {x} = \ left (IP \ right) \ mathbf {x}}$ ${\ displaystyle \ mathbf {u} \ in U, \ mathbf {v} \ in V}$

O alcance e o núcleo de uma projeção são complementares , assim como e . O operador também é uma projeção à medida que o intervalo e o kernel de tornam-se o kernel e o intervalo de e vice-versa. Dizemos é uma projecção ao longo sobre (kernel / gama) e é uma projecção ao longo para . ${\ displaystyle P}$ ${\ displaystyle Q = IP}$ ${\ displaystyle Q}$ ${\ displaystyle P}$ ${\ displaystyle Q}$ ${\ displaystyle P}$ ${\ displaystyle V}$ ${\ displaystyle U}$ ${\ displaystyle Q}$ ${\ displaystyle U}$ ${\ displaystyle V}$

Espectro

Em espaços vetoriais de dimensão infinita, o espectro de uma projeção está contido em como ${\ displaystyle \ {0,1 \}}$

{\ displaystyle (\ lambda IP) ^ {- 1} = {\ frac {1} {\ lambda}} I + {\ frac {1} {\ lambda (\ lambda -1)}} P.}

Apenas 0 ou 1 pode ser um valor próprio de uma projeção. Isso implica que uma projeção ortogonal é sempre uma matriz semi-definida positiva. Em geral, os espaços próprios correspondentes são (respectivamente) o núcleo e o intervalo da projeção. A decomposição de um espaço vetorial em somas diretas não é única. Portanto, dado um subespaço , pode haver muitas projeções cujo intervalo (ou kernel) é . ${\ displaystyle P}$ ${\ displaystyle V}$ ${\ displaystyle V}$

Se uma projeção não for trivial, ela terá um polinômio mínimo , que se transforma em raízes distintas e, portanto, será diagonalizável . ${\ displaystyle x ^ {2} -x = x (x-1)}$ ${\ displaystyle P}$

Produto de projeções

O produto das projeções não é em geral uma projeção, mesmo que sejam ortogonais. Se duas projeções comutam, então seu produto é uma projeção, mas o inverso é falso: o produto de duas projeções não comutantes pode ser uma projeção.

Se duas projeções ortogonais comutam, seu produto é uma projeção ortogonal. Se o produto de duas projeções ortogonais é uma projeção ortogonal, então as duas projeções ortogonais comutam (mais geralmente: dois endomorfismos auto-adjuntos comutam se e somente se seu produto é auto-adjuntos).

Projeções ortogonais

Quando o espaço vetorial tem um produto interno e está completo (é um espaço de Hilbert ), o conceito de ortogonalidade pode ser usado. Uma projeção ortogonal é uma projeção para a qual o intervalo e o espaço nulo são subespaços ortogonais . Assim, para cada e em , . Equivalentemente: ${\ displaystyle W}$ ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle \ mathbf {x}}$ ${\ displaystyle \ mathbf {y}}$ ${\ displaystyle W}$ ${\ displaystyle \ langle P \ mathbf {x}, (\ mathbf {y} -P \ mathbf {y}) \ rangle = \ langle (\ mathbf {x} -P \ mathbf {x}), P \ mathbf { y} \ rangle = 0}$

{\ displaystyle \ langle \ mathbf {x}, P \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, P \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, \ mathbf { y} \ rangle.}

Uma projeção é ortogonal se, e somente se, for auto-adjunta . Usando a auto-adjunta e idempotentes propriedades , para qualquer e no que temos , e ${\ displaystyle P}$ ${\ displaystyle \ mathbf {x}}$ ${\ displaystyle \ mathbf {y}}$ ${\ displaystyle W}$ ${\ displaystyle P \ mathbf {x} \ in U}$ ${\ displaystyle \ mathbf {y} -P \ mathbf {y} \ in V}$

{\ displaystyle \ langle P \ mathbf {x}, \ mathbf {y} -P \ mathbf {y} \ rangle = \ langle P ^ {2} \ mathbf {x}, \ mathbf {y} -P \ mathbf { y} \ rangle = \ langle P \ mathbf {x}, P \ left (IP \ right) \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, \ left (PP ^ {2} \ right) \ mathbf {y} \ rangle = 0}

onde está o produto interno associado . Portanto, e são projeções ortogonais. A outra direção, ou seja, se for ortogonal, então é auto-adjunta, segue de ${\ displaystyle \ langle \ cdot, \ cdot \ rangle}$ ${\ displaystyle W}$ ${\ displaystyle P}$ ${\ displaystyle IP}$ ${\ displaystyle P}$

{\ displaystyle \ langle \ mathbf {x}, P \ mathbf {y} \ rangle = \ langle P \ mathbf {x}, \ mathbf {y} \ rangle = \ langle \ mathbf {x}, P ^ {*} \ mathbf {y} \ rangle}

para todos e em ; assim . ${\ displaystyle x}$ ${\ displaystyle y}$ ${\ displaystyle W}$ ${\ displaystyle P = P ^ {*}}$

Prova de existência

Seja um espaço métrico completo com um produto interno e seja um subespaço linear fechado de (e, portanto, também completo). ${\ displaystyle H}$ ${\ displaystyle U}$ ${\ displaystyle H}$

Para cada o seguinte conjunto de não-negativos norma -Valores tem um ínfimo , e devido à integralidade de que é um mínimo . Definimos como o ponto em que esse mínimo é obtido. ${\ displaystyle \ mathbf {x}}$ ${\ displaystyle \ {\ | \ mathbf {x} - \ mathbf {u} \ | \ mid \ mathbf {u} \ em U \}}$ ${\ displaystyle U}$ ${\ displaystyle P \ mathbf {x}}$ ${\ displaystyle U}$

Obviamente está dentro . Resta mostrar que satisfaz e que é linear. ${\ displaystyle P \ mathbf {x}}$ ${\ displaystyle U}$ ${\ displaystyle P \ mathbf {x}}$ ${\ displaystyle \ langle \ mathbf {x} -P \ mathbf {x}, P \ mathbf {x} \ rangle = 0}$

Vamos definir . Para cada diferente de zero em , o seguinte é válido: ${\ displaystyle \ mathbf {a} = \ mathbf {x} -P \ mathbf {x}}$ ${\ displaystyle \ mathbf {v}}$ ${\ displaystyle U}$

{\ displaystyle \ left \ | \ mathbf {a} - {\ frac {\ langle \ mathbf {a}, \ mathbf {v} \ rangle} {\ | \ mathbf {v} \ | ^ {2}}} \ mathbf {v} \ right \ | ^ {2} = \ | \ mathbf {a} \ | ^ {2} - {\ frac {{\ langle \ mathbf {a}, \ mathbf {v} \ rangle} ^ { 2}} {\ | \ mathbf {v} \ | ^ {2}}}}

Ao definir , vemos que a menos que desaparece. Visto que foi escolhido como o mínimo do conjunto acima mencionado, segue-se que de fato desaparece. Em particular, (por ): . ${\ displaystyle \ mathbf {w} = P \ mathbf {x} + {\ frac {\ langle \ mathbf {a}, \ mathbf {v} \ rangle} {\ | \ mathbf {v} \ | ^ {2} }} \ mathbf {v}}$ ${\ displaystyle \ | \ mathbf {x} - \ mathbf {w} \ | <\ | \ mathbf {x} -P \ mathbf {x} \ |}$ ${\ displaystyle \ langle \ mathbf {a}, \ mathbf {v} \ rangle}$ ${\ displaystyle P \ mathbf {x}}$ ${\ displaystyle \ langle \ mathbf {a}, \ mathbf {v} \ rangle}$ ${\ displaystyle \ mathbf {y} = P \ mathbf {x}}$ ${\ displaystyle \ langle \ mathbf {x} -P \ mathbf {x}, P \ mathbf {x} \ rangle = 0}$

A linearidade decorre do desaparecimento de para todos : ${\ displaystyle \ langle \ mathbf {x} -P \ mathbf {x}, \ mathbf {v} \ rangle}$ ${\ displaystyle \ mathbf {v} \ em U}$

{\ displaystyle \ langle \ left (\ mathbf {x} + \ mathbf {y} \ right) -P \ left (\ mathbf {x} + \ mathbf {y} \ right), \ mathbf {v} \ rangle = 0}

{\ displaystyle \ langle \ left (\ mathbf {x} -P \ mathbf {x} \ right) + \ left (\ mathbf {y} -P \ mathbf {y} \ right), \ mathbf {v} \ rangle = 0}

Ao tomar a diferença entre as equações, temos

{\ displaystyle \ langle P \ mathbf {x} + P \ mathbf {y} -P \ left (\ mathbf {x} + \ mathbf {y} \ right), \ mathbf {v} \ rangle = 0}

Mas, uma vez que podemos escolher (como é em si ), segue-se isso . Da mesma forma, temos para cada escalar . ${\ displaystyle \ mathbf {v} = P \ mathbf {x} + P \ mathbf {y} -P (\ mathbf {x} + \ mathbf {y})}$ ${\ displaystyle U}$ ${\ displaystyle P \ mathbf {x} + P \ mathbf {y} = P (\ mathbf {x} + \ mathbf {y})}$ ${\ displaystyle \ lambda P \ mathbf {x} = P (\ lambda \ mathbf {x})}$ ${\ displaystyle \ lambda}$

Propriedades e casos especiais

Uma projeção ortogonal é um operador limitado . Isso ocorre porque para cada no espaço vetorial que temos, pela desigualdade de Cauchy-Schwarz : ${\ displaystyle \ mathbf {v}}$

{\ displaystyle \ left \ | P \ mathbf {v} \ right \ | ^ {2} = \ langle P \ mathbf {v}, P \ mathbf {v} \ rangle = \ langle P \ mathbf {v}, \ mathbf {v} \ rangle \ leq \ left \ | P \ mathbf {v} \ right \ | \ cdot \ left \ | \ mathbf {v} \ right \ |}

Assim . ${\ displaystyle \ left \ | P \ mathbf {v} \ right \ | \ leq \ left \ | \ mathbf {v} \ right \ |}$

Para complexos dimensionais finitos ou espaços vetoriais reais, o produto interno padrão pode ser substituído por . ${\ displaystyle \ langle \ cdot, \ cdot \ rangle}$

Fórmulas

Um caso simples ocorre quando a projeção ortogonal está em uma linha. Se for um vetor unitário na linha, então a projeção é dada pelo produto externo ${\ displaystyle \ mathbf {u}}$

{\ displaystyle P _ {\ mathbf {u}} = \ mathbf {u} \ mathbf {u} ^ {\ mathrm {T}}.}

(Se for de valor complexo, a transposta na equação acima é substituída por uma transposta Hermitiana). Este operador deixa u invariante e aniquila todos os vetores ortogonais a , provando que é de fato a projeção ortogonal sobre a reta que contém u . Uma maneira simples de ver isso é considerar um vetor arbitrário como a soma de um componente da linha (ou seja, o vetor projetado que buscamos) e outro perpendicular a ele ,. Aplicando a projeção, obtemos ${\ displaystyle \ mathbf {u}}$ ${\ displaystyle \ mathbf {u}}$ ${\ displaystyle \ mathbf {x}}$ ${\ displaystyle \ mathbf {x} = \ mathbf {x} _ {\ parallel} + \ mathbf {x} _ {\ perp}}$

{\ displaystyle P _ {\ mathbf {u}} \ mathbf {x} = \ mathbf {u} \ mathbf {u} ^ {\ mathsf {T}} \ mathbf {x} _ {\ parallel} + \ mathbf {u } \ mathbf {u} ^ {\ mathsf {T}} \ mathbf {x} _ {\ perp} = \ mathbf {u} \ left (\ operatorname {sinal} (\ mathbf {u} ^ {\ mathsf {T }} \ mathbf {x} _ {\ parallel}) \ left \ | \ mathbf {x} _ {\ parallel} \ right \ | \ right) + \ mathbf {u} \ cdot \ mathbf {0} = \ mathbf {x} _ {\ parallel}}

pelas propriedades do produto escalar de vetores paralelos e perpendiculares.

Esta fórmula pode ser generalizada para projeções ortogonais em um subespaço de dimensão arbitrária. Let ser uma base ortonormal do subespaço , e deixe denotar a matriz cujas colunas são , ie . Então a projeção é dada por: ${\ displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ ${\ displaystyle U}$ ${\ displaystyle A}$ ${\ displaystyle n \ times k}$ ${\ displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ ${\ displaystyle A = {\ begin {bmatrix} \ mathbf {u} _ {1} & \ cdots & \ mathbf {u} _ {k} \ end {bmatrix}}}$

{\ displaystyle P_ {A} = AA ^ {\ mathrm {T}}}

que pode ser reescrito como

{\ displaystyle P_ {A} = \ sum _ {i} \ langle \ mathbf {u} _ {i}, \ cdot \ rangle \ mathbf {u} _ {i}.}

A matriz é a isometria parcial que desaparece no complemento ortogonal de e é a isometria que se incorpora ao espaço vetorial subjacente. O intervalo de é, portanto, o espaço final de . Também é claro que é o operador de identidade ativado . ${\ displaystyle A ^ {\ mathrm {T}}}$ ${\ displaystyle U}$ ${\ displaystyle A}$ ${\ displaystyle U}$ ${\ displaystyle P_ {A}}$ ${\ displaystyle A}$ ${\ displaystyle AA ^ {\ mathrm {T}}}$ ${\ displaystyle U}$

A condição de ortonormalidade também pode ser eliminada. Se for uma base (não necessariamente ortonormal) e for a matriz com esses vetores como colunas, a projeção será: ${\ displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ ${\ displaystyle A}$

{\ displaystyle P_ {A} = A \ left (A ^ {\ mathrm {T}} A \ right) ^ {- 1} A ^ {\ mathrm {T}}.}

A matriz ainda se incorpora ao espaço vetorial subjacente, mas não é mais uma isometria em geral. A matriz é um "fator de normalização" que recupera a norma. Por exemplo, o operador de classificação 1 não é uma projeção se Após dividir por obtivermos a projeção no subespaço medido por . ${\ displaystyle A}$ ${\ displaystyle U}$ ${\ displaystyle \ left (A ^ {\ mathrm {T}} A \ right) ^ {- 1}}$ ${\ displaystyle \ mathbf {u} \ mathbf {u} ^ {\ mathrm {T}}}$ ${\ displaystyle \ left \ | \ mathbf {u} \ right \ | \ neq 1.}$ ${\ displaystyle \ mathbf {u} ^ {\ mathrm {T}} \ mathbf {u} = \ left \ | \ mathbf {u} \ right \ | ^ {2},}$ ${\ displaystyle \ mathbf {u} \ left (\ mathbf {u} ^ {\ mathsf {T}} \ mathbf {u} \ right) ^ {- 1} \ mathbf {u} ^ {\ mathsf {T}} }$ ${\ displaystyle u}$

No caso geral, podemos ter uma matriz definida positiva arbitrária definindo um produto interno , e a projeção é dada por . Então ${\ displaystyle D}$ ${\ displaystyle \ langle x, y \ rangle _ {D} = y ^ {\ dagger} Dx}$ ${\ displaystyle P_ {A}}$ ${\ textstyle P_ {A} x = \ operatorname {argmin} _ {y \ in \ mathrm {range} (A)} \ left \ | xy \ right \ | _ {D} ^ {2}}$

{\ displaystyle P_ {A} = A (A ^ {\ mathrm {T}} DA) ^ {- 1} A ^ {\ mathrm {T}} D.}

Quando o espaço de alcance da projecção é gerado por um quadro (ou seja, o número de geradores é maior do que a sua dimensão), a fórmula para a projecção toma a forma: . Aqui representa o pseudoinverso Moore – Penrose . Esta é apenas uma das muitas maneiras de construir o operador de projeção. ${\ displaystyle P_ {A} = AA ^ {+}}$ ${\ displaystyle A ^ {+}}$

Se for uma matriz não singular e (ou seja, é a matriz de espaço nula de ), o seguinte é válido: ${\ displaystyle {\ begin {bmatrix} A&B \ end {bmatrix}}}$ ${\ displaystyle A ^ {\ mathrm {T}} B = 0}$ ${\ displaystyle B}$ ${\ displaystyle A}$

{\ displaystyle {\ begin {align} I & = {\ begin {bmatrix} A&B \ end {bmatrix}} {\ begin {bmatrix} A&B \ end {bmatrix}} ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} \\ & = {\ begin {bmatrix} A&B \ end {bmatrix}} \ left ({\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} {\ begin {bmatrix} A&B \ end {bmatrix}} \ right) ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \ \ B ^ {\ mathrm {T}} \ end {bmatriz}} \\ & = {\ begin {bmatrix} A&B \ end {bmatrix}} {\ begin {bmatrix} A ^ {\ mathrm {T}} A&O \ \ O&B ^ {\ mathrm {T}} B \ end {bmatriz}} ^ {- 1} {\ begin {bmatrix} A ^ {\ mathrm {T}} \\ B ^ {\ mathrm {T}} \ end {bmatrix}} \\ [4pt] & = A (A ^ {\ mathrm {T}} A) ^ {- 1} A ^ {\ mathrm {T}} + B (B ^ {\ mathrm {T}} B) ^ {- 1} B ^ {\ mathrm {T}} \ end {alinhado}}}

Se a condição ortogonal é aprimorado para com não-singular, o seguinte se aplica: ${\ displaystyle A ^ {\ mathrm {T}} WB = A ^ {\ mathrm {T}} W ^ {\ mathrm {T}} B = 0}$ ${\ displaystyle W}$

{\ displaystyle I = {\ begin {bmatrix} A&B \ end {bmatrix}} {\ begin {bmatrix} \ left (A ^ {\ mathsf {T}} WA \ right) ^ {- 1} A ^ {\ mathrm {T}} \\\ left (B ^ {\ mathsf {T}} WB \ right) ^ {- 1} B ^ {\ mathrm {T}} \ end {bmatrix}} W.}

Todas essas fórmulas também são válidas para espaços de produtos internos complexos, desde que a transposta conjugada seja usada em vez da transposta. Mais detalhes sobre as somas dos projetores podem ser encontrados em Banerjee e Roy (2014). Veja também Banerjee (2004) para a aplicação de somas de projetores em trigonometria esférica básica.

Projeções oblíquas

O termo projeções oblíquas é algumas vezes usado para se referir a projeções não ortogonais. Essas projeções também são usadas para representar figuras espaciais em desenhos bidimensionais (veja projeção oblíqua ), embora não tão freqüentemente quanto as projeções ortogonais. Enquanto o cálculo do valor ajustado de uma regressão de mínimos quadrados ordinária requer uma projeção ortogonal, o cálculo do valor ajustado de uma regressão de variáveis instrumentais requer uma projeção oblíqua.

As projeções são definidas por seu espaço nulo e os vetores de base usados para caracterizar seu intervalo (que é o complemento do espaço nulo). Quando esses vetores de base são ortogonais ao espaço nulo, a projeção é uma projeção ortogonal. Quando esses vetores de base não são ortogonais ao espaço nulo, a projeção é uma projeção oblíqua. Deixe que os vetores formem uma base para o alcance da projeção e monte esses vetores na matriz . O intervalo e o espaço nulo são espaços complementares, portanto, o espaço nulo tem dimensão . Segue-se que o complemento ortogonal do espaço nulo tem dimensão . Vamos formar uma base para o complemento ortogonal do espaço nulo da projeção e montar esses vetores na matriz . Então a projeção é definida por ${\ displaystyle \ mathbf {u} _ {1}, \ ldots, \ mathbf {u} _ {k}}$ ${\ displaystyle n \ times k}$ ${\ displaystyle A}$ ${\ displaystyle nk}$ ${\ displaystyle k}$ ${\ displaystyle \ mathbf {v} _ {1}, \ ldots, \ mathbf {v} _ {k}}$ ${\ displaystyle B}$

{\ displaystyle P = A \ left (B ^ {\ mathsf {T}} A \ right) ^ {- 1} B ^ {\ mathsf {T}}.}

Esta expressão generaliza a fórmula para projeções ortogonais dada acima.

Encontrar a projeção com um produto interno

Let Ser um espaço vetorial (neste caso um plano) estendido por vetores ortogonais . Deixe ser um vetor. Pode-se definir uma projeção de sobre como ${\ displaystyle V}$ ${\ displaystyle \ mathbf {u} _ {1}, \ mathbf {u} _ {2}, \ dots, \ mathbf {u} _ {p}}$ ${\ displaystyle y}$ ${\ displaystyle \ mathbf {y}}$ ${\ displaystyle V}$

{\ displaystyle \ operatorname {proj} _ {V} \ mathbf {y} = {\ frac {\ mathbf {y} \ cdot \ mathbf {u} ^ {i}} {\ mathbf {u} ^ {i} \ cdot \ mathbf {u} ^ {i}}} \ mathbf {u} ^ {i}}

onde índices repetidos são somados ( notação de soma de Einstein ). O vetor pode ser escrito como uma soma ortogonal tal que . às vezes é denotado como . Existe um teorema em álgebra linear que afirma que esta é a distância mais curta de para e é comumente usada em áreas como aprendizado de máquina. ${\ displaystyle \ mathbf {y}}$ ${\ displaystyle \ mathbf {y} = \ operatorname {proj} _ {V} \ mathbf {y} + \ mathbf {z}}$ ${\ displaystyle \ operatorname {proj} _ {V} \ mathbf {y}}$ ${\ displaystyle {\ hat {\ mathbf {y}}}}$ ${\ displaystyle \ mathbf {z}}$ ${\ displaystyle \ mathbf {y}}$ ${\ displaystyle V}$

y está sendo projetado no espaço vetorial V.

Formas canônicas

Qualquer projeção em um espaço vetorial de dimensão sobre um campo é uma matriz diagonalizável , uma vez que seu polinômio mínimo se divide , que se divide em fatores lineares distintos. Assim, existe uma base na qual tem a forma ${\ displaystyle P = P ^ {2}}$ ${\ displaystyle d}$ ${\ displaystyle x ^ {2} -x}$ ${\ displaystyle P}$

{\ displaystyle P = I_ {r} \ oplus 0_ {dr}}

onde está o posto de . Aqui está a matriz identidade de tamanho e é a matriz zero de tamanho . Se o espaço vetorial é complexo e equipado com um produto interno , então há uma base ortonormal em que a matriz de P é ${\ displaystyle r}$ ${\ displaystyle P}$ ${\ displaystyle I_ {r}}$ ${\ displaystyle r}$ ${\ displaystyle 0_ {dr}}$ ${\ displaystyle dr}$

{\ displaystyle P = {\ begin {bmatrix} 1 & \ sigma _ {1} \\ 0 & 0 \ end {bmatrix}} \ oplus \ cdots \ oplus {\ begin {bmatrix} 1 & \ sigma _ {k} \\ 0 & 0 \ fim {bmatriz}} \ oplus I_ {m} \ oplus 0_ {s}.}

onde . Os inteiros e os números reais são determinados de forma única. Observe isso . O fator corresponde ao subespaço invariante máximo no qual atua como uma projeção ortogonal (de modo que o próprio P é ortogonal se e somente se ) e os blocos-correspondem às componentes oblíquas . ${\ displaystyle \ sigma _ {1} \ geq \ sigma _ {2} \ geq \ dots \ geq \ sigma _ {k}> 0}$ ${\ displaystyle k, s, m}$ ${\ displaystyle \ sigma _ {i}}$ ${\ displaystyle 2k + s + m = d}$ ${\ displaystyle I_ {m} \ oplus 0_ {s}}$ ${\ displaystyle P}$ ${\ displaystyle k = 0}$ ${\ displaystyle \ sigma _ {i}}$

Projeções em espaços vetoriais normatizados

Quando o espaço vetorial subjacente é um (não necessariamente finito-dimensional) espaço normado , questões analíticas, irrelevante no caso de dimensão finita, necessidade de ser considerado. Suponha que agora seja um espaço de Banach . ${\ displaystyle X}$ ${\ displaystyle X}$

Muitos dos resultados algébricos discutidos acima sobrevivem à passagem para este contexto. Uma dada decomposição de soma direta em subespaços complementares ainda especifica uma projeção e vice-versa. Se for a soma direta , o operador definido por ainda é uma projeção com intervalo e kernel . Também é claro que . Por outro lado, se a projeção está ligada , ou seja , então é facilmente verificado . Ou seja, também é uma projeção. A relação implica e é a soma direta . ${\ displaystyle X}$ ${\ displaystyle X}$ ${\ displaystyle X = U \ oplus V}$ ${\ displaystyle P (u + v) = u}$ ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle P ^ {2} = P}$ ${\ displaystyle P}$ ${\ displaystyle X}$ ${\ displaystyle P ^ {2} = P}$ ${\ displaystyle (1-P) ^ {2} = (1-P)}$ ${\ displaystyle 1-P}$ ${\ displaystyle P ^ {2} = P}$ ${\ displaystyle 1 = P + (1-P)}$ ${\ displaystyle X}$ ${\ displaystyle \ operatorname {rg} (P) \ oplus \ operatorname {rg} (1-P)}$

No entanto, em contraste com o caso de dimensão finita, as projeções não precisam ser contínuas em geral. Se um subespaço de não estiver fechado na topologia de norma, a projeção em não é contínua. Em outras palavras, o intervalo de uma projeção contínua deve ser um subespaço fechado. Além disso, o kernel de uma projeção contínua (na verdade, um operador linear contínuo em geral) é fechado. Assim, uma contínua projecção dá uma decomposição de em duas complementares fechados subespaços: . ${\ displaystyle U}$ ${\ displaystyle X}$ ${\ displaystyle U}$ ${\ displaystyle P}$ ${\ displaystyle P}$ ${\ displaystyle X}$ ${\ displaystyle X = \ operatorname {rg} (P) \ oplus \ ker (P) = \ ker (1-P) \ oplus \ ker (P)}$

O inverso também é válido, com uma suposição adicional. Suponha que seja um subespaço fechado de . Se existe um subespaço fechado tal que X = U ⊕ V , então a projeção com alcance e kernel é contínua. Isso segue do teorema do gráfico fechado . Suponha que x _n → x e Px _n → y . É preciso mostrar isso . Como está fechado e { Px _n } ⊂ U , y está em , ou seja, Py = y . Além disso, x _n - Px _n = ( I - P ) x _n → x - y . Porque é fechado e {( I - P ) x _n } ⊂ V , temos , ou seja , o que comprova a afirmação. ${\ displaystyle U}$ ${\ displaystyle X}$ ${\ displaystyle V}$ ${\ displaystyle P}$ ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle Px = y}$ ${\ displaystyle U}$ ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle xy \ in V}$ ${\ displaystyle P (xy) = Px-Py = Px-y = 0}$

O argumento acima faz uso da suposição de que ambos e são fechados. Em geral, dado um subespaço fechado , não precisa existir um subespaço fechado complementar , embora para espaços de Hilbert isso sempre possa ser feito tomando o complemento ortogonal . Para espaços de Banach, um subespaço unidimensional sempre tem um subespaço complementar fechado. Esta é uma consequência imediata do teorema de Hahn-Banach . Deixe ser o intervalo linear de . Por Hahn-Banach, existe um funcional linear limitado tal que φ ( u ) = 1 . O operador satisfaz , ou seja, é uma projeção. Limite de implica continuidade de e, portanto, é um subespaço complementar fechado de . ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle U}$ ${\ displaystyle V}$ ${\ displaystyle U}$ ${\ displaystyle u}$ ${\ displaystyle \ varphi}$ ${\ displaystyle P (x) = \ varphi (x) u}$ ${\ displaystyle P ^ {2} = P}$ ${\ displaystyle \ varphi}$ ${\ displaystyle P}$ ${\ displaystyle \ ker (P) = \ operatorname {rg} (IP)}$ ${\ displaystyle U}$

Aplicações e outras considerações

As projeções (ortogonais ou não) desempenham um papel importante nos algoritmos para certos problemas de álgebra linear:

Decomposição QR (ver transformação de Householder e decomposição de Gram – Schmidt );
Decomposição de valor singular
Redução para a forma de Hessenberg (a primeira etapa em muitos algoritmos de autovalor )
Regressão linear
Elementos projetivos de álgebras de matriz são usados na construção de certos grupos K na teoria K do Operador

Como afirmado acima, as projeções são um caso especial de idempotentes. Analiticamente, as projeções ortogonais são generalizações não comutativas de funções características . Idempotentes são usados na classificação, por exemplo, de álgebras semisimples , enquanto a teoria da medida começa considerando funções características de conjuntos mensuráveis. Portanto, como se pode imaginar, as projeções são frequentemente encontradas no contexto de álgebras de operadores . Em particular, uma álgebra de von Neumann é gerada por sua rede completa de projeções.

Generalizações

De modo mais geral, dado um mapa entre espaços vetoriais normados, pode-se analogamente pedir que esse mapa seja uma isometria no complemento ortogonal do kernel: que seja uma isometria (compare Isometria parcial ); em particular, deve ser em. O caso de uma projeção ortogonal é quando W é um subespaço de V. Na geometria Riemanniana , isso é usado na definição de uma submersão Riemanniana . ${\ displaystyle T \ dois pontos V \ a W,}$ ${\ displaystyle (\ ker T) ^ {\ perp} \ to W}$

Veja também

Matriz de centralização , que é um exemplo de matriz de projeção.
Ortogonalização
Subespaço invariável
Propriedades do traço
O algoritmo de projeção de Dykstra para calcular a projeção em uma interseção de conjuntos

Notas

Referências

Banerjee, Sudipto; Roy, Anindya (2014), Linear Algebra and Matrix Analysis for Statistics , Textos em Ciência Estatística (1ª ed.), Chapman e Hall / CRC, ISBN 978-1420095388
Dunford, N .; Schwartz, JT (1958). Operadores lineares, parte I: teoria geral . Interscience.
Meyer, Carl D. (2000). Análise de Matrizes e Álgebra Linear Aplicada . Society for Industrial and Applied Mathematics. ISBN 978-0-89871-454-8.

links externos

MIT Linear Algebra Lecture on Projection Matrices on YouTube , do MIT OpenCourseWare
Linear Algebra 15d: The Projection Transformation on YouTube , de Pavel Grinfeld .
Tutorial de projeções geométricas planas - um tutorial simples de seguir que explica os diferentes tipos de projeções geométricas planas.

Languages

In other projects