Sistema de equações lineares - System of linear equations

Um sistema linear em três variáveis ​​determina uma coleção de planos . O ponto de intersecção é a solução.

Em matemática , um sistema de equações lineares (ou sistema linear ) é uma coleção de uma ou mais equações lineares envolvendo o mesmo conjunto de variáveis . Por exemplo,

é um sistema de três equações nas três variáveis x , y , z . Uma solução para um sistema linear é uma atribuição de valores às variáveis ​​de forma que todas as equações sejam satisfeitas simultaneamente. Uma solução para o sistema acima é dada por

uma vez que torna todas as três equações válidas. A palavra "sistema" indica que as equações devem ser consideradas coletivamente, ao invés de individualmente.

Na matemática, a teoria dos sistemas lineares é a base e uma parte fundamental da álgebra linear , um assunto que é usado na maior parte da matemática moderna. Os algoritmos computacionais para encontrar as soluções são uma parte importante da álgebra linear numérica e desempenham um papel proeminente na engenharia , física , química , ciência da computação e economia . Um sistema de equações não lineares pode muitas vezes ser aproximado por um sistema linear (ver linearização ), uma técnica útil ao fazer um modelo matemático ou simulação de computador de um sistema relativamente complexo .

Muitas vezes, os coeficientes das equações são números reais ou complexos e as soluções são pesquisadas no mesmo conjunto de números, mas a teoria e os algoritmos se aplicam a coeficientes e soluções em qualquer campo . Para soluções em um domínio integral, como o anel dos inteiros , ou em outras estruturas algébricas , outras teorias foram desenvolvidas, consulte Equação linear sobre um anel . A programação linear inteira é uma coleção de métodos para encontrar a "melhor" solução inteira (quando há muitas). A teoria da base de Gröbner fornece algoritmos quando coeficientes e incógnitas são polinômios . A geometria tropical também é um exemplo de álgebra linear em uma estrutura mais exótica.

Exemplos elementares

Exemplo trivial

O sistema de uma equação em um desconhecido

tem a solução

No entanto, um sistema linear é comumente considerado como tendo pelo menos duas equações.

Exemplo simples não trivial

O tipo mais simples de sistema linear não trivial envolve duas equações e duas variáveis:

Um método para resolver esse sistema é o seguinte. Primeiro, resolva a equação superior em termos de :

Agora substitua esta expressão por x na equação inferior:

Isso resulta em uma única equação envolvendo apenas a variável . Resolvendo dá , e substituindo isso de volta na equação para rendimentos . Este método generaliza para sistemas com variáveis ​​adicionais (consulte "eliminação de variáveis" abaixo, ou o artigo sobre álgebra elementar .)

Forma geral

Um sistema geral de m equações lineares com n incógnitas pode ser escrito como

onde estão as incógnitas, são os coeficientes do sistema e são os termos constantes.

Freqüentemente, os coeficientes e incógnitas são números reais ou complexos , mas inteiros e números racionais também são vistos, assim como polinômios e elementos de uma estrutura algébrica abstrata .

Equação vetorial

Uma visão extremamente útil é que cada incógnita é um peso para um vetor coluna em uma combinação linear .

Isso permite que toda a linguagem e teoria dos espaços vetoriais (ou mais geralmente, módulos ) sejam aplicadas. Por exemplo, a coleção de todas as combinações lineares possíveis dos vetores do lado esquerdo é chamada de extensão , e as equações têm uma solução apenas quando o vetor do lado direito está dentro dessa extensão. Se cada vetor dentro desse intervalo tiver exatamente uma expressão como uma combinação linear dos vetores esquerdos fornecidos, então qualquer solução é única. Em qualquer caso, o intervalo tem uma base de vetores linearmente independentes que garantem exatamente uma expressão; e o número de vetores nessa base (sua dimensão ) não pode ser maior que m ou n , mas pode ser menor. Isso é importante porque, se tivermos m vetores independentes, uma solução é garantida independentemente do lado direito e, caso contrário, não é garantida.

Equação matricial

A equação vetorial é equivalente a uma equação matricial da forma

onde A é uma matriz m × n , x é um vetor coluna com n entradas e b é um vetor coluna com m entradas.

O número de vetores em uma base para o intervalo agora é expresso como a classificação da matriz.

Conjunto de soluções

O conjunto solução para as equações x - y = −1 e 3 x + y = 9 é o ponto único (2, 3).

Uma solução de um sistema linear é uma atribuição de valores às variáveis x 1 , x 2 , ..., x n de modo que cada uma das equações seja satisfeita. O conjunto de todas as soluções possíveis é denominado conjunto de soluções .

Um sistema linear pode se comportar de qualquer uma das três maneiras possíveis:

  1. O sistema possui infinitas soluções .
  2. O sistema possui uma solução única e exclusiva .
  3. O sistema não tem solução .

Interpretação geométrica

Para um sistema que envolve duas variáveis ( x e y ), cada equação linear determina uma linha na xy - avião . Como uma solução para um sistema linear deve satisfazer todas as equações, o conjunto solução é a interseção dessas linhas e, portanto, é uma linha, um único ponto ou o conjunto vazio .

Para três variáveis, cada equação linear determina um plano no espaço tridimensional , e o conjunto de solução é a interseção desses planos. Assim, o conjunto de solução pode ser um plano, uma linha, um único ponto ou o conjunto vazio. Por exemplo, como três planos paralelos não têm um ponto comum, o conjunto de solução de suas equações está vazio; o conjunto solução das equações de três planos que se cruzam em um ponto é um único ponto; se três planos passam por dois pontos, suas equações têm pelo menos duas soluções comuns; na verdade, o conjunto solução é infinito e consiste em toda a linha que passa por esses pontos.

Para n variáveis, cada equação linear determina um hiperplano no espaço n- dimensional . O conjunto solução é a intersecção desses hiperplanos, e é um plano , que pode ter qualquer dimensão menor que n .

Comportamento geral

O conjunto de soluções para duas equações em três variáveis ​​é, em geral, uma reta.

Em geral, o comportamento de um sistema linear é determinado pela relação entre o número de equações e o número de incógnitas. Aqui, "em geral" significa que um comportamento diferente pode ocorrer para valores específicos dos coeficientes das equações.

  • Em geral, um sistema com menos equações do que incógnitas tem infinitas soluções, mas pode não ter solução. Esse sistema é conhecido como um sistema subdeterminado .
  • Em geral, um sistema com o mesmo número de equações e incógnitas tem uma única solução única.
  • Em geral, um sistema com mais equações do que incógnitas não tem solução. Esse sistema também é conhecido como um sistema sobredeterminado .

No primeiro caso, a dimensão do conjunto da solução é, em geral, igual a n - m , onde n é o número de variáveis e m é o número de equações.

As fotos a seguir ilustram essa tricotomia no caso de duas variáveis:

One Line.svg Two Lines.svg Three Lines.svg
Uma equação Duas equações Três equações

O primeiro sistema tem infinitas soluções, ou seja, todos os pontos da linha azul. O segundo sistema tem uma solução única, ou seja, a interseção das duas linhas. O terceiro sistema não tem soluções, uma vez que as três linhas não compartilham um ponto comum.

Deve-se ter em mente que as fotos acima mostram apenas o caso mais comum (o caso geral). É possível que um sistema de duas equações e duas incógnitas não tenha solução (se as duas retas forem paralelas), ou que um sistema de três equações e duas incógnitas seja solucionável (se as três retas se cruzam em um único ponto).

Um sistema de equações lineares se comporta de maneira diferente do caso geral se as equações forem linearmente dependentes ou se for inconsistente e não tiver mais equações do que incógnitas.

Propriedades

Independência

As equações de um sistema linear são independentes se nenhuma das equações puder ser derivada algebricamente das outras. Quando as equações são independentes, cada equação contém novas informações sobre as variáveis ​​e a remoção de qualquer uma das equações aumenta o tamanho do conjunto de solução. Para equações lineares, a independência lógica é o mesmo que a independência linear .

As equações x - 2 y = −1 , 3 x + 5 y = 8 e 4 x + 3 y = 7 são linearmente dependentes.

Por exemplo, as equações

não são independentes - são a mesma equação quando escalados por um fator de dois e produziriam gráficos idênticos. Este é um exemplo de equivalência em um sistema de equações lineares.

Para um exemplo mais complicado, as equações

não são independentes, porque a terceira equação é a soma das outras duas. Na verdade, qualquer uma dessas equações pode ser derivada das outras duas e qualquer uma das equações pode ser removida sem afetar o conjunto de solução. Os gráficos dessas equações são três retas que se cruzam em um único ponto.

Consistência

As equações 3 x + 2 y = 6 e 3 x + 2 y = 12 são inconsistentes.

Um sistema linear é inconsistente se não tiver solução e, caso contrário, é considerado consistente . Quando o sistema é inconsistente, é possível derivar uma contradição das equações, que sempre podem ser reescritas como a afirmação 0 = 1 .

Por exemplo, as equações

são inconsistentes. Na verdade, subtraindo a primeira equação da segunda e multiplicando ambos os lados do resultado por 1/6, obtemos 0 = 1 . Os gráficos dessas equações no plano xy são um par de retas paralelas .

É possível que três equações lineares sejam inconsistentes, mesmo que quaisquer duas delas sejam consistentes juntas. Por exemplo, as equações

são inconsistentes. Adicionar as duas primeiras equações resulta em 3 x + 2 y = 2 , que pode ser subtraído da terceira equação para resultar em 0 = 1 . Quaisquer duas dessas equações têm uma solução comum. O mesmo fenômeno pode ocorrer para qualquer número de equações.

Em geral, ocorrem inconsistências se os lados esquerdo das equações em um sistema são linearmente dependentes e os termos constantes não satisfazem a relação de dependência. Um sistema de equações cujos lados esquerdos são linearmente independentes é sempre consistente.

Colocando de outra forma, de acordo com o teorema de Rouché-Capelli , qualquer sistema de equações (sobredeterminado ou não) é inconsistente se a classificação da matriz aumentada for maior que a classificação da matriz de coeficientes . Se, por outro lado, os ranks dessas duas matrizes são iguais, o sistema deve ter pelo menos uma solução. A solução é única se e somente se a classificação for igual ao número de variáveis. Caso contrário, a solução geral tem k parâmetros livres onde k é a diferença entre o número de variáveis ​​e a classificação; portanto, em tal caso, há uma infinidade de soluções. A classificação de um sistema de equações (ou seja, a classificação da matriz aumentada) nunca pode ser superior a [o número de variáveis] + 1, o que significa que um sistema com qualquer número de equações pode sempre ser reduzido a um sistema que tem um número de equações independentes que é no máximo igual a [o número de variáveis] + 1.

Equivalência

Dois sistemas lineares usando o mesmo conjunto de variáveis ​​são equivalentes se cada uma das equações no segundo sistema pode ser derivada algebricamente das equações no primeiro sistema e vice-versa. Dois sistemas são equivalentes se ambos forem inconsistentes ou se cada equação de cada um deles for uma combinação linear das equações do outro. Segue-se que dois sistemas lineares são equivalentes se e somente se eles têm o mesmo conjunto de solução.

Resolvendo um sistema linear

Existem vários algoritmos para resolver um sistema de equações lineares.

Descrevendo a solução

Quando o conjunto de soluções é finito, ele é reduzido a um único elemento. Nesse caso, a solução única é descrita por uma sequência de equações cujos lados esquerdos são os nomes das incógnitas e os lados direitos são os valores correspondentes, por exemplo . Quando uma ordem nas incógnitas foi fixada, por exemplo a ordem alfabética, a solução pode ser descrita como um vetor de valores, como no exemplo anterior.

Para descrever um conjunto com um número infinito de soluções, normalmente algumas das variáveis ​​são designadas como livres (ou independentes , ou como parâmetros ), o que significa que podem assumir qualquer valor, enquanto as variáveis ​​restantes são dependentes dos valores do variáveis ​​livres.

Por exemplo, considere o seguinte sistema:

O conjunto de soluções para este sistema pode ser descrito pelas seguintes equações:

Aqui, z é a variável livre, enquanto x e y são dependentes de z . Qualquer ponto no conjunto de soluções pode ser obtido escolhendo primeiro um valor para z e, em seguida, computando os valores correspondentes para x e y .

Cada variável livre dá ao espaço de solução um grau de liberdade , cujo número é igual à dimensão do conjunto de solução. Por exemplo, o conjunto de solução para a equação acima é uma linha, uma vez que um ponto no conjunto de solução pode ser escolhido especificando o valor do parâmetro z . Uma solução infinita de ordem superior pode descrever um plano ou conjunto de dimensão superior.

Diferentes escolhas para as variáveis ​​livres podem levar a diferentes descrições do mesmo conjunto de soluções. Por exemplo, a solução para as equações acima pode, alternativamente, ser descrita como segue:

Aqui x é a variável livre ey e z são dependentes.

Eliminação de variáveis

O método mais simples para resolver um sistema de equações lineares é eliminar variáveis ​​repetidamente. Este método pode ser descrito da seguinte forma:

  1. Na primeira equação, resolva para uma das variáveis ​​em termos das outras.
  2. Substitua esta expressão nas equações restantes. Isso produz um sistema de equações com uma equação a menos e uma incógnita a menos.
  3. Repita até que o sistema seja reduzido a uma única equação linear.
  4. Resolva esta equação e substitua novamente até que toda a solução seja encontrada.

Por exemplo, considere o seguinte sistema:

Resolver a primeira equação para xx = 5 + 2 z - 3 y , e conectar isso na segunda e terceira equação resulta

Resolver a primeira dessas equações para y resulta em y = 2 + 3 z , e conectar isso à segunda equação resulta em z = 2 . Agora temos:

Substituindo z = 2 para a segunda equação dá y = 8 , e substituindo z = 2 e y = 8 para os primeiros produz a equação x = -15 . Portanto, o conjunto solução é o único ponto ( x , y , z ) = (−15, 8, 2) .

Redução de linha

Na redução de linha (também conhecida como eliminação de Gauss ), o sistema linear é representado como uma matriz aumentada :

Essa matriz é então modificada usando operações de linha elementares até atingir a forma escalonada de linha reduzida . Existem três tipos de operações de linha elementares:

Tipo 1 : troque as posições de duas linhas.
Tipo 2 : Multiplique uma linha por um escalar diferente de zero .
Tipo 3 : adiciona a uma linha um múltiplo escalar de outra.

Como essas operações são reversíveis, a matriz aumentada produzida sempre representa um sistema linear equivalente ao original.

Existem vários algoritmos específicos para reduzir a linha de uma matriz aumentada, os mais simples dos quais são a eliminação de Gauss e a eliminação de Gauss-Jordan . O cálculo a seguir mostra a eliminação de Gauss-Jordan aplicada à matriz acima:

A última matriz está na forma escalonada de linha reduzida e representa o sistema x = −15 , y = 8 , z = 2 . Uma comparação com o exemplo da seção anterior sobre a eliminação algébrica de variáveis ​​mostra que esses dois métodos são de fato os mesmos; a diferença está em como os cálculos são escritos.

Regra de Cramer

A regra de Cramer é uma fórmula explícita para a solução de um sistema de equações lineares, com cada variável dada por um quociente de dois determinantes . Por exemplo, a solução para o sistema

É dado por

Para cada variável, o denominador é o determinante da matriz de coeficientes , enquanto o numerador é o determinante de uma matriz na qual uma coluna foi substituída pelo vetor de termos constantes.

Embora a regra de Cramer seja importante teoricamente, ela tem pouco valor prático para grandes matrizes, uma vez que o cálculo de grandes determinantes é um tanto complicado. (Na verdade, grandes determinantes são mais facilmente calculados usando redução de linha.) Além disso, a regra de Cramer tem propriedades numéricas muito pobres, tornando-a inadequada para resolver até mesmo sistemas pequenos de forma confiável, a menos que as operações sejam realizadas em aritmética racional com precisão ilimitada.

Solução matricial

Se o sistema de equações é expresso na forma de matriz , todo o conjunto de soluções também pode ser expresso na forma de matriz. Se a matriz A é quadrada (tem m linhas en = m colunas) e tem classificação completa (todas as m linhas são independentes), então o sistema tem uma solução única dada por

onde é o inverso de uma . Mais geralmente, independentemente de m = n ou não e independentemente da classificação de A , todas as soluções (se houver) são fornecidas usando o pseudoinverso de Moore-Penrose de A , denotado da seguinte forma:

onde é um vetor de parâmetros livres que abrange todos os vetores n × 1 possíveis . Uma condição necessária e suficiente para que qualquer solução (ões) exista é que a solução potencial obtida usando satisfaça - isto é, que Se esta condição não for válida, o sistema de equações é inconsistente e não tem solução. Se a condição for mantida, o sistema é consistente e existe pelo menos uma solução. Por exemplo, no caso acima mencionado em que A é quadrado e de classificação completa, simplesmente é igual e a equação de solução geral simplifica para

como afirmado anteriormente, onde saiu completamente da solução, deixando apenas uma única solução. Em outros casos, entretanto, permanece e, portanto, uma infinidade de valores potenciais do vetor de parâmetro livre dá uma infinidade de soluções da equação.

Outros métodos

Embora sistemas de três ou quatro equações possam ser resolvidos facilmente à mão (veja Cracovian ), os computadores são freqüentemente usados ​​para sistemas maiores. O algoritmo padrão para resolver um sistema de equações lineares é baseado na eliminação gaussiana com algumas modificações. Em primeiro lugar, é essencial evitar a divisão por pequenos números, o que pode levar a resultados imprecisos. Isso pode ser feito reordenando as equações, se necessário, um processo conhecido como pivotamento . Em segundo lugar, o algoritmo não exatamente eliminação de Gauss, mas calcula a decomposição LU da matriz A . Esta é principalmente uma ferramenta organizacional, mas é muito mais rápida se for necessário resolver vários sistemas com a mesma matriz A, mas com vetores b diferentes .

Se a matriz A tiver alguma estrutura especial, isso pode ser explorado para obter algoritmos mais rápidos ou precisos. Por exemplo, sistemas com uma matriz simétrica positiva definida podem ser resolvidos duas vezes mais rápido com a decomposição de Cholesky . A recursão de Levinson é um método rápido para matrizes Toeplitz . Métodos especiais existem também para matrizes com muitos elementos zero (as chamadas matrizes esparsas ), que aparecem frequentemente em aplicações.

Uma abordagem completamente diferente é freqüentemente adotada para sistemas muito grandes, que, de outra forma, consumiriam muito tempo ou memória. A ideia é começar com uma aproximação inicial da solução (que não precisa ser precisa de forma alguma) e mudar essa aproximação em várias etapas para aproximá-la da solução verdadeira. Uma vez que a aproximação é suficientemente precisa, esta é considerada a solução para o sistema. Isso leva à classe de métodos iterativos . Para algumas matrizes esparsas, a introdução da aleatoriedade melhora a velocidade dos métodos iterativos.

Também existe um algoritmo quântico para sistemas lineares de equações .

Sistemas homogêneos

Um sistema de equações lineares é homogêneo se todos os termos constantes forem zero:

Um sistema homogêneo é equivalente a uma equação matricial da forma

onde A é uma matriz m × n , x é um vetor coluna com n entradas e 0 é o vetor zero com m entradas.

Conjunto de solução homogênea

Todo sistema homogêneo possui pelo menos uma solução, conhecida como solução zero (ou trivial ), que é obtida atribuindo-se o valor zero a cada uma das variáveis. Se o sistema tem uma matriz não singular ( det ( A ) ≠ 0 ) então também é a única solução. Se o sistema tem uma matriz singular, então existe um conjunto de soluções com um número infinito de soluções. Este conjunto de soluções possui as seguintes propriedades adicionais:

  1. Se u e v são dois vectores que representam as soluções de um sistema homogéneo, em seguida, o vector soma de u + v é também uma solução para o sistema.
  2. Se u for um vetor que representa uma solução para um sistema homogêneo e r for qualquer escalar , então r u também é uma solução para o sistema.

Essas são exatamente as propriedades necessárias para que o conjunto de solução seja um subespaço linear de R n . Em particular, a solução definida para um sistema homogêneo é a mesma que o espaço nulo da matriz A correspondente . Soluções numéricas para um sistema homogêneo podem ser encontradas com uma decomposição de valor singular .

Relação com sistemas não homogêneos

Existe uma relação estreita entre as soluções para um sistema linear e as soluções para o sistema homogêneo correspondente:

Especificamente, se p é qualquer solução específica para o sistema linear A x = b , então todo o conjunto de solução pode ser descrito como

Geometricamente, isso diz que o conjunto solução para A x = b é uma tradução do conjunto solução para A x = 0 . Especificamente, o plano para o primeiro sistema pode ser obtido traduzindo o subespaço linear para o sistema homogêneo pelo vetor p .

Esse raciocínio só se aplica se o sistema A x = b tiver pelo menos uma solução. Isto ocorre, se e apenas se o vector b reside na imagem da transformação linear Uma .

Veja também

Notas

Referências

Leitura adicional

  • Axler, Sheldon Jay (1997), Linear Algebra Done Right (2ª ed.), Springer-Verlag, ISBN 0-387-98259-0
  • Lay, David C. (22 de agosto de 2005), Linear Algebra and Its Applications (3ª ed.), Addison Wesley, ISBN 978-0-321-28713-7
  • Meyer, Carl D. (15 de fevereiro de 2001), Matrix Analysis and Applied Linear Algebra , Society for Industrial and Applied Mathematics (SIAM), ISBN 978-0-89871-454-8, arquivado do original em 1º de março de 2001
  • Poole, David (2006), Linear Algebra: A Modern Introduction (2ª ed.), Brooks / Cole, ISBN 0-534-99845-3
  • Anton, Howard (2005), Elementary Linear Algebra (Applications Version) (9ª ed.), Wiley International
  • Leon, Steven J. (2006), Linear Algebra With Applications (7ª ed.), Pearson Prentice Hall
  • Strang, Gilbert (2005), Linear Algebra and Its Applications

links externos