Conceito de solução - Solution concept

Refinamentos de equilíbrio selecionados na teoria dos jogos. As setas apontam de um refinamento para o conceito mais geral (isto é, ESS Adequado).

Na teoria dos jogos , um conceito de solução é uma regra formal para prever como um jogo será jogado. Essas previsões são chamadas de "soluções", e descrevem quais estratégias serão adotadas pelos jogadores e, portanto, o resultado do jogo. Os conceitos de solução mais comumente usados ​​são os conceitos de equilíbrio , mais conhecido como equilíbrio de Nash .

Muitos conceitos de solução, para muitos jogos, resultarão em mais de uma solução. Isso coloca qualquer uma das soluções em dúvida, então um teórico de jogos pode aplicar um refinamento para restringir as soluções. Cada conceito de solução sucessivo apresentado a seguir melhora seu antecessor, eliminando equilíbrios implausíveis em jogos mais ricos.

Definição formal

Deixe ser a classe de todos os jogos e, para cada jogo , deixe ser o conjunto de perfis de estratégia de . Um conceito de solução é um elemento do produto direto, ou seja , uma função que para todos

Racionalização e dominância iterada

Nesse conceito de solução, os jogadores são considerados racionais e, portanto, as estratégias estritamente dominadas são eliminadas do conjunto de estratégias que podem ser jogadas de maneira viável. Uma estratégia é estritamente dominada quando existe alguma outra estratégia disponível para o jogador que sempre tem um retorno maior, independentemente das estratégias que os outros jogadores escolham. (Estratégias estritamente dominadas também são importantes na busca de árvore de jogo minimax .) Por exemplo, no dilema dos prisioneiros (período único) (mostrado abaixo), cooperar é estritamente dominado por defeito para ambos os jogadores, porque cada jogador é sempre melhor jogar com defeito , independentemente do que seu oponente faça.

Prisioneiro 2 coopera Prisioneiro 2 Defeito
Prisioneiro 1 coopera -0,5, -0,5 -10, 0
Prisioneiro 1 Defeito 0, −10 -2, -2

equilíbrio de Nash

Um equilíbrio de Nash é um perfil de estratégia (um perfil de estratégia especifica uma estratégia para cada jogador, por exemplo, no jogo do dilema dos prisioneiros acima ( cooperar , desertar ) especifica que o prisioneiro 1 joga cooperado e o prisioneiro 2 joga o defeito ) em que cada estratégia é a melhor resposta a todas as outras estratégias jogadas. Uma estratégia de um jogador é a melhor resposta à estratégia de outro jogador se não houver outra estratégia que possa ser jogada que renderia um pagamento maior em qualquer situação em que a estratégia do outro jogador seja jogada.

Indução reversa

Existem jogos que possuem múltiplos equilíbrios de Nash, alguns dos quais são irrealistas. No caso de jogos dinâmicos, os equilíbrios de Nash irrealistas podem ser eliminados pela aplicação da indução retroativa, que assume que o jogo futuro será racional. Portanto, elimina ameaças não incríveis porque tais ameaças seriam irracionais de realizar se um jogador fosse chamado para fazê-lo.

Por exemplo, considere um jogo dinâmico em que os jogadores são uma empresa incumbente em um setor e um entrante potencial nesse setor. Tal como está, o operador histórico detém o monopólio da indústria e não quer perder parte da sua quota de mercado para o entrante. Se o entrante optar por não entrar, o retorno para o titular é alto (ele mantém seu monopólio) e o entrante não perde nem ganha (seu retorno é zero). Se o concorrente entrar, o titular pode lutar ou acomodar o concorrente. Ela lutará reduzindo seu preço, tirando o entrante do negócio (e incorrendo em custos de saída - uma recompensa negativa) e prejudicando seus próprios lucros. Se acomodar o entrante, perderá algumas de suas vendas, mas um preço alto será mantido e ele receberá maiores lucros do que reduzindo seu preço (mas menores do que os lucros do monopólio).

Se o concorrente entrar, a melhor resposta do titular é acomodar. Se o titular se acomoda, a melhor resposta do entrante é entrar (e obter lucro). Conseqüentemente, o perfil de estratégia em que o titular se acomoda se o entrante entrar e o entrante se o titular se acomoda é um equilíbrio de Nash. No entanto, se o titular for jogar luta, a melhor resposta do inscrito é não entrar. Se o participante não entrar, não importa o que o participante escolha fazer (uma vez que não há outra empresa para fazer isso - observe que se o participante não entrar, lutar e acomodar renderá os mesmos pagamentos para ambos os jogadores; o o operador histórico não baixará seus preços se o concorrente não entrar). Portanto, a luta pode ser considerada a melhor resposta do titular se o participante não entrar. Daí o perfil de estratégia em que o titular luta se o competidor não entra e o entrante não entra se o titular luta é um equilíbrio de Nash. Uma vez que o jogo é dinâmico, qualquer alegação do titular de que lutará é uma ameaça não crível porque, no momento em que o nó de decisão é alcançado, onde ele pode decidir lutar (ou seja, o participante entrou), seria irracional fazê-lo tão. Portanto, esse equilíbrio de Nash pode ser eliminado por indução retroativa.

Veja também:

Equilíbrio de Nash perfeito do subjogo

Uma generalização da indução retroativa é a perfeição do subjogo. A indução reversa pressupõe que todas as jogadas futuras serão racionais. Em equilíbrios perfeitos de subjogos, o jogo em todos os subjogos é racional (especificamente um equilíbrio de Nash). A indução reversa só pode ser usada em jogos finais (finitos) de duração definida e não pode ser aplicada a jogos com informações imperfeitas . Nesses casos, a perfeição do subjogo pode ser usada. O equilíbrio de Nash eliminado descrito acima é imperfeito de subjogo porque não é um equilíbrio de Nash do subjogo que começa no nó alcançado depois que o participante entrou.

Equilíbrio Bayesiano Perfeito

Às vezes, a perfeição do subjogo não impõe uma restrição grande o suficiente a resultados irracionais. Por exemplo, uma vez que os subjogos não podem atravessar conjuntos de informações , um jogo de informações imperfeitas pode ter apenas um subjogo - ele mesmo - e, portanto, a perfeição do subjogo não pode ser usada para eliminar qualquer equilíbrio de Nash. Um equilíbrio bayesiano perfeito (PBE) é uma especificação das estratégias e crenças dos jogadores sobre qual nó do conjunto de informações foi atingido pelo jogo. Uma crença sobre um nó de decisão é a probabilidade de que um determinado jogador pense que esse nó está ou estará em jogo (no caminho de equilíbrio ). Em particular, a intuição do PBE é que ele especifica as estratégias do jogador que são racionais, dadas as crenças do jogador que especifica e as crenças que especifica são consistentes com as estratégias que especifica.

Em um jogo bayesiano, uma estratégia determina o que um jogador joga em cada conjunto de informações controlado por aquele jogador. O requisito de que as crenças sejam consistentes com as estratégias é algo não especificado pela perfeição do subjogo. Portanto, PBE é uma condição de consistência nas crenças dos jogadores. Assim como em um equilíbrio de Nash, a estratégia de nenhum jogador é estritamente dominada, em um PBE, para qualquer conjunto de informações, nenhuma estratégia do jogador é estritamente dominada a partir desse conjunto de informações. Ou seja, para cada crença que o jogador poderia manter naquele conjunto de informações, não há estratégia que produza um retorno esperado maior para aquele jogador. Ao contrário dos conceitos de solução acima, nenhuma estratégia do jogador é estritamente dominada começando em qualquer conjunto de informações, mesmo que esteja fora do caminho de equilíbrio. Assim, no PBE, os jogadores não podem ameaçar jogar com estratégias estritamente dominadas a partir de qualquer informação que saia do caminho de equilíbrio.

O conceito bayesiano em nome desse conceito de solução alude ao fato de que os jogadores atualizam suas crenças de acordo com o teorema de Bayes . Eles calculam as probabilidades com base no que já aconteceu no jogo.

Indução para frente

A indução progressiva é assim chamada porque, assim como a indução retroativa assume que o jogo futuro será racional, a indução progressiva assume que o jogo passado foi racional. Quando um jogador não sabe que tipo de outro jogador é (ou seja, há informações imperfeitas e assimétricas), esse jogador pode formar uma crença de que tipo aquele jogador é, observando as ações anteriores desse jogador. Daí a crença formada por aquele jogador de que a probabilidade de o oponente ser um certo tipo é baseada no jogo passado desse oponente ser racional. Um jogador pode escolher sinalizar seu tipo por meio de suas ações.

Kohlberg e Mertens (1986) introduziram o conceito de solução de equilíbrio estável, um refinamento que satisfaz a indução direta. Um contra-exemplo foi encontrado onde tal equilíbrio estável não satisfazia a indução para trás. Para resolver o problema, Jean-François Mertens introduziu o que os teóricos dos jogos agora chamam de conceito de equilíbrio estável de Mertens , provavelmente o primeiro conceito de solução que satisfaz tanto a indução para frente quanto para trás.

Veja também

Referências