Equilíbrio correlacionado - Correlated equilibrium
Equilíbrio correlacionado | |
---|---|
Um conceito de solução na teoria dos jogos | |
Relação | |
Superconjunto de | equilíbrio de Nash |
Significado | |
Proposto por | Robert Aumann |
Exemplo | Frango |
Na teoria dos jogos , um equilíbrio correlacionado é um conceito de solução mais geral do que o conhecido equilíbrio de Nash . Foi discutido pela primeira vez pelo matemático Robert Aumann em 1974. A ideia é que cada jogador escolha sua ação de acordo com sua observação privada do valor do mesmo sinal público. Uma estratégia atribui uma ação a cada observação possível que um jogador pode fazer. Se nenhum jogador quiser se desviar de sua estratégia (assumindo que os outros também não se desviem), a distribuição da qual os sinais são extraídos é chamada de equilíbrio correlacionado.
Definição formal
Um jogo estratégico para um jogador é caracterizado por um conjunto de ações e função de utilidade para cada jogador . Quando o jogador escolhe a estratégia e os jogadores restantes escolhem um perfil de estratégia descrito pelo -tuple , a utilidade do jogador sim .
Uma modificação de estratégia para o jogador é uma função . Ou seja, diz ao jogador para modificar seu comportamento, jogando a ação quando instruído a jogar .
Deixe ser um espaço de probabilidade contável . Para cada jogador , vamos ser sua partição informações, ser 's posterior e deixe , atribuindo o mesmo valor para os estados na mesma célula de ' s partição informações. Então, é um equilíbrio correlacionado do jogo estratégico para cada jogador e para cada modificação de estratégia :
Em outras palavras, é um equilíbrio correlacionado se nenhum jogador pode melhorar sua utilidade esperada por meio de uma modificação de estratégia.
Um exemplo
D são | C hicken out | |
D são | 0, 0 | 7, 2 |
C hicken out | 2, 7 | 6, 6 |
Um jogo de frango |
Considere o jogo da galinha na foto. Neste jogo, dois indivíduos estão se desafiando para uma competição em que cada um pode ousar ou se acovardar . Se um vai Ousar, é melhor que o outro se acovarde. Mas se um vai acovardar, é melhor que o outro Ouse. Isso leva a uma situação interessante em que cada um quer ousar, mas apenas se o outro se acovardar.
Neste jogo, existem três equilíbrios de Nash . Os dois equilíbrios de Nash de estratégia pura são ( D , C ) e ( C , D ). Também existe um equilíbrio de estratégia mista, em que ambos os jogadores vacilam com probabilidade de 2/3.
Agora considere um terceiro (ou algum evento natural) que tira uma das três cartas rotuladas: ( C , C ), ( D , C ) e ( C , D ), com a mesma probabilidade, ou seja, probabilidade 1/3 para cada cartão. Depois de retirar a carta, o terceiro informa aos jogadores a estratégia atribuída a eles na carta (mas não a estratégia atribuída ao oponente). Suponha que um jogador seja atribuído a D , ele não gostaria de se desviar supondo que o outro jogador jogou sua estratégia atribuída, uma vez que receberá 7 (o maior pagamento possível). Suponha que um jogador é atribuído C . Então, o outro jogador jogará C com probabilidade 1/2 e D com probabilidade 1/2. A utilidade esperada de Daring é 7 (1/2) + 0 (1/2) = 3,5 e a utilidade esperada de acovardar é 2 (1/2) + 6 (1/2) = 4. Assim, o jogador iria prefere amaldiçoar.
Como nenhum dos jogadores tem incentivo para se desviar, esse é um equilíbrio correlacionado. O payoff esperado para este equilíbrio é 7 (1/3) + 2 (1/3) + 6 (1/3) = 5, que é maior do que o payoff esperado do equilíbrio de Nash de estratégia mista.
O seguinte equilíbrio correlacionado tem uma recompensa ainda maior para ambos os jogadores: Recomendar ( C , C ) com probabilidade 1/2 e ( D , C ) e ( C , D ) com probabilidade 1/4 cada. Então, quando um jogador é recomendado para jogar C , ele sabe que o outro jogador vai jogar D com probabilidade (condicional) 1/3 e C com probabilidade 2/3, e obtém o retorno esperado 14/3, que é igual a (não menos que) o retorno esperado quando ela interpreta D . Nesse equilíbrio correlacionado, ambos os jogadores obtêm 5,25 na expectativa. Pode-se mostrar que este é o equilíbrio correlacionado com a soma máxima dos payoffs esperados para os dois jogadores.
Uma das vantagens dos equilíbrios correlacionados é que eles são computacionalmente menos caros do que os equilíbrios de Nash . Isso pode ser capturado pelo fato de que o cálculo de um equilíbrio correlacionado requer apenas a resolução de um programa linear, ao passo que a resolução de um equilíbrio de Nash requer encontrar seu ponto fixo completamente. Outra maneira de ver isso é que é possível que dois jogadores respondam às jogadas históricas de um jogo um do outro e acabem convergindo para um equilíbrio correlacionado.
Referências
Origens
- Fudenberg, Drew e Jean Tirole (1991) Game Theory , MIT Press , 1991, ISBN 0-262-06141-4
- Leyton-Brown, Kevin; Shoham, Yoav (2008), Essentials of Game Theory: A Concise, Multidisciplinary Introduction , San Rafael, CA: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1. Uma introdução matemática de 88 páginas; consulte a Seção 3.5. Grátis online em muitas universidades.
- Osborne, Martin J. e Ariel Rubinstein (1994). A Course in Game Theory , MIT Press. ISBN 0-262-65040-1 (uma introdução moderna no nível de pós-graduação)
- Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations , Nova York: Cambridge University Press , ISBN 978-0-521-89943-7. Uma referência abrangente de uma perspectiva computacional; consulte as Seções 3.4.5 e 4.6. Para download gratuito online .
- Éva Tardos (2004) Notas de aula da teoria dos jogos algorítmicos (observe um erro de digitação importante) [1]
- Iskander Karibzhanov. Código MATLAB para traçar o conjunto de equilíbrios correlacionados em um jogo de forma normal de dois jogadores
- Noam Nisan (2005) Notas de aula do curso Tópicos na fronteira de Economia e Computação (u minúsculo deve ser substituído por u_i) [2]