Conversa barata - Cheap talk

Na teoria dos jogos , conversa fiada é a comunicação entre jogadores que não afeta diretamente os ganhos do jogo. O fornecimento e o recebimento de informações são gratuitos. Isso contrasta com a sinalização em que o envio de certas mensagens pode ser caro para o remetente, dependendo do estado do mundo.

Um ator tem informações e o outro tem habilidade para agir. O jogador informado pode escolher estrategicamente o que dizer e o que não dizer. As coisas se tornam interessantes quando os interesses dos jogadores não estão alinhados. O exemplo clássico é o de um especialista (digamos, um ecologista) tentando explicar o estado do mundo para um tomador de decisões desinformado (digamos, um político votando em um projeto de lei de desmatamento ). O tomador de decisão, após ouvir o laudo do especialista, deve então tomar uma decisão que afeta os payoffs de ambos os jogadores.

Essa configuração básica definida por Vincent Crawford e Joel Sobel deu origem a uma variedade de variantes.

Para dar uma definição formal, conversa fiada é comunicação que é:

  1. sem custos para transmitir e receber
  2. não vinculativo (ou seja, não limita as escolhas estratégicas de nenhuma das partes)
  3. não verificável (ou seja, não pode ser verificado por terceiros, como um tribunal)

Portanto, um agente engajado em uma conversa vulgar pode mentir impunemente, mas pode escolher em equilíbrio por não fazê-lo.

Artigo original de Crawford e Sobel

Configuração

Na forma básica do jogo, existem dois jogadores que comunicam, um emissor S e um receptor R .

Modelo. O remetente S obtém conhecimento do estado do mundo ou de seu "tipo" t . O receptor R não conhece t  ; ele tem apenas crenças ex-ante sobre isso e confia em uma mensagem de S para possivelmente melhorar a precisão de suas crenças.

Mensagem. S decide enviar mensagem m . A mensagem m pode revelar informações completas, mas também pode fornecer informações limitadas e borradas: normalmente dirá "O estado do mundo está entre t 1 e t 2 ". Pode não fornecer nenhuma informação.

A forma da mensagem não importa, desde que haja entendimento mútuo, interpretação comum. Pode ser uma declaração geral do presidente de um banco central, um discurso político em qualquer idioma, etc. Seja qual for a forma, eventualmente significa "O estado do mundo está entre t 1 e t 2 ".

Açao. O receptor R recebe a mensagem m . R atualiza suas crenças sobre o estado do mundo com as novas informações que pode obter, usando a regra de Bayes . R decide agir a . Essa ação afeta sua própria utilidade e a do remetente.

Utilitário. A decisão de S em relação ao conteúdo de m é baseada na maximização de sua utilidade, dado o que ele espera que R faça. Utilidade é uma forma de quantificar satisfação ou desejos. Podem ser lucros financeiros ou satisfação não financeira - por exemplo, até que ponto o meio ambiente é protegido.

→ Utilitários quadráticos:

Os respectivos utilitários de S e R podem ser especificados pelo seguinte:

A teoria se aplica a formas mais gerais de utilidade, mas as preferências quadráticas tornam a exposição mais fácil. Assim, S e R têm objetivos diferentes se b ≠ 0 . O parâmetro b é interpretado como conflito de interesses entre os dois jogadores ou, alternativamente, como viés.

U R é maximizado quando a = t , o que significa que o receptor deseja realizar uma ação que corresponda ao estado do mundo, que ele não conhece em geral. U S é maximizado quando a = t + b , o que significa que S deseja que uma ação um pouco mais alta seja realizada. Uma vez que S não controla a ação, S deve obter a ação desejada escolhendo quais informações revelar. A utilidade de cada jogador depende do estado do mundo e das decisões de ambos os jogadores que eventualmente levam à ação a .

Equilíbrio de Nash. Procuramos um equilíbrio onde cada jogador decide de forma otimizada, assumindo que o outro jogador também decide de forma otimizada. Os jogadores são racionais, embora R tenha apenas informações limitadas. As expectativas se realizam e não há incentivo para se desviar dessa situação.

Teorema

Figura 1: Configuração de comunicação barata

Crawford e Sobel caracterizam possíveis equilíbrios de Nash .

  • Normalmente existem vários equilíbrios , mas em um número finito.
  • Separar , que significa revelação total de informações, não é um equilíbrio de Nash.
  • Balbuciar , o que significa que nenhuma informação é transmitida, é sempre um resultado de equilíbrio.

Quando os interesses estão alinhados, as informações são totalmente divulgadas. Quando o conflito de interesses é muito grande, todas as informações são mantidas ocultas. Esses são casos extremos. O modelo que permite casos mais sutis quando os interesses são próximos, mas diferentes e, nesses casos, o comportamento ideal leva à divulgação de algumas, mas não todas as informações, levando a vários tipos de frases cuidadosamente formuladas que podemos observar.

De forma geral :

  • Existe N * > 0 de modo que para todo N com 1 ≤ N ≤ N * ,
  • existe pelo menos um equilíbrio no qual o conjunto de ações induzidas tem cardinalidade N ; e além disso
  • não há equilíbrio que induz mais do que N * ações.

Mensagens Embora as mensagens possam assumir ex-ante um número infinito de valores possíveis µ (t) para o número infinito de estados possíveis do mundo t , na verdade elas podem assumir apenas um número finito de valores (m 1 , m 2 ,.., m N ) .

Assim, um equilíbrio pode ser caracterizado por uma partição (t 0 (N), t 1 (N).. T N (N)) do conjunto de tipos [0, 1], onde 0 = t 0 (N) < t 1 (N) <. . . <t N (N) = 1 . Esta partição é mostrada no segmento superior direito da Figura 1.

Os t i (N) 's são os limites dos intervalos onde as mensagens são constantes: para t i-1 (N) <t <t i (N), µ (t) = m i .

Ações. Como as ações são funções de mensagens, as ações também são constantes nesses intervalos: para t i-1 (N) <t <t i (N) , α (t) = α (m i ) = a i .

A função de ação agora é indiretamente caracterizada pelo fato de que cada valor a i otimiza o retorno para o R , sabendo que t está entre t 1 e t 2 . Matematicamente (assumindo que t é uniformemente distribuído em [0, 1]),

Utilitários quadráticos:

Dado que R sabe que t está entre t i-1 e t i , e na utilidade quadrática caso especial em que R quer ação a ser tão perto de t possível, podemos mostrar que muito intuitivamente a ação ótima é o meio de o intervalo:

Condição de indiferença. O que acontece em t = t i ? O remetente deve ser indiferente entre enviar a mensagem m i-1 ou m i . 1 ≤ i≤ N-1      

Isso fornece informações sobre N e t i .

→ Praticamente:

Consideramos uma partição de tamanho N . Pode-se mostrar que

N deve ser pequeno o suficiente para que o numerador seja positivo. Isso determina o valor máximo permitido

onde é o teto de , ou seja, o menor inteiro positivo maior ou igual a .

Exemplo: presumimos que b = 1/20 . Então N * = 3 . Descrevemos agora todos os equilíbrios para N = 1 , 2 ou 3 (veja a Figura 2).

Figura 2: Mensagem e utilitários para conflito de interesses b = 1/20 , para N = 1 , 2 e 3

N = 1: Este é o equilíbrio balbuciante. t 0 = 0, t 1 = 1 ; a 1 = 1/2 = 0,5 .

N = 2: t 0 = 0, t 1 = 2/5 = 0,4, t 2 = 1 ; a 1 = 1/5 = 0,2, a 2 = 7/10 = 0,7 .

N = N * = 3: t 0 = 0, t 1 = 2/15, t 2 = 7/15, t 3 = 1 ; a 1 = 1/15, a 2 = 3/10 = 0,3, a 3 = 11/15 .

Com N = 1 , obtemos a mensagem mais grosseira possível, que não fornece nenhuma informação. Portanto, tudo é vermelho no painel superior esquerdo. Com N = 3 , a mensagem é mais precisa . No entanto, permanece bastante grosseiro em comparação com a revelação total, que seria a linha de 45 °, mas que não é um equilíbrio de Nash.

Com um N mais alto e uma mensagem mais precisa, a área azul é mais importante. Isso implica em maior utilidade. Divulgar mais informações beneficia ambas as partes.

Formulários

Teoria do jogo

A conversa fiada pode, em geral, ser adicionada a qualquer jogo e tem o potencial de aumentar o conjunto de resultados de equilíbrio possíveis. Por exemplo, pode-se acrescentar uma rodada de conversa fiada no início da Batalha dos Sexos . Cada jogador anuncia se pretende ir ao jogo de futebol ou à ópera. Como a Batalha dos Sexos é um jogo de coordenação , essa rodada inicial de comunicação pode permitir que os jogadores selecionem entre vários equilíbrios, obtendo assim recompensas mais altas do que no caso não coordenado. As mensagens e estratégias que geram esse resultado são simétricas para cada jogador. São eles: 1) anunciar ópera ou futebol com probabilidade par 2) se uma pessoa anunciar ópera (ou futebol), então, ao ouvir essa mensagem, a outra pessoa dirá ópera (ou futebol) também (Farrell e Rabin , 1996). Se ambos anunciarem opções diferentes, nenhuma coordenação será alcançada. No caso de mensagens de apenas um jogador, isso também pode dar a esse jogador uma vantagem de pioneiro.

Não é garantido, entretanto, que a conversa vulgar terá um efeito sobre as compensações de equilíbrio. Outro jogo, o Dilema do Prisioneiro , é um jogo cujo único equilíbrio está nas estratégias dominantes. Qualquer conversa barata pré-jogo será ignorada e os jogadores irão jogar suas estratégias dominantes (Defeito, Defeito) independentemente das mensagens enviadas.

Aplicações biológicas

Tem sido comumente argumentado que a conversa vulgar não terá efeito sobre a estrutura subjacente do jogo. Em biologia, os autores freqüentemente argumentam que a sinalização cara explica melhor a sinalização entre animais (ver Princípio da desvantagem , teoria da sinalização ). Essa crença geral tem recebido alguns desafios (ver trabalho de Carl Bergstrom e Brian Skyrms 2002, 2004). Em particular, vários modelos que usam a teoria evolucionária dos jogos indicam que conversa fiada pode ter efeitos na dinâmica evolutiva de jogos específicos.

Veja também

Notas

Referências