Superracionalidade - Superrationality

Em economia e teoria dos jogos , um participante é considerado como tendo super- racionalidade (ou racionalidade renormalizada ) se ele tem uma racionalidade perfeita (e, portanto, maximiza sua utilidade ), mas assume que todos os outros jogadores são super-racionais também e que um indivíduo super-racional sempre aparecerá com o a mesma estratégia de qualquer outro pensador superracional ao enfrentar o mesmo problema. Aplicando esta definição, um jogador super-racional jogando contra um oponente super-racional no dilema do prisioneiro irá cooperar enquanto um jogador com interesse próprio racionalmente desertaria.

Esta regra de decisão não é um modelo dominante dentro da teoria dos jogos e foi sugerida por Douglas Hofstadter em seu artigo, série e livro Metamagical Themas como um tipo alternativo de tomada de decisão racional diferente da amplamente aceita teoria dos jogos . Superrationality é uma forma de Immanuel Kant 's imperativo categórico , e está intimamente relacionado com o conceito de Kant equilíbrio proposto pelo economista e analítica marxista John Roemer. Hofstadter forneceu esta definição: "Os pensadores superracionais, por definição recursiva, incluem em seus cálculos o fato de estarem em um grupo de pensadores superracionais." Isso é equivalente a raciocinar como se todos no grupo obedecessem ao imperativo categórico de Kant: "deve-se realizar aquelas ações e apenas aquelas que defendemos que todos os outros também realizam".

Ao contrário do suposto " humano recíproco ", o pensador superracional nem sempre jogará o equilíbrio que maximiza a utilidade social total e, portanto, não é um filantropo .

Dilema do Prisioneiro

A ideia de super-racionalidade é que dois pensadores lógicos que analisam o mesmo problema pensarão na mesma resposta correta. Por exemplo, se duas pessoas são boas em matemática e ambas tiveram o mesmo problema complicado para resolver, ambas obterão a mesma resposta certa. Na matemática, saber que as duas respostas serão iguais não altera o valor do problema, mas na teoria dos jogos, saber que a resposta será a mesma pode alterar a própria resposta.

O dilema do prisioneiro geralmente é formulado em termos de sentenças de prisão para criminosos, mas pode ser expresso da mesma forma com prêmios em dinheiro. Dois jogadores podem escolher entre cooperar (C) ou desertar (D). Os jogadores escolhem sem saber o que o outro vai fazer. Se ambos cooperarem, cada um receberá $ 100. Se ambos desertarem, cada um receberá $ 1. Se um cooperar e o outro defeituar, o jogador que desertou recebe $ 200, enquanto o jogador que cooperou não recebe nada.

Os quatro resultados e a recompensa para cada jogador estão listados abaixo.

Jogador B coopera Defeitos do jogador B
O jogador A coopera Ambos recebem $ 100 Jogador A: $ 0
Jogador B: $ 200
Defeitos do jogador A Jogador A: $ 200
Jogador B: $ 0
Ambos recebem $ 1

Uma maneira válida de os jogadores raciocinarem é a seguinte:

  1. Supondo que o outro jogador deserte, se eu cooperar, não ganho nada e se deserro, recebo um dólar.
  2. Supondo que o outro jogador coopere, recebo $ 100 se cooperar e $ 200 se desertar.
  3. Portanto, o que quer que o outro jogador faça, minha recompensa é aumentada por desertar, mesmo que apenas em um dólar.

A conclusão é que a coisa racional a fazer é desertar. Esse tipo de raciocínio define a racionalidade da teoria dos jogos e dois jogadores racionais da teoria dos jogos que jogam esse jogo desertam e recebem um dólar cada.

Superracionalidade é um método alternativo de raciocínio. Primeiro, assume-se que a resposta para um problema simétrico será a mesma para todos os jogadores superracionais. Assim, a mesmice é levada em consideração antes de se saber qual será a estratégia. A estratégia é encontrada maximizando o retorno para cada jogador, supondo que todos eles usem a mesma estratégia. Uma vez que o jogador superracional sabe que o outro jogador superracional fará a mesma coisa, seja o que for, existem apenas duas escolhas para dois jogadores superracionais. Ambos irão cooperar ou ambos irão desertar, dependendo do valor da resposta superracional. Assim, os dois jogadores superracionais irão cooperar, uma vez que essa resposta maximiza seu retorno. Dois jogadores superracionais jogando este jogo vão sair com $ 100 cada um.

Observe que um jogador superracional jogando contra um jogador racional da teoria do jogo irá desertar, uma vez que a estratégia apenas pressupõe que os jogadores superracionais concordarão. Um jogador super-racional jogando contra um jogador de super-racionalidade incerta às vezes desertará e às vezes cooperará, com base na probabilidade de o outro jogador ser super-racional.

Embora a teoria dos jogos padrão presuma um conhecimento comum da racionalidade, ela o faz de uma maneira diferente. A análise teórica do jogo maximiza os payoffs ao permitir que cada jogador mude estratégias independentemente dos outros, mesmo que, no final, assuma que a resposta em um jogo simétrico será a mesma para todos. Esta é a definição de um equilíbrio de Nash teórico do jogo , que define uma estratégia estável como aquela em que nenhum jogador pode melhorar os ganhos mudando unilateralmente o curso. O equilíbrio superracional em um jogo simétrico é aquele em que todas as estratégias dos jogadores são forçadas a ser as mesmas antes da etapa de maximização. (Não há uma extensão acordada do conceito de super-racionalidade para jogos assimétricos.)

Alguns argumentam que a super-racionalidade implica um tipo de pensamento mágico em que cada jogador supõe que sua decisão de cooperar fará com que o outro jogador coopere, mesmo que não haja comunicação. Hofstadter aponta que o conceito de "escolha" não se aplica quando o objetivo do jogador é descobrir algo, e que a decisão não faz com que o outro jogador coopere, mas sim a mesma lógica leva à mesma resposta independente da comunicação ou causa e efeito. Este debate é sobre se é razoável para os seres humanos agirem de maneira super-racional, não sobre o que significa super-racionalidade, e é semelhante a argumentos sobre se é razoável para os humanos agirem de maneira "racional", conforme descrito pela teoria dos jogos (em que eles podem descobrir o que outros jogadores farão ou terão feito perguntando a si mesmos, o que eu faria se eu fosse eles, e aplicando indução retroativa e eliminação iterada de estratégias dominadas ).

Estratégias probabilísticas

Para simplificar, a descrição anterior da super-racionalidade ignorou estratégias mistas : a possibilidade de que a melhor escolha seria jogar uma moeda ou, mais geralmente, escolher resultados diferentes com alguma probabilidade. No dilema do prisioneiro , é super-racional cooperar com probabilidade 1, mesmo quando estratégias mistas são admitidas, porque o retorno médio quando um jogador coopera e o outro defeitos são os mesmos de quando ambos cooperam e, portanto, desertar aumenta o risco de ambos desertarem, o que diminui o pagamento esperado. Mas, em alguns casos, a estratégia superracional é mista.

Por exemplo, se os ganhos são os seguintes:

CC - $ 100 / $ 100
CD - $ 0 / $ 1.000.000
DC - $ 1.000.000 / $ 0
DD - $ 1 / $ 1

De forma que desertar tenha uma grande recompensa, a estratégia superracional é desertar com uma probabilidade de 499.900 / 999.899 ou um pouco mais de 49,995%. À medida que a recompensa aumenta para o infinito, a probabilidade se aproxima de 1/2 ainda mais, e as perdas por adotar a estratégia mais simples de 1/2 (que já são mínimas) se aproximam de 0. Em um exemplo menos extremo, se a recompensa para um cooperador e um desertor custava $ 400 e $ 0, respectivamente, o mundo de estratégia mista superracional estaria desertando com probabilidade 100/299 ou cerca de 1/3.

Em situações semelhantes com mais jogadores, o uso de um dispositivo de randomização pode ser essencial. Um exemplo discutido por Hofstadter é o dilema da platonia : um trilionário excêntrico contata 20 pessoas e diz a elas que se apenas uma delas enviar um telegrama (presumivelmente não custará nada) até o meio-dia do dia seguinte, essa pessoa receberá um bilhão de dólares. Se receberem mais de um telegrama ou nenhum, ninguém receberá dinheiro e a comunicação entre jogadores é proibida. Nesta situação, a coisa superracional a fazer (se for sabido que todos os 20 são superracionais) é enviar um telegrama com probabilidade p = 1/20 - ou seja, cada destinatário essencialmente rola um dado de 20 lados e envia apenas um telegrama se for "1". Isso maximiza a probabilidade de que exatamente um telegrama seja recebido.

Observe, porém, que esta não é a solução na análise teórica de jogo convencional. Vinte jogadores, teoricamente racionais, enviariam telegramas cada um e, portanto, nada receberiam. Isso ocorre porque o envio de telegramas é a estratégia dominante ; se um jogador individual enviar telegramas, ele terá a chance de receber dinheiro, mas se não enviar nenhum telegrama, não poderá receber nada. (Se fosse garantido que todos os telegramas chegassem, eles enviariam apenas um e ninguém esperava receber dinheiro).

Veja também

Referências