Teoria dos jogos comportamentais - Behavioral game theory

A teoria dos jogos comportamentais analisa as decisões estratégicas interativas e o comportamento usando os métodos da teoria dos jogos , economia experimental e psicologia experimental . Os experimentos incluem testar desvios de simplificações típicas da teoria econômica, como o axioma da independência e a negligência do altruísmo , justiça e efeitos de enquadramento . Como programa de pesquisa, o assunto é um desenvolvimento das últimas três décadas.

A teoria dos jogos tradicional concentra-se na estrutura matemática dos equilíbrios e tende a usar a escolha racional básica envolvendo a maximização da utilidade . Em contraste, a teoria dos jogos comportamentais concentra-se em como o comportamento real tende a se desviar das previsões padrão: como podemos explicar e modelar esses desvios e como podemos fazer melhores previsões usando modelos mais precisos? As escolhas estudadas na teoria dos jogos comportamentais nem sempre são racionais e nem sempre representam a escolha que maximiza a utilidade.

A teoria dos jogos comportamentais usa experimentos de laboratório e de campo, bem como modelagem - tanto teórica quanto computacional. Recentemente, métodos de aprendizado de máquina foram aplicados no trabalho na interseção da economia , psicologia e ciência da computação para melhorar a previsão e a compreensão do comportamento em jogos.

História

A teoria dos jogos comportamentais começou com o trabalho de Allais em 1953 e Ellsberg em 1961. Eles descobriram o paradoxo de Allais e o paradoxo de Ellsberg , respectivamente. Ambos os paradoxos mostram que as escolhas feitas pelos participantes em um jogo não refletem o benefício que eles esperam receber ao fazer essas escolhas. Na década de 1970, o trabalho de Vernon Smith mostrou que os mercados econômicos podiam ser examinados experimentalmente, e não apenas teoricamente. Ao mesmo tempo, vários economistas conduziram experimentos que descobriram variações dos modelos tradicionais de tomada de decisão, como teoria do arrependimento , teoria da perspectiva e desconto hiperbólico . Essas descobertas mostraram que os tomadores de decisão reais consideram muitos fatores ao fazer escolhas. Por exemplo, uma pessoa pode tentar minimizar a quantidade de arrependimento que sentirá depois de tomar uma decisão e pesar suas opções com base na quantidade de arrependimento que espera de cada uma. Como não foram examinados anteriormente pela teoria econômica tradicional, fatores como arrependimento e muitos outros estimularam pesquisas adicionais.

A partir da década de 1980, os experimentadores começaram a examinar as condições que causam divergências em relação à escolha racional . Ultimato e jogos de barganha examinaram o efeito das emoções nas previsões do comportamento do oponente. Um dos exemplos mais conhecidos de um jogo de ultimato é o programa de televisão Deal or No Deal, no qual os participantes devem tomar decisões de vender ou continuar jogando com base em ultimatos monetários dados a eles pelo "banqueiro". Esses jogos também exploraram o efeito da confiança nos resultados da tomada de decisões e no comportamento de maximização da utilidade. Jogos de recursos comuns foram usados ​​para testar experimentalmente como a cooperação e a desejabilidade social afetam as escolhas do sujeito. Um exemplo da vida real de um jogo de recurso comum pode ser a decisão de um convidado da festa de pegar de um prato de comida. As decisões dos convidados não seriam afetadas apenas por quão famintos eles estão, mas também por quanto do recurso compartilhado, a comida, resta e se o convidado acredita que outros os julgariam por comer mais. Os experimentadores durante esse período consideravam o comportamento que não maximizava a utilidade como resultado do raciocínio equivocado do participante. Na virada do século, economistas e psicólogos expandiram essa pesquisa. Os modelos baseados na teoria da escolha racional foram adaptados para refletir as preferências do tomador de decisão e tentar racionalizar as escolhas que não maximizaram a utilidade.

Comparação com a teoria dos jogos tradicionais

A teoria do jogo tradicional usa modelos teóricos para determinar a escolha mais benéfica de todos os jogadores em um jogo. A teoria dos jogos usa a teoria da escolha racional junto com suposições do conhecimento comum dos jogadores para prever decisões que maximizam a utilidade. Também permite que os jogadores prevejam as estratégias de seus oponentes. A teoria dos jogos tradicional é uma teoria basicamente normativa , pois busca apontar a decisão que os jogadores racionais devem escolher, mas não tenta explicar por que essa decisão foi tomada. A racionalidade é um pressuposto primário da teoria dos jogos, portanto não há explicações para as diferentes formas de decisões racionais ou irracionais.

A teoria dos jogos comportamentais é uma teoria principalmente positiva, em vez de uma teoria normativa. Uma teoria positiva busca descrever fenômenos em vez de prescrever uma ação correta. As teorias positivas devem ser testáveis ​​e podem ser provadas como verdadeiras ou falsas. Uma teoria normativa é subjetiva e baseada em opiniões. Por causa disso, as teorias normativas não podem ser provadas como verdadeiras ou falsas. A teoria dos jogos comportamentais tenta explicar a tomada de decisão usando dados experimentais. A teoria permite decisões racionais e irracionais porque ambas são examinadas por meio de experimentos da vida real. Especificamente, a teoria dos jogos comportamentais tenta explicar os fatores que influenciam as decisões do mundo real. Esses fatores não são explorados na área da teoria dos jogos tradicionais, mas podem ser postulados e observados por meio de dados empíricos. As descobertas da teoria dos jogos comportamentais tendem a ter maior validade externa e podem ser melhor aplicadas ao comportamento de tomada de decisão no mundo real.

Exemplos de jogos usados ​​na pesquisa comportamental da teoria dos jogos

Fatores que afetam a racionalidade em jogos

Crenças

Espera-se que as crenças sobre outras pessoas em um jogo de tomada de decisão influenciem a capacidade de fazer escolhas racionais. No entanto, as crenças dos outros também podem fazer com que os resultados experimentais se desviem das decisões de equilíbrio e maximização da utilidade. Em um experimento de Costa-Gomez (2008), os participantes foram questionados sobre suas crenças de primeira ordem sobre as ações do oponente antes de completar uma série de jogos de forma normal com outros participantes. Os participantes cumpriram o Equilíbrio de Nash apenas 35% do tempo. Além disso, os participantes apenas declararam crenças de que seus oponentes obedeceriam ao equilíbrio tradicional da teoria dos jogos 15% das vezes. Isso significa que os participantes acreditaram que seus oponentes seriam menos racionais do que realmente eram. Os resultados deste estudo mostram que os participantes não escolhem a ação de maximização da utilidade e esperam que seus oponentes façam o mesmo. Além disso, os resultados mostram que os participantes não escolheram a ação de maximização da utilidade que correspondeu às suas crenças sobre a ação do oponente. Embora os participantes possam ter acreditado que seu oponente tinha mais probabilidade de tomar uma determinada decisão, eles ainda tomavam decisões como se seu oponente estivesse escolhendo aleatoriamente. Outro estudo que examinou participantes do programa de TV Deal or No Deal encontrou divergências em relação à escolha racional. Os participantes eram mais propensos a basear suas decisões em resultados anteriores ao progredir no jogo. A aversão ao risco diminuiu quando as expectativas dos participantes não foram atendidas durante o jogo. Por exemplo, um sujeito que experimentou uma série de resultados positivos tinha menos probabilidade de aceitar o acordo e encerrar o jogo. O mesmo era verdade para um sujeito que experimentou resultados principalmente negativos no início do jogo.

Cooperação social

O comportamento social e a cooperação com outros participantes são dois fatores que não são modelados na teoria dos jogos tradicional, mas costumam ser vistos em um ambiente experimental. A evolução das normas sociais tem sido negligenciada nos modelos de tomada de decisão, mas essas normas influenciam as maneiras pelas quais as pessoas reais interagem umas com as outras e fazem escolhas. Uma tendência é a pessoa ser uma forte retribuidora. Esse tipo de pessoa entra em um jogo com predisposição para cooperar com outros jogadores. Eles aumentarão seus níveis de cooperação em resposta à cooperação de outros jogadores e diminuirão seus níveis de cooperação, mesmo às suas próprias custas, para punir os jogadores que não cooperarem. Este não é um comportamento de maximização de recompensa, pois um forte reciprocador está disposto a reduzir sua recompensa a fim de encorajar a cooperação de outras pessoas.

Dufwenberg e Kirchsteiger (2004) desenvolveram um modelo baseado na reciprocidade denominado equilíbrio de reciprocidade sequencial. Este modelo adapta a lógica da teoria dos jogos tradicionais à ideia de que os jogadores retribuem ações para cooperar. O modelo havia sido usado para prever com mais precisão os resultados experimentais de jogos clássicos, como o dilema do prisioneiro e o jogo da centopéia. Rabin (1993) também criou um equilíbrio de justiça que mede o efeito do altruísmo nas escolhas. Ele descobriu que, quando um jogador é altruísta com outro jogador, é mais provável que o segundo jogador retribua esse altruísmo. Isso se deve à ideia de justiça. Equilíbrios de justiça assumem a forma de máximo mútuo, em que ambos os jogadores escolhem um resultado que mais beneficia a ambos, ou mínimo mútuo, em que ambos os jogadores escolhem um resultado que mais os prejudica. Esses equilíbrios também são equilíbrios de Nash , mas incorporam a disposição dos participantes de cooperar e jogar limpo.

Incentivos, consequências e engano

O papel dos incentivos e consequências na tomada de decisão é interessante para os teóricos dos jogos comportamentais porque afeta o comportamento racional. Post (2008) analisou o comportamento do concorrente Deal or no Deal a fim de chegar a conclusões sobre a tomada de decisão quando as apostas são altas. O estudo das escolhas do competidor chegou à conclusão de que, em um jogo sequencial com apostas altas, as decisões eram baseadas em resultados anteriores, e não na racionalidade. Jogadores que enfrentam uma sucessão de bons resultados, neste caso, eles eliminam os casos de baixo valor do jogo, ou jogadores que enfrentam uma sucessão de resultados ruins tornam-se menos avessos ao risco. Isso significa que os jogadores que estão tendo resultados excepcionalmente bons ou excepcionalmente ruins são mais propensos a apostar e continuar jogando do que os jogadores médios. Os jogadores sortudos ou azarados estavam dispostos a rejeitar ofertas de mais de cem por cento do valor esperado de seu caso para continuar jogando. Isso mostra uma mudança do comportamento de evitar o risco para o comportamento de busca do risco. Este estudo destaca vieses comportamentais que não são levados em consideração pela teoria dos jogos tradicionais. O comportamento mais arriscado de competidores azarados pode ser atribuído ao efeito do ponto de equilíbrio, que afirma que os jogadores continuarão a tomar decisões arriscadas para ganhar dinheiro de volta. Por outro lado, o comportamento mais arriscado em competidores sortudos pode ser explicado pelo efeito do dinheiro da casa, que afirma que os jogadores vencedores têm maior probabilidade de tomar decisões arriscadas porque percebem que não estão jogando com seu próprio dinheiro. Esta análise mostra que os incentivos influenciam a escolha racional, especialmente quando os jogadores tomam uma série de decisões.

Incentivos e consequências também desempenham um grande papel no engano nos jogos. Gneezy (2005) estudou engano usando um jogo emissor-receptor barato. Neste tipo de jogo, o jogador recebe informações sobre os pagamentos da opção A e da opção B. Em seguida, o jogador um dá uma recomendação ao jogador dois sobre qual opção escolher. O jogador um pode escolher enganar o jogador dois, e o jogador dois pode escolher rejeitar o conselho do jogador. Gneezy descobriu que os participantes eram mais sensíveis ao ganho com a mentira do que à perda do oponente. Ele também descobriu que os participantes não eram totalmente egoístas e se importavam com o quanto seus oponentes perdiam com o engano, mas esse efeito diminuía à medida que seu próprio pagamento aumentava. Essas descobertas mostram que os tomadores de decisão examinam os incentivos para mentir e as consequências da mentira para decidir se mentem ou não. Em geral, as pessoas são avessas a mentir, mas, dados os incentivos certos, tendem a ignorar as consequências. Wang (2009) também usou um jogo de conversa barato para estudar o engano nos participantes com um incentivo para enganar. Usando o rastreamento ocular, ele descobriu que os participantes que receberam informações sobre recompensas se concentraram em sua própria recompensa duas vezes mais do que seus oponentes. Isso sugere pensamento estratégico mínimo. Além disso, as pupilas dos participantes dilataram-se quando enviaram uma mensagem enganosa e dilataram-se mais quando contaram uma mentira maior. Por meio dessas pistas físicas, Wang concluiu que enganar é cognitivamente difícil. Essas descobertas mostram que fatores como incentivos, consequências e engano podem criar decisões irracionais e afetar a maneira como os jogos se desenrolam.

Decisões de grupo

A teoria dos jogos comportamentais considera os efeitos dos grupos na racionalidade. No mundo real, muitas decisões são tomadas por equipes, mas a teoria dos jogos tradicional usa um indivíduo como tomador de decisões. Isso criou a necessidade de modelar o comportamento de tomada de decisão do grupo. Bornstein e Yaniv (1998) examinaram a diferença de racionalidade entre grupos e indivíduos em um jogo de ultimato. Neste jogo, o jogador um (ou grupo um) decide qual porcentagem de um pagamento dar ao jogador dois (ou grupo dois) e então o jogador dois decide se aceita ou rejeita esta oferta. Os participantes na condição de grupo foram colocados em grupos de três e autorizados a deliberar sobre suas decisões. A racionalidade perfeita neste jogo seria o jogador um oferecer ao jogador dois nenhum pagamento, mas isso quase nunca é o caso nas ofertas observadas. Bornstein e Yaniv descobriram que os grupos eram menos generosos, dispostos a abrir mão de uma parcela menor do pagamento, na condição jogador um e mais aceitando ofertas baixas na condição jogador dois do que os indivíduos. Esses resultados sugerem que os grupos são mais racionais do que os indivíduos.

Kocher e Sutter (2005) usaram um jogo de concurso de beleza para estudar e comparar o comportamento individual e de grupo. Um jogo de concurso de beleza é aquele em que todos os participantes escolhem um número entre zero e cem. O vencedor é o participante que escolhe um número mais próximo de dois terços do número médio. No primeiro turno, a escolha racional seria trinta e três, já que é dois terços do número médio, cinquenta. Dado um número infinito de rodadas, todos os participantes devem escolher zero de acordo com a teoria dos jogos. Kocher e Sutter descobriram que os grupos não tiveram um desempenho mais racional do que os indivíduos na primeira rodada do jogo. No entanto, os grupos tiveram um desempenho mais racional do que os indivíduos nas rodadas subsequentes. Isso mostra que os grupos são capazes de aprender o jogo e adaptar sua estratégia mais rapidamente do que os indivíduos.

Veja também

Referências