Heurística Take-the-Best - Take-the-best heuristic

Em psicologia , a heurística take-the-best é uma heurística (uma estratégia simples para tomada de decisão ) que decide entre duas alternativas, escolhendo com base na primeira sugestão que as discrimina, onde as sugestões são ordenadas pela validade da sugestão (da mais alta para a mais baixa) . Na formulação original, as sugestões foram assumidas como tendo valores binários (sim ou não) ou com um valor desconhecido. A lógica da heurística é que ela baseia sua escolha apenas na melhor sugestão (razão) e ignora o resto.

Os psicólogos Gerd Gigerenzer e Daniel Goldstein descobriram que a heurística se saiu surpreendentemente bem em fazer inferências precisas em ambientes do mundo real, como inferir qual das duas cidades é maior. Desde então, a heurística foi modificada e aplicada a domínios da medicina , inteligência artificial e previsão política . Também foi demonstrado que a heurística pode modelar com precisão como os especialistas, como funcionários alfandegários de aeroportos e ladrões profissionais, tomam decisões. A heurística também pode prever detalhes do processo cognitivo , como número de pistas usadas e tempos de resposta, muitas vezes melhor do que modelos complexos que integram todas as pistas disponíveis; como tal, é um exemplo do efeito menos é mais .

Tomada de decisão por um motivo

As teorias de tomada de decisão normalmente assumem que todas as razões relevantes (características ou pistas) são pesquisadas e integradas na decisão final. Ainda assim, sob a incerteza (em oposição ao risco), as pistas relevantes normalmente não são todas conhecidas, nem seus pesos precisos e as correlações entre as pistas. Nessas situações, confiar apenas na melhor sugestão disponível pode ser uma alternativa razoável que permite decisões rápidas, econômicas e precisas. Essa é a lógica de uma classe de heurísticas conhecida como “tomada de decisão por um motivo”, que inclui pegue o melhor. Considere sugestões com valores binários (0, 1), onde 1 indica o valor da sugestão que está associado a um valor de critério mais alto. A tarefa é inferir qual das duas alternativas tem o valor de critério mais alto. Um exemplo é qual das duas equipes da NBA vai ganhar o jogo, com base em pistas como partida em casa e quem venceu a última partida. A heurística pegue o melhor envolve três etapas para fazer tal inferência:

Regra de pesquisa : observe as dicas na ordem de sua validade.

Regra de parada : Pare a busca quando a primeira sugestão for encontrada onde os valores das duas alternativas diferem.

Regra de decisão : preveja que a alternativa com o valor de sugestão mais alto tem o valor mais alto na variável de resultado.

A validade v de uma sugestão é dada por v = C / (C + W), onde C é o número de inferências corretas quando uma sugestão discrimina, e W é o número de inferências erradas, todas estimadas a partir de amostras.

Tire o melhor para a tarefa de comparação

Considere a tarefa de inferir qual objeto, A ou B, tem um valor mais alto em um critério numérico. Como exemplo, imagine alguém tendo que julgar se a cidade alemã de Colônia tem uma população maior do que a outra cidade alemã de Stuttgart. Esse julgamento ou inferência deve ser baseado em informações fornecidas por pistas binárias, como "A cidade é uma capital estadual?". Do ponto de vista formal, a tarefa é uma categorização: um par (A, B) deve ser categorizado como X A > X B ou X B > X A (onde X denota o critério), com base nas informações da sugestão.

As sugestões são binárias; isso significa que eles assumem dois valores e podem ser modelados, por exemplo, como tendo os valores 0 e 1 (para "sim" e "não"). Eles são classificados de acordo com sua validade de sugestão , definida como a proporção de comparações corretas entre os pares A e B, para os quais possui valores diferentes, ou seja, para os quais discrimina entre A e B. O take-the-best analisa cada sugestão, um após o outro, de acordo com a classificação por validade e interrompendo na primeira vez que uma dica discrimina os itens e conclui que o item com maior valor também possui maior valor no critério. A matriz de todos os objetos da classe de referência, da qual A e B foram retirados, e dos valores de sugestão que descrevem esses objetos, constitui o chamado ambiente. Gigerenzer e Goldstein, que introduziram Take-The-Best (ver Gerd Gigerenzer & Daniel Goldstein , DG (1996)) consideraram, como um exemplo prático, precisamente pares de cidades alemãs. no entanto, apenas aqueles com mais de 100.000 habitantes. A tarefa de comparação para um determinado par (A, B) de cidades alemãs da classe de referência, consistiu em estabelecer qual delas tem maior população, a partir de nove pistas. As dicas eram de valor binário, como se a cidade é uma capital estadual ou se há um time de futebol na liga nacional. Os valores das sugestões podem ser modelados por 1's (para "sim") e 0's (para "não") de forma que cada cidade possa ser identificada com seu "perfil de sugestão", ou seja, um vetor de 1 'e 0's, ordenados de acordo com a classificação de pistas.

A questão era: Como se pode inferir qual dos dois objetos, por exemplo, cidade A com per fi l de sugestão (100101010) e cidade B com per fi l de sugestão (100010101) , pontua mais alto no critério estabelecido, ou seja, tamanho da população? A heurística take-the-best simplesmente compara os perfis lexicograficamente, assim como os números escritos na base dois são comparados: o valor da primeira sugestão é 1 para ambos, o que significa que a primeira sugestão não discrimina entre A e B. O valor da segunda sugestão é 0 para ambos, novamente sem discriminação. O mesmo acontece para o valor da terceira sugestão, enquanto o valor da quarta sugestão é 1 para A e 0 para B, implicando que A é julgado como tendo um valor mais alto no critério. Em outras palavras, X A > X B se e somente se (100101010) > (100010101) .

Matematicamente, isso significa que as pistas encontradas para a comparação permitem um isomorfismo de quase ordem entre os objetos comparados no critério, neste caso cidades com suas populações e seus vetores binários correspondentes. Aqui, "quase" significa que o isomorfismo, em geral, não é perfeito, porque o conjunto de pistas não é perfeito.

O que é surpreendente é que essa heurística simples tem um ótimo desempenho em comparação com outras estratégias. Uma medida óbvia para estabelecer o desempenho de um mecanismo de inferência é determinada pela porcentagem de julgamentos corretos. Além disso, o que mais importa não é apenas o desempenho da heurística ao ajustar os dados conhecidos, mas ao generalizar a partir de um conjunto de treinamento conhecido para novos itens.

Czerlinski, Goldstein e Gigerenzer compararam várias estratégias com Take-the-best: um Tallying simples, ou modelo de peso unitário (também chamado de "Regra de Dawes" naquela literatura), um modelo linear ponderado nas pistas ponderadas por suas validades (também chamado "Regra de Franklin" nessa literatura), Regressão Linear e Minimalista. Seus resultados mostram a robustez do Take-the-best em generalização.

Desempenho heurístico no conjunto de dados da cidade alemã
Desempenho heurístico no conjunto de dados da cidade alemã, gerado com ggplot2 com base nos dados de. Veja as etapas para reproduzir no CRAN .
Desempenho heurístico em 20 conjuntos de dados
Desempenho heurístico em 20 conjuntos de dados de uma ilustração dentro da referência n °

Por exemplo, considere a tarefa de selecionar a maior cidade de duas cidades quando

  • Os modelos são ajustados a um conjunto de dados de 83 cidades alemãs
  • Os modelos selecionam o maior de um par de cidades para todos os 83 * 82/2 pares de cidades.

A porcentagem correta foi de aproximadamente 74% para a regressão, pegue o melhor, linear de peso unitário. Mais especificamente, as pontuações foram 74,3%, 74,2% e 74,1%, portanto, a regressão venceu por uma pequena margem.

No entanto, o artigo também considerou a generalização (também conhecida como previsão fora da amostra).

  • Os modelos são ajustados a um conjunto de dados de uma metade selecionada aleatoriamente de 83 cidades alemãs
  • Os modelos selecionam a maior de um par de cidades retiradas da * outra * metade das cidades.

Nesse caso, quando 10.000 divisões aleatórias diferentes foram usadas, a regressão teve em média 71,9% de acertos, Take-the-best teve 72,2% de acertos e a unidade com linear teve 71,4% de acertos. A heurística Take-the-best foi mais precisa do que a regressão neste caso. Esses resultados foram apresentados em.

Veja também

Referências