Raciocínio de senso comum - Commonsense reasoning

Na inteligência artificial (IA), o raciocínio do senso comum é uma capacidade humana de fazer suposições sobre o tipo e a essência das situações comuns que os humanos encontram todos os dias. Essas suposições incluem julgamentos sobre a natureza dos objetos físicos, propriedades taxonômicas e intenções das pessoas. Um dispositivo que exibe um raciocínio de senso comum pode ser capaz de tirar conclusões semelhantes à psicologia popular dos humanos (a capacidade inata dos humanos de raciocinar sobre o comportamento e as intenções das pessoas) e à física ingênua (compreensão natural dos humanos do mundo físico).

Definições e caracterizações

Algumas definições e caracterizações de senso comum de diferentes autores incluem:

  • "O conhecimento de senso comum inclui os fatos básicos sobre eventos (incluindo ações) e seus efeitos, fatos sobre o conhecimento e como ele é obtido, fatos sobre crenças e desejos. Inclui também os fatos básicos sobre objetos materiais e suas propriedades."
  • "O conhecimento de senso comum difere do conhecimento enciclopédico porque lida com o conhecimento geral e não com os detalhes de entidades específicas."
  • Conhecimento de senso comum é "conhecimento do mundo real que pode fornecer uma base para conhecimento adicional a ser reunido e interpretado automaticamente".
  • O mundo do senso comum consiste em "tempo, espaço, interações físicas, pessoas e assim por diante".
  • O bom senso é "todo o conhecimento sobre o mundo que consideramos natural, mas raramente afirmamos em voz alta".
  • O bom senso é "conhecimento de base amplamente reutilizável que não é específico para uma área específica ... conhecimento que você deveria ter."

O professor Ernest Davis da NYU caracteriza o conhecimento do senso comum como "o que uma criança típica de sete anos sabe sobre o mundo", incluindo objetos físicos, substâncias, plantas, animais e a sociedade humana. Geralmente exclui o aprendizado de livros, o conhecimento especializado e o conhecimento das convenções; mas às vezes inclui conhecimento sobre esses tópicos. Por exemplo, saber jogar cartas é um conhecimento especializado, não um "conhecimento de senso comum"; mas saber que as pessoas jogam cartas por diversão conta como "conhecimento de senso comum".

Problema de raciocínio de senso comum

Um sistema de carro que dirige sozinho pode usar uma rede neural para determinar quais partes da imagem parecem corresponder às imagens de treinamento anteriores de pedestres e, em seguida, modelar essas áreas como prismas retangulares de movimento lento, mas um tanto imprevisíveis, que devem ser evitados.

Comparada com os humanos, a IA existente carece de vários recursos de raciocínio do senso comum humano; mais notavelmente, os humanos têm mecanismos poderosos para raciocinar sobre a " física ingênua ", como espaço, tempo e interações físicas. Isso permite que até mesmo crianças pequenas façam inferências como "Se eu rolar esta caneta da mesa, ela cairá no chão". Os humanos também têm um poderoso mecanismo de " psicologia popular " que os ajuda a interpretar frases em linguagem natural como "Os vereadores recusaram permissão aos manifestantes porque defendiam a violência". (Uma IA genérica tem dificuldade em discernir se os supostos defensores da violência são os vereadores ou os manifestantes.) Essa falta de "conhecimento comum" significa que a IA muitas vezes comete erros diferentes dos cometidos pelos humanos, de maneiras que podem parecer incompreensíveis. Por exemplo, os carros autônomos existentes não podem raciocinar sobre a localização nem as intenções dos pedestres da maneira exata que os humanos fazem e, em vez disso, devem usar modos não humanos de raciocínio para evitar acidentes.

Os subtópicos sobrepostos do raciocínio do senso comum incluem quantidades e medidas, tempo e espaço, física, mentes, sociedade, planos e objetivos e ações e mudanças.

Problema de conhecimento de senso comum

O problema do conhecimento de senso comum é um projeto atual na esfera da inteligência artificial para criar um banco de dados que contenha o conhecimento geral que a maioria dos indivíduos deve ter, representado de forma acessível a programas de inteligência artificial que utilizam linguagem natural. Devido ao amplo escopo do conhecimento do senso comum, esta questão é considerada um dos problemas mais difíceis na pesquisa de IA. Para que qualquer tarefa seja executada como uma mente humana faria, a máquina deve parecer tão inteligente quanto um ser humano. Essas tarefas incluem reconhecimento de objetos , tradução automática e mineração de texto . Para realizá-los, a máquina precisa estar ciente dos mesmos conceitos que um indivíduo, que possui o conhecimento do senso comum, reconhece.

Bom senso em tarefas inteligentes

Em 1961, Bar Hillel discutiu pela primeira vez a necessidade e a importância do conhecimento prático para o processamento de linguagem natural no contexto da tradução automática. Algumas ambigüidades são resolvidas usando regras simples e fáceis de adquirir. Outros exigem um amplo conhecimento do mundo ao redor, portanto, exigem mais conhecimento de bom senso. Por exemplo, quando uma máquina é usada para traduzir um texto, surgem problemas de ambigüidade, que podem ser facilmente resolvidos através de uma compreensão concreta e verdadeira do contexto. Os tradutores online geralmente resolvem ambigüidades usando palavras análogas ou semelhantes. Por exemplo, ao traduzir as frases "O eletricista está trabalhando" e "O telefone está funcionando" para o alemão, a máquina traduz corretamente "trabalhar" no sentido de "trabalhar" no primeiro e como "funcionar bem" no segundo 1. A máquina viu e leu no corpo dos textos que as palavras alemãs para "trabalhador" e "eletricista" são freqüentemente usadas em combinação e encontradas próximas umas das outras. O mesmo se aplica a "telefone" e "funcionar corretamente". No entanto, o proxy estatístico que funciona em casos simples freqüentemente falha em casos complexos. Os programas de computador existentes realizam tarefas de linguagem simples, manipulando frases curtas ou palavras separadas, mas não tentam uma compreensão mais profunda e se concentram em resultados de curto prazo.

Visão computacional

Questões desse tipo surgem na visão computacional. Por exemplo, ao olhar para uma fotografia de uma casa de banho, alguns itens pequenos e apenas parcialmente visíveis, como toalhas de rosto e garrafas, são reconhecíveis pelos objetos circundantes (sanita, lavatório, banheira), que sugerem a finalidade do quarto. Em uma imagem isolada, seriam difíceis de identificar. Os filmes são tarefas ainda mais difíceis. Alguns filmes contêm cenas e momentos que não podem ser compreendidos simplesmente combinando modelos memorizados com imagens. Por exemplo, para entender o contexto do filme, o espectador deve fazer inferências sobre as intenções dos personagens e fazer suposições dependendo de seu comportamento. No estado da arte contemporâneo, é impossível construir e gerenciar um programa que execute tarefas como o raciocínio, ou seja, prever as ações dos personagens. O máximo que pode ser feito é identificar ações básicas e rastrear personagens.

Manipulação robótica

A necessidade e a importância do raciocínio de senso comum em robôs autônomos que trabalham em um ambiente não controlado da vida real é evidente. Por exemplo, se um robô é programado para realizar as tarefas de um garçom em um coquetel e vê que o copo que ele pegou está quebrado, o garçom-robô não deve derramar o líquido no copo, mas sim pegar outro. Essas tarefas parecem óbvias quando um indivíduo possui um raciocínio de senso comum simples, mas garantir que um robô evitará tais erros é um desafio.

Sucessos no raciocínio automatizado de senso comum

Progresso significativo no campo do raciocínio do senso comum automatizado é feito nas áreas do raciocínio taxonômico, ações e raciocínio de mudança, raciocínio sobre o tempo. Cada uma dessas esferas tem uma teoria bem conhecida para uma ampla gama de inferências de senso comum.

Raciocínio taxonômico

Taxonomia é a coleção de indivíduos e categorias e suas relações. Três relações básicas são:

  • Um indivíduo é uma instância de uma categoria. Por exemplo, o Tweety individual é uma instância da categoria robin .
  • Uma categoria é um subconjunto de outra. Por exemplo, robin é um subconjunto de pássaros .
  • Duas categorias são disjuntas. Por exemplo, o robin é separado do pinguim .

A transitividade é um tipo de inferência em taxonomia. Visto que Tweety é uma instância de robin e o robin é um subconjunto de pássaro , segue-se que Tweety é uma instância de pássaro . Herança é outro tipo de inferência. Como Tweety é uma instância de robin , que é um subconjunto de bird e bird é marcado com a propriedade canfly , segue-se que Tweety e robin têm a propriedade canfly . Quando um indivíduo taxonomiza categorias mais abstratas, delinear e delimitar categorias específicas torna-se mais problemático. Estruturas taxonômicas simples são freqüentemente usadas em programas de IA. Por exemplo, WordNet é um recurso que inclui uma taxonomia, cujos elementos são significados de palavras em inglês. Os sistemas de mineração da Web usados ​​para coletar conhecimento de senso comum de documentos da Web se concentram nas relações taxonômicas e, especificamente, na coleta de relações taxonômicas.

Ação e mudança

A teoria da ação, eventos e mudança é outra gama do raciocínio do senso comum. Existem métodos de raciocínio estabelecidos para domínios que satisfazem as restrições listadas abaixo:

  • Os eventos são atômicos, o que significa que um evento ocorre por vez e o raciocinador precisa considerar o estado e a condição do mundo no início e no final do evento específico, mas não durante os estados, enquanto ainda há uma evidência de on - mudanças em andamento (progresso).
  • Cada mudança é o resultado de algum evento
  • Os eventos são determinísticos, ou seja, o estado do mundo no final do evento é definido pelo estado do mundo no início e a especificação do evento.
  • Existe um único ator e todos os eventos são suas ações.
  • O estado relevante do mundo no início é conhecido ou pode ser calculado.

Raciocínio temporal

O raciocínio temporal é a capacidade de fazer suposições sobre o conhecimento dos humanos sobre tempos, durações e intervalos de tempo. Por exemplo, se um indivíduo sabe que Mozart nasceu depois de Hadyn e morreu antes dele, eles podem usar seu conhecimento de raciocínio temporal para deduzir que Mozart morreu mais jovem que Hadyn. As inferências envolvidas reduzem-se a resolver sistemas de desigualdades lineares. Integrar esse tipo de raciocínio com propósitos concretos, como a interpretação da linguagem natural , é mais desafiador, porque as expressões da linguagem natural têm uma interpretação dependente do contexto. Tarefas simples, como atribuir carimbos de data / hora a procedimentos, não podem ser realizadas com total precisão.

Raciocínio qualitativo

O raciocínio qualitativo é a forma de raciocínio do senso comum analisada com certo sucesso. Ele se preocupa com a direção da mudança nas quantidades inter-relacionadas. Por exemplo, se o preço de uma ação subir, a quantidade de ações que serão vendidas diminuirá. Se algum ecossistema contiver lobos e cordeiros e o número de lobos diminuir, a taxa de mortalidade dos cordeiros também diminuirá. Essa teoria foi inicialmente formulada por Johan de Kleer, que analisou um objeto em movimento em uma montanha-russa. A teoria do raciocínio qualitativo é aplicada em muitas esferas, como física, biologia, engenharia, ecologia, etc. Ela serve como base para muitos programas práticos, mapeamento analógico, compreensão de texto.

Desafios na automação do raciocínio do senso comum

Em 2014, existem alguns sistemas comerciais tentando tornar significativo o uso do raciocínio do senso comum. No entanto, eles usam informações estatísticas como um proxy para o conhecimento do senso comum, onde o raciocínio está ausente. Os programas atuais manipulam palavras individuais, mas não tentam nem oferecem maior compreensão. De acordo com Ernest Davis e Gary Marcus , cinco obstáculos principais interferem na produção de um "raciocínio de bom senso" satisfatório.

  • Primeiro, alguns dos domínios envolvidos no raciocínio do senso comum são apenas parcialmente compreendidos. Os indivíduos estão longe de uma compreensão abrangente de domínios como comunicação e conhecimento, interações interpessoais ou processos físicos.
  • Em segundo lugar, situações que parecem facilmente previstas ou presumidas podem ter complexidade lógica, que o conhecimento de senso comum dos humanos não cobre. Alguns aspectos de situações semelhantes são estudados e bem compreendidos, mas existem muitas relações que são desconhecidas, mesmo em princípio, e como poderiam ser representadas de uma forma utilizável por computadores.
  • Terceiro, o raciocínio do senso comum envolve um raciocínio plausível. Requer chegar a uma conclusão razoável, dado o que já é conhecido. O raciocínio plausível tem sido estudado por muitos anos e existem muitas teorias desenvolvidas que incluem o raciocínio probabilístico e a lógica não monotônica . Ele assume diferentes formas, que incluem o uso de dados e regras não confiáveis, cujas conclusões às vezes não são certas.
  • Quarto, há muitos domínios, nos quais um pequeno número de exemplos é extremamente frequente, enquanto há um grande número de exemplos altamente raros.
  • Quinto, ao formular presunções, é desafiador discernir e determinar o nível de abstração.

Em comparação com os humanos, a partir de 2018 os programas de computador existentes apresentam um desempenho extremamente ruim em testes de benchmark de "raciocínio de senso comum" modernos, como o Winograd Schema Challenge . O problema de obter competência de nível humano em tarefas de "conhecimento de senso comum" é considerado provavelmente " IA completo " (ou seja, resolvê-lo exigiria a capacidade de sintetizar uma inteligência de nível humano ). Alguns pesquisadores acreditam que os dados de aprendizado supervisionado são insuficientes para produzir uma inteligência geral artificial capaz de raciocínio de senso comum e, portanto, recorreram a técnicas de aprendizado menos supervisionado.

Abordagens e técnicas

O estudo de raciocínio do Commonsense é dividido em abordagens baseadas no conhecimento e abordagens baseadas no aprendizado de máquina e usando um grande corpora de dados com interações limitadas entre esses dois tipos de abordagens. Existem também abordagens de crowdsourcing, que tentam construir uma base de conhecimento ligando o conhecimento coletivo e a contribuição de pessoas não especializadas. As abordagens baseadas no conhecimento podem ser separadas em abordagens baseadas na lógica matemática.

Nas abordagens baseadas no conhecimento, os especialistas estão analisando as características das inferências necessárias para fazer o raciocínio em uma área específica ou para uma determinada tarefa. As abordagens baseadas no conhecimento consistem em abordagens baseadas na matemática, abordagens informais baseadas no conhecimento e abordagens em grande escala. As abordagens matematicamente fundamentadas são puramente teóricas e o resultado é um papel impresso em vez de um programa. O trabalho limita-se ao leque de domínios e às técnicas de raciocínio que estão a ser reflectidas. Nas abordagens informais baseadas no conhecimento, as teorias de raciocínio são baseadas em dados anedóticos e intuição que são resultados da psicologia comportamental empírica. Abordagens informais são comuns na programação de computadores. Duas outras técnicas populares para extrair conhecimento de senso comum de documentos da Web envolvem Web Mining e Crowd sourcing .

COMET (2019), que usa a arquitetura de modelo de linguagem OpenAI GPT e bases de conhecimento de senso comum existentes, como ConceptNet , afirma gerar inferências de senso comum em um nível que se aproxima de benchmarks humanos. Como muitos outros esforços atuais, o COMET depende excessivamente dos padrões de linguagem da superfície e é julgado como carente de um profundo conhecimento de nível humano de muitos conceitos de senso comum. Outras abordagens de modelo de linguagem incluem treinamento em cenas visuais, em vez de apenas texto, e treinamento em descrições textuais de cenários que envolvem a física do senso comum.

Referências

links externos