Problema de quadro - Frame problem

Em inteligência artificial , o problema de quadro descreve um problema com o uso da lógica de primeira ordem (FOL) para expressar fatos sobre um robô no mundo. Representar o estado de um robô com FOL tradicional requer o uso de muitos axiomas que simplesmente implicam que as coisas no ambiente não mudam arbitrariamente. Por exemplo, Hayes descreve um " mundo de blocos " com regras sobre como empilhar blocos. Em um sistema FOL, axiomas adicionais são necessários para fazer inferências sobre o ambiente (por exemplo, que um bloco não pode mudar de posição a menos que seja fisicamente movido). O problema do frame é encontrar coleções adequadas de axiomas para uma descrição viável de um ambiente de robô.

John McCarthy e Patrick J. Hayes definiram esse problema em seu artigo de 1969, Some Philosophical Problems from the Standpoint of Artificial Intelligence . Neste artigo, e em muitos que vieram depois, o problema matemático formal foi um ponto de partida para discussões mais gerais sobre a dificuldade da representação do conhecimento para a inteligência artificial. Questões como fornecer suposições padrão racionais e o que os humanos consideram bom senso em um ambiente virtual. Posteriormente, o termo adquiriu um significado mais amplo na filosofia , onde é formulado como o problema de limitar as crenças que precisam ser atualizadas em resposta às ações. No contexto lógico, as ações são normalmente especificadas por aquilo que mudam, com a suposição implícita de que todo o resto (o quadro) permanece inalterado.

Descrição

O problema do quadro ocorre mesmo em domínios muito simples. Um cenário com uma porta, que pode ser aberta ou fechada, e uma luz, que pode estar acesa ou apagada, é representado estaticamente por duas proposições e . Se essas condições podem mudar, elas são melhor representadas por dois predicados e que dependem do tempo; esses predicados são chamados de fluentes . Um domínio no qual a porta é fechada e a luz apagada no tempo 0, e a porta aberta no tempo 1, pode ser representado diretamente na lógica pelas seguintes fórmulas: ${\ displaystyle \ mathrm {abrir}}$ ${\ displaystyle \ mathrm {on}}$ ${\ displaystyle \ mathrm {open} (t)}$ ${\ displaystyle \ mathrm {on} (t)}$

{\ displaystyle \ neg \ mathrm {abrir} (0)}

{\ displaystyle \ neg \ mathrm {on} (0)}

{\ displaystyle \ mathrm {abrir} (1)}

As duas primeiras fórmulas representam a situação inicial; a terceira fórmula representa o efeito de executar a ação de abrir a porta no tempo 1. Se tal ação tivesse pré-condições, como a porta sendo destrancada, ela seria representada por . Na prática, haveria um predicado para especificar quando uma ação é executada e uma regra para especificar os efeitos das ações. O artigo sobre o cálculo da situação dá mais detalhes. ${\ displaystyle \ neg \ mathrm {bloqueado} (0) \ implica \ mathrm {aberto} (1)}$ ${\ displaystyle \ mathrm {executeopen} (t)}$ ${\ displaystyle \ forall t. \ mathrm {executeopen} (t) \ implica \ mathrm {open} (t + 1)}$

Embora as três fórmulas acima sejam uma expressão direta na lógica do que é conhecido, elas não bastam para extrair corretamente as consequências. Embora as seguintes condições (representando a situação esperada) sejam consistentes com as três fórmulas acima, elas não são as únicas.

${\ displaystyle \ neg \ mathrm {abrir} (0)}$	${\ displaystyle \ mathrm {abrir} (1)}$
${\ displaystyle \ neg \ mathrm {on} (0)}$	${\ displaystyle \ neg \ mathrm {on} (1)}$

Na verdade, outro conjunto de condições que é consistente com as três fórmulas acima é:

${\ displaystyle \ neg \ mathrm {abrir} (0)}$	${\ displaystyle \ mathrm {abrir} (1)}$
${\ displaystyle \ neg \ mathrm {on} (0)}$	${\ displaystyle \ mathrm {on} (1)}$

O problema do quadro é que especificar apenas quais condições são alteradas pelas ações não implica que todas as outras condições não sejam alteradas. Este problema pode ser resolvido adicionando os chamados “axiomas de quadro”, que especificam explicitamente que todas as condições não afetadas pelas ações não são alteradas durante a execução dessa ação. Por exemplo, uma vez que a ação executada no tempo 0 é a de abrir a porta, um axioma de moldura afirmaria que o status da luz não muda do tempo 0 para o tempo 1:

{\ displaystyle \ mathrm {on} (0) \ iff \ mathrm {on} (1)}

O problema da moldura é que um desses axiomas é necessário para cada par de ação e condição, de modo que a ação não afete a condição. Em outras palavras, o problema é formalizar um domínio dinâmico sem especificar explicitamente os axiomas do referencial.

A solução proposta por McCarthy para resolver este problema envolve assumir que uma quantidade mínima de mudanças de condição ocorreu; esta solução é formalizada no quadro da circunscrição . O problema do tiro em Yale , entretanto, mostra que essa solução nem sempre é correta. Soluções alternativas foram então propostas, envolvendo completamento de predicado, oclusão fluente, axiomas de estado sucessor , etc .; eles são explicados abaixo. No final da década de 1980, o problema da estrutura, conforme definido por McCarthy e Hayes, foi resolvido. Mesmo depois disso, no entanto, o termo "problema de quadro" ainda foi usado, em parte para se referir ao mesmo problema, mas em configurações diferentes (por exemplo, ações simultâneas), e em parte para se referir ao problema geral de representação e raciocínio com dinâmica domínios.

Soluções

As soluções a seguir descrevem como o problema do frame é resolvido em vários formalismos. Os formalismos em si não são apresentados por completo: o que é apresentado são versões simplificadas que são suficientes para explicar a solução completa.

Solução de oclusão fluente

Esta solução foi proposta por Erik Sandewall , que também definiu uma linguagem formal para a especificação de domínios dinâmicos; portanto, tal domínio pode ser expresso primeiro nesta linguagem e, em seguida, traduzido automaticamente para a lógica. Neste artigo, apenas a expressão em lógica é mostrada, e apenas na linguagem simplificada sem nomes de ações.

A lógica desta solução é representar não apenas o valor das condições ao longo do tempo, mas também se elas podem ser afetadas pela última ação executada. Este último é representado por outra condição, chamada oclusão. Uma condição é considerada ocluída em um determinado momento se uma ação que acaba de ser executada torna a condição verdadeira ou falsa como um efeito. A oclusão pode ser vista como “permissão para mudar”: se uma condição for obstruída, ela é dispensada de obedecer à restrição de inércia.

No exemplo simplificado da porta e da luz, a oclusão pode ser formalizada por dois predicados e . O raciocínio é que uma condição pode alterar o valor apenas se o predicado de oclusão correspondente for verdadeiro no próximo momento. Por sua vez, o predicado de oclusão é verdadeiro apenas quando uma ação que afeta a condição é executada. ${\ displaystyle \ mathrm {occludeopen} (t)}$ ${\ displaystyle \ mathrm {occludeon} (t)}$

{\ displaystyle \ neg \ mathrm {abrir} (0)}

{\ displaystyle \ neg \ mathrm {on} (0)}

{\ displaystyle \ mathrm {open} (1) \ wedge \ mathrm {occludeopen} (1)}

{\ displaystyle \ forall t. \ neg \ mathrm {occludeopen} (t) \ implica (\ mathrm {open} (t-1) \ iff \ mathrm {open} (t))}

{\ displaystyle \ forall t. \ neg \ mathrm {occludeon} (t) \ implica (\ mathrm {on} (t-1) \ iff \ mathrm {on} (t))}

Em geral, toda ação que torna uma condição verdadeira ou falsa também torna verdadeiro o predicado de oclusão correspondente. Nesse caso, é verdadeiro, tornando o antecedente da quarta fórmula acima falso para ; portanto, a restrição que não vale para . Portanto, pode alterar o valor, que é também o que é imposto pela terceira fórmula. ${\ displaystyle \ mathrm {occludeopen} (1)}$ ${\ displaystyle t = 1}$ ${\ displaystyle \ mathrm {abrir} (t-1) \ iff \ mathrm {abrir} (t)}$ ${\ displaystyle t = 1}$ ${\ displaystyle \ mathrm {abrir}}$

Para que essa condição funcione, os predicados de oclusão precisam ser verdadeiros apenas quando se tornam verdadeiros como efeito de uma ação. Isso pode ser alcançado pela circunscrição ou pela conclusão do predicado. É importante notar que a oclusão não implica necessariamente uma mudança: por exemplo, executar a ação de abrir a porta já aberta (na formalização acima) torna o predicado verdadeiro e torna verdadeiro; no entanto, não mudou de valor, como já era verdade. ${\ displaystyle \ mathrm {occludeopen}}$ ${\ displaystyle \ mathrm {abrir}}$ ${\ displaystyle \ mathrm {abrir}}$

Solução de completação de predicado

Essa codificação é semelhante à solução de oclusão fluente, mas os predicados adicionais denotam mudança, não permissão para mudar. Por exemplo, representa o fato de que o predicado mudará de tempos em tempos . Como resultado, um predicado muda se e somente se o predicado de mudança correspondente for verdadeiro. Uma ação resulta em uma mudança se e somente se torna verdadeira uma condição que era anteriormente falsa ou vice-versa. ${\ displaystyle \ mathrm {changeopen} (t)}$ ${\ displaystyle \ mathrm {abrir}}$ ${\ displaystyle t}$ ${\ displaystyle t + 1}$

{\ displaystyle \ neg \ mathrm {abrir} (0)}

{\ displaystyle \ neg \ mathrm {on} (0)}

{\ displaystyle \ neg \ mathrm {aberto} (0) \ implica \ mathrm {mudança aberta} (0)}

{\ displaystyle \ forall t. \ mathrm {changeopen} (t) \ iff (\ neg \ mathrm {open} (t) \ iff \ mathrm {open} (t + 1))}

{\ displaystyle \ forall t. \ mathrm {changeon} (t) \ iff (\ neg \ mathrm {on} (t) \ iff \ mathrm {on} (t + 1))}

A terceira fórmula é uma maneira diferente de dizer que abrir a porta faz com que a porta seja aberta. Precisamente, afirma que a abertura da porta altera o estado da porta se ela tivesse sido fechada anteriormente. As duas últimas condições afirmam que uma condição altera o valor no momento, se e somente se o predicado de alteração correspondente for verdadeiro no momento . Para completar a solução, os pontos de tempo em que os predicados de mudança são verdadeiros devem ser os menores possíveis, e isso pode ser feito aplicando a conclusão de predicado às regras que especificam os efeitos das ações. ${\ displaystyle t}$ ${\ displaystyle t}$

Solução de axiomas de estado sucessor

O valor de uma condição após a execução de uma ação pode ser determinado pelo fato de que a condição é verdadeira se e somente se:

a ação torna a condição verdadeira; ou
a condição era anteriormente verdadeira e a ação não a torna falsa.

Um axioma de estado sucessor é uma formalização na lógica desses dois fatos. Por exemplo, se e são duas condições usadas para denotar que a ação executada no momento era abrir ou fechar a porta, respectivamente, o exemplo em execução é codificado da seguinte maneira. ${\ displaystyle \ mathrm {opendoor} (t)}$ ${\ displaystyle \ mathrm {closedoor} (t)}$ ${\ displaystyle t}$

{\ displaystyle \ neg \ mathrm {abrir} (0)}

{\ displaystyle \ neg \ mathrm {on} (0)}

{\ displaystyle \ mathrm {opendoor} (0)}

{\ displaystyle \ forall t. \ mathrm {open} (t + 1) \ iff \ mathrm {opendoor} (t) \ vee (\ mathrm {open} (t) \ wedge \ neg \ mathrm {closedoor} (t) )}

Essa solução é centrada no valor das condições, e não nos efeitos das ações. Em outras palavras, existe um axioma para cada condição, ao invés de uma fórmula para cada ação. As pré-condições para ações (que não estão presentes neste exemplo) são formalizadas por outras fórmulas. Os axiomas de estado sucessor são usados na variante do cálculo de situação proposto por Ray Reiter .

Solução de cálculo fluente

O cálculo fluente é uma variante do cálculo de situação. Ele resolve o problema do quadro usando termos lógicos de primeira ordem , em vez de predicados, para representar os estados. A conversão de predicados em termos na lógica de primeira ordem é chamada de reificação ; o cálculo fluente pode ser visto como uma lógica na qual predicados que representam o estado de condições são reificados.

A diferença entre um predicado e um termo na lógica de primeira ordem é que um termo é uma representação de um objeto (possivelmente um objeto complexo composto de outros objetos), enquanto um predicado representa uma condição que pode ser verdadeira ou falsa quando avaliada sobre um determinado conjunto de termos.

No cálculo fluente, cada estado possível é representado por um termo obtido pela composição de outros termos, cada um representando as condições que são verdadeiras no estado. Por exemplo, o estado em que a porta está aberta e a luz acesa é representado pelo termo . É importante notar que um termo não é verdadeiro ou falso por si só, pois é um objeto e não uma condição. Em outras palavras, o termo representa um estado possível e não significa por si só que esse é o estado atual. Uma condição separada pode ser estabelecida para especificar que este é realmente o estado em um determinado momento, por exemplo, significa que este é o estado no momento . ${\ displaystyle \ mathrm {aberto} \ circ \ mathrm {on}}$ ${\ displaystyle \ mathrm {aberto} \ circ \ mathrm {on}}$ ${\ displaystyle \ mathrm {estado} (\ mathrm {aberto} \ circ \ mathrm {on}, 10)}$ ${\ displaystyle 10}$

A solução para o problema de quadro dado no cálculo fluente é especificar os efeitos das ações, declarando como um termo que representa o estado muda quando a ação é executada. Por exemplo, a ação de abrir a porta no momento 0 é representada pela fórmula:

{\ displaystyle \ mathrm {estado} (s \ circ \ mathrm {aberto}, 1) \ iff \ mathrm {estado} (s, 0)}

A ação de fechar a porta, que torna uma condição falsa em vez de verdadeira, é representada de uma maneira ligeiramente diferente:

{\ displaystyle \ mathrm {estado} (s, 1) \ iff \ mathrm {estado} (s \ circ \ mathrm {aberto}, 0)}

Esta fórmula funciona desde que sejam fornecidos axiomas adequados sobre e , por exemplo, um termo contendo a mesma condição duas vezes não é um estado válido (por exemplo, é sempre falso para todos e ). ${\ displaystyle \ mathrm {estado}}$ ${\ displaystyle \ circ}$ ${\ displaystyle \ mathrm {estado} (\ mathrm {aberto} \ circ s \ circ \ mathrm {aberto}, t)}$ ${\ displaystyle s}$ ${\ displaystyle t}$

Solução de cálculo de eventos

O cálculo de evento usa termos para representar fluentes, como o cálculo fluente, mas também tem axiomas que restringem o valor dos fluentes, como os axiomas de estado sucessor. No cálculo de evento, a inércia é reforçada por fórmulas que afirmam que um fluente é verdadeiro se tiver sido verdadeiro em um determinado ponto de tempo anterior e nenhuma ação de alterá-lo para falso foi realizada nesse ínterim. O preenchimento do predicado ainda é necessário no cálculo do evento para obter que um fluente se torne verdadeiro apenas se uma ação que o torna verdadeiro tiver sido executada, mas também para obter que uma ação foi executada apenas se isso for explicitamente declarado.

Solução lógica padrão

O problema da moldura pode ser pensado como o problema de formalizar o princípio de que, por padrão, "tudo se presume permanecer no estado em que está" ( Leibniz , "An Introduction to a Secret Encyclopædia", c . 1679). Esse padrão, às vezes chamado de lei da inércia do senso comum , foi expresso por Raymond Reiter na lógica padrão :

{\ displaystyle {\ frac {R (x, s) \;: \ R (x, \ mathrm {do} (a, s))} {R (x, \ mathrm {do} (a, s))} }}

(se for verdadeiro na situação , e pode ser assumido que permanece verdadeiro após a execução da ação , então podemos concluir que permanece verdadeiro). ${\ displaystyle R (x)}$ ${\ displaystyle s}$ ${\ displaystyle R (x)}$ ${\ displaystyle a}$ ${\ displaystyle R (x)}$

Steve Hanks e Drew McDermott argumentaram, com base em seu exemplo de tiro em Yale , que essa solução para o problema da moldura é insatisfatória. Hudson Turner mostrou, no entanto, que funciona corretamente na presença de postulados adicionais apropriados.

Solução de programação de conjunto de respostas

A contrapartida da solução lógica padrão na linguagem de programação de conjunto de respostas é uma regra com forte negação :

{\ displaystyle r (X, T + 1) \ leftarrow r (X, T), \ {\ hbox {não}} \ sim r (X, T + 1)}

(se for verdadeiro no momento , e pode ser assumido que permanece verdadeiro no momento , então podemos concluir que permanece verdadeiro). ${\ displaystyle r (X)}$ ${\ displaystyle T}$ ${\ displaystyle r (X)}$ ${\ displaystyle T + 1}$ ${\ displaystyle r (X)}$

Solução lógica de separação

A lógica de separação é um formalismo para raciocinar sobre programas de computador usando especificações pré / pós do formulário . A lógica de separação é uma extensão da lógica de Hoare orientada para o raciocínio sobre estruturas de dados mutáveis na memória do computador e outros recursos dinâmicos, e tem um conectivo especial *, pronunciado "e separadamente", para apoiar o raciocínio independente sobre regiões de memória disjuntas. ${\ displaystyle \ {pré-condição \} \ code \ \ {pós-condição \}}$

A lógica de separação emprega uma interpretação rígida de especificações pré / pós, que dizem que o código só pode acessar locais de memória garantidos para existir pela pré-condição. Isso leva à solidez da regra de inferência mais importante da lógica, a regra de quadro

${\ displaystyle {\ frac {\ {pré-condição \} \ code \ {postcondition \}} {\ {pré-condição \ ast frame \} \ code \ \ {postcondition \ ast frame \}}}}$

A regra de quadro permite que descrições de memória arbitrária fora da área de cobertura (memória acessada) do código sejam adicionadas a uma especificação: isso permite que a especificação inicial se concentre apenas na área de cobertura. Por exemplo, a inferência

${\ displaystyle {\ frac {\ {lista (x) \} \ código \ \ {lista ordenada (x) \}} {\ {lista (x) \ ast lista ordenada (y) \} \ código \ \ {lista ordenada (x ) \ ast lista classificada (y) \}}}}$

captura aquele código que classifica uma lista x não remove a classificação de uma lista separada y, e faz isso sem mencionar y na especificação inicial acima da linha.

A automação da regra de quadro levou a aumentos significativos na escalabilidade de técnicas de raciocínio automatizado para código, eventualmente implantadas industrialmente em bases de código com 10s de milhões de linhas.

Parece haver alguma semelhança entre a solução da lógica de separação para o problema do referencial e a do cálculo fluente mencionado acima.

Linguagens de descrição de ação

As linguagens de descrição de ação evitam o problema do quadro em vez de resolvê-lo. Uma linguagem de descrição de ação é uma linguagem formal com uma sintaxe específica para descrever situações e ações. Por exemplo, que a ação abre a porta, se não estiver trancada, é expresso por: ${\ displaystyle \ mathrm {opendoor}}$

{\ displaystyle \ mathrm {opendoor}}

causa se

{\ displaystyle \ mathrm {abrir}}

{\ displaystyle \ neg \ mathrm {bloqueado}}

A semântica de uma linguagem de descrição de ação depende do que a linguagem pode expressar (ações simultâneas, efeitos atrasados, etc.) e geralmente é baseada em sistemas de transição .

Uma vez que os domínios são expressos nessas linguagens, em vez de diretamente na lógica, o problema do quadro só surge quando uma especificação dada em uma lógica de descrição de ação deve ser traduzida em lógica. Normalmente, no entanto, uma tradução é fornecida a partir dessas linguagens para responder à programação definida, em vez da lógica de primeira ordem.

Veja também

Notas

Referências

Doherty, P .; Gustafsson, J .; Karlsson, L .; Kvarnström, J. (1998). "TAL: Especificação e tutorial da linguagem de lógica de ação temporal" . Transações Eletrônicas em Inteligência Artificial . 2 (3–4): 273–306.
Gelfond, M .; Lifschitz, V. (1993). “Representando ação e mudança por programas lógicos” . Journal of Logic Programming . 17 (2–4): 301–322. doi : 10.1016 / 0743-1066 (93) 90035-f .
Gelfond, M .; Lifschitz, V. (1998). "Linguagens de ação" . Transações Eletrônicas em Inteligência Artificial . 2 (3–4): 193–210.
Hanks, S .; McDermott, D. (1987). "Lógica não monotônica e projeção temporal". Inteligência Artificial . 33 (3): 379–412. doi : 10.1016 / 0004-3702 (87) 90043-9 .
Levesque, H .; Pirri, F .; Reiter, R. (1998). "Fundamentos para o cálculo da situação" . Transações Eletrônicas em Inteligência Artificial . 2 (3–4): 159–178.
Liberatore, P. (1997). “A complexidade da linguagem A” . Transações Eletrônicas em Inteligência Artificial . 1 (1-3): 13-37.
Lifschitz, V. (2012). "O problema da moldura, então e agora" (PDF) . Universidade do Texas em Austin .Apresentado na celebração das realizações de John McCarthy , Universidade de Stanford , 25 de março de 2012.
McCarthy, J .; Hayes, PJ (1969). “Alguns problemas filosóficos do ponto de vista da inteligência artificial” . Inteligência de máquina . 4 : 463–502. CiteSeerX 10.1.1.85.5082 .
McCarthy, J. (1986). "Aplicações da circunscrição à formalização do conhecimento do senso comum" . Inteligência Artificial . 28 : 89–116. CiteSeerX 10.1.1.29.5268 . doi : 10.1016 / 0004-3702 (86) 90032-9 .
Miller, R .; Shanahan, M. (1999). “O cálculo de eventos na lógica clássica - axiomatizações alternativas” . Transações Eletrônicas em Inteligência Artificial . 3 (1): 77–105.
Pirri, F .; Reiter, R. (1999). “Algumas contribuições para a metateoria do Cálculo da Situação”. Jornal do ACM . 46 (3): 325–361. doi : 10.1145 / 316542.316545 . S2CID 16203802 .
Reiter, R. (1980). "Uma lógica para raciocínio padrão" (PDF) . Inteligência Artificial . 13 (1–2): 81–132. CiteSeerX 10.1.1.250.9224 . doi : 10.1016 / 0004-3702 (80) 90014-4 .
R., Raymond (1991). “O problema do frame no cálculo da situação: uma solução simples (às vezes) e um resultado completo para a regressão de metas”. Em Lifschitz, Vladimir (ed.). Inteligência Artificial e Teoria Matemática da Computação: Artigos em Honra a John McCarthy . Nova York: Academic Press. pp. 359–380. CiteSeerX 10.1.1.137.2995 .
Sandewall, E. (1972). "Uma abordagem para o problema de frame e sua implementação". Inteligência de máquina . 7 : 195–204.
Sandewall, E. (1994). Recursos e fluentes . (vol. 1). Nova York: Oxford University Press. ISBN 978-0-19-853845-5.
Sandewall, E .; Shoham, Y. (1995). "Raciocínio Temporal Não Monotônico". Em Gabbay, DM; Hogger, CJ; Robinson, JA (eds.). Manual de Lógica em Inteligência Artificial e Programação em Lógica . (vol. 4). Imprensa da Universidade de Oxford. pp. 439–498. ISBN 978-0-19-853791-5.
Sandewall, E. (1998). "Lógica robótica cognitiva e sua metateoria: recursos e fluentes revisitados" . Transações Eletrônicas em Inteligência Artificial . 2 (3–4): 307–329.
Shanahan, M. (1997). Resolvendo o problema da moldura: Uma investigação matemática da lei da inércia do senso comum . MIT Press. ISBN 9780262193849.
Thielscher, M. (1998). "Introdução ao cálculo fluente" . Transações Eletrônicas em Inteligência Artificial . 2 (3–4): 179–192.
Toth, JA (1995). "Resenha de livro. Kenneth M. e Patrick J. Hayes, eds" . Agentes de raciocínio em um mundo dinâmico: o problema do quadro. Inteligência Artificial . 73 (1–2): 323–369. doi : 10.1016 / 0004-3702 (95) 90043-8 .
Turner, H. (1997). "Representando ações em programas lógicos e teorias padrão: uma abordagem de cálculo de situação" (PDF) . Journal of Logic Programming . 31 (1–3): 245–298. doi : 10.1016 / s0743-1066 (96) 00125-2 .

links externos

Zalta, Edward N. (ed.). "O problema do quadro" . Stanford Encyclopedia of Philosophy .
Alguns problemas filosóficos do ponto de vista da inteligência artificial ; o artigo original de McCarthy e Hayes que propôs o problema.

Languages

In other projects