FrameNet - FrameNet

FrameNet
Declaração de missão Construir um banco de dados léxico baseado em uma teoria do significado chamada Frame Semantics .
Comercial? Não (disponível gratuitamente para download)
Tipo de projeto Banco de dados lexical (contendo: quadros, elementos de quadro (FE), unidades lexicais (LU), frases de exemplo e relações de quadro)
Localização Instituto Internacional de Ciência da Computação em Berkeley, Califórnia
Proprietário Collin Baker (atual gerente de projeto)
Fundador Charles J. Fillmore
Estabelecido 1997 ; 24 anos atras ( 1997 )
Local na rede Internet framenet .icsi .berkeley .edu

Em linguística computacional , FrameNet é um projeto realizado no International Computer Science Institute em Berkeley, Califórnia, que produz um recurso eletrônico baseado em uma teoria do significado chamada semântica de quadro . FrameNet revela, por exemplo, que a frase "John vendeu um carro para Mary" descreve essencialmente a mesma situação básica (quadro semântico) que "Mary comprou um carro de John", apenas de uma perspectiva diferente. Um quadro semântico pode ser pensado como uma estrutura conceitual que descreve um evento, relação ou objeto e os participantes nele. O banco de dados lexical FrameNet contém mais de 1.200 quadros semânticos , 13.000 unidades lexicais (um emparelhamento de uma palavra com um significado ; palavras polissêmicas são representadas por várias unidades lexicais ) e 202.000 frases de exemplo. FrameNet é em grande parte criação de Charles J. Fillmore , que desenvolveu a teoria da semântica de quadros na qual o projeto se baseia, e foi inicialmente o líder do projeto quando o projeto começou em 1997. Collin Baker se tornou o gerente de projeto em 2000. O projeto FrameNet tem sido influente tanto na lingüística quanto no processamento de linguagem natural, levando à tarefa de etiquetagem automática de papéis semânticos .

Conceitos

Molduras

Um quadro é uma representação esquemática de uma situação envolvendo vários participantes, acessórios e outros papéis conceituais. Exemplos de nomes de quadros são Being_borne Locative_relation. Um quadro no FrameNet contém uma descrição textual do que ele representa (uma definição de quadro), elementos de quadro associados, unidades lexicais, frases de exemplo e relações quadro a quadro.

Elementos de quadro

Elementos de quadro (FE) fornecem informações adicionais para a estrutura semântica de uma frase. Cada quadro possui um número de FEs centrais e não centrais que podem ser considerados como funções semânticas. FEs centrais são essenciais para o significado do quadro, enquanto FEs não centrais são geralmente descritivos (como tempo, lugar, maneira, etc.).

Alguns exemplos incluem:

  • O único núcleo FE do Being_bornquadro é chamado Child; FE non-core sendo Time, Place, Relatives, etc.
  • Núcleo FE do Commerce_goods-transferincluir o Seller, Buyer, Goods, entre outras coisas, enquanto FE non-core incluem um Place, Purpose, etc.

O FrameNet inclui dados superficiais sobre as funções sintáticas que os elementos do quadro desempenham nas frases de exemplo. Por exemplo, para uma frase como "Ela nasceu por volta de 460 DC", o FrameNet marcaria "Ela" como um sintagma nominal referindo-se ao ChildFE e "cerca de 460 DC" como um sintagma nominal correspondendo ao Timeelemento do quadro. Os detalhes de como os elementos do quadro podem ser percebidos em uma frase são importantes porque revelam informações importantes sobre os quadros de subcategorização , bem como possíveis alternâncias de diátese (por exemplo, "João quebrou a janela" vs. "A janela quebrou") de um verbo.

Unidades lexicais

As unidades lexicais (LU) são lemas, com sua classe gramatical, que evocam um quadro específico. Em outras palavras, quando uma LU é identificada em uma frase, essa LU específica pode ser associada a seu (s) quadro (s) específico (s). Para cada quadro, pode haver muitas LUs associadas a esse quadro e também pode haver muitos quadros que compartilham uma LU específica; esse é normalmente o caso de LUs que têm vários sentidos de palavra. Ao lado do quadro, cada unidade lexical é associada a elementos de quadro específicos por meio das frases de exemplo anotadas.

Exemplo:

As unidades lexicais que evocam a Complainingmoldura (ou versões perspectivadas mais específicas dela, para ser mais preciso), incluem os verbos "reclamar", "perdão", "lamentar" e outros.

Frases de exemplo

Os quadros são associados a frases de exemplo e os elementos dos quadros são marcados dentro das frases. Assim, a sentença

Ela nasceu por volta de 460 DC

está associado à moldura Being_born, enquanto "Ela" é marcada como o elemento da moldura Childe "cerca de 460 AD" é marcada como Time. (Consulte o FrameNet Annotation Report para born.v.) Desde o início, o projeto FrameNet se comprometeu a examinar evidências do uso real da linguagem, conforme encontrado em coleções de texto como o British National Corpus . Com base nessas frases de exemplo, as ferramentas de rotulagem de função semântica automática são capazes de determinar quadros e marcar elementos de quadro em novas frases.

Valences

O FrameNet também expõe as estatísticas sobre as valências dos quadros , ou seja, o número e a posição dos elementos do quadro nas frases de exemplo. A sentença

Ela nasceu por volta de 460 DC

cai no padrão de valência

NP Ext, INI -, NP Dep

que ocorre duas vezes nas frases de exemplo no FrameNet, a saber:

Ela foi nascido cerca de 460 AD , filha e neta de Romano e imperadores bizantinos, cuja família tinha sido proeminente na política romanos há mais de 700 anos.
Ele logo foi enviado para o norte da África e nunca conheceu sua única filha, uma filha nascida em 8 de junho de 1941 .

Relações de quadro

Além disso, FrameNet captura relacionamentos entre diferentes frames usando relações. Isso inclui o seguinte:

  • Herança: quando um quadro é uma versão mais específica de outro, quadro pai mais abstrato. Tudo o que for verdadeiro sobre o quadro pai também deve ser verdadeiro sobre o quadro filho, e um mapeamento é especificado entre os elementos do quadro do pai e os elementos do quadro do filho.
  • Perspectivized_in: Um quadro neutro (como Commerce_transfer-goods) é conectado a um quadro com uma perspectiva específica do mesmo cenário (por exemplo, o Commerce_sellquadro, que assume a perspectiva do vendedor ou o Commerce_buyquadro, que assume a perspectiva do comprador)
  • Subframe: Alguns quadros, como o Criminal_processquadro referem-se a cenários complexos que consistem em vários estados ou eventos que podem ser descritos por quadros separados como Arrest, Triale assim por diante.
  • Precede: a relação Precede captura uma ordem temporal que se mantém entre subtramas de um cenário complexo.
  • Causative_of e Inchoative_of: há uma relação bastante sistemática entre descrições estativas (como Position_on_a_scaleframe, por exemplo, "Ela tinha um salário alto") e descrições causais (como Cause_change_of_scalar_positionframe, por exemplo, "Ela aumentou seu salário") ou descrições incoativas (como Change_position_on_a_scaleframe, por exemplo " Seu salário aumentou ").
  • Usando: Uma relação que existe entre um quadro que de alguma forma envolve outro quadro. Por exemplo, o Judgment_communicationquadro usa o Judgmentquadro e o Statementquadro, mas não herda de nenhum deles porque não há correspondência clara dos elementos do quadro.
  • See_also: conecta frames que possuem alguma semelhança, mas precisam ser distinguidos com cuidado.

Formulários

O FrameNet provou ser útil em uma série de aplicações computacionais, porque os computadores precisam de conhecimento adicional para reconhecer que "John vendeu um carro para Mary" e "Mary comprou um carro de John" descrevem essencialmente a mesma situação, apesar de usar dois bastante verbos diferentes, preposições diferentes e uma ordem de palavras diferente. O FrameNet tem sido usado em aplicações como resposta a perguntas , paráfrase , reconhecimento de vinculação textual e extração de informações , seja diretamente ou por meio de ferramentas de etiquetagem de papéis semânticos . O primeiro sistema automático para Semantic Role Labeling (SRL, às vezes também conhecido como "análise semântica superficial") foi desenvolvido por Daniel Gildea e Daniel Jurafsky com base no FrameNet em 2002. Semantic Role Labeling se tornou uma das tarefas padrão em linguagem natural processamento, com a versão mais recente (1.7) do FrameNet agora totalmente compatível com o Natural Language Toolkit .

Como os frames são descrições essencialmente semânticas, eles são semelhantes entre os idiomas, e vários projetos surgiram ao longo dos anos que contaram com o FrameNet original como base para FrameNets adicionais que não sejam em inglês, para espanhol, japonês, alemão e polonês, entre outros .

Veja também

Referências

Leitura adicional

links externos