Linguagem de rede universal - Universal Networking Language

Universal Networking Language ( UNL ) é uma linguagem formal declarativa projetada especificamente para representar dados semânticos extraídos de textos em linguagem natural . Ele pode ser usado como uma linguagem pivô em sistemas de tradução automática interlinguística ou como uma linguagem de representação do conhecimento em aplicações de recuperação de informação .

Escopo e objetivos

A UNL foi projetada para estabelecer uma base simples para representar os aspectos mais centrais da informação e do significado de uma forma independente da linguagem humana e da máquina. Como um formalismo independente da linguagem, a UNL visa codificar, armazenar, disseminar e recuperar informações independentemente da língua original em que foram expressas. Nesse sentido, a UNL busca fornecer ferramentas para superar a barreira do idioma de forma sistemática.

À primeira vista, UNL parece uma espécie de interlíngua, na qual os textos originais são convertidos antes de serem traduzidos para as línguas de destino. Ele pode, de fato, ser usado para esse fim e também de forma muito eficiente. No entanto, sua verdadeira força é a representação do conhecimento e seu objetivo principal é fornecer uma infraestrutura para lidar com o conhecimento que já existe ou pode existir em qualquer idioma.

No entanto, é importante notar que, no momento, seria tolice alegar representar o significado “completo” de qualquer palavra, sentença ou texto para qualquer idioma. Sutilezas de intenção e interpretação tornam o “significado completo”, qualquer que seja o nosso conceito, muito variável e subjetivo para qualquer tratamento sistemático. Assim, a UNL evita as armadilhas de tentar representar o “significado completo” de sentenças ou textos, visando, em vez disso, o significado “central” ou “consensual” mais frequentemente atribuído a eles. Nesse sentido, muito da sutileza da poesia, metáfora, linguagem figurativa, insinuação e outros comportamentos comunicativos indiretos complexos está além do escopo e objetivos atuais da UNL. Em vez disso, a UNL visa o comportamento comunicativo direto e o significado literal como uma base tangível e concreta para a maior parte da comunicação humana em ambientes práticos do dia-a-dia.

Estrutura

Na abordagem UNL, a informação transmitida pela linguagem natural é representada frase por frase como um hipergrafo composto por um conjunto de links rotulados binários direcionados (referidos como relações ) entre nós ou hipérnodos (as Palavras Universais , ou simplesmente UWs ), que representam conceitos. UWs também podem ser anotados com atributos que representam informações de contexto.

Como exemplo, a frase em inglês 'The sky was blue ?!' pode ser representado em UNL da seguinte forma:

UNLGraph.svg

No exemplo acima, "sky (icl> natural world)" e "blue (icl> color)", que representam conceitos individuais, são UWs; "aoj" (= atributo de um objeto) é uma relação semântica binária direcionada que liga os dois UWs; e "@def", "@interrogative", "@past", "@exclamation" e "@entry" são atributos que modificam UWs.

Os UWs pretendem representar conceitos universais, mas são expressos em palavras em inglês ou em qualquer outro idioma natural para serem legíveis por humanos. Eles consistem em uma "palavra-chave" (a raiz UW) e uma "lista de restrições" (o sufixo UW entre parênteses), onde as restrições são usadas para eliminar a ambigüidade do conceito geral transmitido pela palavra-chave. O conjunto de UWs é organizado na Ontologia UNL, na qual os conceitos de alto nível são relacionados aos de nível inferior por meio das relações "icl" (= é um tipo de), "iof" (= é uma instância de) e " equ "(= é igual a).

As relações têm como objetivo representar ligações semânticas entre palavras em todos os idiomas existentes. Eles podem ser ontológicos (como "icl" e "iof", referidos acima), lógicos (como "e" e "ou") e temáticos (como "agt" = agente, "ins" = instrumento, "tim" = hora, "plc" = lugar, etc.). Existem atualmente 46 relações nas especificações UNL. Eles definem em conjunto a sintaxe UNL.

Os atributos representam informações que não podem ser transmitidas por UWs e relações. Normalmente, eles representam informações relativas ao tempo ("@past", "@future", etc.), referência ("@def", "@indef", etc.), modalidade ("@can", "@must", etc.), foco ("@topic", "@focus", etc.) e assim por diante.

Dentro do Programa UNL, o processo de representação de sentenças em linguagem natural em gráficos UNL é denominado UNLization , e o processo de geração de sentenças em linguagem natural a partir de gráficos UNL é denominado NLization . A UNLization, que envolve a análise e compreensão da linguagem natural, deve ser realizada de forma semi-automática (ou seja, por humanos com recursos de computador); e a NLização deve ser realizada de forma totalmente automática.

História

O Programa UNL teve início em 1996, por iniciativa do Instituto de Estudos Avançados da Universidade das Nações Unidas em Tóquio, Japão. Em janeiro de 2001, a Universidade das Nações Unidas criou uma organização autônoma, a Fundação UNDL, para ser responsável pelo desenvolvimento e gestão do Programa UNL. A fundação, uma organização internacional sem fins lucrativos, tem uma identidade independente da Universidade das Nações Unidas, embora tenha ligações especiais com a ONU. Herdou da UNU / IAS o mandato de implementação do Programa UNL para que possa cumprir a sua missão.

O programa já ultrapassou marcos importantes. A arquitetura geral do Sistema UNL foi desenvolvida com um conjunto de softwares básicos e ferramentas necessárias para seu funcionamento. Eles estão sendo testados e aprimorados. Nos últimos anos, uma vasta quantidade de recursos linguísticos das várias línguas nativas já em desenvolvimento, bem como da expressão UNL, foi acumulada. Além disso, a infraestrutura técnica para expandir esses recursos já está instalada, facilitando a participação de muito mais idiomas no sistema UNL a partir de agora. Um número crescente de artigos científicos e dissertações acadêmicas sobre a UNL são publicados a cada ano.

A conquista mais visível até o momento é o reconhecimento pelo Tratado de Cooperação de Patentes (PCT) do caráter inovador e da aplicabilidade industrial da UNL, obtido em maio de 2002 por meio da Organização Mundial da Propriedade Intelectual (OMPI). Adquirir as patentes (patentes americanas 6.704.700 e 7.107.206) para a UNL é uma conquista completamente nova dentro das Nações Unidas.

Veja também

links externos

UNL Society