Interface do usuário em linguagem natural - Natural-language user interface

A interface de usuário em linguagem natural ( LUI ou NLUI ) é um tipo de interface humana de computador em que fenômenos linguísticos como verbos, frases e cláusulas atuam como controles de IU para criar, selecionar e modificar dados em aplicativos de software.

No design de interface , as interfaces de linguagem natural são procuradas por sua velocidade e facilidade de uso, mas a maioria sofre os desafios de compreender uma ampla variedade de entradas ambíguas . As interfaces de linguagem natural são uma área ativa de estudo no campo do processamento de linguagem natural e linguística computacional . Uma interface intuitiva de linguagem natural geral é um dos objetivos ativos da Web Semântica .

As interfaces de texto são "naturais" em vários graus. Muitas linguagens de programação formais (não naturais) incorporam expressões idiomáticas da linguagem humana natural. Da mesma forma, um mecanismo de busca por palavra - chave tradicional pode ser descrito como uma interface de usuário em linguagem natural "superficial".

Visão geral

Na linguagem natural, o mecanismo de busca iria, em teoria, encontrar respostas direcionadas às perguntas do usuário (ao contrário de uma busca por palavra-chave). Por exemplo, quando confrontados com uma pergunta da forma 'qual estado dos EUA tem o imposto de renda mais alto ?', Os mecanismos de pesquisa convencionais ignoram a pergunta e, em vez disso, procuram as palavras - chave 'estado', 'renda' e 'imposto'. A pesquisa em linguagem natural, por outro lado, tenta usar o processamento de linguagem natural para entender a natureza da pergunta e, em seguida, pesquisar e retornar um subconjunto da web que contém a resposta à pergunta. Se funcionar, os resultados teriam maior relevância do que os resultados de um mecanismo de busca por palavra-chave, devido à questão que está sendo incluída.

História

As interfaces de protótipo Nl já haviam aparecido no final dos anos sessenta e no início dos anos setenta.

  • SHRDLU , uma interface de linguagem natural que manipula blocos em um "mundo de blocos" virtual
  • Lunar , uma interface de linguagem natural para um banco de dados contendo análises químicas das rochas lunares da Apollo-11 por William A. Woods .
  • O Chat-80 transformou questões em inglês em expressões Prolog , que foram avaliadas em relação ao banco de dados Prolog. O código do Chat-80 foi amplamente divulgado e formou a base de várias outras interfaces Nl experimentais. Uma demonstração online está disponível no site da LPA.
  • ELIZA , escrito no MIT por Joseph Weizenbaum entre 1964 e 1966, imitou um psicoterapeuta e foi operado pelo processamento das respostas dos usuários aos scripts. Usando quase nenhuma informação sobre o pensamento ou emoção humana, o script DOCTOR às vezes fornecia uma interação surpreendentemente semelhante à humana. Uma demonstração online está disponível no site da LPA.
  • Janus também é um dos poucos sistemas para apoiar questões temporais.
  • Intelecto da Trinzic (formado pela fusão da AICorp e Aion).
  • O Parlance da BBN se baseou na experiência de desenvolvimento dos sistemas Rus e Irus .
  • IBM Languageaccess
  • Perguntas e respostas da Symantec .
  • Datatalker da Natural Language Inc.
  • Loqui da BIM Systems.
  • Assistente de Inglês da Linguistic Technology Corporation .

Desafios

No passado, as interfaces de linguagem natural levaram os usuários a antropomorfizar o computador ou, pelo menos, a atribuir mais inteligência às máquinas do que o necessário. Por parte do usuário, isso gerou expectativas irreais sobre os recursos do sistema. Essas expectativas dificultarão o conhecimento das restrições do sistema se os usuários atribuírem muita capacidade a ele e, no final das contas, levarão à decepção quando o sistema não funcionar conforme o esperado, como foi o caso no inverno de IA das décadas de 1970 e 80.

Um artigo de 1995 intitulado 'Interfaces de linguagem natural para bancos de dados - uma introdução', descreve alguns desafios:

Anexo modificador
A solicitação "Liste todos os funcionários com carteira de motorista da empresa" é ambígua, a menos que você saiba que as empresas não podem ter carteira de motorista.
Conjunção e disjunção
"Liste todos os candidatos que moram na Califórnia e no Arizona" é ambíguo, a menos que você saiba que uma pessoa não pode morar em dois lugares ao mesmo tempo.
Resolução da anáfora
resolver o que um usuário quer dizer com 'ele', 'ela' ou 'isso', em uma consulta autorreferencial.

Outros objetivos a serem considerados de forma mais geral são a velocidade e eficiência da interface, em todos os algoritmos esses dois pontos são o ponto principal que vai determinar se alguns métodos são melhores que outros e, portanto, têm maior sucesso no mercado. Além disso, a localização em sites de vários idiomas requer consideração extra - isso se baseia em diferentes estruturas de frases e variações de sintaxe de idioma entre a maioria dos idiomas.

Finalmente, no que se refere aos métodos utilizados, o principal problema a ser resolvido é a criação de um algoritmo geral que possa reconhecer todo o espectro de diferentes vozes, sem levar em consideração a nacionalidade, o sexo ou a idade. As diferenças significativas entre os recursos extraídos - mesmo de falantes que dizem a mesma palavra ou frase - devem ser superadas com sucesso.

Usos e aplicações

A interface de linguagem natural dá origem à tecnologia usada para muitas aplicações diferentes.

Alguns dos principais usos são:

  • Ditado , é o uso mais comum para sistemas de reconhecimento automatizado de fala (ASR) hoje. Isso inclui transcrições médicas, ditados jurídicos e comerciais e processamento de texto em geral. Em alguns casos, vocabulários especiais são usados ​​para aumentar a precisão do sistema.
  • Comando e controle , os sistemas ASR projetados para executar funções e ações no sistema são definidos como sistemas de comando e controle. Expressões como "Open Netscape" e "Start a new xterm" farão exatamente isso.
  • Telefonia , alguns sistemas PBX / Voice Mail permitem que os chamadores falem comandos em vez de pressionar botões para enviar tons específicos.
  • Vestíveis , porque as entradas são limitadas para dispositivos vestíveis, falar é uma possibilidade natural.
  • Médico, deficiências , muitas pessoas têm dificuldade de digitar devido a limitações físicas, como lesões por esforços repetitivos (LER), distrofia muscular e muitos outros. Por exemplo, pessoas com dificuldade de ouvir podem usar um sistema conectado ao telefone para converter a fala de uma pessoa em texto.
  • Aplicações integradas , alguns novos telefones celulares incluem reconhecimento de voz C&C que permite expressões como "ligar para casa". Este pode ser um fator importante no futuro do reconhecimento automático de voz e do Linux .
  • Desenvolvimento de software : um ambiente de desenvolvimento integrado pode incorporar interfaces de linguagem natural para ajudar os desenvolvedores.

Abaixo estão nomeados e definidos alguns dos aplicativos que usam o reconhecimento de linguagem natural e, portanto, têm utilitários integrados listados acima.

Ubiquidade

Ubiquity, um add-on para Mozilla Firefox , é uma coleção de comandos derivados de linguagem natural rápidos e fáceis que agem como mashups de serviços da web, permitindo aos usuários obter informações e relacioná-las com as páginas atuais e outras.

Wolfram Alpha

Wolfram Alpha é um serviço online que responde a perguntas factuais diretamente computando a resposta a partir de dados estruturados, em vez de fornecer uma lista de documentos ou páginas da web que podem conter a resposta como um mecanismo de busca faria. Foi anunciado em março de 2009 por Stephen Wolfram e lançado ao público em 15 de maio de 2009.

Siri

Siri é um aplicativo de assistente pessoal inteligente integrado ao sistema operacional iOS . O aplicativo usa processamento de linguagem natural para responder a perguntas e fazer recomendações.

As afirmações de marketing do Siri incluem que ele se adapta às preferências individuais do usuário ao longo do tempo e personaliza os resultados, além de realizar tarefas como fazer reservas para o jantar enquanto tenta pegar um táxi.

Outros

  • Ask.com - A ideia original por trás de Ask Jeeves (Ask.com) era a busca tradicional de palavras-chave com a capacidade de obter respostas a perguntas feitas na linguagem natural do dia-a-dia. O Ask.com atual ainda oferece suporte para isso, com suporte adicional para questões de matemática, dicionário e conversão.
  • Braina - Braina é uma interface de linguagem natural para o sistema operacional Windows que permite digitar ou falar frases em inglês para realizar uma determinada ação ou encontrar informações.
Captura de tela da interface clássica do GNOME DO.
  • GNOME Do - Permite encontrar rapidamente diversos artefatos do ambiente GNOME (aplicativos, contatos do Evolution e Pidgin, favoritos do Firefox, artistas e álbuns do Rhythmbox e assim por diante) e executar as ações básicas sobre eles (iniciar, abrir, enviar por e-mail, conversar, jogar, etc.).
  • hakia - hakia era um mecanismo de busca na Internet. A empresa inventou uma nova infraestrutura alternativa para indexação que usava o algoritmo SemanticRank, uma combinação de soluções das disciplinas de semântica ontológica, lógica fuzzy, linguística computacional e matemática. hakia fechou em 2014.
  • Lexxe - Lexxe era um mecanismo de busca da Internet que usava processamento de linguagem natural para consultas (busca semântica). As pesquisas podem ser feitas com palavras-chave, frases e perguntas, como "Quantos anos tem a Wikipedia?" A Lexxe encerrou seus serviços de mecanismo de pesquisa em 2015.
  • Pikimal - Pikimal usava linguagem natural vinculada à preferência do usuário para fazer recomendações de pesquisa por modelo. Pikimal fechou em 2015.
  • Powerset - Em 11 de maio de 2008, a empresa revelou uma ferramenta para pesquisar um subconjunto fixo da Wikipedia usando frases de conversação em vez de palavras-chave. Em 1 de julho de 2008, ele foi comprado pela Microsoft .
  • Q-go - A tecnologia Q-go fornece respostas relevantes aos usuários em resposta a consultas no site de uma empresa na Internet ou intranet corporativa, formuladas em frases naturais ou entrada de palavras-chave semelhantes. A Q-go foi adquirida pela RightNow Technologies em 2011.
  • Yebol - o Yebol era um mecanismo de pesquisa de "decisão" vertical que desenvolveu uma plataforma de pesquisa semântica baseada em conhecimento. Os algoritmos de inteligência artificial infundidos com inteligência humana do Yebol agruparam e categorizaram automaticamente os resultados de pesquisa, sites, páginas e conteúdo apresentados em um formato indexado visualmente que está mais alinhado com a intenção humana inicial. Yebol usou algoritmos de associação, classificação e agrupamento para analisar palavras-chave ou páginas da web relacionadas. Processamento de linguagem natural integrado Yebol, sistemas complexos abertos metassintéticos e algoritmos de máquina com conhecimento humano para cada consulta para estabelecer um diretório da web que realmente 'aprende', usando algoritmos de correlação, agrupamento e classificação para gerar automaticamente a consulta de conhecimento, que foi retido e regenerado para a frente.

Veja também

Referências