Texto preditivo - Predictive text

Texto preditivo é uma tecnologia de entrada usada onde uma tecla ou botão representa muitas letras, como nos teclados numéricos de telefones celulares e em tecnologias de acessibilidade . Cada pressionamento de tecla resulta em uma previsão, em vez de sequenciar repetidamente o mesmo grupo de "letras" que ele representa, na mesma ordem invariável. O texto preditivo pode permitir que uma palavra inteira seja inserida pressionando uma única tecla. O texto preditivo faz uso eficiente de menos teclas do dispositivo para inserir a escrita em uma mensagem de texto , um e-mail , um catálogo de endereços , um calendário e assim por diante .

Os sistemas de texto preditivo gerais mais usados ​​são T9 , iTap , eZiText e LetterWise / WordWise. Existem muitas maneiras de construir um dispositivo que prevê texto, mas todos os sistemas de texto preditivo têm configurações linguísticas iniciais que oferecem previsões que são priorizadas novamente para se adaptarem a cada usuário. Esse aprendizado se adapta, por meio da memória do dispositivo, ao feedback esclarecedor do usuário que resulta em pressionamentos de teclas corretivas, como pressionar uma tecla "próximo" para chegar à intenção. A maioria dos sistemas de texto preditivo possui um banco de dados do usuário para facilitar esse processo.

Teoricamente, o número de pressionamentos de tecla necessários por caractere desejado na escrita final é, em média, comparável ao uso de um teclado . Isso é aproximadamente verdadeiro, desde que todas as palavras usadas estejam em seu banco de dados, a pontuação seja ignorada e nenhum erro de entrada seja cometido durante a digitação ou ortografia. As teclas teóricas por caractere, KSPC, de um teclado são KSPC = 1,00 e de multitap é KSPC = 2,03. O LetterWise da Eatoni é um híbrido multi-tap preditivo, que ao operar em um teclado de telefone padrão atinge KSPC = 1,15 para o inglês.

A escolha de qual sistema de texto preditivo é o melhor para usar envolve a correspondência do estilo de interface preferido do usuário, o nível de habilidade aprendida do usuário para operar o software de texto preditivo e a meta de eficiência do usuário. Existem vários níveis de risco em sistemas de texto preditivo, versus sistemas multitap , porque o texto previsto que é escrito automaticamente que fornece o benefício de velocidade e eficiência mecânica pode, se o usuário não tiver o cuidado de revisar, resultar na transmissão de informações incorretas. Os sistemas de texto preditivo levam tempo para aprender a usar bem e, portanto, geralmente, o sistema de um dispositivo tem opções do usuário para configurar a escolha de multitap ou qualquer uma das várias escolas de métodos de texto preditivo.

Fundo

O serviço de mensagens curtas (SMS) permite que um usuário de telefone celular envie mensagens de texto (também chamadas de mensagens, SMSes, textos e txts) como uma mensagem curta. O sistema mais comum de entrada de texto SMS é conhecido como " multi-toque ". Usando o multi-toque, uma tecla é pressionada várias vezes para acessar a lista de letras dessa tecla. Por exemplo, pressionar a tecla "2" uma vez exibe um "a", duas vezes exibe um "b" e três vezes exibe um "c". Para inserir duas letras sucessivas que estão na mesma tecla, o usuário deve fazer uma pausa ou clicar no botão "próximo". Um usuário pode digitar pressionando um teclado alfanumérico sem olhar para o visor do equipamento eletrônico. Assim, o multitap é fácil de entender e pode ser usado sem nenhum feedback visual. No entanto, o multitap não é muito eficiente, exigindo potencialmente muitos toques no teclado para inserir uma única letra.

Na entrada de texto preditivo ideal, todas as palavras usadas estão no dicionário, a pontuação é ignorada, nenhum erro de ortografia é cometido e nenhum erro de digitação é cometido. O dicionário ideal incluiria todas as gírias, nomes próprios , abreviações , URLs , palavras em idiomas estrangeiros e outras palavras exclusivas do usuário. Essa circunstância ideal dá ao software de previsão de texto a redução no número de toques de tecla que um usuário precisa para inserir uma palavra. O usuário pressiona o número correspondente a cada letra e, desde que a palavra exista no dicionário de texto preditivo, ou seja eliminada a ambiguidade corretamente por sistemas não pertencentes ao dicionário, ela aparecerá. Por exemplo, pressionar "4663" normalmente será interpretado como a palavra bom , desde que um banco de dados linguístico em inglês esteja atualmente em uso, embora alternativas como casa , capuz e casco também sejam interpretações válidas da sequência de toques nas teclas.

Os sistemas mais utilizados de texto preditivo são da Tegic T9 , da Motorola iTap , ea Eatoni Ergonomics " LetterWise e WordWise. O T9 e o iTap usam dicionários, mas os produtos da Eatoni Ergonomics usam um processo de desambiguação, um conjunto de regras estatísticas para recriar palavras a partir de sequências de teclas. Todos os sistemas de previsão de texto requerem um banco de dados linguístico para cada idioma de entrada compatível.

Sistemas de dicionário vs. não dicionário

A desambiguação tradicional funciona referenciando um dicionário de palavras comumente usadas, embora Eatoni ofereça um sistema de desambiguação sem dicionário.

Em sistemas baseados em dicionário, conforme o usuário pressiona os botões numéricos, um algoritmo procura no dicionário uma lista de palavras possíveis que correspondem à combinação de teclas pressionadas e oferece a escolha mais provável. O usuário pode então confirmar a seleção e prosseguir ou usar uma tecla para percorrer as combinações possíveis.

Um sistema sem dicionário constrói palavras e outras sequências de letras a partir das estatísticas de partes de palavras. Para tentar previsões do resultado pretendido de pressionamentos de tecla ainda não inseridos, a desambiguação pode ser combinada com um recurso de completamento de palavras .

Qualquer um dos sistemas (desambiguação ou preditivo) pode incluir um banco de dados do usuário, que pode ser classificado como um sistema de "aprendizado" quando palavras ou frases são inseridas no banco de dados do usuário sem intervenção direta do usuário. O banco de dados do usuário é para armazenar palavras ou frases que não são bem eliminadas pelo banco de dados pré-fornecido. Alguns sistemas de desambiguação tentam ainda corrigir a ortografia, formatar texto ou realizar outras reescritas automáticas, com o risco de aumentar ou frustrar os esforços do usuário para inserir o texto.

História

As teclas de acionamento da máquina de escrever chinesa criada por Lin Yutang na década de 1940 incluíam sugestões de caracteres após aquele selecionado. Em 1951, o compositor chinês Zhang Jiying organizou os caracteres chineses em grupos associativos, um precursor da entrada de texto preditiva moderna, e quebrou recordes de velocidade ao fazer isso. A entrada preditiva de texto a partir de um teclado de telefone é conhecida pelo menos desde os anos 1970 (Smith e Goodwin, 1971). O texto preditivo era usado principalmente para pesquisar nomes em diretórios pelo telefone, até que as mensagens de texto em telefones celulares se tornaram amplamente utilizadas.

Exemplo

Um teclado padrão ITU-T E.161 usado para mensagens de texto

Em um teclado de telefone normal, se os usuários desejavam digite o em um sistema de entrada de teclado "multi-toque", que seria necessário para:

  • Pressione 8 (tuv) uma vez para selecionar t .
  • Pressione 4 (ghi) duas vezes para selecionar h .
  • Pressione 3 (def) duas vezes para selecionar e .

Enquanto isso, em um telefone com previsão de texto, eles precisam apenas:

  • Pressione 8 uma vez para selecionar o grupo (tuv) para o primeiro caractere.
  • Pressione 4 uma vez para selecionar o grupo (ghi) para o segundo caractere.
  • Pressione 3 uma vez para selecionar o grupo (def) para o terceiro caractere.

O sistema atualiza o visor à medida que cada tecla pressionada é inserida, para mostrar a entrada mais provável. Neste exemplo, a previsão reduziu o número de pressionamentos de botão de cinco para três. O efeito é ainda maior com palavras mais longas e compostas de letras posteriormente na sequência de cada tecla.

Um sistema preditivo baseado em dicionário é baseado na esperança de que a palavra desejada esteja no dicionário. Essa esperança pode ser perdida se a palavra difere de alguma forma do uso comum - em particular, se a palavra não é escrita ou digitada corretamente, é uma gíria ou um nome próprio . Nestes casos, algum outro mecanismo deve ser usado para inserir a palavra. Além disso, a abordagem de dicionário simples falha com linguagens aglutinativas , onde uma única palavra não representa necessariamente uma única entidade semântica.

Empresas e produtos

O texto preditivo é desenvolvido e comercializado em uma variedade de produtos concorrentes, como o T9 da Nuance Communications . Outros produtos incluem o iTap da Motorola , o Eatoni Ergonomic 's LetterWise (caractere, em vez de predição baseada em palavras), WordWise (predição baseada em palavras sem dicionário), EQ3 (um layout semelhante ao QWERTY compatível com teclados de telefones regulares); Prevalente Devices 's Phraze-It ; TenGO da Xrgomics (um sistema de teclado QWERTY reduzido de seis teclas); Adaptxt (considera linguagem, contexto, gramática e semântica); Lightkey (um software de digitação preditiva para Windows); Texto inteligente (natureza estatística da linguagem, sem dicionário, alocação dinâmica de teclas); e Tipo Oizea (ambigüidade temporal); Tauto da Intelab; WordLogic's Intelligent Input Platform ™ (previsão de texto avançada patenteada e baseada em camadas, inclui dicionário multilíngue, verificação ortográfica e pesquisa na Web integrada).

Textônimos

Palavras produzidas pela mesma combinação de teclas foram chamadas de "textônimos"; também "txtonyms"; ou "T9ônimos" (pronuncia-se "tnônimos"), embora não sejam específicos de T9. A seleção do textônimo incorreto pode ocorrer sem erros ortográficos ou de digitação, se o textônimo incorreto for selecionado por padrão ou por erro do usuário. Conforme mencionado acima, a sequência de teclas 4663 em um teclado de telefone, fornecido com um banco de dados linguístico em inglês, geralmente será eliminada como a palavra good . No entanto, a mesma sequência de teclas também corresponde a outras palavras, como casa , ido , casco , capuz e assim por diante. Por exemplo, "Você está em casa?" poderia ser processado como "Você está bem?" se o usuário se esquecer de alterar a palavra padrão 4663. Isso pode levar a mal-entendidos; por exemplo, a sequência 735328 pode corresponder a selecionar ou ao seu antônimo rejeitar . Uma linha de 2010 que levou ao homicídio culposo foi desencadeada por um erro de textonym. O texto preditivo que escolhe um padrão diferente daquele que o usuário espera tem semelhanças com o efeito Cupertino , pelo qual o software de verificação ortográfica altera a grafia para a de uma palavra indesejada.

Os textônimos têm sido usados ​​como gíria da Geração Y ; por exemplo, o uso da palavra livro para significar legal , uma vez que livro é o padrão nos sistemas de texto preditivo que supõem que seja mais frequente do que legal . Isso está relacionado à cacografia .

Falha de desambiguação e erro ortográfico

Os textônimos nos quais um sistema de desambiguação fornece mais de uma palavra do dicionário para uma única sequência de pressionamentos de tecla não são o único problema, ou mesmo o mais importante, limitando a eficácia das implementações de texto preditivo. Mais importante, de acordo com as referências acima, são as palavras para as quais a desambiguação produz uma resposta única e incorreta. O sistema pode, por exemplo, responder com Blairf na entrada de 252473, quando a palavra pretendida era Blaise ou Claire , ambas correspondendo à sequência de teclas, mas não são, neste exemplo, encontradas pelo sistema de texto preditivo. Quando ocorrem erros de digitação ou ortografia, é muito improvável que sejam reconhecidos corretamente por um sistema de desambiguação, embora os mecanismos de correção de erros possam mitigar esse efeito.

Veja também

Conceitos

Produtos

Dispositivos

Referências

Leitura adicional

  • Smith, Sidney L .; Goodwin, Nancy C. (1971). "Entrada alfabética de dados por meio do teclado sensível ao toque: um comentário". Fatores humanos . 13 (2): 189–190. doi : 10.1177 / 001872087101300212 . S2CID  61164630 .

links externos