Processamento de texto - Text processing

P.Oxy.6.993 texto transcrito.svg

Na computação, o termo processamento de texto refere-se à teoria e prática de automatizar a criação ou manipulação de texto eletrônico. Texto geralmente se refere a todos os caracteres alfanuméricos especificados no teclado da pessoa que pratica a prática, mas, em geral, texto significa a camada de abstração imediatamente acima da codificação de caracteres padrão do texto de destino. O termo processamento refere-se ao processamento automatizado (ou mecanizado), em oposição à mesma manipulação feita manualmente.

O processamento de texto envolve comandos de computador que invocam conteúdo, alterações de conteúdo e movimento do cursor, por exemplo para

  • procure e substitua
  • formato
  • gerar um relatório processado do conteúdo de, ou
  • filtrar um arquivo ou relatório de um arquivo de texto.

O processamento de texto de uma expressão regular é uma máquina de edição virtual, possuindo uma linguagem de programação primitiva que possui registros nomeados (identificadores) e posições nomeadas na sequência de caracteres que compõem o texto. Usando estes, o "processador de texto" pode, por exemplo, marcar uma região do texto e depois movê-la. O processamento de texto de um utilitário é um programa de filtro ou filtro . Esses dois mecanismos compreendem o processamento de texto.

Definição

Como a marcação padronizada, como os códigos de escape ANSI, geralmente são invisíveis para o editor, eles compreendem um conjunto de propriedades transitórias que às vezes se tornam indistinguíveis do processamento de texto . Mas as distinções definitivas do processamento de texto são o processamento de texto adequado:

  • representa "utilitários de processamento de texto", não apenas aplicativos de "edição de texto".
  • é muito mais "o jeito do teclado", em oposição ao "jeito do mouse" (por exemplo, arrastar e soltar, recortar e colar) de iniciar uma edição.
  • é o acesso sequencial em vez do acesso aleatório na abordagem.
  • opera diretamente na camada de apresentação, em vez de indiretamente na camada de aplicativo .
  • trabalha com dados brutos que são padronizados e funcionam de forma mais aberta, em vez de tender para qualquer método proprietário.

Desta forma, marcações como fonte e cor não são realmente um fator distintivo, porque as sequências de caracteres que afetam a fonte e a cor são simplesmente caracteres padrão inseridos automaticamente por um modo de processamento de texto de fundo , feito para funcionar de forma transparente por editores de texto compatíveis , mas tornando-se o contrário visível como comandos de processamento de texto quando esse modo não está em vigor. Portanto, o processamento de texto é definido basicamente (mas não inteiramente) em torno dos caracteres visuais (ou grafemas ), em vez dos caracteres padrão, ainda invisíveis.

História

O desenvolvimento do processamento de texto por computador começou a sério com a formalização de Kleene o que é uma linguagem regular . Essas expressões regulares poderiam então se tornar um miniprograma, completo com um processo de compilação, disponível para realizar qualquer edição, uma vez que a linguagem fosse estendida. Da mesma forma, os filtros são estendidos ao desenvolver opções específicas .

Conceitos Básicos

Um editor essencialmente chama um fluxo de entrada e o direciona para o ambiente de processamento de texto, que é um shell de comando ou um editor de texto . A saída resultante é aplicável ao processamento de texto posterior, cujo resultado final é comparável a uma única aplicação de um algoritmo aplicado uma vez por um programa de computador mais sofisticado e estruturado.

O processamento de texto, ao contrário de um algoritmo, é uma sequência administrada manualmente de macros mais simples que são as expressões de ação padrão e mecanismos de filtragem. Em ambos os casos, a intenção do programador é impressa indiretamente em um determinado conjunto de caracteres textuais no ato do processamento do texto. Os resultados de uma etapa de processamento de texto às vezes são apenas promissores, e o mecanismo tentado geralmente está sujeito a vários rascunhos por meio de feedback visual, até que a expressão regular ou os detalhes da linguagem de marcação, ou até que as opções do utilitário sejam totalmente dominadas.

O processamento de texto está preocupado principalmente com a produção de caracteres textuais no mais alto nível de computação, onde suas atividades estão logo abaixo dos usos práticos da computação - a transmissão manual de informações.

Em última análise, toda a computação é processamento de texto, desde os caracteres textuais autocompiláveis ​​de um montador, passando pela linguagem de programação automatizada gerada para lidar com um blob de dados gráficos e, finalmente, até os metacaracteres de expressões regulares que tratam de documentos de texto existentes.

O processamento de texto é sua própria automação.

Personagens

Os caracteres textuais vêm em conjuntos de caracteres padronizados contendo também caracteres de controle, como um caractere de nova linha, que organiza o texto. Outros tipos de caracteres de controle organizam a transmissão, definem os conjuntos de caracteres e realizam outras tarefas de manutenção.

Veja também

links externos