Processamento de texto - Text processing
Na computação, o termo processamento de texto refere-se à teoria e prática de automatizar a criação ou manipulação de texto eletrônico. Texto geralmente se refere a todos os caracteres alfanuméricos especificados no teclado da pessoa que pratica a prática, mas, em geral, texto significa a camada de abstração imediatamente acima da codificação de caracteres padrão do texto de destino. O termo processamento refere-se ao processamento automatizado (ou mecanizado), em oposição à mesma manipulação feita manualmente.
O processamento de texto envolve comandos de computador que invocam conteúdo, alterações de conteúdo e movimento do cursor, por exemplo para
- procure e substitua
- formato
- gerar um relatório processado do conteúdo de, ou
- filtrar um arquivo ou relatório de um arquivo de texto.
O processamento de texto de uma expressão regular é uma máquina de edição virtual, possuindo uma linguagem de programação primitiva que possui registros nomeados (identificadores) e posições nomeadas na sequência de caracteres que compõem o texto. Usando estes, o "processador de texto" pode, por exemplo, marcar uma região do texto e depois movê-la. O processamento de texto de um utilitário é um programa de filtro ou filtro . Esses dois mecanismos compreendem o processamento de texto.
Definição
Como a marcação padronizada, como os códigos de escape ANSI, geralmente são invisíveis para o editor, eles compreendem um conjunto de propriedades transitórias que às vezes se tornam indistinguíveis do processamento de texto . Mas as distinções definitivas do processamento de texto são o processamento de texto adequado:
- representa "utilitários de processamento de texto", não apenas aplicativos de "edição de texto".
- é muito mais "o jeito do teclado", em oposição ao "jeito do mouse" (por exemplo, arrastar e soltar, recortar e colar) de iniciar uma edição.
- é o acesso sequencial em vez do acesso aleatório na abordagem.
- opera diretamente na camada de apresentação, em vez de indiretamente na camada de aplicativo .
- trabalha com dados brutos que são padronizados e funcionam de forma mais aberta, em vez de tender para qualquer método proprietário.
Desta forma, marcações como fonte e cor não são realmente um fator distintivo, porque as sequências de caracteres que afetam a fonte e a cor são simplesmente caracteres padrão inseridos automaticamente por um modo de processamento de texto de fundo , feito para funcionar de forma transparente por editores de texto compatíveis , mas tornando-se o contrário visível como comandos de processamento de texto quando esse modo não está em vigor. Portanto, o processamento de texto é definido basicamente (mas não inteiramente) em torno dos caracteres visuais (ou grafemas ), em vez dos caracteres padrão, ainda invisíveis.
História
O desenvolvimento do processamento de texto por computador começou a sério com a formalização de Kleene o que é uma linguagem regular . Essas expressões regulares poderiam então se tornar um miniprograma, completo com um processo de compilação, disponível para realizar qualquer edição, uma vez que a linguagem fosse estendida. Da mesma forma, os filtros são estendidos ao desenvolver opções específicas .
Conceitos Básicos
Um editor essencialmente chama um fluxo de entrada e o direciona para o ambiente de processamento de texto, que é um shell de comando ou um editor de texto . A saída resultante é aplicável ao processamento de texto posterior, cujo resultado final é comparável a uma única aplicação de um algoritmo aplicado uma vez por um programa de computador mais sofisticado e estruturado.
O processamento de texto, ao contrário de um algoritmo, é uma sequência administrada manualmente de macros mais simples que são as expressões de ação padrão e mecanismos de filtragem. Em ambos os casos, a intenção do programador é impressa indiretamente em um determinado conjunto de caracteres textuais no ato do processamento do texto. Os resultados de uma etapa de processamento de texto às vezes são apenas promissores, e o mecanismo tentado geralmente está sujeito a vários rascunhos por meio de feedback visual, até que a expressão regular ou os detalhes da linguagem de marcação, ou até que as opções do utilitário sejam totalmente dominadas.
O processamento de texto está preocupado principalmente com a produção de caracteres textuais no mais alto nível de computação, onde suas atividades estão logo abaixo dos usos práticos da computação - a transmissão manual de informações.
Em última análise, toda a computação é processamento de texto, desde os caracteres textuais autocompiláveis de um montador, passando pela linguagem de programação automatizada gerada para lidar com um blob de dados gráficos e, finalmente, até os metacaracteres de expressões regulares que tratam de documentos de texto existentes.
O processamento de texto é sua própria automação.
Personagens
Os caracteres textuais vêm em conjuntos de caracteres padronizados contendo também caracteres de controle, como um caractere de nova linha, que organiza o texto. Outros tipos de caracteres de controle organizam a transmissão, definem os conjuntos de caracteres e realizam outras tarefas de manutenção.
Veja também
links externos
- O assunto do livro Automatic Text Processing de Gerard Salton
- Banco de dados com ferramentas de processamento de texto (23/10/2013)
- Software de análise de conteúdo Software para análise de conteúdo.
- Ferramentas de texto online Ferramentas de processamento de texto online.