Writeprint - Writeprint

Writeprint é um método em linguística forense de estabelecer a identificação do autor na Internet, comparada a uma impressão digital. A identidade é estabelecida por meio da comparação de características estilométricas distintivas de um texto escrito desconhecido com amostras conhecidas do autor suspeito ( invariantes do escritor ). Mesmo sem um suspeito, o writeprint fornece características de fundo em potencial do autor, como nacionalidade e educação.

Existem cinco aspectos gerais para a identificação do autor na impressão escrita:

  • Características lexicais - a análise do léxico , a escolha do vocabulário pelo autor, usando caracteres e palavras para identificar as preferências de um indivíduo;
    • uso de letras maiúsculas e minúsculas, frequência de certas letras, comprimento médio da palavra, comprimento médio do próprio enunciado
  • Recursos sintáticos - a análise do estilo de escrita do autor e da estrutura da frase, como pontuação e hifenização, uso de voz passiva e complexidade da frase;
  • Recursos estruturais - a análise da organização do autor e do arranjo estrutural da obra, incluindo comprimento, espaçamento e recuo do parágrafo.
    • englobando a disposição de frases dentro de parágrafos, o uso de despedidas, saudações e assinaturas em um ambiente de e-mail, por exemplo;
  • Recursos específicos do conteúdo - a análise da linguagem que é contextualmente significativa para o assunto do trabalho escrito, incluindo o uso de gírias ou siglas. Para ser mais específico, esses recursos determinam os interesses do assunto, identificando palavras-chave que eles usam;
  • Características idiossincráticas - a análise de erros e outros elementos não gramaticais que podem ser exclusivos do autor, como grafia incorreta, uso incorreto de palavras e formas verbais imprecisas. Como isso pode ser difícil de controlar, ele alcançou alta precisão na identificação do autor quando combinado com outros recursos.

Embora os cinco recursos acima sejam os métodos tradicionais de identificação do autor, existem recursos exclusivos do texto online. Recursos como a escolha da fonte, o uso de emojis e links para outros sites fornecem um caminho para a identificação que está ausente na análise de texto tradicional.

Veja também

Referências