caractere substituto - Substitute character


Da Wikipédia, a enciclopédia livre

Um caractere substituto (␚) é um caractere de controle que é usado no lugar de um personagem que é reconhecida como inválida ou errónea, ou que não podem ser representados em um determinado dispositivo. Ele também é usado como uma seqüência de escape em algumas linguagens de programação .

No ASCII conjunto de caracteres , este personagem é codificado pelo número 26 ( 1A hex ). Padrões teclados transmitir este código quando os Ctrle Zteclas em simultâneo (Ctrl + Z, por convenção, frequentemente descritos como ^ Z). Unicode codifica esse personagem, mas recomenda que o caractere de substituição (, U + FFFD) ser usado em vez de representar entradas un-decodificáveis, quando a codificação de saída é compatível com ele.

usos

Fim do arquivo

Historicamente, sob precoce PC CP / M 1 e 2 os sistemas operativos (e seus derivados como MP / M ) foi necessário para marcar explicitamente o fim de um ficheiro (EOF) porque o CP / M sistema de arquivo não pode registar o tamanho do ficheiro exacto pelo próprio ; arquivos foram alocados em extensões (registros) de tamanho fixo, normalmente deixando algum espaço alocado, mas não utilizado no final de cada arquivo. Este espaço extra foi preenchido com 1A 16 ( hex caracteres) sob CP / M. Os sistemas de ficheiros CP / M estendidos utilizados pela CP / M 3 e mais elevadas (e derivados como / simultâneas CP M , concomitante DOS e O DOS Plus ) arquivos apoiava byte-granular, de modo que este já não era um requisito físico, mas uma mera convenção (especialmente para arquivos de texto ), a fim de garantir a retrocompatibilidade.

Em CP / H , 86-DOS , MS-DOS , PC DOS , DR-DOS , e os seus diversos derivados, a personagem SUB também foi utilizado para indicar o fim de um fluxo de caracteres, e assim utilizado para terminar a entrada do utilizador num interactivo linha de comando janela (e, como tal, muitas vezes usado para terminar o redirecionamento de console de entrada, por exemplo, como instigada por COPY CON: TYPEDTXT.TXT ).

Embora não tecnicamente necessário para indicar o final de um arquivo, muitos editores de texto e idiomas de programa continua a apoiar esta convenção, ou pode ser configurado para inserir este personagem no final de um arquivo ao editar, ou pelo menos adequadamente lidar com eles em texto arquivos. Nesses casos, é muitas vezes chamado de EOF "soft", como ele não representa necessariamente o fim físico do arquivo, mas é mais um marcador que indica que "não há dados úteis além deste ponto". Na realidade, mais dados podem existir para além deste personagem até o final real dos dados no sistema de arquivos, assim ele pode ser usado para esconder o conteúdo do arquivo quando o arquivo é inserido no console ou abertos em editores. Muitos padrões de formato de arquivo (por exemplo, PNG ou GIF ) incluem o personagem SUB em seus cabeçalhos para executar precisamente esta função. Alguns formatos de arquivo de texto modernos (por exemplo CSV-1203 ) ainda recomendar um caractere EOF arrastando a ser acrescentado como o último caractere no arquivo. No entanto, ao digitar Control+ Znão inserir um caractere EOF em um arquivo em qualquer MS-DOS ou Microsoft Windows , nem as APIs desses sistemas usar o caractere para denotar o fim real de um arquivo.

Algumas linguagens de programação (por exemplo, Visual Basic ) não vai ler passado um EOF "soft" ao usar o arquivo embutido texto lendo primitivas (INPUT, LINE INPUT etc.), e métodos alternativos devem ser aprovadas, por exemplo, abrir o arquivo em modo binário ou usando o File System Object para o progresso para além dela.

Character 26 foi usado para marcar "Fim do arquivo", mesmo que o ASCII chama-Substituto, e tem outros personagens para isso. Número 28, que é chamado de " arquivo separador " também tem sido usado para fins semelhantes.

Outros usos

Em Unix sistemas operacionais, esse personagem é normalmente usado para suspender o processo interativo atualmente em execução. O processo em suspensão pode então ser retomado em primeiro plano de modo (interactivo), ou ser feita a continuar a execução no fundo modo, ou ser terminada . Quando inserido por um usuário em seu terminal de computador , o processo de primeiro plano em execução no momento é enviado um "ponto terminal" ( SIGTSTP sinal), o que geralmente faz com que o processo de suspender a sua execução. O usuário pode depois continuar a execução do processo usando o comando "primeiro plano" ( fg) ou o " fundo de comando" ( bg).

O relatório Considerações Unicode Segurança recomenda esse personagem como um substituto seguro para personagens unmappable durante a conversão conjunto de caracteres.

Em muitos GUIs e aplicações Control+ Z( ⌘ Command+ Zno Mac OS) pode ser usado para desfazer a última ação. Em muitas aplicações ações cedo do que o último também pode ser desfeita pressionando Control+ Zvárias vezes. Control+ ZEra um de um punhado de teclado seqüências escolhidas pelos designers programa a Xerox PARC para controlar a edição de texto . Presumivelmente, estes particulares batidas de tecla foram escolhidos por causa da sua localização sobre um padrão teclado QWERTY , uma vez que o Z (desfazer), X (corte), C (cópia), e V teclas (colar) estão localizados juntos na extremidade esquerda da linha inferior do teclado QWERTY padrão.

Representação

  • ASCII e Unicode representação de "substituto":
    código Octal: 32
    código decimal: 26
    código hexadecimal: 1A, U + 001A
    símbolo mnemônico: SUB
    valor binário: 11010

Referências

Veja também