VISCII - VISCII
MIME / IANA | VISCII |
---|---|
Línguas) | Vietnamita , inglês |
Criado por | Grupo Viet-Std |
Definições | RFC 1456 |
Classificação | SBCS de 8 bits |
Baseado em | ASCII |
VISCII é uma codificação de caracteres ASCII modificada não oficialmente definida para usar o idioma vietnamita com computadores . Não deve ser confundida com a codificação VSCII registrada oficialmente com nome semelhante . VISCII mantém os 95 caracteres imprimíveis de ASCII inalterados, mas substitui 6 dos 33 caracteres de controle por caracteres imprimíveis. Ele adiciona 128 caracteres pré-compostos . Unicode e a página de código do Windows-1258 agora são usados para praticamente todos os dados de computador vietnamita, mas os arquivos VSCII e VISCII legados podem precisar de conversão.
História e nomenclatura
VISCII foi projetado pelo Grupo de Trabalho de Padronização Vietnamita (Grupo Viet-Std) liderado por Christopher Cuong T. Nguyen, Cuong M. Bui e Hoc D. Ngo com base no Vale do Silício , Califórnia em 1992, enquanto trabalhavam com o consórcio Unicode para incluem caracteres vietnamitas pré-compostos no padrão Unicode. VISCII, junto com VIQR , foi publicado pela primeira vez em um relatório bilíngue em setembro de 1992, no qual foi apelidado de "Código Padrão Vietnamita para Intercâmbio de Informações". O relatório observou uma proliferação no uso de computador no Vietnã e o crescente volume de comunicações baseadas em computador entre vietnamitas no exterior, que os aplicativos existentes usavam codificações específicas do fornecedor que eram incapazes de interoperar entre si, e que a padronização entre os fornecedores era, portanto, necessária. A inclusão bem-sucedida de vietnamitas compostos e pré-compostos no Unicode 1.0 foi o resultado das lições aprendidas com o desenvolvimento de VISCII de 8 bits e VIQR de 7 bits.
No ano seguinte, em 1993, o Vietnã adotou o TCVN 5712 , seu primeiro padrão nacional no domínio da tecnologia da informação . Isso definiu uma codificação de caracteres chamada VSCII , que foi desenvolvida pelo TCVN Technical Committee on Information Technology (TCVN / TC1), e com seu nome significando "Código padrão vietnamita para intercâmbio de informações". VSCII é incompatível com, e de outra forma não relacionado ao VISCII publicado anteriormente. Ao contrário de VISCII, VSCII é um "Padrão vietnamita" no sentido de um padrão nacional .
VISCII e VIQR foram aprovados como o status informativo RFC 1456 , atribuído ao grupo Viet-Std e datado de maio de 1993. Como é o caso das RFCs da IETF, a RFC 1456 as observa como "convenções" usadas por falantes vietnamitas no exterior na Usenet , e que "não especifica nenhum nível de padrão". Apesar disso, continua a chamar VISCII de "Código Padrão do Vietnã para Intercâmbio de Informações" (o mesmo nome adotado por VSCII). Os rótulos VISCII
e csVISCII
estão registrados com IANA for VISCII, com referência ao RFC 1456. (Não há, por outro lado, nenhum rótulo IANA oficial para TCVN 5712 / VSCII, embora x-viet-tcvn5712
fosse anteriormente suportado pelo Mozilla Firefox .)
Projeto
Um conjunto de caracteres ASCII estendido tradicional consiste no conjunto ASCII mais até 128 caracteres. O vietnamita requer 134 combinações de letras diacríticas adicionais, o que é seis demais. Existem ( exceto o suporte de marca de tom para letras maiúsculas, como em VSCII-3 ) essencialmente quatro maneiras diferentes de lidar com este problema:
- Use codificação de largura variável (assim como UTF-8 )
- Inclui a combinação de marcas diacríticas para marcas de tom (como fazem VSCII-2 e Windows-1258 ) ou para sinais diacríticos em geral (como fazem ANSEL e VNI )
- Substitua alguma pontuação ASCII, de preferência pontuação que não seja invariável no ISO 646 (como faz o VNI para DOS )
- Substitua pelo menos seis dos caracteres de controle ASCII básicos (como fazem VPS e VSCII-1 )
VISCII escolheu a última opção, substituindo seis dos menos problemáticos (por exemplo, menos provável de ser reconhecido por um aplicativo e agido especialmente) códigos de controle C0 (STX, ENQ, ACK, DC4, EM e RS) por seis dos combinações diacríticas maiúsculas menos usadas. Embora esta opção possa fazer com que os programas que usam esses códigos de controle funcionem mal ao lidar com texto VISCII, ela cria menos complicações do que as outras duas opções (os designers observam que a transmissão não -8-bit limpa apresenta mais dificuldade na prática do que a reutilização de caracteres de controle). No entanto, as localizações dos caracteres de controle C0 ou C1 e os códigos usados para o espaço ininterrupto em ISO-8859-1 , Mac OS Roman e OEM-US foram deliberadamente atribuídos a letras maiúsculas, com a intenção de fazer uso de pontos de código minúsculos com uma fonte totalmente em maiúsculas, uma solução alternativa útil se os caracteres gráficos não pudessem ser exibidos para esses códigos.
No entanto, usar todos os pontos de código estendidos para letras acentuadas não deixou espaço para adicionar símbolos úteis, números sobrescritos, aspas curvas, travessões adequados, etc., como a maioria dos outros conjuntos de caracteres ASCII estendidos.
A localização dos caracteres deliberadamente segue principalmente a ISO-8859-1, onde há caracteres em comum entre as duas páginas de código (a maiúscula Õ sendo indicada como uma exceção), motivada por questões de facilidade de uso.
Apoio, suporte
VISCII é parcialmente suportado pelo TriChlor Software Group na Califórnia, que lançou vários pacotes de software, bibliotecas e fontes compatíveis com VISCII para MS-DOS e Windows, Unix e Macintosh. O software compatível com VISCII está disponível em muitos sites FTP .
VISCII foi historicamente oferecido como uma codificação para e - mail de saída pelo Mozilla Thunderbird . Também era suportado pelo software de teclado vietnamita do Windows, WinVNKey, criado por Christopher Cuong T. Nguyen e posteriormente atualizado por meio de várias versões do Windows por Hoc D. Ngo e outros.
VISCII foi usado principalmente por falantes vietnamitas no exterior, com VSCII (TCVN) sendo mais popular no norte do Vietnã e VNI sendo mais popular no sul do Vietnã.
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UMA | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
Ẳ 1EB2 |
ETX 0003 |
EOT 0004 |
Ẵ 1EB4 |
Ẫ 1EAA |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
Ỷ 1EF6 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
Ỹ 1EF8 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
Ỵ 1EF4 |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
a 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
eu 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
Ạ 1EA0 |
Ắ 1EAE |
Ằ 1EB0 |
Ặ 1EB6 |
Ấ 1EA4 |
Ầ 1EA6 |
Ẩ 1EA8 |
Ậ 1EAC |
Ẽ 1EBC |
Ẹ 1EB8 |
Ế 1EBE |
Ề 1EC0 |
Ể 1EC2 |
Ễ 1EC4 |
Ệ 1EC6 |
Ố 1ED0 |
9_ 144 |
Ồ 1ED2 |
Ổ 1ED4 |
Ỗ 1ED6 |
Ộ 1ED8 |
Ợ 1EE2 |
Ớ 1EDA |
Ờ 1EDC |
Ở 1EDE |
Ị 1ECA |
Ỏ 1ECE |
Ọ 1ECC |
Ỉ 1EC8 |
Ủ 1EE6 |
Ũ 0168 |
Ụ 1EE4 |
Ỳ 1EF2 |
A_ 160 |
Õ 00D5 |
ắ 1EAF |
ằ 1EB1 |
ặ 1EB7 |
ấ 1EA5 |
ầ 1EA7 |
ẩ 1EA9 |
ậ 1EAD |
ẽ 1EBD |
ẹ 1EB9 |
ế 1EBF |
ề 1EC1 |
ể 1EC3 |
ễ 1EC5 |
ệ 1EC7 |
ố 1ED1 |
B_ 176 |
ồ 1ED3 |
ổ 1ED5 |
ỗ 1ED7 |
Ỡ 1EE0 |
Ơ 01A0 |
ộ 1ED9 |
ờ 1EDD |
Ø 1EDF |
ị 1ECB |
Ự 1EF0 |
Ứ 1EE8 |
Ừ 1EEA |
Ử 1EEC |
ơ 01A1 |
ớ 1EDB |
Ư 01AF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
Ả 1EA2 |
Ă 0102 |
ẳ 1EB3 |
ẵ 1EB5 |
È 00C8 |
É 00C9 |
Ê 00CA |
Ẻ 1EBA |
Ì 00CC |
Í 00CD |
Ĩ 0128 |
ỳ 1EF3 |
D_ 208 |
Đ 0110 |
ứ 1EE9 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
ạ 1EA1 |
ỷ 1EF7 |
ừ 1EEB |
ử 1EED |
Ù 00D9 |
Ú 00DA |
ỹ 1EF9 |
ỵ 1EF5 |
Ý 00DD |
ỡ 1EE1 |
ư 01B0 |
E_ 224 |
à 00E0 |
á 00E1 |
â 00E2 |
ã 00E3 |
ả 1EA3 |
ă 0103 |
ữ 1EEF |
ẫ 1EAB |
è 00E8 |
é 00E9 |
ê 00EA |
ẻ 1EBB |
ì 00EC |
í 00ED |
ĩ 0129 |
ỉ 1EC9 |
F_ 240 |
đ 0111 |
ự 1EF1 |
ò 00F2 |
ó 00F3 |
ô 00F4 |
õ 00F5 |
ỏ 1ECF |
ọ 1ECD |
ụ 1EE5 |
ù 00F9 |
ú 00FA |
ũ 0169 |
ủ 1EE7 |
ý 00FD |
ợ 1EE3 |
Ữ 1EEE |
Carta Número Pontuação Símbolo De outros Indefinido
As diferenças de ISO-8859-1 são mostradas sombreadas.
Veja também
- ASCII
- Vietnamita Quoted-Readable (VIQR)
- Código padrão vietnamita para intercâmbio de informações (VSCII)
- Windows-1258
Referências
Leitura adicional
- Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: VISCII - Rotinas de conversão para VISCII" . CPAN libintl-perl . Arquivado do original em 14/01/2017 . Recuperado em 14/01/2017 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
links externos
- RFC 1456 - Convenções para codificação do idioma vietnamita
- Grupo de Trabalho de Padronização Vietnamita com base na Califórnia
- Relatório Viet-Std 1992
- AnGiang Software
- Software compatível com VISCII e fontes para MS-DOS e Windows
- Software compatível com VISCII, bibliotecas e fontes para Unix
- WinVNKey , driver de teclado vietnamita para Windows com suporte a conjuntos de caracteres multinacionais, incluindo VISCII
- MacVNKey , driver de teclado compatível com VISCII para Macintosh clássico