VISCII - VISCII

VISCII
MIME / IANA VISCII
Línguas) Vietnamita , inglês
Criado por Grupo Viet-Std
Definições RFC  1456
Classificação SBCS de 8 bits
Baseado em ASCII

VISCII é uma codificação de caracteres ASCII modificada não oficialmente definida para usar o idioma vietnamita com computadores . Não deve ser confundida com a codificação VSCII registrada oficialmente com nome semelhante . VISCII mantém os 95 caracteres imprimíveis de ASCII inalterados, mas substitui 6 dos 33 caracteres de controle por caracteres imprimíveis. Ele adiciona 128 caracteres pré-compostos . Unicode e a página de código do Windows-1258 agora são usados ​​para praticamente todos os dados de computador vietnamita, mas os arquivos VSCII e VISCII legados podem precisar de conversão.

História e nomenclatura

VISCII foi projetado pelo Grupo de Trabalho de Padronização Vietnamita (Grupo Viet-Std) liderado por Christopher Cuong T. Nguyen, Cuong M. Bui e Hoc D. Ngo com base no Vale do Silício , Califórnia em 1992, enquanto trabalhavam com o consórcio Unicode para incluem caracteres vietnamitas pré-compostos no padrão Unicode. VISCII, junto com VIQR , foi publicado pela primeira vez em um relatório bilíngue em setembro de 1992, no qual foi apelidado de "Código Padrão Vietnamita para Intercâmbio de Informações". O relatório observou uma proliferação no uso de computador no Vietnã e o crescente volume de comunicações baseadas em computador entre vietnamitas no exterior, que os aplicativos existentes usavam codificações específicas do fornecedor que eram incapazes de interoperar entre si, e que a padronização entre os fornecedores era, portanto, necessária. A inclusão bem-sucedida de vietnamitas compostos e pré-compostos no Unicode 1.0 foi o resultado das lições aprendidas com o desenvolvimento de VISCII de 8 bits e VIQR de 7 bits.

No ano seguinte, em 1993, o Vietnã adotou o TCVN 5712 , seu primeiro padrão nacional no domínio da tecnologia da informação . Isso definiu uma codificação de caracteres chamada VSCII , que foi desenvolvida pelo TCVN Technical Committee on Information Technology (TCVN / TC1), e com seu nome significando "Código padrão vietnamita para intercâmbio de informações". VSCII é incompatível com, e de outra forma não relacionado ao VISCII publicado anteriormente. Ao contrário de VISCII, VSCII é um "Padrão vietnamita" no sentido de um padrão nacional .

VISCII e VIQR foram aprovados como o status informativo RFC  1456 , atribuído ao grupo Viet-Std e datado de maio de 1993. Como é o caso das RFCs da IETF, a RFC 1456 as observa como "convenções" usadas por falantes vietnamitas no exterior na Usenet , e que "não especifica nenhum nível de padrão". Apesar disso, continua a chamar VISCII de "Código Padrão do Vietnã para Intercâmbio de Informações" (o mesmo nome adotado por VSCII). Os rótulos VISCIIe csVISCIIestão registrados com IANA for VISCII, com referência ao RFC 1456. (Não há, por outro lado, nenhum rótulo IANA oficial para TCVN 5712 / VSCII, embora x-viet-tcvn5712fosse anteriormente suportado pelo Mozilla Firefox .)

Projeto

Um conjunto de caracteres ASCII estendido tradicional consiste no conjunto ASCII mais até 128 caracteres. O vietnamita requer 134 combinações de letras diacríticas adicionais, o que é seis demais. Existem ( exceto o suporte de marca de tom para letras maiúsculas, como em VSCII-3 ) essencialmente quatro maneiras diferentes de lidar com este problema:

  1. Use codificação de largura variável (assim como UTF-8 )
  2. Inclui a combinação de marcas diacríticas para marcas de tom (como fazem VSCII-2 e Windows-1258 ) ou para sinais diacríticos em geral (como fazem ANSEL e VNI )
  3. Substitua alguma pontuação ASCII, de preferência pontuação que não seja invariável no ISO 646 (como faz o VNI para DOS )
  4. Substitua pelo menos seis dos caracteres de controle ASCII básicos (como fazem VPS e VSCII-1 )

VISCII escolheu a última opção, substituindo seis dos menos problemáticos (por exemplo, menos provável de ser reconhecido por um aplicativo e agido especialmente) códigos de controle C0 (STX, ENQ, ACK, DC4, EM e RS) por seis dos combinações diacríticas maiúsculas menos usadas. Embora esta opção possa fazer com que os programas que usam esses códigos de controle funcionem mal ao lidar com texto VISCII, ela cria menos complicações do que as outras duas opções (os designers observam que a transmissão não -8-bit limpa apresenta mais dificuldade na prática do que a reutilização de caracteres de controle). No entanto, as localizações dos caracteres de controle C0 ou C1 e os códigos usados ​​para o espaço ininterrupto em ISO-8859-1 , Mac OS Roman e OEM-US foram deliberadamente atribuídos a letras maiúsculas, com a intenção de fazer uso de pontos de código minúsculos com uma fonte totalmente em maiúsculas, uma solução alternativa útil se os caracteres gráficos não pudessem ser exibidos para esses códigos.

No entanto, usar todos os pontos de código estendidos para letras acentuadas não deixou espaço para adicionar símbolos úteis, números sobrescritos, aspas curvas, travessões adequados, etc., como a maioria dos outros conjuntos de caracteres ASCII estendidos.

A localização dos caracteres deliberadamente segue principalmente a ISO-8859-1, onde há caracteres em comum entre as duas páginas de código (a maiúscula Õ sendo indicada como uma exceção), motivada por questões de facilidade de uso.

Apoio, suporte

VISCII é parcialmente suportado pelo TriChlor Software Group na Califórnia, que lançou vários pacotes de software, bibliotecas e fontes compatíveis com VISCII para MS-DOS e Windows, Unix e Macintosh. O software compatível com VISCII está disponível em muitos sites FTP .

VISCII foi historicamente oferecido como uma codificação para e - mail de saída pelo Mozilla Thunderbird . Também era suportado pelo software de teclado vietnamita do Windows, WinVNKey, criado por Christopher Cuong T. Nguyen e posteriormente atualizado por meio de várias versões do Windows por Hoc D. Ngo e outros.

VISCII foi usado principalmente por falantes vietnamitas no exterior, com VSCII (TCVN) sendo mais popular no norte do Vietnã e VNI sendo mais popular no sul do Vietnã.

Conjunto de caracteres

VISCII
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_
0
NUL
0000
SOH
0001

1EB2
ETX
0003
EOT
0004

1EB4

1EAA
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013

1EF6
NAK
0015
SYN
0016
ETB
0017
CAN
0018

1EF8
SUB
001A
ESC
001B
FS
001C
GS
001D

1EF4
US
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
a
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
eu
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

1EA0

1EAE

1EB0

1EB6

1EA4

1EA6

1EA8

1EAC

1EBC

1EB8

1EBE

1EC0

1EC2

1EC4

1EC6

1ED0
9_
144

1ED2

1ED4

1ED6

1ED8

1EE2

1EDA

1EDC

1EDE

1ECA

1ECE

1ECC

1EC8

1EE6
Ũ
0168

1EE4

1EF2
A_
160
Õ
00D5

1EAF

1EB1

1EB7

1EA5

1EA7

1EA9

1EAD

1EBD

1EB9
ế
1EBF

1EC1

1EC3

1EC5

1EC7

1ED1
B_
176

1ED3

1ED5

1ED7

1EE0
Ơ
01A0

1ED9

1EDD
Ø
1EDF

1ECB

1EF0

1EE8

1EEA

1EEC
ơ
01A1

1EDB
Ư
01AF
C_
192
À
00C0
Á
00C1
Â
00C2
Ã
00C3

1EA2
Ă
0102

1EB3

1EB5
È
00C8
É
00C9
Ê
00CA

1EBA
Ì
00CC
Í
00CD
Ĩ
0128

1EF3
D_
208
Đ
0110

1EE9
Ò
00D2
Ó
00D3
Ô
00D4

1EA1

1EF7

1EEB

1EED
Ù
00D9
Ú
00DA

1EF9

1EF5
Ý
00DD

1EE1
ư
01B0
E_
224
à
00E0
á
00E1
â
00E2
ã
00E3

1EA3
ă
0103

1EEF

1EAB
è
00E8
é
00E9
ê
00EA

1EBB
ì
00EC
í
00ED
ĩ
0129

1EC9
F_
240
đ
0111

1EF1
ò
00F2
ó
00F3
ô
00F4
õ
00F5

1ECF

1ECD

1EE5
ù
00F9
ú
00FA
ũ
0169

1EE7
ý
00FD

1EE3

1EEE

  Carta  Número  Pontuação  Símbolo  De outros  Indefinido

As diferenças de ISO-8859-1 são mostradas sombreadas.

Veja também

Referências

Leitura adicional

links externos