Windows-1256 - Windows-1256
MIME / IANA | windows-1256 |
---|---|
Apelido) | cp1256 ( página de código 1256) |
Línguas) | Árabe , persa , urdu , inglês , francês (exceto letras maiúsculas com diacríticos) |
Criado por | Microsoft |
Padrão | Padrão de codificação WHATWG |
Classificação | ASCII estendido , Windows-125x |
Windows-1256 é uma página de código usada no Microsoft Windows para escrever árabe e outros idiomas que usam a escrita árabe , como persa e urdu .
Esta página de código não é compatível com as codificações ISO-8859-6 e MacArabic .
O Windows-1256 codifica todas as letras abstratas do alfabeto árabe básico, nem todas as formas visuais concretas de variantes de formas de letras isoladas, iniciais, mediais, finais ou ligadas (ou seja, codifica caracteres, não glifos). As letras árabes no intervalo C0-FF estão em ordem alfabética árabe, mas alguns caracteres latinos estão intercalados entre eles. Estes são alguns caracteres latinos do Windows-1252 usados para o francês , uma vez que esse idioma europeu tem alguma relevância histórica nas ex-colônias francesas no norte da África, como Marrocos e Argélia . Isso permitiu que os textos em francês e árabe fossem misturados ao usar o Windows 1256 sem qualquer necessidade de alternar a página de código (no entanto, as letras maiúsculas com diacríticos não foram incluídas).
A IBM usa a página de códigos 1256 ( CCSID 1256, euro sign extended CCSID 5352 e o adicional CCSID 9448 estendido) para Windows-1256.
O Unicode é preferível ao Windows 1256 em aplicativos modernos, especialmente na Internet; significando a codificação UTF-8 dominante para páginas da web (consulte também a escrita árabe em Unicode , para uma cobertura completa, ao contrário, por exemplo, do Windows 1256 ou ISO-8859-6 que não cobrem extras). Menos de 0,1% de todas as páginas da web usam o Windows-1256 em setembro de 2019.
Conjunto de caracteres
Como a página de código original deixou 9 valores (bytes) marcados como "NÃO USADOS" na especificação original, esses bytes foram usados posteriormente para caracteres adicionais necessários para a escrita perso-árabe (para os idiomas persa e urdu ), mais o símbolo do euro .
A tabela a seguir mostra a versão estendida do Windows-1256. Cada caractere é mostrado com seu equivalente Unicode e seu código decimal.
Aqui, cada letra árabe é mostrada de forma isolada. As formas reais das letras dentro das palavras árabes são processadas por uma combinação de regras de software e suporte de fonte apropriado.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UMA | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
a 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
eu 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
€ 20AC |
پ 067E |
‚ 201A |
ƒ 0192 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
02C6 |
‰ 2030 |
ٹ 0679 |
‹ 2039 |
Œ 0152 |
چ 0686 |
ژ 0698 |
ڈ 0688 |
9_ 144 |
گ 06AF |
' 2018 |
' 2019 |
“ 201C |
” 201D |
• 2022 |
- 2013 |
- 2014 |
ک 06A9 |
™ 2122 |
ڑ 0691 |
› 203A |
œ 0153 |
ZWNJ 200C |
ZWJ 200D |
ں 06BA |
A_ 160 |
NBSP 00A0 |
، 060C |
¢ 00A2 |
£ 00A3 |
¤ 00A4 |
¥ 00A5 |
¦ 00A6 |
§ 00A7 |
¨ 00A8 |
© 00A9 |
ھ 06BE |
« 00AB |
¬ 00AC |
TÍMIDO 00AD |
® 00AE |
¯ 00AF |
B_ 176 |
° 00B0 |
± 00B1 |
² 00B2 |
³ 00B3 |
´ 00B4 |
µ 00B5 |
¶ 00B6 |
· 00B7 |
¸ 00B8 |
¹ 00B9 |
؛ 061B |
» 00BB |
¼ 00BC |
½ 00BD |
¾ 00BE |
؟ 061F |
C_ 192 |
ہ 06C1 |
ء 0621 |
آ 0622 |
أ 0623 |
ؤ 0624 |
إ 0625 |
ئ 0626 |
ا 0627 |
ب 0628 |
ة 0629 |
ت 062A |
ث 062B |
ج 062C |
ح 062D |
خ 062E |
د 062F |
D_ 208 |
ذ 0630 |
ر 0631 |
ز 0632 |
س 0633 |
Ô 0634 |
ص 0635 |
ض 0636 |
× 00D7 |
ط 0637 |
ظ 0638 |
ع 0639 |
غ 063A |
0640 |
ف 0641 |
ق 0642 |
ك 0643 |
E_ 224 |
à 00E0 |
ل 0644 |
â 00E2 |
م 0645 |
ن 0646 |
ه 0647 |
و 0648 |
ç 00E7 |
è 00E8 |
é 00E9 |
ê 00EA |
ë 00EB |
ى 0649 |
ي 064A |
î 00EE |
ï 00EF |
F_ 240 |
064B |
064C |
064D |
064E |
ô 00F4 |
064F |
0650 |
÷ 00F7 |
0651 |
ù 00F9 |
0652 |
û 00FB |
ü 00FC |
LRM 200E |
RLM 200F |
ے 06D2 |
Carta Número Pontuação Símbolo Outro Indefinido