Página de código 936 (Microsoft Windows) - Code page 936 (Microsoft Windows)

A página de código 936 do Windows (abreviado MS936 , Windows-936 ou (ambiguamente) CP936 ), é a codificação de caracteres da Microsoft para chinês simplificado , um dos quatro DBCSs para idiomas do leste asiático . Originalmente, o Windows-936 cobria o GB 2312 (em sua forma EUC-CN ), mas foi expandido para cobrir a maior parte do GBK com o lançamento do Windows 95 .

A página de código 936 da IBM é uma codificação diferente para chinês simplificado, embora o International Components for Unicode não inclua um codec IBM-936 e use a página de código do Windows para o rótulo "cp936". A página de código da IBM para cobertura GBK é a página de código 1386 ( CP1386 ou IBM-1386 ), que é definida como uma combinação da página de código de byte único 1114 e a página de código de byte duplo 1385 .

Ele foi substituído pela página de código 54936 ( GB 18030 ), mas em 2014 ainda era predominante em uso. O prompt de comando do Windows usa CP936 como a página de código padrão para instalações chinesas simplificadas, embora parte do GB 18030 tenha se tornado obrigatório para todos os produtos de software vendidos na China. Em 2002, o nome GBK da IANA na Internet foi registrado com o mapeamento do Windows-936, tornando-o a definição GBK de fato na Internet.

Os conceitos de "Windows-936", "GBK", "GB2312" e "EUC-CN" às vezes são confundidos em vários produtos de software. As páginas de código MS936 e 1386 não são idênticas ao GBK porque uma página de código codifica caracteres, enquanto o GBK define apenas pontos de código. Além disso, o sinal do euro (€), codificado como 0x80 no Windows-936 e IBM-1386, não está definido no GBK. Por outro lado, 95 caracteres definidos no GBK inicialmente não foram codificados no Windows-936.

Isso é parcialmente resolvido em versões posteriores do Windows e, como no Windows 7, todos os caracteres GBK que não estão na área de uso privado Unicode BMP podem ser exibidos usando a página de código 936, mas a codificação de 95 caracteres ainda não era suportada em 2014. No entanto, "CP936" e "GBK" costumam ser usados ​​alternadamente devido à popularidade dos produtos da Microsoft no mercado chinês quando o GBK foi publicado.

Desde que o GBK substituiu o GB 2312 há muito tempo, esses dois termos também se tornaram virtualmente equivalentes para muitos usuários, portanto, "Windows-936", "GBK" e "GB 2312" são mal interpretados por muitos como significando a mesma coisa, embora na verdade sejam significativamente diferentes. Em vez de suportar precisamente EUC-CN / GB 2312, a maioria dos produtos de software baseados no Windows modernos significam suporte parcial para GBK via Windows-936 quando usam o termo "GB 2312" como uma opção de codificação de caracteres. Isso pode ser observado em produtos como o Microsoft Internet Explorer e o Notepad ++.

Notas

Referências

links externos

Windows-936:

IBM-1386: