Bloco Unicode - Unicode block
Um bloco Unicode é um dos vários intervalos contíguos de códigos de caracteres numéricos ( pontos de código ) do conjunto de caracteres Unicode que são definidos pelo Consórcio Unicode para fins administrativos e de documentação. Normalmente, propostas como a adição de novos glifos são discutidas e avaliadas considerando o bloco ou blocos relevantes como um todo.
Cada bloco é geralmente, mas nem sempre, destinado a fornecer glifos usados por um ou mais idiomas específicos, ou em alguma área de aplicação geral, como matemática , levantamento topográfico , composição decorativa , fóruns sociais, etc.
Design e implementação
Os blocos Unicode são identificados por nomes exclusivos, que usam apenas caracteres ASCII e geralmente são descritivos da natureza dos símbolos, em inglês ; como "Tibetano" ou "Suplementar Setas-A". (Ao comparar nomes de bloco, deve-se igualar letras maiúsculas com letras minúsculas e ignorar qualquer espaço em branco, hífens e barras inferiores; portanto, o sobrenome é equivalente a "suplementos_arrows__a" e "SUPPLEMENTALARROWSA".
Os blocos são disjuntos aos pares , ou seja, não se sobrepõem. O ponto de código inicial e o tamanho (número de pontos de código) de cada bloco são sempre múltiplos de 16; portanto, na notação hexadecimal , o ponto inicial (menor) é U + xxx 0 e o ponto final (maior) é U + yyy F, onde xxx e yyy são três ou mais dígitos hexadecimais. (Essas restrições têm como objetivo simplificar a exibição de glifos em documentos do Unicode Consortium, como tabelas com 16 colunas rotuladas com o último dígito hexadecimal do ponto de código.) O tamanho de um bloco pode variar de um mínimo de 16 a um máximo de 65.536 pontos de código.
Cada ponto de código atribuído tem uma propriedade de glifo chamada "Bloco", cujo valor é uma cadeia de caracteres que nomeia o bloco exclusivo que possui esse ponto. No entanto, um bloco também pode conter pontos de código não atribuídos, geralmente reservados para futuras adições de caracteres que "logicamente" deveriam pertencer a esse bloco. Os pontos de código que não pertencem a nenhum dos blocos nomeados, por exemplo, nos planos não atribuídos 4–13, têm o valor block = "No_block".
Outras classificações
Cada ponto Unicode também possui uma propriedade chamada " Categoria Geral ", que tenta descrever a função do símbolo correspondente nas linguagens ou aplicativos para os quais foi incluído no sistema. Exemplos de categorias gerais são "Lu" (significando letra maiúscula), "Nd" (dígito decimal), "Pi" (pontuação aberta) e "Mn" (marca sem espaçamento, ou seja, um diacrítico para o precedente glifo). Essa divisão é completamente independente dos blocos de código: os pontos de código com uma determinada categoria geral geralmente abrangem muitos blocos e não precisam ser consecutivos, nem mesmo dentro de cada bloco.
Cada ponto de código também tem uma propriedade de script , especificando a qual sistema de escrita se destina ou se se destina a vários sistemas de escrita. Este, também, é independente do bloco.
Nas descrições do sistema Unicode, um bloco pode ser subdividido em subgrupos mais específicos, como os " símbolos de xadrez " no bloco " Símbolos diversos ". Esses subgrupos não são "blocos" no sentido técnico usado pelo consórcio Unicode e são nomeados apenas para a conveniência dos usuários.
Lista de blocos
Unicode 14.0 define 320 blocos:
- 164 no plano 0, o plano multilíngue básico (na tabela abaixo: § BMP )
- 145 no plano 1, o Plano Suplementar Multilíngue ( § SMP )
- 6 no plano 2, o plano ideográfico suplementar ( § SIP )
- 1 no plano 3, o plano ideográfico terciário ( § TIP )
- 2 no plano 14 (E em hexadecimal ), o plano de uso especial suplementar ( § SSP )
- Um de cada nos planos 15 (F hex ) e 16 (10 hex ), denominado Área de Uso Privado Suplementar-A e -B ( § PUA-A )
Plano | Alcance do bloco | Nome do bloco | Pontos de código | Personagens atribuídos | Scripts |
---|---|---|---|---|---|
0 BMP | U + 0000..U + 007F | Latim básico | 128 | 128 | Latim (52 caracteres), Comum (76 caracteres) |
0 BMP | U + 0080..U + 00FF | Suplemento Latin-1 | 128 | 128 | Latim (64 caracteres), Comum (64 caracteres) |
0 BMP | U + 0100..U + 017F | Latim Extended-A | 128 | 128 | Latina |
0 BMP | U + 0180..U + 024F | Latim Extended-B | 208 | 208 | Latina |
0 BMP | U + 0250..U + 02AF | Extensões IPA | 96 | 96 | Latina |
0 BMP | U + 02B0..U + 02FF | Letras modificadoras de espaçamento | 80 | 80 | Bopomofo (2 caracteres), latino (14 caracteres), comum (64 caracteres) |
0 BMP | U + 0300..U + 036F | Combinando Marcas Diacríticas | 112 | 112 | Herdado |
0 BMP | U + 0370..U + 03FF | Grego e copta | 144 | 135 | Cóptico (14 caracteres), grego (117 caracteres), comum (4 caracteres) |
0 BMP | U + 0400..U + 04FF | cirílico | 256 | 256 | Cirílico (254 caracteres), herdado (2 caracteres) |
0 BMP | U + 0500..U + 052F | Suplemento Cirílico | 48 | 48 | cirílico |
0 BMP | U + 0530..U + 058F | Armênio | 96 | 91 | Armênio |
0 BMP | U + 0590..U + 05FF | hebraico | 112 | 88 | hebraico |
0 BMP | U + 0600..U + 06FF | árabe | 256 | 256 | Árabe (238 caracteres), Comum (6 caracteres), Herdado (12 caracteres) |
0 BMP | U + 0700..U + 074F | Siríaco | 80 | 77 | Siríaco |
0 BMP | U + 0750..U + 077F | Suplemento árabe | 48 | 48 | árabe |
0 BMP | U + 0780..U + 07BF | Thaana | 64 | 50 | Thaana |
0 BMP | U + 07C0..U + 07FF | NKo | 64 | 62 | Nko |
0 BMP | U + 0800..U + 083F | samaritano | 64 | 61 | samaritano |
0 BMP | U + 0840..U + 085F | Mandaico | 32 | 29 | Mandaico |
0 BMP | U + 0860..U + 086F | Suplemento Siríaco | 16 | 11 | Siríaco |
0 BMP | U + 0870..U + 089F | Árabe Estendido-B | 48 | 41 | árabe |
0 BMP | U + 08A0..U + 08FF | Árabe Extended-A | 96 | 96 | Árabe (95 caracteres), Comum (1 caractere) |
0 BMP | U + 0900..U + 097F | Devanágari | 128 | 128 | Devanágari (122 caracteres), Comum (2 caracteres), Herdado (4 caracteres) |
0 BMP | U + 0980..U + 09FF | bengali | 128 | 96 | bengali |
0 BMP | U + 0A00..U + 0A7F | Gurmukhi | 128 | 80 | Gurmukhi |
0 BMP | U + 0A80..U + 0AFF | Guzerate | 128 | 91 | Guzerate |
0 BMP | U + 0B00..U + 0B7F | Oriya | 128 | 91 | Oriya |
0 BMP | U + 0B80..U + 0BFF | tâmil | 128 | 72 | tâmil |
0 BMP | U + 0C00..U + 0C7F | Telugu | 128 | 100 | Telugu |
0 BMP | U + 0C80..U + 0CFF | Canarim | 128 | 90 | Canarim |
0 BMP | U + 0D00..U + 0D7F | Malaiala | 128 | 118 | Malaiala |
0 BMP | U + 0D80..U + 0DFF | Cingalês | 128 | 91 | Cingalês |
0 BMP | U + 0E00..U + 0E7F | tailandês | 128 | 87 | Tailandês (86 caracteres), Comum (1 caractere) |
0 BMP | U + 0E80..U + 0EFF | Lao | 128 | 82 | Lao |
0 BMP | U + 0F00..U + 0FFF | Tibetano | 256 | 211 | Tibetano (207 caracteres), Comum (4 caracteres) |
0 BMP | U + 1000..U + 109F | Myanmar | 160 | 160 | Myanmar |
0 BMP | U + 10A0..U + 10FF | Georgiano | 96 | 88 | Georgiano (87 caracteres), Comum (1 caractere) |
0 BMP | U + 1100..U + 11FF | Hangul Jamo | 256 | 256 | Hangul |
0 BMP | U + 1200..U + 137F | Etíope | 384 | 358 | Etíope |
0 BMP | U + 1380..U + 139F | Suplemento Etíope | 32 | 26 | Etíope |
0 BMP | U + 13A0..U + 13FF | Cherokee | 96 | 92 | Cherokee |
0 BMP | U + 1400..U + 167F | Syllabics aboriginal canadense unificado | 640 | 640 | Aborígine canadense |
0 BMP | U + 1680..U + 169F | Ogham | 32 | 29 | Ogham |
0 BMP | U + 16A0..U + 16FF | Rúnico | 96 | 89 | Rúnico (86 caracteres), Comum (3 caracteres) |
0 BMP | U + 1700..U + 171F | Tagalo | 32 | 23 | Tagalo |
0 BMP | U + 1720..U + 173F | Hanunoo | 32 | 23 | Hanunoo (21 caracteres), Comum (2 caracteres) |
0 BMP | U + 1740..U + 175F | Buhid | 32 | 20 | Buhid |
0 BMP | U + 1760..U + 177F | Tagbanwa | 32 | 18 | Tagbanwa |
0 BMP | U + 1780..U + 17FF | Khmer | 128 | 114 | Khmer |
0 BMP | U + 1800..U + 18AF | mongol | 176 | 158 | Mongol (155 caracteres), Comum (3 caracteres) |
0 BMP | U + 18B0..U + 18FF | Prolongamento de Syllabics Aboriginal Canadense Unificado | 80 | 70 | Aborígine canadense |
0 BMP | U + 1900..U + 194F | Limbu | 80 | 68 | Limbu |
0 BMP | U + 1950..U + 197F | Tai Le | 48 | 35 | Tai Le |
0 BMP | U + 1980..U + 19DF | Novo Tai Lue | 96 | 83 | Novo Tai Lue |
0 BMP | U + 19E0..U + 19FF | Símbolos Khmer | 32 | 32 | Khmer |
0 BMP | U + 1A00..U + 1A1F | Buginês | 32 | 30 | Buginês |
0 BMP | U + 1A20..U + 1AAF | Tai Tham | 144 | 127 | Tai Tham |
0 BMP | U + 1AB0..U + 1AFF | Combinando Marcas Diacríticas Estendidas | 80 | 31 | Herdado |
0 BMP | U + 1B00..U + 1B7F | Balinesa | 128 | 124 | Balinesa |
0 BMP | U + 1B80..U + 1BBF | Sudanês | 64 | 64 | Sudanês |
0 BMP | U + 1BC0..U + 1BFF | Batak | 64 | 56 | Batak |
0 BMP | U + 1C00..U + 1C4F | Lepcha | 80 | 74 | Lepcha |
0 BMP | U + 1C50..U + 1C7F | Ol Chiki | 48 | 48 | Ol Chiki |
0 BMP | U + 1C80..U + 1C8F | Cirílico Extended-C | 16 | 9 | cirílico |
0 BMP | U + 1C90..U + 1CBF | Georgian Extended | 48 | 46 | Georgiano |
0 BMP | U + 1CC0..U + 1CCF | Suplemento Sudanês | 16 | 8 | Sudanês |
0 BMP | U + 1CD0..U + 1CFF | Extensões Védicas | 48 | 43 | Comum (16 caracteres), Herdado (27 caracteres) |
0 BMP | U + 1D00..U + 1D7F | Extensões Fonéticas | 128 | 128 | Cirílico (2 caracteres), grego (15 caracteres), latino (111 caracteres) |
0 BMP | U + 1D80..U + 1DBF | Suplemento de extensões fonéticas | 64 | 64 | Grego (1 caractere), latino (63 caracteres) |
0 BMP | U + 1DC0..U + 1DFF | Suplemento de combinação de marcas diacríticas | 64 | 64 | Herdado |
0 BMP | U + 1E00..U + 1EFF | Adicional estendido latino | 256 | 256 | Latina |
0 BMP | U + 1F00..U + 1FFF | Grego estendido | 256 | 233 | grego |
0 BMP | U + 2000..U + 206F | Pontuação Geral | 112 | 111 | Comum (109 caracteres), herdado (2 caracteres) |
0 BMP | U + 2070..U + 209F | Sobrescritos e subscritos | 48 | 42 | Latim (15 caracteres), Comum (27 caracteres) |
0 BMP | U + 20A0..U + 20CF | Símbolos de Moeda | 48 | 33 | Comum |
0 BMP | U + 20D0..U + 20FF | Combinando Marcas Diacríticas para Símbolos | 48 | 33 | Herdado |
0 BMP | U + 2100..U + 214F | Símbolos semelhantes a letras | 80 | 80 | Grego (1 caractere), latino (4 caracteres), Comum (75 caracteres) |
0 BMP | U + 2150..U + 218F | Formulários numéricos | 64 | 60 | Latim (41 caracteres), Comum (19 caracteres) |
0 BMP | U + 2190..U + 21FF | Setas; flechas | 112 | 112 | Comum |
0 BMP | U + 2200..U + 22FF | Operadores matemáticos | 256 | 256 | Comum |
0 BMP | U + 2300..U + 23FF | Técnico Diverso | 256 | 256 | Comum |
0 BMP | U + 2400..U + 243F | Imagens de controle | 64 | 39 | Comum |
0 BMP | U + 2440..U + 245F | Reconhecimento Ótico de Caracteres | 32 | 11 | Comum |
0 BMP | U + 2460..U + 24FF | Alfanuméricos incluídos | 160 | 160 | Comum |
0 BMP | U + 2500..U + 257F | Desenho da Caixa | 128 | 128 | Comum |
0 BMP | U + 2580..U + 259F | Elementos de Bloco | 32 | 32 | Comum |
0 BMP | U + 25A0..U + 25FF | Formas geométricas | 96 | 96 | Comum |
0 BMP | U + 2600..U + 26FF | Símbolos Diversos | 256 | 256 | Comum |
0 BMP | U + 2700..U + 27BF | Dingbats | 192 | 192 | Comum |
0 BMP | U + 27C0..U + 27EF | Símbolos Matemáticos Diversos-A | 48 | 48 | Comum |
0 BMP | U + 27F0..U + 27FF | Setas Suplementares-A | 16 | 16 | Comum |
0 BMP | U + 2800..U + 28FF | Padrões de Braille | 256 | 256 | Braille |
0 BMP | U + 2900..U + 297F | Setas Suplementares-B | 128 | 128 | Comum |
0 BMP | U + 2980..U + 29FF | Símbolos Matemáticos Diversos-B | 128 | 128 | Comum |
0 BMP | U + 2A00..U + 2AFF | Operadores matemáticos suplementares | 256 | 256 | Comum |
0 BMP | U + 2B00..U + 2BFF | Símbolos e Setas Diversos | 256 | 253 | Comum |
0 BMP | U + 2C00..U + 2C5F | Glagolítico | 96 | 96 | Glagolítico |
0 BMP | U + 2C60..U + 2C7F | Latim Extended-C | 32 | 32 | Latina |
0 BMP | U + 2C80..U + 2CFF | cóptico | 128 | 123 | cóptico |
0 BMP | U + 2D00..U + 2D2F | Suplemento georgiano | 48 | 40 | Georgiano |
0 BMP | U + 2D30..U + 2D7F | Tifinagh | 80 | 59 | Tifinagh |
0 BMP | U + 2D80..U + 2DDF | Etíope Estendido | 96 | 79 | Etíope |
0 BMP | U + 2DE0..U + 2DFF | Cirílico Extended-A | 32 | 32 | cirílico |
0 BMP | U + 2E00..U + 2E7F | Pontuação Suplementar | 128 | 94 | Comum |
0 BMP | U + 2E80..U + 2EFF | Suplemento CJK Radicals | 128 | 115 | Han |
0 BMP | U + 2F00..U + 2FDF | Radicais Kangxi | 224 | 214 | Han |
0 BMP | U + 2FF0..U + 2FFF | Caracteres de descrição ideográfica | 16 | 12 | Comum |
0 BMP | U + 3000..U + 303F | Símbolos e pontuação CJK | 64 | 64 | Han (15 caracteres), Hangul (2 caracteres), Comum (43 caracteres), Herdado (4 caracteres) |
0 BMP | U + 3040..U + 309F | Hiragana | 96 | 93 | Hiragana (89 caracteres), Comum (2 caracteres), Herdado (2 caracteres) |
0 BMP | U + 30A0..U + 30FF | Katakana | 96 | 96 | Katakana (93 caracteres), Comum (3 caracteres) |
0 BMP | U + 3100..U + 312F | Bopomofo | 48 | 43 | Bopomofo |
0 BMP | U + 3130..U + 318F | Hangul Compatibility Jamo | 96 | 94 | Hangul |
0 BMP | U + 3190..U + 319F | Kanbun | 16 | 16 | Comum |
0 BMP | U + 31A0..U + 31BF | Bopomofo Extended | 32 | 32 | Bopomofo |
0 BMP | U + 31C0..U + 31EF | CJK Strokes | 48 | 36 | Comum |
0 BMP | U + 31F0..U + 31FF | Extensões Fonéticas Katakana | 16 | 16 | Katakana |
0 BMP | U + 3200..U + 32FF | Cartas CJK Incluídas e Meses | 256 | 255 | Hangul (62 caracteres), Katakana (47 caracteres), Comum (146 caracteres) |
0 BMP | U + 3300..U + 33FF | Compatibilidade CJK | 256 | 256 | Katakana (88 caracteres), Comum (168 caracteres) |
0 BMP | U + 3400..U + 4DBF | CJK Unified Ideographs Extension A | 6.592 | 6.592 | Han |
0 BMP | U + 4DC0..U + 4DFF | Símbolos de hexagrama Yijing | 64 | 64 | Comum |
0 BMP | U + 4E00..U + 9FFF | CJK Unified Ideographs | 20.992 | 20.992 | Han |
0 BMP | U + A000..U + A48F | Sílabas Yi | 1.168 | 1.165 | Yi |
0 BMP | U + A490..U + A4CF | Yi Radicals | 64 | 55 | Yi |
0 BMP | U + A4D0..U + A4FF | Lisu | 48 | 48 | Lisu |
0 BMP | U + A500..U + A63F | Vai | 320 | 300 | Vai |
0 BMP | U + A640..U + A69F | Cirílico estendido-B | 96 | 96 | cirílico |
0 BMP | U + A6A0..U + A6FF | Bamum | 96 | 88 | Bamum |
0 BMP | U + A700..U + A71F | Letras de tom modificador | 32 | 32 | Comum |
0 BMP | U + A720..U + A7FF | Latim Extended-D | 224 | 193 | Latino (188 caracteres), Comum (5 caracteres) |
0 BMP | U + A800..U + A82F | Syloti Nagri | 48 | 45 | Syloti Nagri |
0 BMP | U + A830..U + A83F | Formulários de números índicos comuns | 16 | 10 | Comum |
0 BMP | U + A840..U + A87F | Phags-pa | 64 | 56 | Phags Pa |
0 BMP | U + A880..U + A8DF | Saurashtra | 96 | 82 | Saurashtra |
0 BMP | U + A8E0..U + A8FF | Devanágari Estendido | 32 | 32 | Devanágari |
0 BMP | U + A900..U + A92F | Kayah Li | 48 | 48 | Kayah Li (47 caracteres), Comum (1 caractere) |
0 BMP | U + A930..U + A95F | Rejang | 48 | 37 | Rejang |
0 BMP | U + A960..U + A97F | Hangul Jamo Extended-A | 32 | 29 | Hangul |
0 BMP | U + A980..U + A9DF | Javanês | 96 | 91 | Javanês (90 caracteres), Comum (1 caractere) |
0 BMP | U + A9E0..U + A9FF | Myanmar Extended-B | 32 | 31 | Myanmar |
0 BMP | U + AA00..U + AA5F | Cham | 96 | 83 | Cham |
0 BMP | U + AA60..U + AA7F | Mianmar Extended-A | 32 | 32 | Myanmar |
0 BMP | U + AA80..U + AADF | Tai Viet | 96 | 72 | Tai Viet |
0 BMP | U + AAE0..U + AAFF | Extensões Meetei Mayek | 32 | 23 | Meetei Mayek |
0 BMP | U + AB00..U + AB2F | Ethiopic Extended-A | 48 | 32 | Etíope |
0 BMP | U + AB30..U + AB6F | Latim Extended-E | 64 | 60 | Latim (56 caracteres), Grego (1 caractere), Comum (3 caracteres) |
0 BMP | U + AB70..U + ABBF | Suplemento Cherokee | 80 | 80 | Cherokee |
0 BMP | U + ABC0..U + ABFF | Meetei Mayek | 64 | 56 | Meetei Mayek |
0 BMP | U + AC00..U + D7AF | Sílabas hangul | 11.184 | 11.172 | Hangul |
0 BMP | U + D7B0..U + D7FF | Hangul Jamo Extended-B | 80 | 72 | Hangul |
0 BMP | U + D800..U + DB7F | Altas substitutas | 896 | 0 | Desconhecido |
0 BMP | U + DB80..U + DBFF | Substitutos de alto uso privado | 128 | 0 | Desconhecido |
0 BMP | U + DC00..U + DFFF | Substitutos baixos | 1.024 | 0 | Desconhecido |
0 BMP | U + E000..U + F8FF | Área de Uso Privado | 6.400 | 6.400 | Desconhecido |
0 BMP | U + F900..U + FAFF | Ideogramas de compatibilidade CJK | 512 | 472 | Han |
0 BMP | U + FB00..U + FB4F | Formulários de apresentação alfabética | 80 | 58 | Armênio (5 caracteres), hebraico (46 caracteres), latino (7 caracteres) |
0 BMP | U + FB50..U + FDFF | Formulários de apresentação em árabe-A | 688 | 631 | Árabe (629 caracteres), Comum (2 caracteres) |
0 BMP | U + FE00..U + FE0F | Seletores de variação | 16 | 16 | Herdado |
0 BMP | U + FE10..U + FE1F | Formas Verticais | 16 | 10 | Comum |
0 BMP | U + FE20..U + FE2F | Combinando Meias Marcas | 16 | 16 | Cirílico (2 caracteres), Herdado (14 caracteres) |
0 BMP | U + FE30..U + FE4F | Formulários de compatibilidade CJK | 32 | 32 | Comum |
0 BMP | U + FE50..U + FE6F | Variantes de forma pequena | 32 | 26 | Comum |
0 BMP | U + FE70..U + FEFF | Formas de apresentação em árabe-B | 144 | 141 | Árabe (140 caracteres), Comum (1 caractere) |
0 BMP | U + FF00..U + FFEF | Formas de meia largura e largura total | 240 | 225 | Hangul (52 caracteres), Katakana (55 caracteres), Latino (52 caracteres), Comum (66 caracteres) |
0 BMP | U + FFF0..U + FFFF | Especiais | 16 | 5 | Comum |
1 SMP | U + 10000..U + 1007F | Linear B Silabário | 128 | 88 | Linear B |
1 SMP | U + 10080..U + 100FF | Ideogramas Lineares B | 128 | 123 | Linear B |
1 SMP | U + 10100..U + 1013F | Números do Egeu | 64 | 57 | Comum |
1 SMP | U + 10140..U + 1018F | Números da Grécia Antiga | 80 | 79 | grego |
1 SMP | U + 10190..U + 101CF | Símbolos Antigos | 64 | 14 | Grego (1 caractere), Comum (13 caracteres) |
1 SMP | U + 101D0..U + 101FF | Disco de Phaistos | 48 | 46 | Comum (45 caracteres), Herdado (1 caractere) |
1 SMP | U + 10280..U + 1029F | Lícia | 32 | 29 | Lícia |
1 SMP | U + 102A0..U + 102DF | Carian | 64 | 49 | Carian |
1 SMP | U + 102E0..U + 102FF | Números de epacto copta | 32 | 28 | Comum (27 caracteres), Herdado (1 caractere) |
1 SMP | U + 10300..U + 1032F | Itálico antigo | 48 | 39 | Itálico antigo |
1 SMP | U + 10330..U + 1034F | gótico | 32 | 27 | gótico |
1 SMP | U + 10350..U + 1037F | Old Permic | 48 | 43 | Old Permic |
1 SMP | U + 10380..U + 1039F | Ugarítico | 32 | 31 | Ugarítico |
1 SMP | U + 103A0..U + 103DF | Persa antigo | 64 | 50 | Persa antigo |
1 SMP | U + 10400..U + 1044F | Deseret | 80 | 80 | Deseret |
1 SMP | U + 10450..U + 1047F | Shavian | 48 | 48 | Shavian |
1 SMP | U + 10480..U + 104AF | Osmanya | 48 | 40 | Osmanya |
1 SMP | U + 104B0..U + 104FF | Osage | 80 | 72 | Osage |
1 SMP | U + 10500..U + 1052F | Elbasan | 48 | 40 | Elbasan |
1 SMP | U + 10530..U + 1056F | Albanês caucasiano | 64 | 53 | Albanês caucasiano |
1 SMP | U + 10570..U + 105BF | Vithkuqi | 80 | 70 | Vithkuqi |
1 SMP | U + 10600..U + 1077F | Linear A | 384 | 341 | Linear A |
1 SMP | U + 10780..U + 107BF | Latim Extended-F | 64 | 57 | Latina |
1 SMP | U + 10800..U + 1083F | Silabário cipriota | 64 | 55 | Cipriota |
1 SMP | U + 10840..U + 1085F | Aramaico imperial | 32 | 31 | Aramaico imperial |
1 SMP | U + 10860..U + 1087F | Palmireno | 32 | 32 | Palmireno |
1 SMP | U + 10880..U + 108AF | Nabateu | 48 | 40 | Nabateu |
1 SMP | U + 108E0..U + 108FF | Hatran | 32 | 26 | Hatran |
1 SMP | U + 10900..U + 1091F | Fenício | 32 | 29 | Fenício |
1 SMP | U + 10920..U + 1093F | Lídio | 32 | 27 | Lídio |
1 SMP | U + 10980..U + 1099F | Hieróglifos Meroíticos | 32 | 32 | Hieróglifos Meroíticos |
1 SMP | U + 109A0..U + 109FF | Meroitic Cursive | 96 | 90 | Meroitic Cursive |
1 SMP | U + 10A00..U + 10A5F | Kharoshthi | 96 | 68 | Kharoshthi |
1 SMP | U + 10A60..U + 10A7F | Old South Arabian | 32 | 32 | Old South Arabian |
1 SMP | U + 10A80..U + 10A9F | Old North Arabian | 32 | 32 | Old North Arabian |
1 SMP | U + 10AC0..U + 10AFF | Maniqueísta | 64 | 51 | Maniqueísta |
1 SMP | U + 10B00..U + 10B3F | Avestan | 64 | 61 | Avestan |
1 SMP | U + 10B40..U + 10B5F | Parta inscrita | 32 | 30 | Parta inscrita |
1 SMP | U + 10B60..U + 10B7F | Pahlavi inscrito | 32 | 27 | Pahlavi inscrito |
1 SMP | U + 10B80..U + 10BAF | Saltério Pahlavi | 48 | 29 | Saltério Pahlavi |
1 SMP | U + 10C00..U + 10C4F | Turco antigo | 80 | 73 | Turco antigo |
1 SMP | U + 10C80..U + 10CFF | Húngaro antigo | 128 | 108 | Húngaro antigo |
1 SMP | U + 10D00..U + 10D3F | Hanifi Rohingya | 64 | 50 | Hanifi Rohingya |
1 SMP | U + 10E60..U + 10E7F | Símbolos Numéricos Rumi | 32 | 31 | árabe |
1 SMP | U + 10E80..U + 10EBF | Iazidi | 64 | 47 | Iazidi |
1 SMP | U + 10F00..U + 10F2F | Old Sogdian | 48 | 40 | Old Sogdian |
1 SMP | U + 10F30..U + 10F6F | Sogdian | 64 | 42 | Sogdian |
1 SMP | U + 10F70..U + 10FAF | Velho uigur | 64 | 26 | Velho uigur |
1 SMP | U + 10FB0..U + 10FDF | Chorasmian | 48 | 28 | Chorasmian |
1 SMP | U + 10FE0..U + 10FFF | Elymaic | 32 | 23 | Elymaic |
1 SMP | U + 11000..U + 1107F | Brahmi | 128 | 115 | Brahmi |
1 SMP | U + 11080..U + 110CF | Kaithi | 80 | 68 | Kaithi |
1 SMP | U + 110D0..U + 110FF | Sora Sompeng | 48 | 35 | Sora Sompeng |
1 SMP | U + 11100..U + 1114F | Chakma | 80 | 71 | Chakma |
1 SMP | U + 11150..U + 1117F | Mahajani | 48 | 39 | Mahajani |
1 SMP | U + 11180..U + 111DF | Sharada | 96 | 96 | Sharada |
1 SMP | U + 111E0..U + 111FF | Números Arcaicos Sinhala | 32 | 20 | Cingalês |
1 SMP | U + 11200..U + 1124F | Khojki | 80 | 62 | Khojki |
1 SMP | U + 11280..U + 112AF | Multani | 48 | 38 | Multani |
1 SMP | U + 112B0..U + 112FF | Khudawadi | 80 | 69 | Khudawadi |
1 SMP | U + 11300..U + 1137F | Grantha | 128 | 86 | Grantha (85 caracteres), herdado (1 caractere) |
1 SMP | U + 11400..U + 1147F | Newa | 128 | 97 | Newa |
1 SMP | U + 11480..U + 114DF | Tirhuta | 96 | 82 | Tirhuta |
1 SMP | U + 11580..U + 115FF | Siddham | 128 | 92 | Siddham |
1 SMP | U + 11600..U + 1165F | Modi | 96 | 79 | Modi |
1 SMP | U + 11660..U + 1167F | Suplemento Mongol | 32 | 13 | mongol |
1 SMP | U + 11680..U + 116CF | Takri | 80 | 68 | Takri |
1 SMP | U + 11700..U + 1174F | Ahom | 80 | 65 | Ahom |
1 SMP | U + 11800..U + 1184F | Dogra | 80 | 60 | Dogra |
1 SMP | U + 118A0..U + 118FF | Warang Citi | 96 | 84 | Warang Citi |
1 SMP | U + 11900..U + 1195F | Dives Akuru | 96 | 72 | Dives Akuru |
1 SMP | U + 119A0..U + 119FF | Nandinagari | 96 | 65 | Nandinagari |
1 SMP | U + 11A00..U + 11A4F | Praça Zanabazar | 80 | 72 | Praça Zanabazar |
1 SMP | U + 11A50..U + 11AAF | Soyombo | 96 | 83 | Soyombo |
1 SMP | U + 11AB0..U + 11ABF | Syllabics aboriginal canadense unificado estendido-A | 16 | 16 | Aborígine canadense |
1 SMP | U + 11AC0..U + 11AFF | Pau Cin Hau | 64 | 57 | Pau Cin Hau |
1 SMP | U + 11C00..U + 11C6F | Bhaiksuki | 112 | 97 | Bhaiksuki |
1 SMP | U + 11C70..U + 11CBF | Marchen | 80 | 68 | Marchen |
1 SMP | U + 11D00..U + 11D5F | Masaram Gondi | 96 | 75 | Masaram Gondi |
1 SMP | U + 11D60..U + 11DAF | Gunjala Gondi | 80 | 63 | Gunjala Gondi |
1 SMP | U + 11EE0..U + 11EFF | Makasar | 32 | 25 | Makasar |
1 SMP | U + 11FB0..U + 11FBF | Suplemento Lisu | 16 | 1 | Lisu |
1 SMP | U + 11FC0..U + 11FFF | Suplemento de Tamil | 64 | 51 | tâmil |
1 SMP | U + 12000..U + 123FF | Cuneiforme | 1.024 | 922 | Cuneiforme |
1 SMP | U + 12400..U + 1247F | Números cuneiformes e pontuação | 128 | 116 | Cuneiforme |
1 SMP | U + 12480..U + 1254F | Cuneiforme Dinástico Inferior | 208 | 196 | Cuneiforme |
1 SMP | U + 12F90..U + 12FFF | Cypro-Minoan | 112 | 99 | Cypro Minoan |
1 SMP | U + 13000..U + 1342F | Hieróglifos egípcios | 1.072 | 1.071 | Hieróglifos egípcios |
1 SMP | U + 13430..U + 1343F | Controles de formato de hieróglifo egípcio | 16 | 9 | Hieróglifos egípcios |
1 SMP | U + 14400..U + 1467F | Hieróglifos da Anatólia | 640 | 583 | Hieróglifos da Anatólia |
1 SMP | U + 16800..U + 16A3F | Suplemento Bamum | 576 | 569 | Bamum |
1 SMP | U + 16A40..U + 16A6F | Mro | 48 | 43 | Mro |
1 SMP | U + 16A70..U + 16ACF | Tangsa | 96 | 89 | Tangsa |
1 SMP | U + 16AD0..U + 16AFF | Bassa Vah | 48 | 36 | Bassa Vah |
1 SMP | U + 16B00..U + 16B8F | Pahawh Hmong | 144 | 127 | Pahawh Hmong |
1 SMP | U + 16E40..U + 16E9F | Medefaidrin | 96 | 91 | Medefaidrin |
1 SMP | U + 16F00..U + 16F9F | Miao | 160 | 149 | Miao |
1 SMP | U + 16FE0..U + 16FFF | Símbolos ideográficos e pontuação | 32 | 7 | Han (4 caracteres), Khitan Small Script (1 caractere), Nushu (1 caractere), Tangut (1 caractere) |
1 SMP | U + 17000..U + 187FF | Tangut | 6.144 | 6.136 | Tangut |
1 SMP | U + 18800..U + 18AFF | Componentes Tangut | 768 | 768 | Tangut |
1 SMP | U + 18B00..U + 18CFF | Khitan Small Script | 512 | 470 | Khitan Small Script |
1 SMP | U + 18D00..U + 18D7F | Suplemento Tangut | 128 | 9 | Tangut |
1 SMP | U + 1AFF0..U + 1AFFF | Kana Extended-B | 16 | 13 | Katakana |
1 SMP | U + 1B000..U + 1B0FF | Suplemento Kana | 256 | 256 | Hiragana (255 caracteres), Katakana (1 caractere) |
1 SMP | U + 1B100..U + 1B12F | Kana Extended-A | 48 | 35 | Hiragana (32 caracteres), Katakana (3 caracteres) |
1 SMP | U + 1B130..U + 1B16F | Extensão Kana pequena | 64 | 7 | Hiragana (3 caracteres), Katakana (4 caracteres) |
1 SMP | U + 1B170..U + 1B2FF | Nushu | 400 | 396 | Nüshu |
1 SMP | U + 1BC00..U + 1BC9F | Duployan | 160 | 143 | Duployan |
1 SMP | U + 1BCA0..U + 1BCAF | Controles de formato abreviado | 16 | 4 | Comum |
1 SMP | U + 1CF00..U + 1CFCF | Notação Musical Znamenny | 208 | 185 | Comum (116 caracteres), herdado (69 caracteres) |
1 SMP | U + 1D000..U + 1D0FF | Símbolos Musicais Bizantinos | 256 | 246 | Comum |
1 SMP | U + 1D100..U + 1D1FF | Símbolos Musicais | 256 | 233 | Comum (211 caracteres), herdado (22 caracteres) |
1 SMP | U + 1D200..U + 1D24F | Notação Musical Grega Antiga | 80 | 70 | grego |
1 SMP | U + 1D2E0..U + 1D2FF | Algarismos maias | 32 | 20 | Comum |
1 SMP | U + 1D300..U + 1D35F | Símbolos de Tai Xuan Jing | 96 | 87 | Comum |
1 SMP | U + 1D360..U + 1D37F | Números da barra de contagem | 32 | 25 | Comum |
1 SMP | U + 1D400..U + 1D7FF | Símbolos Alfanuméricos Matemáticos | 1.024 | 996 | Comum |
1 SMP | U + 1D800..U + 1DAAF | Sutton SignWriting | 688 | 672 | SignWriting |
1 SMP | U + 1DF00..U + 1DFFF | Latim Extended-G | 256 | 31 | Latina |
1 SMP | U + 1E000..U + 1E02F | Suplemento Glagolítico | 48 | 38 | Glagolítico |
1 SMP | U + 1E100..U + 1E14F | Nyiakeng Puachue Hmong | 80 | 71 | Nyiakeng Puachue Hmong |
1 SMP | U + 1E290..U + 1E2BF | Totó | 48 | 31 | Totó |
1 SMP | U + 1E2C0..U + 1E2FF | Wancho | 64 | 59 | Wancho |
1 SMP | U + 1E7E0..U + 1E7FF | Ethiopic Extended-B | 32 | 28 | Etíope |
1 SMP | U + 1E800..U + 1E8DF | Mende Kikakui | 224 | 213 | Mende Kikakui |
1 SMP | U + 1E900..U + 1E95F | Adlam | 96 | 88 | Adlam |
1 SMP | U + 1EC70..U + 1ECBF | Números índicos de Siyaq | 80 | 68 | Comum |
1 SMP | U + 1ED00..U + 1ED4F | Números Otomanos de Siyaq | 80 | 61 | Comum |
1 SMP | U + 1EE00..U + 1EEFF | Símbolos alfabéticos matemáticos árabes | 256 | 143 | árabe |
1 SMP | U + 1F000..U + 1F02F | Mahjong Tiles | 48 | 44 | Comum |
1 SMP | U + 1F030..U + 1F09F | Domino Tiles | 112 | 100 | Comum |
1 SMP | U + 1F0A0..U + 1F0FF | Cartas de jogar | 96 | 82 | Comum |
1 SMP | U + 1F100..U + 1F1FF | Suplemento Alfanumérico Incluído | 256 | 200 | Comum |
1 SMP | U + 1F200..U + 1F2FF | Suplemento ideográfico fechado | 256 | 64 | Hiragana (1 caractere), Comum (63 caracteres) |
1 SMP | U + 1F300..U + 1F5FF | Símbolos e pictogramas diversos | 768 | 768 | Comum |
1 SMP | U + 1F600..U + 1F64F | Emoticons | 80 | 80 | Comum |
1 SMP | U + 1F650..U + 1F67F | Dingbats ornamentais | 48 | 48 | Comum |
1 SMP | U + 1F680..U + 1F6FF | Transporte e símbolos de mapa | 128 | 117 | Comum |
1 SMP | U + 1F700..U + 1F77F | Símbolos Alquímicos | 128 | 116 | Comum |
1 SMP | U + 1F780..U + 1F7FF | Formas geométricas estendidas | 128 | 102 | Comum |
1 SMP | U + 1F800..U + 1F8FF | Setas Suplementares-C | 256 | 150 | Comum |
1 SMP | U + 1F900..U + 1F9FF | Símbolos e pictogramas suplementares | 256 | 256 | Comum |
1 SMP | U + 1FA00..U + 1FA6F | Símbolos de xadrez | 112 | 98 | Comum |
1 SMP | U + 1FA70..U + 1FAFF | Símbolos e pictogramas estendidos-A | 144 | 88 | Comum |
1 SMP | U + 1FB00..U + 1FBFF | Símbolos para computação legada | 256 | 212 | Comum |
2 SIP | U + 20000..U + 2A6DF | CJK Unified Ideographs Extension B | 42.720 | 42.720 | Han |
2 SIP | U + 2A700..U + 2B73F | CJK Unified Ideographs Extension C | 4.160 | 4.153 | Han |
2 SIP | U + 2B740..U + 2B81F | CJK Unified Ideographs Extension D | 224 | 222 | Han |
2 SIP | U + 2B820..U + 2CEAF | CJK Unified Ideographs Extension E | 5.776 | 5.762 | Han |
2 SIP | U + 2CEB0..U + 2EBEF | CJK Unified Ideographs Extension F | 7.488 | 7.473 | Han |
2 SIP | U + 2F800..U + 2FA1F | Suplemento de ideogramas de compatibilidade CJK | 544 | 542 | Han |
3 DICA | U + 30000..U + 3134F | CJK Unified Ideographs Extension G | 4.944 | 4.939 | Han |
14 SSP | U + E0000..U + E007F | Tag | 128 | 97 | Comum |
14 SSP | U + E0100..U + E01EF | Suplemento de Seletores de Variação | 240 | 240 | Herdado |
15 PUA-A | U + F0000..U + FFFFF | Área de uso privado suplementar-A | 65.536 | 65.534 | Desconhecido |
16 PUA-B | U + 100000..U + 10FFFF | Área de uso privado suplementar-B | 65.536 | 65.534 | Desconhecido |
Blocos excluídos
A Política de Estabilidade Unicode requer que um caractere, uma vez atribuído, não possa ser movido ou removido, embora possa ser descontinuado. Isso se aplica ao Unicode 2.0 e todas as versões subseqüentes.
Antes disso, os seguintes blocos anteriores foram removidos:
Alcance do bloco | Nome do bloco | Faixa agora ocupada por | Substituído por bloco | Pontos de código | Personagens atribuídos | Scripts |
---|---|---|---|---|---|---|
U + 1000..U + 105F | Tibetano | Myanmar | Tibetano | 96 | 71 | Tibetano |
U + 3400..U + 3D2D | Hangul | CJK Unified Ideographs Extension A | Sílabas hangul | 2350 | 2350 | Hangul |
U + 3D2E..U + 44B7 | Hangul Suplementar-A | CJK Unified Ideographs Extension A | 1930 | 1930 | Hangul | |
U + 44B8..U + 4DFF | Hangul Suplementar-B | CJK Unified Ideographs Extension A | 2376 | 2376 | Hangul | |
Símbolos de hexagrama Yijing |
Referências
links externos
- Site oficial do Unicode Consortium (inglês)