Bloco Unicode - Unicode block

Um bloco Unicode é um dos vários intervalos contíguos de códigos de caracteres numéricos ( pontos de código ) do conjunto de caracteres Unicode que são definidos pelo Consórcio Unicode para fins administrativos e de documentação. Normalmente, propostas como a adição de novos glifos são discutidas e avaliadas considerando o bloco ou blocos relevantes como um todo.

Cada bloco é geralmente, mas nem sempre, destinado a fornecer glifos usados ​​por um ou mais idiomas específicos, ou em alguma área de aplicação geral, como matemática , levantamento topográfico , composição decorativa , fóruns sociais, etc.

Design e implementação

Os blocos Unicode são identificados por nomes exclusivos, que usam apenas caracteres ASCII e geralmente são descritivos da natureza dos símbolos, em inglês ; como "Tibetano" ou "Suplementar Setas-A". (Ao comparar nomes de bloco, deve-se igualar letras maiúsculas com letras minúsculas e ignorar qualquer espaço em branco, hífens e barras inferiores; portanto, o sobrenome é equivalente a "suplementos_arrows__a" e "SUPPLEMENTALARROWSA".

Os blocos são disjuntos aos pares , ou seja, não se sobrepõem. O ponto de código inicial e o tamanho (número de pontos de código) de cada bloco são sempre múltiplos de 16; portanto, na notação hexadecimal , o ponto inicial (menor) é U + xxx 0 e o ponto final (maior) é U + yyy F, onde xxx e yyy são três ou mais dígitos hexadecimais. (Essas restrições têm como objetivo simplificar a exibição de glifos em documentos do Unicode Consortium, como tabelas com 16 colunas rotuladas com o último dígito hexadecimal do ponto de código.) O tamanho de um bloco pode variar de um mínimo de 16 a um máximo de 65.536 pontos de código.

Cada ponto de código atribuído tem uma propriedade de glifo chamada "Bloco", cujo valor é uma cadeia de caracteres que nomeia o bloco exclusivo que possui esse ponto. No entanto, um bloco também pode conter pontos de código não atribuídos, geralmente reservados para futuras adições de caracteres que "logicamente" deveriam pertencer a esse bloco. Os pontos de código que não pertencem a nenhum dos blocos nomeados, por exemplo, nos planos não atribuídos 4–13, têm o valor block = "No_block".

Outras classificações

Cada ponto Unicode também possui uma propriedade chamada " Categoria Geral ", que tenta descrever a função do símbolo correspondente nas linguagens ou aplicativos para os quais foi incluído no sistema. Exemplos de categorias gerais são "Lu" (significando letra maiúscula), "Nd" (dígito decimal), "Pi" (pontuação aberta) e "Mn" (marca sem espaçamento, ou seja, um diacrítico para o precedente glifo). Essa divisão é completamente independente dos blocos de código: os pontos de código com uma determinada categoria geral geralmente abrangem muitos blocos e não precisam ser consecutivos, nem mesmo dentro de cada bloco.

Cada ponto de código também tem uma propriedade de script , especificando a qual sistema de escrita se destina ou se se destina a vários sistemas de escrita. Este, também, é independente do bloco.

Nas descrições do sistema Unicode, um bloco pode ser subdividido em subgrupos mais específicos, como os " símbolos de xadrez " no bloco " Símbolos diversos ". Esses subgrupos não são "blocos" no sentido técnico usado pelo consórcio Unicode e são nomeados apenas para a conveniência dos usuários.

Lista de blocos

Unicode 14.0 define 320 blocos:

  • 164 no plano 0, o plano multilíngue básico (na tabela abaixo: § BMP )
  • 145 no plano 1, o Plano Suplementar Multilíngue ( § SMP )
  • 6 no plano 2, o plano ideográfico suplementar ( § SIP )
  • 1 no plano 3, o plano ideográfico terciário ( § TIP )
  • 2 no plano 14 (E em hexadecimal ), o plano de uso especial suplementar ( § SSP )
  • Um de cada nos planos 15 (F hex ) e 16 (10 hex ), denominado Área de Uso Privado Suplementar-A e -B ( § PUA-A )
Plano Alcance do bloco Nome do bloco Pontos de código Personagens atribuídos Scripts
 0 BMP U + 0000..U + 007F Latim básico 128 128 Latim (52 caracteres), Comum (76 caracteres)
 0 BMP U + 0080..U + 00FF Suplemento Latin-1 128 128 Latim (64 caracteres), Comum (64 caracteres)
 0 BMP U + 0100..U + 017F Latim Extended-A 128 128 Latina
 0 BMP U + 0180..U + 024F Latim Extended-B 208 208 Latina
 0 BMP U + 0250..U + 02AF Extensões IPA 96 96 Latina
 0 BMP U + 02B0..U + 02FF Letras modificadoras de espaçamento 80 80 Bopomofo (2 caracteres), latino (14 caracteres), comum (64 caracteres)
 0 BMP U + 0300..U + 036F Combinando Marcas Diacríticas 112 112 Herdado
 0 BMP U + 0370..U + 03FF Grego e copta 144 135 Cóptico (14 caracteres), grego (117 caracteres), comum (4 caracteres)
 0 BMP U + 0400..U + 04FF cirílico 256 256 Cirílico (254 caracteres), herdado (2 caracteres)
 0 BMP U + 0500..U + 052F Suplemento Cirílico 48 48 cirílico
 0 BMP U + 0530..U + 058F Armênio 96 91 Armênio
 0 BMP U + 0590..U + 05FF hebraico 112 88 hebraico
 0 BMP U + 0600..U + 06FF árabe 256 256 Árabe (238 caracteres), Comum (6 caracteres), Herdado (12 caracteres)
 0 BMP U + 0700..U + 074F Siríaco 80 77 Siríaco
 0 BMP U + 0750..U + 077F Suplemento árabe 48 48 árabe
 0 BMP U + 0780..U + 07BF Thaana 64 50 Thaana
 0 BMP U + 07C0..U + 07FF NKo 64 62 Nko
 0 BMP U + 0800..U + 083F samaritano 64 61 samaritano
 0 BMP U + 0840..U + 085F Mandaico 32 29 Mandaico
 0 BMP U + 0860..U + 086F Suplemento Siríaco 16 11 Siríaco
 0 BMP U + 0870..U + 089F Árabe Estendido-B 48 41 árabe
 0 BMP U + 08A0..U + 08FF Árabe Extended-A 96 96 Árabe (95 caracteres), Comum (1 caractere)
 0 BMP U + 0900..U + 097F Devanágari 128 128 Devanágari (122 caracteres), Comum (2 caracteres), Herdado (4 caracteres)
 0 BMP U + 0980..U + 09FF bengali 128 96 bengali
 0 BMP U + 0A00..U + 0A7F Gurmukhi 128 80 Gurmukhi
 0 BMP U + 0A80..U + 0AFF Guzerate 128 91 Guzerate
 0 BMP U + 0B00..U + 0B7F Oriya 128 91 Oriya
 0 BMP U + 0B80..U + 0BFF tâmil 128 72 tâmil
 0 BMP U + 0C00..U + 0C7F Telugu 128 100 Telugu
 0 BMP U + 0C80..U + 0CFF Canarim 128 90 Canarim
 0 BMP U + 0D00..U + 0D7F Malaiala 128 118 Malaiala
 0 BMP U + 0D80..U + 0DFF Cingalês 128 91 Cingalês
 0 BMP U + 0E00..U + 0E7F tailandês 128 87 Tailandês (86 caracteres), Comum (1 caractere)
 0 BMP U + 0E80..U + 0EFF Lao 128 82 Lao
 0 BMP U + 0F00..U + 0FFF Tibetano 256 211 Tibetano (207 caracteres), Comum (4 caracteres)
 0 BMP U + 1000..U + 109F Myanmar 160 160 Myanmar
 0 BMP U + 10A0..U + 10FF Georgiano 96 88 Georgiano (87 caracteres), Comum (1 caractere)
 0 BMP U + 1100..U + 11FF Hangul Jamo 256 256 Hangul
 0 BMP U + 1200..U + 137F Etíope 384 358 Etíope
 0 BMP U + 1380..U + 139F Suplemento Etíope 32 26 Etíope
 0 BMP U + 13A0..U + 13FF Cherokee 96 92 Cherokee
 0 BMP U + 1400..U + 167F Syllabics aboriginal canadense unificado 640 640 Aborígine canadense
 0 BMP U + 1680..U + 169F Ogham 32 29 Ogham
 0 BMP U + 16A0..U + 16FF Rúnico 96 89 Rúnico (86 caracteres), Comum (3 caracteres)
 0 BMP U + 1700..U + 171F Tagalo 32 23 Tagalo
 0 BMP U + 1720..U + 173F Hanunoo 32 23 Hanunoo (21 caracteres), Comum (2 caracteres)
 0 BMP U + 1740..U + 175F Buhid 32 20 Buhid
 0 BMP U + 1760..U + 177F Tagbanwa 32 18 Tagbanwa
 0 BMP U + 1780..U + 17FF Khmer 128 114 Khmer
 0 BMP U + 1800..U + 18AF mongol 176 158 Mongol (155 caracteres), Comum (3 caracteres)
 0 BMP U + 18B0..U + 18FF Prolongamento de Syllabics Aboriginal Canadense Unificado 80 70 Aborígine canadense
 0 BMP U + 1900..U + 194F Limbu 80 68 Limbu
 0 BMP U + 1950..U + 197F Tai Le 48 35 Tai Le
 0 BMP U + 1980..U + 19DF Novo Tai Lue 96 83 Novo Tai Lue
 0 BMP U + 19E0..U + 19FF Símbolos Khmer 32 32 Khmer
 0 BMP U + 1A00..U + 1A1F Buginês 32 30 Buginês
 0 BMP U + 1A20..U + 1AAF Tai Tham 144 127 Tai Tham
 0 BMP U + 1AB0..U + 1AFF Combinando Marcas Diacríticas Estendidas 80 31 Herdado
 0 BMP U + 1B00..U + 1B7F Balinesa 128 124 Balinesa
 0 BMP U + 1B80..U + 1BBF Sudanês 64 64 Sudanês
 0 BMP U + 1BC0..U + 1BFF Batak 64 56 Batak
 0 BMP U + 1C00..U + 1C4F Lepcha 80 74 Lepcha
 0 BMP U + 1C50..U + 1C7F Ol Chiki 48 48 Ol Chiki
 0 BMP U + 1C80..U + 1C8F Cirílico Extended-C 16 9 cirílico
 0 BMP U + 1C90..U + 1CBF Georgian Extended 48 46 Georgiano
 0 BMP U + 1CC0..U + 1CCF Suplemento Sudanês 16 8 Sudanês
 0 BMP U + 1CD0..U + 1CFF Extensões Védicas 48 43 Comum (16 caracteres), Herdado (27 caracteres)
 0 BMP U + 1D00..U + 1D7F Extensões Fonéticas 128 128 Cirílico (2 caracteres), grego (15 caracteres), latino (111 caracteres)
 0 BMP U + 1D80..U + 1DBF Suplemento de extensões fonéticas 64 64 Grego (1 caractere), latino (63 caracteres)
 0 BMP U + 1DC0..U + 1DFF Suplemento de combinação de marcas diacríticas 64 64 Herdado
 0 BMP U + 1E00..U + 1EFF Adicional estendido latino 256 256 Latina
 0 BMP U + 1F00..U + 1FFF Grego estendido 256 233 grego
 0 BMP U + 2000..U + 206F Pontuação Geral 112 111 Comum (109 caracteres), herdado (2 caracteres)
 0 BMP U + 2070..U + 209F Sobrescritos e subscritos 48 42 Latim (15 caracteres), Comum (27 caracteres)
 0 BMP U + 20A0..U + 20CF Símbolos de Moeda 48 33 Comum
 0 BMP U + 20D0..U + 20FF Combinando Marcas Diacríticas para Símbolos 48 33 Herdado
 0 BMP U + 2100..U + 214F Símbolos semelhantes a letras 80 80 Grego (1 caractere), latino (4 caracteres), Comum (75 caracteres)
 0 BMP U + 2150..U + 218F Formulários numéricos 64 60 Latim (41 caracteres), Comum (19 caracteres)
 0 BMP U + 2190..U + 21FF Setas; flechas 112 112 Comum
 0 BMP U + 2200..U + 22FF Operadores matemáticos 256 256 Comum
 0 BMP U + 2300..U + 23FF Técnico Diverso 256 256 Comum
 0 BMP U + 2400..U + 243F Imagens de controle 64 39 Comum
 0 BMP U + 2440..U + 245F Reconhecimento Ótico de Caracteres 32 11 Comum
 0 BMP U + 2460..U + 24FF Alfanuméricos incluídos 160 160 Comum
 0 BMP U + 2500..U + 257F Desenho da Caixa 128 128 Comum
 0 BMP U + 2580..U + 259F Elementos de Bloco 32 32 Comum
 0 BMP U + 25A0..U + 25FF Formas geométricas 96 96 Comum
 0 BMP U + 2600..U + 26FF Símbolos Diversos 256 256 Comum
 0 BMP U + 2700..U + 27BF Dingbats 192 192 Comum
 0 BMP U + 27C0..U + 27EF Símbolos Matemáticos Diversos-A 48 48 Comum
 0 BMP U + 27F0..U + 27FF Setas Suplementares-A 16 16 Comum
 0 BMP U + 2800..U + 28FF Padrões de Braille 256 256 Braille
 0 BMP U + 2900..U + 297F Setas Suplementares-B 128 128 Comum
 0 BMP U + 2980..U + 29FF Símbolos Matemáticos Diversos-B 128 128 Comum
 0 BMP U + 2A00..U + 2AFF Operadores matemáticos suplementares 256 256 Comum
 0 BMP U + 2B00..U + 2BFF Símbolos e Setas Diversos 256 253 Comum
 0 BMP U + 2C00..U + 2C5F Glagolítico 96 96 Glagolítico
 0 BMP U + 2C60..U + 2C7F Latim Extended-C 32 32 Latina
 0 BMP U + 2C80..U + 2CFF cóptico 128 123 cóptico
 0 BMP U + 2D00..U + 2D2F Suplemento georgiano 48 40 Georgiano
 0 BMP U + 2D30..U + 2D7F Tifinagh 80 59 Tifinagh
 0 BMP U + 2D80..U + 2DDF Etíope Estendido 96 79 Etíope
 0 BMP U + 2DE0..U + 2DFF Cirílico Extended-A 32 32 cirílico
 0 BMP U + 2E00..U + 2E7F Pontuação Suplementar 128 94 Comum
 0 BMP U + 2E80..U + 2EFF Suplemento CJK Radicals 128 115 Han
 0 BMP U + 2F00..U + 2FDF Radicais Kangxi 224 214 Han
 0 BMP U + 2FF0..U + 2FFF Caracteres de descrição ideográfica 16 12 Comum
 0 BMP U + 3000..U + 303F Símbolos e pontuação CJK 64 64 Han (15 caracteres), Hangul (2 caracteres), Comum (43 caracteres), Herdado (4 caracteres)
 0 BMP U + 3040..U + 309F Hiragana 96 93 Hiragana (89 caracteres), Comum (2 caracteres), Herdado (2 caracteres)
 0 BMP U + 30A0..U + 30FF Katakana 96 96 Katakana (93 caracteres), Comum (3 caracteres)
 0 BMP U + 3100..U + 312F Bopomofo 48 43 Bopomofo
 0 BMP U + 3130..U + 318F Hangul Compatibility Jamo 96 94 Hangul
 0 BMP U + 3190..U + 319F Kanbun 16 16 Comum
 0 BMP U + 31A0..U + 31BF Bopomofo Extended 32 32 Bopomofo
 0 BMP U + 31C0..U + 31EF CJK Strokes 48 36 Comum
 0 BMP U + 31F0..U + 31FF Extensões Fonéticas Katakana 16 16 Katakana
 0 BMP U + 3200..U + 32FF Cartas CJK Incluídas e Meses 256 255 Hangul (62 caracteres), Katakana (47 caracteres), Comum (146 caracteres)
 0 BMP U + 3300..U + 33FF Compatibilidade CJK 256 256 Katakana (88 caracteres), Comum (168 caracteres)
 0 BMP U + 3400..U + 4DBF CJK Unified Ideographs Extension A 6.592 6.592 Han
 0 BMP U + 4DC0..U + 4DFF Símbolos de hexagrama Yijing 64 64 Comum
 0 BMP U + 4E00..U + 9FFF CJK Unified Ideographs 20.992 20.992 Han
 0 BMP U + A000..U + A48F Sílabas Yi 1.168 1.165 Yi
 0 BMP U + A490..U + A4CF Yi Radicals 64 55 Yi
 0 BMP U + A4D0..U + A4FF Lisu 48 48 Lisu
 0 BMP U + A500..U + A63F Vai 320 300 Vai
 0 BMP U + A640..U + A69F Cirílico estendido-B 96 96 cirílico
 0 BMP U + A6A0..U + A6FF Bamum 96 88 Bamum
 0 BMP U + A700..U + A71F Letras de tom modificador 32 32 Comum
 0 BMP U + A720..U + A7FF Latim Extended-D 224 193 Latino (188 caracteres), Comum (5 caracteres)
 0 BMP U + A800..U + A82F Syloti Nagri 48 45 Syloti Nagri
 0 BMP U + A830..U + A83F Formulários de números índicos comuns 16 10 Comum
 0 BMP U + A840..U + A87F Phags-pa 64 56 Phags Pa
 0 BMP U + A880..U + A8DF Saurashtra 96 82 Saurashtra
 0 BMP U + A8E0..U + A8FF Devanágari Estendido 32 32 Devanágari
 0 BMP U + A900..U + A92F Kayah Li 48 48 Kayah Li (47 caracteres), Comum (1 caractere)
 0 BMP U + A930..U + A95F Rejang 48 37 Rejang
 0 BMP U + A960..U + A97F Hangul Jamo Extended-A 32 29 Hangul
 0 BMP U + A980..U + A9DF Javanês 96 91 Javanês (90 caracteres), Comum (1 caractere)
 0 BMP U + A9E0..U + A9FF Myanmar Extended-B 32 31 Myanmar
 0 BMP U + AA00..U + AA5F Cham 96 83 Cham
 0 BMP U + AA60..U + AA7F Mianmar Extended-A 32 32 Myanmar
 0 BMP U + AA80..U + AADF Tai Viet 96 72 Tai Viet
 0 BMP U + AAE0..U + AAFF Extensões Meetei Mayek 32 23 Meetei Mayek
 0 BMP U + AB00..U + AB2F Ethiopic Extended-A 48 32 Etíope
 0 BMP U + AB30..U + AB6F Latim Extended-E 64 60 Latim (56 caracteres), Grego (1 caractere), Comum (3 caracteres)
 0 BMP U + AB70..U + ABBF Suplemento Cherokee 80 80 Cherokee
 0 BMP U + ABC0..U + ABFF Meetei Mayek 64 56 Meetei Mayek
 0 BMP U + AC00..U + D7AF Sílabas hangul 11.184 11.172 Hangul
 0 BMP U + D7B0..U + D7FF Hangul Jamo Extended-B 80 72 Hangul
 0 BMP U + D800..U + DB7F Altas substitutas 896 0 Desconhecido
 0 BMP U + DB80..U + DBFF Substitutos de alto uso privado 128 0 Desconhecido
 0 BMP U + DC00..U + DFFF Substitutos baixos 1.024 0 Desconhecido
 0 BMP U + E000..U + F8FF Área de Uso Privado 6.400 6.400 Desconhecido
 0 BMP U + F900..U + FAFF Ideogramas de compatibilidade CJK 512 472 Han
 0 BMP U + FB00..U + FB4F Formulários de apresentação alfabética 80 58 Armênio (5 caracteres), hebraico (46 caracteres), latino (7 caracteres)
 0 BMP U + FB50..U + FDFF Formulários de apresentação em árabe-A 688 631 Árabe (629 caracteres), Comum (2 caracteres)
 0 BMP U + FE00..U + FE0F Seletores de variação 16 16 Herdado
 0 BMP U + FE10..U + FE1F Formas Verticais 16 10 Comum
 0 BMP U + FE20..U + FE2F Combinando Meias Marcas 16 16 Cirílico (2 caracteres), Herdado (14 caracteres)
 0 BMP U + FE30..U + FE4F Formulários de compatibilidade CJK 32 32 Comum
 0 BMP U + FE50..U + FE6F Variantes de forma pequena 32 26 Comum
 0 BMP U + FE70..U + FEFF Formas de apresentação em árabe-B 144 141 Árabe (140 caracteres), Comum (1 caractere)
 0 BMP U + FF00..U + FFEF Formas de meia largura e largura total 240 225 Hangul (52 caracteres), Katakana (55 caracteres), Latino (52 caracteres), Comum (66 caracteres)
 0 BMP U + FFF0..U + FFFF Especiais 16 5 Comum
 1 SMP U + 10000..U + 1007F Linear B Silabário 128 88 Linear B
 1 SMP U + 10080..U + 100FF Ideogramas Lineares B 128 123 Linear B
 1 SMP U + 10100..U + 1013F Números do Egeu 64 57 Comum
 1 SMP U + 10140..U + 1018F Números da Grécia Antiga 80 79 grego
 1 SMP U + 10190..U + 101CF Símbolos Antigos 64 14 Grego (1 caractere), Comum (13 caracteres)
 1 SMP U + 101D0..U + 101FF Disco de Phaistos 48 46 Comum (45 caracteres), Herdado (1 caractere)
 1 SMP U + 10280..U + 1029F Lícia 32 29 Lícia
 1 SMP U + 102A0..U + 102DF Carian 64 49 Carian
 1 SMP U + 102E0..U + 102FF Números de epacto copta 32 28 Comum (27 caracteres), Herdado (1 caractere)
 1 SMP U + 10300..U + 1032F Itálico antigo 48 39 Itálico antigo
 1 SMP U + 10330..U + 1034F gótico 32 27 gótico
 1 SMP U + 10350..U + 1037F Old Permic 48 43 Old Permic
 1 SMP U + 10380..U + 1039F Ugarítico 32 31 Ugarítico
 1 SMP U + 103A0..U + 103DF Persa antigo 64 50 Persa antigo
 1 SMP U + 10400..U + 1044F Deseret 80 80 Deseret
 1 SMP U + 10450..U + 1047F Shavian 48 48 Shavian
 1 SMP U + 10480..U + 104AF Osmanya 48 40 Osmanya
 1 SMP U + 104B0..U + 104FF Osage 80 72 Osage
 1 SMP U + 10500..U + 1052F Elbasan 48 40 Elbasan
 1 SMP U + 10530..U + 1056F Albanês caucasiano 64 53 Albanês caucasiano
 1 SMP U + 10570..U + 105BF Vithkuqi 80 70 Vithkuqi
 1 SMP U + 10600..U + 1077F Linear A 384 341 Linear A
 1 SMP U + 10780..U + 107BF Latim Extended-F 64 57 Latina
 1 SMP U + 10800..U + 1083F Silabário cipriota 64 55 Cipriota
 1 SMP U + 10840..U + 1085F Aramaico imperial 32 31 Aramaico imperial
 1 SMP U + 10860..U + 1087F Palmireno 32 32 Palmireno
 1 SMP U + 10880..U + 108AF Nabateu 48 40 Nabateu
 1 SMP U + 108E0..U + 108FF Hatran 32 26 Hatran
 1 SMP U + 10900..U + 1091F Fenício 32 29 Fenício
 1 SMP U + 10920..U + 1093F Lídio 32 27 Lídio
 1 SMP U + 10980..U + 1099F Hieróglifos Meroíticos 32 32 Hieróglifos Meroíticos
 1 SMP U + 109A0..U + 109FF Meroitic Cursive 96 90 Meroitic Cursive
 1 SMP U + 10A00..U + 10A5F Kharoshthi 96 68 Kharoshthi
 1 SMP U + 10A60..U + 10A7F Old South Arabian 32 32 Old South Arabian
 1 SMP U + 10A80..U + 10A9F Old North Arabian 32 32 Old North Arabian
 1 SMP U + 10AC0..U + 10AFF Maniqueísta 64 51 Maniqueísta
 1 SMP U + 10B00..U + 10B3F Avestan 64 61 Avestan
 1 SMP U + 10B40..U + 10B5F Parta inscrita 32 30 Parta inscrita
 1 SMP U + 10B60..U + 10B7F Pahlavi inscrito 32 27 Pahlavi inscrito
 1 SMP U + 10B80..U + 10BAF Saltério Pahlavi 48 29 Saltério Pahlavi
 1 SMP U + 10C00..U + 10C4F Turco antigo 80 73 Turco antigo
 1 SMP U + 10C80..U + 10CFF Húngaro antigo 128 108 Húngaro antigo
 1 SMP U + 10D00..U + 10D3F Hanifi Rohingya 64 50 Hanifi Rohingya
 1 SMP U + 10E60..U + 10E7F Símbolos Numéricos Rumi 32 31 árabe
 1 SMP U + 10E80..U + 10EBF Iazidi 64 47 Iazidi
 1 SMP U + 10F00..U + 10F2F Old Sogdian 48 40 Old Sogdian
 1 SMP U + 10F30..U + 10F6F Sogdian 64 42 Sogdian
 1 SMP U + 10F70..U + 10FAF Velho uigur 64 26 Velho uigur
 1 SMP U + 10FB0..U + 10FDF Chorasmian 48 28 Chorasmian
 1 SMP U + 10FE0..U + 10FFF Elymaic 32 23 Elymaic
 1 SMP U + 11000..U + 1107F Brahmi 128 115 Brahmi
 1 SMP U + 11080..U + 110CF Kaithi 80 68 Kaithi
 1 SMP U + 110D0..U + 110FF Sora Sompeng 48 35 Sora Sompeng
 1 SMP U + 11100..U + 1114F Chakma 80 71 Chakma
 1 SMP U + 11150..U + 1117F Mahajani 48 39 Mahajani
 1 SMP U + 11180..U + 111DF Sharada 96 96 Sharada
 1 SMP U + 111E0..U + 111FF Números Arcaicos Sinhala 32 20 Cingalês
 1 SMP U + 11200..U + 1124F Khojki 80 62 Khojki
 1 SMP U + 11280..U + 112AF Multani 48 38 Multani
 1 SMP U + 112B0..U + 112FF Khudawadi 80 69 Khudawadi
 1 SMP U + 11300..U + 1137F Grantha 128 86 Grantha (85 caracteres), herdado (1 caractere)
 1 SMP U + 11400..U + 1147F Newa 128 97 Newa
 1 SMP U + 11480..U + 114DF Tirhuta 96 82 Tirhuta
 1 SMP U + 11580..U + 115FF Siddham 128 92 Siddham
 1 SMP U + 11600..U + 1165F Modi 96 79 Modi
 1 SMP U + 11660..U + 1167F Suplemento Mongol 32 13 mongol
 1 SMP U + 11680..U + 116CF Takri 80 68 Takri
 1 SMP U + 11700..U + 1174F Ahom 80 65 Ahom
 1 SMP U + 11800..U + 1184F Dogra 80 60 Dogra
 1 SMP U + 118A0..U + 118FF Warang Citi 96 84 Warang Citi
 1 SMP U + 11900..U + 1195F Dives Akuru 96 72 Dives Akuru
 1 SMP U + 119A0..U + 119FF Nandinagari 96 65 Nandinagari
 1 SMP U + 11A00..U + 11A4F Praça Zanabazar 80 72 Praça Zanabazar
 1 SMP U + 11A50..U + 11AAF Soyombo 96 83 Soyombo
 1 SMP U + 11AB0..U + 11ABF Syllabics aboriginal canadense unificado estendido-A 16 16 Aborígine canadense
 1 SMP U + 11AC0..U + 11AFF Pau Cin Hau 64 57 Pau Cin Hau
 1 SMP U + 11C00..U + 11C6F Bhaiksuki 112 97 Bhaiksuki
 1 SMP U + 11C70..U + 11CBF Marchen 80 68 Marchen
 1 SMP U + 11D00..U + 11D5F Masaram Gondi 96 75 Masaram Gondi
 1 SMP U + 11D60..U + 11DAF Gunjala Gondi 80 63 Gunjala Gondi
 1 SMP U + 11EE0..U + 11EFF Makasar 32 25 Makasar
 1 SMP U + 11FB0..U + 11FBF Suplemento Lisu 16 1 Lisu
 1 SMP U + 11FC0..U + 11FFF Suplemento de Tamil 64 51 tâmil
 1 SMP U + 12000..U + 123FF Cuneiforme 1.024 922 Cuneiforme
 1 SMP U + 12400..U + 1247F Números cuneiformes e pontuação 128 116 Cuneiforme
 1 SMP U + 12480..U + 1254F Cuneiforme Dinástico Inferior 208 196 Cuneiforme
 1 SMP U + 12F90..U + 12FFF Cypro-Minoan 112 99 Cypro Minoan
 1 SMP U + 13000..U + 1342F Hieróglifos egípcios 1.072 1.071 Hieróglifos egípcios
 1 SMP U + 13430..U + 1343F Controles de formato de hieróglifo egípcio 16 9 Hieróglifos egípcios
 1 SMP U + 14400..U + 1467F Hieróglifos da Anatólia 640 583 Hieróglifos da Anatólia
 1 SMP U + 16800..U + 16A3F Suplemento Bamum 576 569 Bamum
 1 SMP U + 16A40..U + 16A6F Mro 48 43 Mro
 1 SMP U + 16A70..U + 16ACF Tangsa 96 89 Tangsa
 1 SMP U + 16AD0..U + 16AFF Bassa Vah 48 36 Bassa Vah
 1 SMP U + 16B00..U + 16B8F Pahawh Hmong 144 127 Pahawh Hmong
 1 SMP U + 16E40..U + 16E9F Medefaidrin 96 91 Medefaidrin
 1 SMP U + 16F00..U + 16F9F Miao 160 149 Miao
 1 SMP U + 16FE0..U + 16FFF Símbolos ideográficos e pontuação 32 7 Han (4 caracteres), Khitan Small Script (1 caractere), Nushu (1 caractere), Tangut (1 caractere)
 1 SMP U + 17000..U + 187FF Tangut 6.144 6.136 Tangut
 1 SMP U + 18800..U + 18AFF Componentes Tangut 768 768 Tangut
 1 SMP U + 18B00..U + 18CFF Khitan Small Script 512 470 Khitan Small Script
 1 SMP U + 18D00..U + 18D7F Suplemento Tangut 128 9 Tangut
 1 SMP U + 1AFF0..U + 1AFFF Kana Extended-B 16 13 Katakana
 1 SMP U + 1B000..U + 1B0FF Suplemento Kana 256 256 Hiragana (255 caracteres), Katakana (1 caractere)
 1 SMP U + 1B100..U + 1B12F Kana Extended-A 48 35 Hiragana (32 caracteres), Katakana (3 caracteres)
 1 SMP U + 1B130..U + 1B16F Extensão Kana pequena 64 7 Hiragana (3 caracteres), Katakana (4 caracteres)
 1 SMP U + 1B170..U + 1B2FF Nushu 400 396 Nüshu
 1 SMP U + 1BC00..U + 1BC9F Duployan 160 143 Duployan
 1 SMP U + 1BCA0..U + 1BCAF Controles de formato abreviado 16 4 Comum
 1 SMP U + 1CF00..U + 1CFCF Notação Musical Znamenny 208 185 Comum (116 caracteres), herdado (69 caracteres)
 1 SMP U + 1D000..U + 1D0FF Símbolos Musicais Bizantinos 256 246 Comum
 1 SMP U + 1D100..U + 1D1FF Símbolos Musicais 256 233 Comum (211 caracteres), herdado (22 caracteres)
 1 SMP U + 1D200..U + 1D24F Notação Musical Grega Antiga 80 70 grego
 1 SMP U + 1D2E0..U + 1D2FF Algarismos maias 32 20 Comum
 1 SMP U + 1D300..U + 1D35F Símbolos de Tai Xuan Jing 96 87 Comum
 1 SMP U + 1D360..U + 1D37F Números da barra de contagem 32 25 Comum
 1 SMP U + 1D400..U + 1D7FF Símbolos Alfanuméricos Matemáticos 1.024 996 Comum
 1 SMP U + 1D800..U + 1DAAF Sutton SignWriting 688 672 SignWriting
 1 SMP U + 1DF00..U + 1DFFF Latim Extended-G 256 31 Latina
 1 SMP U + 1E000..U + 1E02F Suplemento Glagolítico 48 38 Glagolítico
 1 SMP U + 1E100..U + 1E14F Nyiakeng Puachue Hmong 80 71 Nyiakeng Puachue Hmong
 1 SMP U + 1E290..U + 1E2BF Totó 48 31 Totó
 1 SMP U + 1E2C0..U + 1E2FF Wancho 64 59 Wancho
 1 SMP U + 1E7E0..U + 1E7FF Ethiopic Extended-B 32 28 Etíope
 1 SMP U + 1E800..U + 1E8DF Mende Kikakui 224 213 Mende Kikakui
 1 SMP U + 1E900..U + 1E95F Adlam 96 88 Adlam
 1 SMP U + 1EC70..U + 1ECBF Números índicos de Siyaq 80 68 Comum
 1 SMP U + 1ED00..U + 1ED4F Números Otomanos de Siyaq 80 61 Comum
 1 SMP U + 1EE00..U + 1EEFF Símbolos alfabéticos matemáticos árabes 256 143 árabe
 1 SMP U + 1F000..U + 1F02F Mahjong Tiles 48 44 Comum
 1 SMP U + 1F030..U + 1F09F Domino Tiles 112 100 Comum
 1 SMP U + 1F0A0..U + 1F0FF Cartas de jogar 96 82 Comum
 1 SMP U + 1F100..U + 1F1FF Suplemento Alfanumérico Incluído 256 200 Comum
 1 SMP U + 1F200..U + 1F2FF Suplemento ideográfico fechado 256 64 Hiragana (1 caractere), Comum (63 caracteres)
 1 SMP U + 1F300..U + 1F5FF Símbolos e pictogramas diversos 768 768 Comum
 1 SMP U + 1F600..U + 1F64F Emoticons 80 80 Comum
 1 SMP U + 1F650..U + 1F67F Dingbats ornamentais 48 48 Comum
 1 SMP U + 1F680..U + 1F6FF Transporte e símbolos de mapa 128 117 Comum
 1 SMP U + 1F700..U + 1F77F Símbolos Alquímicos 128 116 Comum
 1 SMP U + 1F780..U + 1F7FF Formas geométricas estendidas 128 102 Comum
 1 SMP U + 1F800..U + 1F8FF Setas Suplementares-C 256 150 Comum
 1 SMP U + 1F900..U + 1F9FF Símbolos e pictogramas suplementares 256 256 Comum
 1 SMP U + 1FA00..U + 1FA6F Símbolos de xadrez 112 98 Comum
 1 SMP U + 1FA70..U + 1FAFF Símbolos e pictogramas estendidos-A 144 88 Comum
 1 SMP U + 1FB00..U + 1FBFF Símbolos para computação legada 256 212 Comum
 2 SIP U + 20000..U + 2A6DF CJK Unified Ideographs Extension B 42.720 42.720 Han
 2 SIP U + 2A700..U + 2B73F CJK Unified Ideographs Extension C 4.160 4.153 Han
 2 SIP U + 2B740..U + 2B81F CJK Unified Ideographs Extension D 224 222 Han
 2 SIP U + 2B820..U + 2CEAF CJK Unified Ideographs Extension E 5.776 5.762 Han
 2 SIP U + 2CEB0..U + 2EBEF CJK Unified Ideographs Extension F 7.488 7.473 Han
 2 SIP U + 2F800..U + 2FA1F Suplemento de ideogramas de compatibilidade CJK 544 542 Han
 3 DICA U + 30000..U + 3134F CJK Unified Ideographs Extension G 4.944 4.939 Han
14 SSP U + E0000..U + E007F Tag 128 97 Comum
14 SSP U + E0100..U + E01EF Suplemento de Seletores de Variação 240 240 Herdado
15 PUA-A U + F0000..U + FFFFF Área de uso privado suplementar-A 65.536 65.534 Desconhecido
16 PUA-B U + 100000..U + 10FFFF Área de uso privado suplementar-B 65.536 65.534 Desconhecido

Blocos excluídos

A Política de Estabilidade Unicode requer que um caractere, uma vez atribuído, não possa ser movido ou removido, embora possa ser descontinuado. Isso se aplica ao Unicode 2.0 e todas as versões subseqüentes.

Antes disso, os seguintes blocos anteriores foram removidos:

Antigos blocos Unicode anteriores ao Unicode 2.0
Alcance do bloco Nome do bloco Faixa agora ocupada por Substituído por bloco Pontos de código Personagens atribuídos Scripts
U + 1000..U + 105F Tibetano Myanmar Tibetano 96 71 Tibetano
U + 3400..U + 3D2D Hangul CJK Unified Ideographs Extension A Sílabas hangul 2350 2350 Hangul
U + 3D2E..U + 44B7 Hangul Suplementar-A CJK Unified Ideographs Extension A 1930 1930 Hangul
U + 44B8..U + 4DFF Hangul Suplementar-B CJK Unified Ideographs Extension A 2376 2376 Hangul
Símbolos de hexagrama Yijing

Referências

links externos