Pontuação Geral - General Punctuation

Pontuação Geral
Faixa U + 2000..U + 206F
(112 pontos de código)
Plano BMP
Scripts Comum (109 char.)
Herdado (2 char.)
Conjuntos de símbolos Controles de formato de
espaços de pontuação
Atribuído 111 pontos de código
Não utilizado 1 ponto de código reservado
6 obsoleto
Histórico da versão Unicode
1.0.0 (1991) 67 (+67)
1.1 (1993) 76 (+9)
3.0 (1999) 83 (+7)
3.2 (2002) 95 (+12)
4.0 (2003) 97 (+2)
4,1 (2005) 106 (+9)
5.1 (2008) 107 (+1)
6.3 (2013) 111 (+4)
Nota :

Pontuação geral é um bloco Unicode que contém pontuação , espaçamento e caracteres de formatação para uso com todos os scripts e sistemas de escrita. Estão incluídos os espaços de largura definida , formatos de junção, formatos direcionais, aspas inteligentes , pontuação arcaica e inovadora, como o interrobang e operadores matemáticos invisíveis.

Os caracteres de pontuação adicionais estão no bloco de pontuação suplementar e espalhados em dezenas de outros blocos Unicode.

Bloquear


Gráfico de código oficial Unicode Consortium geral de pontuação (PDF)
  0 1 2 3 4 5 6 7 8 9 UMA B C D E F
U + 200x NQ
 SP 
MQ
 SP 
EN
 SP 
EM
 SP 
 3 / M 
SP
 4 / M 
SP
 6 / M 
SP
F
 SP 
P
 SP 
TH
 SP 
H
 SP 
ZW
 SP 
ZW
 NJ 
 ZW 
J
 LRM   RLM 
U + 201x -  NB 
-
- - - - ' '
U + 202x L
 SEP 
P
 SEP 
 LRE   RLE   PDF   LRO   RLO   NNB 
SP
U + 203x
U + 204x
U + 205x MM
  SP  
U + 206x  WJ   ƒ ()    ×     ,     +    LRI   RLI   FSI   PDI  I
 SS 
A
 SS 
I
 AFS 
A
 AFS 
NA
 DS 
SEM
 DS 
Notas
1. ^ A partir do Unicode versão 14.0
2. ^ A área cinza indica ponto de código não atribuído
3. ^ Os pontos de código Unicode U + 206A - U + 206F estão obsoletos a partir do Unicode versão 3.0

Vários caracteres neste bloco geralmente não são renderizados com um glifo diretamente visível. Dez caracteres de espaço em branco U + 2002 a U + 200B (fixo en ou 12 em, em, 13 em, 14 em, 16 em, figura e espaço de pontuação , variável fina ou 15 em e cabelo espaço , espaço de largura zero fixa ) e U + 205F ( meio matemático ou espaço 29 em ) diferem pela largura horizontal, enquanto U + 2000 e U + 2001 ( en e em quad ) são efetivamente apelidos de U + 2002 e U +2003, respectivamente; outros dois, U + 202F e U + 2060 (mal denominado word joiner ) são variantes do U + 2009 ou U + 2004 e U + 200B que proíbem quebras de linha. Três caracteres de largura zero U + 200B a U + 200D ( espaço, não-marcador e marcador ) diferem em como afetam a ligadura e o formato de letras adjacentes, como as formas contextuais em árabe. Onze caracteres invisíveis U + 200E, U + 200F ( marca da esquerda para a direita e da direita para a esquerda ), U + 202A a U + 202E (incisões , estalos e substituições ) e U + 2066 até U + 2069 ( isolados ) controlar a direcionalidade do texto, a menos que a marcação de nível superior os substitua. Existem separadores de linhas e parágrafos explícitos em U + 2028 e U + 2029.

Emoji

O bloco de Pontuação geral contém dois emojis : U + 203C e U + 2049.

O bloco tem quatro variantes padronizadas definidas para especificar o estilo emoji (U + FE0F VS16) ou apresentação de texto (U + FE0E VS15) para os dois emojis, sendo que ambos são padronizados para uma apresentação de texto.

Sequências de variação de emoji
U + 203C 2049
ponto de código base
base + VS15 (texto) ‼ ︎ ⁉︎
base + VS16 (emoji) ‼ ️ ⁉️

História

Os seguintes documentos relacionados a Unicode registram a finalidade e o processo de definição de caracteres específicos no bloco de Pontuação Geral:

Referências