código Baudot - Baudot code


Da Wikipédia, a enciclopédia livre

O código de Baudot [bodo] , inventado por Émile Baudot , é um conjunto de caracteres antecedendo EBCDIC e ASCII . Foi o antecessor do Internacional Telegraph Alphabet No. 2 (ITA2), o teletipo código em uso até o advento do ASCII. Cada caracter do alfabeto é representada por uma série de cinco bits , enviadas através de um canal de comunicação tal como um fio de telégrafo ou um sinal de rádio. A taxa de símbolos de medição é conhecido como de transmissão , e é derivada a partir do mesmo nome.

História

código Baudot (ITA1)

código Baudot (ITA1)
Código Baudot - de 1888 patent.png
Uma versão inicial da patente US de Baudot 1888, listando de A a Z, t e * (Erasure)
Alias ​​(es) Internacional Telegraph alfabeto 1
Status atual Substituído por ITA2 (não compatíveis entre si).
Classificação 5-bit stateful latino básico de codificação
Precedido por Código Morse
Sucedido por ITA2

Tecnicamente, os códigos de cinco bits começou no século 17, quando Francis Bacon desenvolveu a cifra agora chamado código bacon . A cifra não foi projetado para telecomunicações máquina (que era, em vez de um método de criptografar uma mensagem escondida em outra ) e, apesar de, em teoria, poderia ser adaptado para o efeito, abrangia apenas 24 das 26 letras do alfabeto Inglês (dois conjuntos de letras, de I / J e L / V, foram expressos com o mesmo código) e não continha pontuação, espaços, números ou os caracteres de controlo , tornando-a de pouca utilidade.

Baudot inventou o seu código original em 1870 e patenteou em 1874. Era um código de 5 bits, com igual dentro e fora intervalos, o que permitiu a transmissão do alfabeto romano, e incluiu sinais de pontuação e controle. Foi baseado em um código anteriormente desenvolvido por Carl Friedrich Gauss e Wilhelm Weber em 1834. Era um código de Gray (quando vogais e consoantes são classificadas em sua ordem alfabética), no entanto, o código por si só não foi patenteado (apenas a máquina) porque a lei de patentes francês não permite que conceitos para ser patenteado.

código original de Baudot foi adaptado para ser enviado a partir de um teclado manual e nenhum equipamento de teletipo que nunca foi construído que usou em sua forma original. O código foi inserido em um teclado que tinha apenas cinco teclas tipo piano e foi operado usando dois dedos da mão esquerda e três dedos da mão direita. Uma vez que as chaves haviam sido pressionado, eles foram fechadas até contatos mecânicos em uma unidade distribuidora passou sobre o setor ligado a esse teclado particular, quando o teclado foi desbloqueado pronto para o próximo caractere a ser inserido, com um clique audível (conhecido como o "sinal de cadência") para alertar o operador. Operadores tinham de manter um ritmo constante, e a velocidade normal de operação foi de 30 palavras por minuto.

A tabela "mostra a alocação do código Baudot que foi empregada no British Post Office para os serviços continentais e interiores. Um número de caracteres no código continental são substituídos por fractionals no código para o interior. Elementos de código 1, 2 e 3 são transmitidos por chaves 1, 2 e 3, e estes são operados pelos três primeiros dedos da mão direita ". elementos de código 4 e 5 são transmitidas por chaves 4 e 5, e estes são operados pelos dois primeiros dedos da mão esquerda.

Código de Baudot ficou conhecido como o Internacional Telegraph Alphabet No. 1 ( ITA1 ). Ele não é mais usado.

código de Murray

fita de papel com furos que representam o "Baudot-Murray Code". Observe as colunas totalmente perfurados de "Apagar / cartas selecione" códigos no início da mensagem (à direita); foram usados ​​para cortar a banda facilmente entre mensagens distintas. A mensagem em seguida inicia-se com um controlo de figura deslocamento seguido por um retorno do carro.

Em 1901, o código de Baudot foi modificado por Donald Murray (1865-1945), solicitado pelo seu desenvolvimento de um teclado de máquina de escrever-like. O sistema de Murray empregue um passo intermediário; um perfurador de teclado, o que permitiu um operador para perfurar uma fita de papel, e um transmissor de fita para o envio da mensagem a partir da fita perfurada . Na extremidade receptora da linha, um mecanismo de impressão iria imprimir em uma fita de papel, e / ou um reperforator poderia ser usado para fazer uma cópia perfurada da mensagem. Como já não havia uma ligação entre o movimento da mão do operador e os bits transmitidos, não havia nenhuma preocupação sobre providenciar o código para minimizar a fadiga do operador, e em vez disso Murray concebido o código para minimizar o desgaste das máquinas, atribuindo as combinações de código com o menor número perfurados orifícios para os mais caracteres utilizados frequentemente .

Por exemplo, as cartas de uma buracos são E e T. Os dez letras de dois furos são AOINSHRDLZ, muito semelhante ao " Etaoin SHRDLU ordem" usado em máquinas Linotype . Mais dez letras têm três buracos, e as letras de quatro furos são VXKQ.

O código de Murray também introduziu o que ficou conhecido como "formato effectors" ou " caracteres de controle " - o CR (Carriage Return) e LF (Line Feed) códigos. Alguns dos códigos de Baudot mudou-se para as posições onde eles já ficaram desde então: o NULL ou em branco e o código DEL. NULL / EM BRANCO foi usado como um código inativo para quando há mensagens estavam sendo enviados, mas o mesmo código foi usado para codificar a separação espaço entre as palavras. Sequências de códigos DEL (colunas totalmente perfurados) foram usadas no início ou final de mensagens ou entre elas, permitindo a fácil separação de mensagens distintas. (Códigos BELL poderia ser inserido nessas sequências de sinal para o operador remoto que uma nova mensagem de vinha ou que a transmissão de uma mensagem foi terminado).

Primeiros britânicos Creed máquinas usado o sistema Murray.

Western Union

Teclado de um teletipo usando o código Baudot (variante EUA), com figuras e as chaves de mudança de LTRs

Código de Murray foi adotada pela Western Union , que usou até a década de 1950, com algumas alterações que consistiam de omitir alguns personagens e adicionando mais códigos de controle. Um caráter explícito SPC (espaço) foi introduzido, no lugar do branco / NULL, e um novo BEL código tocou uma campainha ou produzido um sinal sonoro no receptor. Além disso, o WRU ou "Quem é você?" código foi introduzido, o que causou um equipamento de recepção para enviar um fluxo de identificação de volta para o remetente.

ITA2

código ITA2 Baudot-Murray
2.jpg Internacional Telegraph Alphabet
variante britânica de ITA2
Alias ​​(es) Internacional Telegraph alfabeto 2
Classificação 5-bit stateful latino básico de codificação
Precedido por ITA1
Sucedido por FIELDATA ,
ITA 5 ( US-ASCII )
MTK-2
Línguas) russo
Classificação 5-bit stateful cirílico codificação
Precedido por código Morse russo
Sucedido por KOI-7

Em 1924, o CCITT introduziu o Internacional Telegraph Alphabet No. 2 ( ITA2 código) como um padrão internacional, que foi baseado no código Western Union com algumas pequenas alterações. Os EUA padronizado em uma versão de ITA2 chamado o código americano Teletypewriter (US TTY) que foi a base para os códigos de teletipo de 5 bits até a estréia do 7-bit ASCII em 1963.

Alguns pontos de código (azul na tabela marcados) foram reservados para uso específico nacional.

A posição de código atribuído como nulo foi de fato usado apenas para o estado ocioso de teleimpressoras. Durante longos períodos de tempo ocioso, a taxa de impulso não foi sincronizada entre ambos os dispositivos (que poderia até ser desligado ou não permanentemente interligados em linhas telefônicas comutadas). Para iniciar uma mensagem foi primeiro necessário calibrar a taxa de impulso de uma sequência de impulsos cronometrados regularmente "mark" (1) por grupo de cinco impulsos, que também poderiam ser detectados por dispositivos electrónicos passivos simples para ligar o teletipo; esta série de impulsos estava gerando série de apagamento / apagar e também inicialização do estado do receptor para o modo de troca cartas, no entanto, o primeiro impulso pode ser perdido, de modo que este poder no procedimento poderia, então, ser encerrada por um único nulo imediatamente seguido por um apagamento / excluir personagem. Para preservar a sincronização entre dispositivos, o código nulo não pode ser utilizado de forma arbitrária no meio de mensagens (esta foi uma melhoria para o sistema Baudot inicial onde os espaços não foram diferenciados explicitamente, por isso era difícil manter os contadores de impulsos para repetir espaços em teleimpressoras). Mas foi então possível voltar a sincronizar os dispositivos a qualquer momento através do envio de um nulo no meio de uma mensagem (imediatamente seguido por um Erasure / Excluir controle / LS se seguido de uma letra, ou por um controle FS se seguido de um número). Envio de controles nulos também não causou a faixa de papel para avançar para a próxima linha (como nada foi perfurado), de modo que este salvo comprimentos preciosos da faixa de papel punchable. Ao contrário do apagamento / apagar / LS código de controlo foi sempre perfurados e sempre deslocada para o modo (iniciais) cartas. Segundo algumas fontes, o ponto de código nulo foi reservado apenas para uso-country interno.

A mudança para o código de letras (LS) também é utilizável como uma forma de cancelar / eliminar texto de uma fita perfurada depois de ter sido lido, permitindo a destruição segura da mensagem antes de reciclar a banda deu um soco. Para essa função, que também desempenha o mesmo papel de material de enchimento como o código Excluir em ASCII (e também em outras codificações de 7 bits ou 8 bits, incluindo EBCDIC para cartões perfurados). Uma vez que os códigos para um texto fragmento foi substituído pelo número arbitrário de códigos LS, o que se segue é ainda preservada e decodable. Ele também pode ser usado como um iniciador para se certificar de que a decodificação do primeiro código não vai dar um dígito ou outro símbolo a partir da página números (porque o código nulo pode ser arbitrariamente inserido perto do fim de uma banda de soco ou no início do -lo, e tem que ser ignorado, enquanto o código de espaço é significativo em texto).

As células marcadas como reservados para extensões (usando o código LS novamente a partir das letras mudam página, logo depois de um primeiro código LS a mudar a partir da página figuras) foi definido para mudar para um novo modo: nesse novo modo, a página de cartas são contendo letras minúsculas somente, mas uma terceira página de códigos ainda é acessível para as letras maiúsculas, de forma temporária para uma única letra (LS codificar antes que a carta), pode ser bloqueado (com FS + LS) para um número ilimitado de letras maiúsculas ou dígitos e, em seguida, desbloqueado para retornar ao modo de minúsculas (com um único LS). A célula marcada como "Reservada" também é utilizável (utilizando o código de FS a partir dos números de página Shift) para comutar a página de dados (que normalmente contém dígitos e nacionais letras minúsculas ou símbolos) com uma quarta principal (em que as letras nacionais são uppercased e outros símbolos podem ser codificados).

ITA2 ainda é usado em dispositivos de telecomunicação para surdos (TDD), telex , e alguns de rádio amador aplicações, tais como radioteletipo ( "RTTY"). ITA2 também é usado na solução de transmissão aprimorada (um protocolo financeiro do século 21 início especificado pela Deutsche Börse ) para reduzir a codificação de caracteres pegada.

Nomenclatura

Quase todos os equipamentos teleprinter do século 20 usado o código do Western Union, ITA2, ou variantes. Os radioamadores casualmente chamar ITA2 e variantes "Baudot" incorretamente, e até mesmo o ARRL 's Amateur Radio Handbook faz isso, embora em edições mais recentes das tabelas de códigos identifica corretamente como ITA2.

Conjunto de caracteres

Baudot Original variantes

Original Baudot, UK doméstica

código Baudot original, UK variante doméstica (carta set, mudou para com 0x10)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
A
0041
E
0045
/
002F
Y
0059
L
0055
I
0049
O
004F
FS
000E
J
004A
G
0047
H
0048
B
0042
C
0043
F
0046
D
0044
1_ SP
0020
-
002D
X
0058
Z
005A
S
0053
T
0054
W
0057
V
0056
DEL
007F
K
004B
M
004D
L
004C
R
0052
Q
0051
N
004E
P
0050
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
código Baudot original, UK variante doméstica (figura set, mudou para com 0x08)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
1
0031
2
0032
¹/
00B9 2044
3
0033
4
0034
³/
00B3 2044
5
0035
SP
0020
6
0036
7
0037
¹
00B9
8
0038
9
0039
⁵/
2075 2044
0
0030
1_ LS
000F
.
002e
⁹/
2079 2044
:
003A
⁷/
2077 2044
²
00B2
?
003F
'
0027
DEL
007F
(
0028
)
0029
=
003D
-
002D
/
002F
£
00A3
+
002B
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F

  Carta    Número    pontuação    Símbolo  Outros  indefinido     

Baudot original, Europeu Continental

código Baudot original, variante europeia continental (carta set, mudou para com 0x10)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
A
0041
E
0045
E
00C9
Y
0059
L
0055
I
0049
O
004F
FS
000E
J
004A
G
0047
H
0048
B
0042
C
0043
F
0046
D
0044
1_ SP
0020
t
0074
X
0058
Z
005A
S
0053
T
0054
W
0057
V
0056
DEL
007F
K
004B
M
004D
L
004C
R
0052
Q
0051
N
004E
P
0050
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
Baudot código original, variante continental (figura conjunto, ligado com a 0x08)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
1
0031
2
0032
&
0026
3
0033
4
0034
º
00BA
5
0035
SP
0020
6
0036
7
0037
h
0068
8
0038
9
0039
f
0066
0
0030
1_ LS
000F
.
002e
,
002C
:
003A
;
003B
!
0021
?
003F
'
0027
DEL
007F
(
0028
)
0029
=
003D
-
002D
/
002F

2116
%
0025
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F

  Carta    Número    pontuação    Símbolo  Outros  indefinido     

Baudot original, ITA 1

ITA 1 (carta conjunto, ligado com a 0x10)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
A
0041
E
0045
CR
000D
Y
0059
L
0055
I
0049
O
004F
FS
000E
J
004A
G
0047
H
0048
B
0042
C
0043
F
0046
D
0044
1_ SP
0020
LF
000A
X
0058
Z
005A
S
0053
T
0054
W
0057
V
0056
DEL
007F
K
004B
M
004D
L
004C
R
0052
Q
0051
N
004E
P
0050
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
ITA 1 (figura conjunto, ligado com a 0x08)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
1
0031
2
0032
CR
000D
3
0033
4
0034
PU
5
0035
SP
0020
6
0036
7
0037
+
002B
8
0038
9
0039
PU
0
0030
1_ LS
000F
LF
000A
,
002C
:
003A
.
002e
PU
?
003F
'
0027
DEL
007F
(
0028
)
0029
=
003D
-
002D
/
002F
PU
%
0025
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F

  Carta    Número    pontuação    Símbolo  Outros  indefinido     

Baudot-Murray variantes

Código Murray

código Murray (carta conjunto, ligado com a 0x04)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL / SP
0000/0020
E
0045
COL
?
A
0041
LS
000F
S
0053
I
0049
L
0055
LF
000A
D
0044
R
0052
J
004A
N
004E
F
0046
C
0043
K
004B
1_ T
0054
Z
005A
L
004C
W
0057
H
0048
Y
0059
P
0050
Q
0051
O
004F
B
0042
G
0047
FS
000E
M
004D
X
0058
V
0056
DEL /*
007F / 002A
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
código Murray (figura conjunto, ligado com a 0x1B)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL / SP
0000/0020
3
0033
COL
?
LS
000F
'
0027
8
0038
7
0037
LF
000A
²
00B2
4
0034
⁷/
2077 2044
-
002D / 2212
¹/
00B9 2044
(
0028
⁹/
2079 2044
1_ 5
0035
.
002e
/
002F
2
0032
⁵/
2075 2044
6
0036
0
0030
1
0031
9
0039
?
003F
³/
00B3 2044
FS
000E
,
002C
£
00A3
)
0029
DEL /*
007F / 002A
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F

ITA 2 e US-TTY

ITA2 e código US-TTY Baudot-Murray (carta conjunto, ligado com a 0x1F)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
E
0045
LF
000A
A
0041
SP
0020
S
0053
I
0049
L
0055
CR
000D
D
0044
R
0052
J
004A
N
004E
F
0046
C
0043
K
004B
1_ T
0054
Z
005A
L
004C
W
0057
H
0048
Y
0059
P
0050
Q
0051
O
004F
B
0042
G
0047
FS
000E
M
004D
X
0058
V
0056
LS / DEL
000F / 007F
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
código US-TTY Baudot-Murray (figura conjunto, ligado com a 0x1B)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
3
0033
LF
000A
-
002D / 2212
SP
0020
BEL
0007
8
0038
7
0037
CR
000D
$
0024
4
0034
'
0027
,
002C
!
0021
:
003B
(
0028
1_ 5
0035
"
0022
)
0029
2
0032
#
0023
6
0036
0
0030
1
0031
9
0039
?
003F
&
0026
FS
000E
.
002e
/
002F
;
003B
LS
000F
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
código ITA2 Baudot-Murray (figura conjunto, ligado com a 0x1B)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_ NUL
0000
3
0033
LF
000A
-
002D / 2212
SP
0020
'
0027
8
0038
7
0037
CR
000D
ENQ
0005
4
0034
BEL
0007
,
002C
!
0021
:
003B
(
0028
1_ 5
0035
+
002B
)
0029
2
0032
£
00A3
6
0036
0
0030
1
0031
9
0039
?
003F
&
0026
FS
000E
.
002e
/
002F
=
003D
LS
000F
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F

  Carta    Número    pontuação    Símbolo  Outros  indefinido     

detalhes

NOTA: Esta tabela pressupõe o espaço chamado "1" por Baudot e Murray é mais à direita, e menos significativo. A forma como os bits transmitidos foram embalados em códigos maiores variados pelo fabricante. A solução mais comum atribui os bits a partir do bit menos significativo para o bit mais significativo (deixando os três bits mais significativos de um byte não utilizado).

Tabela de códigos ITA2 (expresso como hexadecimais números)

Em ITA2, caracteres são expressos usando cinco bits. ITA2 usa dois sub-conjuntos de códigos, a "carta deslocamento" (LTRS), e o "figura deslocamento" (figuras). O carácter FIGS (11011) sinais que os caracteres seguintes são para ser interpretadas como sendo no conjunto de figuras, até que este é reposto pelo (11111) LTRS personagem. Em utilização, as LTR ou Figs deslocar tecla é pressionada e libertada, a transmissão do carácter correspondente mudança para a outra máquina. As letras ou números caracteres desejados são então digitado. Ao contrário de uma máquina de escrever ou moderno teclado de computador, a tecla shift não é mantido pressionado enquanto os caracteres correspondentes são digitados. "Inquérito" irá desencadear answerback da outra máquina. Significa "Quem é você?"

CR é retorno do carro , LF é avanço de linha , BEL é o carácter de sino que tocou um pequeno sino (muitas vezes usado para alertar os operadores para uma mensagem de entrada), SP é espaço, e NUL é o carácter nulo (fita em branco).

Nota: as conversões binárias dos pontos de código são frequentemente mostrado na ordem inversa, dependendo do (presumivelmente) a partir do qual o lado que se vê a fita de papel. Nota ainda que os personagens de "controle" foram escolhidos para que eles eram ou simétrica ou em pares úteis de modo que a inserção de uma fita de "cabeça para baixo" não resultou em problemas para o equipamento e a impressão resultante poderia ser decifrado. Assim FIGS (11011), LTRS (11111) e espaço (00100) são invariantes, enquanto CR (00010) e LF (01000), geralmente utilizado como um par, são tratados da mesma forma, independentemente da ordem pela impressoras de página. LTRS também poderia ser usado para overpunch caracteres a serem excluídos em uma fita de papel (muito parecido com DEL em 7-bit ASCII ).

A seqüência RYRYRY ... é frequentemente usado em mensagens de teste, e no início de cada transmissão. Uma vez que o símbolo R representa 01010 e Y é 10101, a sequência exerce tanto de componentes mecânicos de um telex sob tensão máxima. Além disso, ao mesmo tempo, o ajuste fino do receptor foi feito usando duas luzes coloridas (uma para cada tom). 'RYRYRY ...' produzido 0101010101 ..., o que fez as luzes brilham com igual brilho quando o ajuste foi correta. Esta sequência de sintonização é apenas útil quando ITA2 é utilizado com dois tons FSK modulação, tal como é frequentemente observado em radioteletipo uso (RTTY).

US implementações de código Baudot podem diferir na adição de alguns caracteres, tais como o #, & na camada FIGS.

A versão russa do código Baudot ( MTK-2 ) usou três modos de mudança; a carta cirílico modo foi ativado pelo caráter (00000). Por causa do maior número de caracteres em alfabeto cirílico, os personagens ! , & , £ foram omitidos e substituídos por cirílicos, e BEL tem o mesmo código como cirílico carta Ю. As letras cirílicas š e Å são omitidas, e Ч é mesclado com o numeral 4.

Veja também

notas de rodapé

Referências

Outras leituras

Este artigo é baseado em material retirado do foldoc antes de 1 de Novembro de 2008 e constituída sob as "novas licenças" termos da GFDL , versão 1.3 ou posterior.