Armazenamento de dados em fita magnética - Magnetic tape data storage

O armazenamento de dados em fita magnética é um sistema para armazenar informações digitais em fita magnética usando a gravação digital .

A fita era um meio importante para o armazenamento de dados primários nos primeiros computadores, normalmente usando grandes carretéis abertos de fita de 7 trilhas e , posteriormente, de 9 trilhas . A fita magnética moderna é mais comumente embalada em cartuchos e cassetes, como a série Linear Tape-Open (LTO) amplamente suportada e IBM 3592 . O dispositivo que executa a gravação ou leitura de dados é chamado de unidade de fita . Autoloaders e bibliotecas de fitas são freqüentemente usados ​​para automatizar o manuseio e a troca de cartuchos. A compatibilidade era importante para permitir a transferência de dados.

O armazenamento de dados em fita agora é mais usado para backup do sistema, arquivo de dados e troca de dados. O baixo custo da fita a manteve viável para armazenamento e arquivamento de longo prazo.

Bobinas abertas

Inicialmente, a fita magnética para armazenamento de dados foi enrolada em bobinas de 10,5 polegadas (27 cm) . Esse padrão para grandes sistemas de computador persistiu até o final da década de 1980, com capacidade cada vez maior devido a substratos mais finos e mudanças na codificação. Cartuchos de fita e cassetes estavam disponíveis a partir de meados da década de 1970 e eram freqüentemente usados ​​com pequenos sistemas de computador. Com a introdução do cartucho IBM 3480 em 1984, descrito como "cerca de um quarto do tamanho ... mas armazenava até 20% a mais de dados", grandes sistemas de computador começaram a se afastar das fitas de carretel aberto em direção aos cartuchos.

UNIVAC

A fita magnética foi usada pela primeira vez a dados informáticos recorde em 1951 sobre o UNIVAC I . O meio de gravação da unidade UNISERVO era uma tira de metal fina de bronze de fósforo folheado a níquel de 0,5 polegadas (12,7 mm) de largura . A densidade de gravação foi de 128 caracteres por polegada (198 micrômetros / caractere) em oito trilhas a uma velocidade linear de 100 in / s (2,54 m / s), resultando em uma taxa de dados de 12.800 caracteres por segundo. Das oito trilhas, seis eram dados, uma era para paridade e uma era um relógio, ou trilha de tempo. Levando em consideração o espaço vazio entre os blocos de fita, a taxa de transferência real era de cerca de 7.200 caracteres por segundo. Um pequeno rolo de fita mylar separou a fita de metal e o cabeçote de leitura / gravação.

Formatos IBM

10+Carretel de 12 polegadas (270 mm) de diâmetro de fita de 9 trilhas

Os computadores IBM da década de 1950 usavam fita revestida de óxido férrico semelhante à usada na gravação de áudio. A tecnologia da IBM logo se tornou o padrão da indústria de fato . As dimensões da fita magnética eram de 0,5 polegadas (12,7 mm) de largura e enroladas em bobinas removíveis. Diferentes comprimentos de fita estavam disponíveis com 1.200 pés (370 m) e 2.400 pés (730 m) em mil e meia de espessura sendo um pouco padrão. Durante a década de 1980, comprimentos de fita mais longos, como 3.600 pés (1.100 m), tornaram-se disponíveis usando um filme PET muito mais fino . A maioria das unidades de fita pode suportar um tamanho máximo de bobina de 10,5 polegadas (267 mm). Um chamado minirretel era comum para conjuntos de dados menores, como para distribuição de software. Eram bobinas de 7 polegadas (18 cm), geralmente sem comprimento fixo - a fita era dimensionada para caber na quantidade de dados gravados nela como uma medida de economia de custos.

O CDC usou fitas magnéticas de 12 polegadas (13 mm) compatíveis com IBM , mas também ofereceu uma variante de 1 polegada de largura (25 mm), com 14 trilhas (12 trilhas de dados correspondendo à palavra de 12 bits dos processadores periféricos da série CDC 6000 , mais dois bits de paridade) na unidade CDC 626.

Os primeiros drives de fita da IBM, como o IBM 727 e o IBM 729 , eram drives de chão mecanicamente sofisticados que usavam colunas de vácuo para armazenar longos loops de fita em forma de U. Entre o servo controle de motores potentes de bobina, um acionamento de cabrestante de baixa massa e a baixa fricção e tensão controlada das colunas de vácuo, o início e a parada rápidos da fita na interface fita-cabeça podem ser alcançados. A aceleração rápida é possível porque a massa da fita nas colunas de vácuo é pequena; o comprimento da fita protegida nas colunas fornece tempo para acelerar as bobinas de alta inércia . Quando ativas, as duas bobinas de fita alimentam ou puxam a fita para fora das colunas de vácuo, girando intermitentemente em rajadas rápidas e não sincronizadas, resultando em uma ação visualmente impressionante. Imagens de estoque de tais unidades de fita de coluna a vácuo em movimento eram ironicamente usadas para representar computadores em filmes e televisão.

As primeiras fitas de meia polegada tinham sete trilhas paralelas de dados ao longo do comprimento da fita, permitindo caracteres de seis bits mais um bit de paridade gravado na fita. Isso era conhecido como fita de sete faixas . Com a introdução do mainframe IBM System / 360 , fitas de nove trilhas foram introduzidas para oferecer suporte aos novos caracteres de 8 bits que eram usados. O final de um arquivo era designado por um padrão especial de gravação denominado marca de fita , e o final dos dados gravados em uma fita por duas marcas de fita sucessivas. O início e o fim físicos da fita utilizável foram indicados por tiras adesivas reflexivas de folha de alumínio colocadas na parte de trás.

A densidade de gravação aumentou com o tempo. As densidades comuns de sete trilhas começaram com 200 caracteres de seis bits por polegada (CPI), depois 556 e finalmente 800. As fitas de nove trilhas tinham densidades de 800 (usando NRZI ), depois 1600 (usando PE ) e finalmente 6250 (usando GCR ). Isso se traduz em cerca de 5 megabytes a 140 megabytes por  bobina de fita de comprimento padrão (2.400 pés). A densidade efetiva também aumentou à medida que a lacuna entre blocos (lacuna entre registros ) diminuiu de 34 polegadas (19 mm) nominal em um carretel de fita de sete trilhas para 0,30 polegadas (7,6 mm) em uma bobina de fita de nove trilhas de 6250 bpi.

Pelo menos em parte devido ao sucesso do System / 360 e à padronização resultante em códigos de caracteres de 8 bits e endereçamento de bytes, as fitas de nove trilhas foram amplamente utilizadas na indústria de computadores durante as décadas de 1970 e 1980. A IBM descontinuou novos produtos bobina a bobina, substituindo-os por produtos baseados em cartuchos, começando em 1984 com a introdução da família 3480 baseada em cartuchos .

Formato DEC

LINCtape , e seu derivado, DECtape foram variações dessa "fita redonda". Eles eram essencialmente um meio de armazenamento pessoal. usou fita com 0,75 polegadas (19 mm) de largura e apresentava uma trilha de formatação fixa que, ao contrário da fita padrão, tornava possível ler e reescrever blocos repetidamente no lugar. LINCtapes e DECtapes tinham capacidade e taxa de transferência de dados semelhantes aos disquetes que os substituíram, mas seus tempos de acesso eram da ordem de trinta segundos a um minuto.

Cartuchos e cassetes

Cartuchos de um quarto de polegada

No contexto de fita magnética, o termo cassete ou cartucho significa um pedaço de fita magnética em um invólucro de plástico com uma ou duas bobinas para controlar o movimento da fita. O tipo de embalagem afeta os tempos de carregamento e descarregamento, bem como o comprimento da fita que pode ser presa. Em um cartucho de bobina única, há uma bobina de recolhimento na unidade, enquanto um cartucho de bobina dupla tem bobinas de recolhimento e de suprimento no cartucho. Uma unidade de fita usa um ou mais motores precisamente controlados para enrolar a fita de uma bobina para a outra, passando um cabeçote de leitura / gravação.

Um cartucho de dados IBM 3590 pode conter até 10 GiB descompactado.

Um tipo diferente é o cartucho de fita sem fim , que tem um loop contínuo de fita enrolado em uma bobina especial que permite que a fita seja retirada do centro da bobina e depois enrolada em torno da borda e, portanto, não precisa rebobinar para repetir . Esse tipo é semelhante a um cartucho de bobina única, pois não há bobina de recolhimento dentro da unidade de fita.

O drive IBM 7340 Hypertape, lançado em 1961, usava um cassete de bobina dupla com uma fita de 2,5 cm de largura, capaz de conter 2 milhões de caracteres de seis bits por cassete.

Nas décadas de 1970 e 1980, os cassetes compactos de áudio eram freqüentemente usados ​​como um sistema de armazenamento de dados barato para computadores domésticos ou, em alguns casos, para diagnósticos ou código de inicialização para sistemas maiores, como o Burroughs B1700 . Os cassetes compactos são logicamente, bem como fisicamente, sequenciais; eles devem ser rebobinados e lidos desde o início para carregar os dados. Os primeiros cartuchos estavam disponíveis antes que os computadores pessoais tivessem unidades de disco acessíveis e podiam ser usados ​​como dispositivos de acesso aleatório , enrolando e posicionando automaticamente a fita, embora com tempos de acesso de muitos segundos.

Em 1984, a IBM introduziu a família 3480 de cartuchos de carretel único e unidades de fita que foram fabricados por vários fornecedores até pelo menos 2004. Fornecendo inicialmente 200 megabytes por cartucho, a capacidade da família aumentou com o tempo para 2,4 gigabytes por cartucho. DLT (Digital Linear Tape), também uma fita baseada em cartucho, estava disponível no início de 1984, mas em 2007 o desenvolvimento futuro foi interrompido em favor do LTO.

Em 2003, a IBM apresentou a família 3592 para substituir o IBM 3590 . Embora o nome seja semelhante, não há compatibilidade entre o 3590 e o 3592. Como o 3590 e o 3480 antes dele, este formato de fita tem uma fita de 12 polegadas (13 mm) enrolada em um único cartucho de carretel. Inicialmente introduzida para suportar 300 gigabytes, a sexta geração lançada em 2018 suporta uma capacidade nativa de 20 terabytes.

O cartucho de bobina simples Linear Tape-Open (LTO) foi anunciado em 1997 com 100 megabytes e em sua oitava geração suporta 12 terabytes no mesmo tamanho de cartucho. A partir de 2019, a LTO substituiu completamente todas as outras tecnologias de fita em aplicativos de computador, com exceção de algumas famílias IBM 3592 de ponta.

Detalhes técnicos

Densidade linear

Bytes por polegada (BPI) é a métrica para a densidade na qual os dados são armazenados em mídia magnética. O termo BPI pode se referir a bits por polegada, mas mais frequentemente se refere abytespor polegada.

O termo BPI pode significar bytes por polegada quando as faixas de um determinado formato são organizadas em bytes, como em fitas de 9 faixas.

Largura da fita

A largura da mídia é o principal critério de classificação para tecnologias de fita. Uma meia polegada (13 mm) tem sido historicamente a largura mais comum de fita para armazenamento de dados de alta capacidade. Muitos outros tamanhos existem e a maioria foi desenvolvida para ter embalagens menores ou maior capacidade.

Método de gravação

Linear

O método de gravação também é uma maneira importante de classificar tecnologias de fita, geralmente caindo em duas categorias: linear e varredura.

Linear

Serpentina linear

O método linear organiza os dados em longas trilhas paralelas que abrangem o comprimento da fita. Múltiplas cabeças de fita gravam simultaneamente trilhas de fita paralelas em uma única mídia. Este método foi usado nas primeiras unidades de fita. É o método de gravação mais simples, mas também possui a densidade de dados mais baixa.

Uma variação da tecnologia linear é a gravação serpentina linear, que usa mais trilhas do que cabeças de fita. Cada cabeça ainda grava uma faixa por vez. Depois de fazer uma passagem por toda a extensão da fita, todas as cabeças se movem levemente e fazem outra passagem na direção reversa, gravando outro conjunto de faixas. Este procedimento é repetido até que todas as faixas tenham sido lidas ou gravadas. Usando o método da serpentina linear, o meio de fita pode ter muito mais trilhas do que cabeças de leitura / gravação. Em comparação com a gravação linear simples, usando o mesmo comprimento de fita e o mesmo número de cabeças, a capacidade de armazenamento de dados é substancialmente maior.

Scanning

Helicoidal

Os métodos de varredura de gravação gravam trilhas curtas e densas ao longo da largura da mídia de fita, não ao longo do comprimento. Os cabeçotes de fita são colocados em um tambor ou disco que gira rapidamente enquanto a fita, de movimento relativamente lento, passa por ele.

Um método antigo usado para obter uma taxa de dados mais alta do que o método linear predominante era a varredura transversal . Neste método, um disco giratório com as cabeças da fita embutidas na borda externa é colocado perpendicularmente ao caminho da fita. Este método é usado nos gravadores de dados de instrumentação DCRsi da Ampex e no antigo sistema de fita de vídeo quadruplex Ampex . Outro método antigo era a varredura arqueada . Neste método, as cabeças estão na face de um disco giratório que é colocado plano contra a fita. O caminho das cabeças da fita forma um arco.

A gravação de varredura helicoidal grava trilhas curtas e densas em diagonal . Este método é usado por praticamente todos os sistemas de fitas de vídeo atuais e vários formatos de fitas de dados.

Layout de bloco e correspondência de velocidade

Em um formato típico, os dados são gravados na fita em blocos com intervalos entre os blocos e cada bloco é gravado em uma única operação com a fita em execução contínua durante a gravação. No entanto, uma vez que a taxa na qual os dados são gravados ou lidos na unidade de fita não é determinística, uma unidade de fita geralmente tem que lidar com uma diferença entre a taxa na qual os dados entram e saem da fita e a taxa em que os dados são fornecidos ou exigido por seu hospedeiro.

Vários métodos foram usados ​​sozinhos e em combinação para lidar com essa diferença. Se o host não puder acompanhar a taxa de transferência da unidade de fita, a unidade de fita pode ser interrompida, submetida a backup e reiniciada (conhecido como sapata , com a reinicialização opcionalmente ocorrendo em uma velocidade mais baixa). Um grande buffer de memória pode ser usado para enfileirar os dados. No passado, o tamanho do bloco do host afetava a densidade dos dados na fita, mas nas unidades modernas, os dados são normalmente organizados em blocos de tamanho fixo que podem ou não ser compactados e / ou criptografados, e o tamanho do bloco do host não afeta mais a densidade dos dados em fita. O artigo Linear Tape-Open cobre isso. As unidades de fita modernas oferecem um recurso de correspondência de velocidade, em que a unidade pode diminuir dinamicamente a velocidade física da fita conforme necessário para evitar engraxar os sapatos.

No passado, o tamanho da lacuna entre blocos era constante, enquanto o tamanho do bloco de dados era baseado no tamanho do bloco do host, afetando a capacidade da fita - por exemplo, no armazenamento de dados chave de contagem . Na maioria das unidades modernas, isso não é mais verdade. As unidades do tipo Linear Tape-Open usam um bloco de tamanho fixo para fita (uma arquitetura de bloco fixo ), independente do tamanho do bloco do host, e a lacuna entre os blocos é variável para auxiliar na correspondência de velocidade durante as gravações. Em unidades com compactação, a compactação dos dados afetará a capacidade.

Acesso sequencial aos dados

A fita é caracterizada pelo acesso sequencial aos dados. Embora a fita possa fornecer transferências de dados sequenciais rápidas, leva dezenas de segundos para carregar uma fita e posicionar a cabeça da fita em um local arbitrário. Por outro lado, a tecnologia de disco rígido pode realizar a ação equivalente em dezenas de milissegundos (3 ordens de magnitude mais rápido) e pode ser considerada como oferecendo acesso aleatório aos dados.

Os sistemas de arquivos lógicos requerem que os dados e metadados sejam armazenados no meio de armazenamento de dados. Armazenar metadados em um local e dados em outro requer muita atividade de reposicionamento lento na maioria dos sistemas de fita. Como resultado, a maioria dos sistemas de fita usa um sistema de arquivos trivial no qual os arquivos são endereçados por número, não por nome de arquivo. Metadados como nome de arquivo ou hora de modificação geralmente não são armazenados. As etiquetas de fita armazenam esses metadados e são usadas para trocar dados entre sistemas. Arquivador de arquivos e ferramentas de backup foram criados para compactar vários arquivos junto com os metadados relacionados em um único 'arquivo de fita'. As unidades de fita serpentina (por exemplo, QIC ) podem melhorar o tempo de acesso mudando para a trilha apropriada; partições de fita foram usadas para informações de diretório. O Linear Tape File System é um método de armazenamento de metadados de arquivo em uma parte separada da fita. Isso possibilita copiar e colar arquivos ou diretórios em uma fita como se fosse igual a outro disco, mas não altera a natureza fundamental do acesso sequencial da fita.

Tempo de acesso

A fita tem uma latência bastante longa para acessos aleatórios, uma vez que o deck deve enrolar em média um terço do comprimento da fita para se mover de um bloco de dados arbitrário para outro. A maioria dos sistemas de fita tenta aliviar a longa latência intrínseca, seja usando indexação, onde uma tabela de pesquisa separada ( diretório de fita ) é mantida, o que dá a localização física da fita para um determinado número de bloco de dados (uma obrigação para unidades serpentinas), ou marcando blocos com uma marca de fita que pode ser detectada ao enrolar a fita em alta velocidade.

Compressão de dados

A maioria das unidades de fita agora inclui algum tipo de compactação de dados sem perdas . Existem vários algoritmos que fornecem resultados semelhantes: LZ (a maioria), IDRC (Exabyte), ALDC (IBM, QIC) e DLZ1 (DLT). Incorporados no hardware da unidade de fita, eles compactam um buffer relativamente pequeno de dados por vez, portanto, não podem atingir uma compactação extremamente alta, mesmo de dados altamente redundantes. Uma proporção de 2: 1 é típica, com alguns fornecedores reivindicando 2,6: 1 ou 3: 1. A proporção realmente obtida com dados reais é freqüentemente menor do que o valor declarado; a taxa de compactação não pode ser considerada ao especificar a capacidade do equipamento, por exemplo, uma unidade que afirma ter uma capacidade compactada de 500 GB pode não ser adequada para fazer backup de 500 GB de dados reais. Os dados que já estão armazenados de forma eficiente podem não permitir nenhuma compactação significativa; um banco de dados esparso pode oferecer fatores muito maiores. A compactação de software pode obter resultados muito melhores com dados esparsos, mas usa o processador do computador host e pode tornar o backup mais lento se não for possível compactar tão rápido quanto os dados são gravados.

Os algoritmos de compactação usados ​​em produtos de baixo custo não são os mais eficazes conhecidos hoje, e melhores resultados geralmente podem ser obtidos desligando a compactação de hardware E usando compactação de software (e criptografia, se desejado).

Texto simples, imagens brutas e arquivos de banco de dados ( TXT , ASCII , BMP , DBF , etc.) normalmente compactam muito melhor do que outros tipos de dados armazenados em sistemas de computador. Por outro lado, os dados criptografados e os dados pré-compactados ( PGP , ZIP , JPEG , MPEG , MP3 , etc.) normalmente aumentam de tamanho se a compactação de dados for aplicada. Em alguns casos, essa expansão de dados pode chegar a 15%.

Encriptação

Existem padrões para criptografar fitas. A criptografia é usada para que, mesmo se uma fita for roubada, os ladrões não possam usar os dados na fita. O gerenciamento de chaves é crucial para manter a segurança. A compactação é mais eficiente se feita antes da criptografia, pois os dados criptografados não podem ser compactados de forma eficaz devido à entropia que introduz. Algumas unidades de fita corporativas podem criptografar dados rapidamente. Algoritmos de criptografia de streaming simétrico também podem fornecer alto desempenho.

Memória do cartucho e auto-identificação

Alguns cartuchos de fita, principalmente os cartuchos LTO , têm pequenos chips de armazenamento de dados associados embutidos nos cartuchos para registrar metadados sobre a fita, como o tipo de codificação, o tamanho do armazenamento, datas e outras informações. Também é comum que os cartuchos de fita tenham códigos de barras em suas etiquetas para auxiliar uma biblioteca de fitas automatizada.

Viabilidade

A fita permanece viável em data centers modernos porque:

  1. é o meio de menor custo para armazenar grandes quantidades de dados;
  2. como meio removível, permite a criação de um espaço de ar que pode impedir que os dados sejam hackeados, criptografados ou excluídos;
  3. sua longevidade permite a retenção de dados estendida que pode ser exigida por agências reguladoras.

As camadas de menor custo de armazenamento em nuvem também podem ser fitas.

Mídia magnética de alta densidade

Em 2014, a Sony anunciou que havia desenvolvido, usando uma nova tecnologia de formação de película fina a vácuo capaz de formar partículas de cristal extremamente finas, uma tecnologia de armazenamento em fita com a maior densidade de dados de fita magnética relatada, 148 Gbit / in² (23 Gbit / cm²) , potencialmente permitindo uma capacidade de fita nativa de 185 TB. Foi desenvolvido pela Sony , com anúncio em 2017, sobre densidade de dados relatada de 201 Gbit / in² (31 Gbit / cm²), dando capacidade de fita compactada padrão de 330 TB.

Em maio de 2014, a Fujifilm acompanhou a Sony e anunciou que desenvolverá um cartucho de fita de 154 TB em conjunto com a IBM , que terá uma densidade de armazenamento de dados de área de 85,9 GBit / in² (13,3 bilhões de bits por cm²) em fita particulada magnética linear . A tecnologia desenvolvida pela Fujifilm, denominada NANOCUBIC, reduz o volume de partículas da fita magnética BaFe, aumentando simultaneamente a lisura da fita, aumentando a relação sinal / ruído durante a leitura e gravação e permitindo a resposta em alta frequência.

Em dezembro de 2020, a Fujifilm e a IBM anunciaram uma tecnologia que poderia resultar em uma fita cassete com capacidade de 580 terabytes, usando ferrita de estrôncio como meio de gravação.

Lista cronológica de formatos de fita

IBM 729V

Veja também

Notas

Referências

links externos