Projeto Genoma da BBC - BBC Genome Project

Logotipo da BBC Genome

O Projeto Genoma da BBC é um banco de dados pesquisável online de listagens de programas, inicialmente com base no conteúdo do Radio Times da primeira edição em 1923 a 2009. As listagens de televisão pós-2009 podem ser acessadas através do site de Programas da BBC.

História

Anterior

BBC Genome não é o primeiro banco de dados pesquisável online. Em abril de 2006, eles deram ao público acesso ao Infax - seu único banco de dados eletrônico de programas na época. Continha cerca de 900.000 entradas, mas nem todos os programas já transmitidos, e encerrou a operação em dezembro de 2007. A página inicial do site ainda está disponível para visualização no Arquivo da Internet . Depois que o Infax foi encerrado, uma mensagem no site dizia que ele seria incorporado às informações nas páginas individuais do programa. Em 2012, o Infax foi substituído pelo banco de dados Fabric, mas isso é apenas para uso interno na BBC.

Radio Times

Captura de tela de um erro de OCR (desde que corrigido) no Genome. O texto, "O Natal de Uza TarbuclC", deveria ser " O Natal de Liza Tarbuck ".

Em dezembro de 2012, a BBC concluiu um exercício de digitalização, examinando as listagens do Radio Times de todos os programas da BBC de 1923 a 2009 de uma tiragem inteira de cerca de 4.500 cópias da revista. Eles identificaram cerca de cinco milhões de programas envolvendo 8,5 milhões de atores, apresentadores, escritores e equipe técnica. O Genoma da BBC foi lançado para uso público em 15 de outubro de 2014.

As listagens são publicadas com antecedência e, portanto, não incluem alterações tardias ou cancelamentos que foram refletidos no Infax. No entanto, eles incluem um grande número de transmissões iniciais de rádio e televisão e "programas de DJ" da BBC Radio 1 e BBC Radio 2 que raramente eram mantidos oficialmente, que não eram listados no Infax (que também não costumava incluir repetições de programas arquivados antes de 1976) porque não estavam nos arquivos da BBC. Os problemas foram digitalizados em alta resolução , produzindo imagens TIFF e reconhecimento óptico de caracteres foi usado para transformar o texto da página em texto pesquisável no banco de dados do Genome.

O objetivo deste projeto é permitir que os pesquisadores sejam capazes de encontrar informações mais facilmente e ajudar os Arquivos da BBC a construir uma imagem do que existe e do que está faltando no arquivo. Correções para erros de OCR e alterações nas programações anunciadas estão sendo feitas por crowdsourcing , com mais de 440.910 edições geradas pelo usuário aceitas após a revisão editorial em meados de dezembro de 2018. Cada entrada da lista tem um identificador exclusivo que pode ser expresso como um URL. Por exemplo, a primeira triagem de Doctor Who é http://genome.ch.bbc.co.uk/8f81c193ba224e84981f353cae480d49. Um programa de transmissão pode ter mais de um identificador, se foi transmitido (e, portanto, listado) em ocasiões repetidas ou em regiões diferentes.

Outro conteúdo

Edições digitalizadas de revistas inteiras (incluindo capas, artigos em prosa, anúncios e outros conteúdos não listados) da década de 1920 foram adicionadas em março de 2017; para a década de 1930 em dezembro de 2017; para a década de 1940 em dezembro de 2018; e para a década de 1950 em dezembro de 2019.

Listagens ausentes

Data de emissão Razão
14 de maio de 1926 Greve geral
21 de fevereiro de 1947 Crise de combustível
28 de fevereiro de 1947
8 de setembro de 1950 Disputa de impressão
13 de outubro de 1950
20 de outubro de 1950
27 de outubro de 1950
1 de agosto de 1981
2 de abril de 1983
9 de abril de 1983
3 de dezembro de 1983

Veja também

Referências

links externos