OrthoDB - OrthoDB

OrthoDB
OrthoDB logo.png
Contente
Descrição Catálogo de ortólogos .
Contato
Centro de Pesquisa Instituto Suíço de Bioinformática
Laboratório Computational Evolutionary Genomics Group
Autores Evgenia V. Kriventseva
Citação primária Kriventseva et al. (2015)
Data de lançamento 2007
Acesso
Local na rede Internet www .orthodb .org
URL de download https://www.orthodb.org/?page=filelist
Endpoint Sparql sparql .orthodb .org / sparql
Diversos
Licença CC-BY-3.0

OrthoDB apresenta um catálogo de genes codificadores de proteínas ortólogos em vertebrados , artrópodes , fungos , plantas e bactérias . A ortologia se refere ao último ancestral comum da espécie em consideração e, portanto, OrthoDB delineia explicitamente os ortólogos em cada radiação principal ao longo da filogenia da espécie. O banco de dados de ortólogos apresenta descritores de proteínas disponíveis, juntamente com os atributos Gene Ontology e InterPro , que servem para fornecer anotações descritivas gerais dos grupos ortólogos e facilitar a consulta abrangente do banco de dados de ortologia. OrthoDB também fornece características evolutivas computadas de ortólogos, como duplicação de genes e perfis de perda, taxas de divergência, grupos de irmãos e arquiteturas de íntron-exon de gene.

Em genômica comparada, a importância da escala não pode ser subestimada. Como o delineamento da ortologia do gene requer conhecimento específico e recursos computacionais consideráveis, escala é algo que grupos de pesquisa não especializados individuais não podem realizar por conta própria. Esta tarefa desafiadora é alcançada pelo OrthoDB , com conjuntos muito abrangentes de espécies e vários recursos exclusivos, como as extensas anotações funcionais e evolutivas de grupos ortólogos, com a integração de muitos links úteis para outros bancos de dados líderes mundiais que se concentram na captura de informações sobre genes função. Nenhum genoma pode existir como uma fonte de dados útil sem extensas análises comparativas com outros genomas - OrthoDB fornece um recurso criticamente importante para a genômica comparativa para toda a comunidade de pesquisadores, desde aqueles interessados ​​em grandes questões evolutivas até aqueles focados nas funções biológicas específicas de genes individuais .

Metodologia

A ortologia é definida em relação ao último ancestral comum da espécie considerada, determinando assim a natureza hierárquica das classificações ortólogas. Isso é explicitamente abordado no OrthoDB pela aplicação do procedimento de delineamento de ortologia em cada ponto principal de radiação da filogenia considerada. A implementação do OrthoDB emprega um algoritmo de agrupamento Best-Reciprocal-Hit (BRH) baseado em comparações de sequência de proteínas Smith-Waterman todos contra todos . O pré-processamento do conjunto de genes seleciona o transcrito de codificação de proteína mais longo de genes com splicing alternativo e de cópias de genes muito semelhantes. O procedimento triangula BRHs para construir progressivamente os clusters e requer uma sobreposição de alinhamento de sequência mínima geral para evitar a caminhada no domínio. Esses núcleos centrais são expandidos para incluir todos os parálogos dentro da espécie mais intimamente relacionados e as cópias de genes muito semelhantes anteriormente identificadas.

Conteúdo de dados

O banco de dados contém cerca de 600 espécies eucarióticas e mais de 3600 bactérias provenientes de Ensembl , UniProt , NCBI , FlyBase e vários outros bancos de dados. A amostragem cada vez maior de genomas sequenciados traz um relato mais claro da maioria das genealogias de genes que facilitarão hipóteses informadas sobre a função do gene em genomas recém-sequenciados.

Exemplos de estudos que empregaram dados do OrthoDB incluem análises comparativas da evolução do repertório de genes , comparações de genes de desenvolvimento de mosca-das-frutas e mosquitos , análises de alterações induzidas por farinha de sangue ou infecção na expressão gênica em mosquitos , análise da evolução da produção de leite de mamífero , e evolução do gene e do genoma do mosquito . Outros estudos citando OrthoDB podem ser encontrados no PubMed e no Google Scholar .

atuação

OrthoDB tem apresentado um bom desempenho consistente em avaliações de benchmarking ao lado de outros procedimentos de delineamento de ortologia. Os resultados foram comparados a árvores de referência para três famílias de proteínas bem conservadas e a um conjunto maior de famílias de proteínas com curadoria.

BUSCO

B enchmarking conjuntos de L niversal Si ngle- C opy O rthologs - grupos Orthologous são seleccionados a partir de OrthoDB para as classificações de nível de raiz de artrópodes, vertebrados, metazoários, fungos, e outros clados principais. Os grupos devem conter ortólogos de cópia única em pelo menos 90% das espécies (em outros, eles podem ser perdidos ou duplicados), e as espécies ausentes não podem ser todas do mesmo clado. As espécies com perdas ou duplicações frequentes são removidas da seleção, a menos que ocupem uma posição chave na filogenia. Espera- se, portanto, que BUSCOs sejam encontrados como ortólogos de cópia única em qualquer genoma recentemente sequenciado do clado filogenético apropriado e podem ser usados ​​para analisar genomas sequenciados recentemente para avaliar sua integridade relativa. A ferramenta de avaliação BUSCO e os conjuntos de dados (acessíveis aqui ) estão sendo amplamente usados ​​em muitos projetos de genômica, com a maioria dos editores de periódicos exigindo essas avaliações de qualidade antes de aceitar novas publicações do genoma.

Notas e referências

Veja também

links externos