Gene de sobreposição - Overlapping gene

Um gene sobreposto (ou OLG ) é um gene cuja sequência de nucleotídeos expressável se sobrepõe parcialmente à sequência de nucleotídeos expressável de outro gene. Desse modo, uma sequência de nucleotídeos pode contribuir para a função de um ou mais produtos gênicos . A definição atual de um gene sobreposto varia significativamente entre eucariotos, procariotos e vírus. Em procariotos e vírus, a sobreposição deve ser entre sequências de codificação , mas não transcritos de mRNA , enquanto em eucariotos a sobreposição de genes é quase sempre definida como a sobreposição de transcritos de mRNA.

Sobreimpressão refere - se a um tipo de sobreposição em que toda ou parte da sequência de um gene é lida em um quadro de leitura alternativo de outro gene no mesmo locus . Overprinting tem sido implicado como um mecanismo para de novo surgimento de novos genes a partir de sequências existentes, quer genes mais velhos ou previamente n codificantes regiões do genoma. Genes sobreimpressos são características particularmente comuns da organização genômica dos vírus, provavelmente aumentando muito o número de genes expressáveis ​​em potencial a partir de um pequeno conjunto de informações genéticas virais.

Classificação

Sobreposição fora de fase em tandem dos genes mitocondriais humanos ATP8 (quadro +1, em vermelho) e ATP6 (quadro +3, em azul)

Os genes podem se sobrepor de várias maneiras e podem ser classificados por suas posições em relação uns aos outros.

  • Sobreposição unidirecional ou em tandem : a extremidade 3 ' de um gene se sobrepõe à extremidade 5' de outro gene na mesma fita. Este arranjo pode ser simbolizado com a notação → → onde as setas indicam o quadro de leitura do início ao fim.
  • Sobreposição convergente ou terminal : as extremidades 3 ' dos dois genes se sobrepõem em fitas opostas. Isso pode ser escrito como → ←.
  • Divergente ou cauda-de sobreposição: o 5' extremidades dos dois genes se sobrepõem em cadeias opostas. Isso pode ser escrito como ← →.

Genes sobrepostos também podem ser classificados por fases , que descrevem seus quadros de leitura relativos :

  • A sobreposição em fase ocorre quando as sequências compartilhadas usam o mesmo quadro de leitura. Isso também é conhecido como "fase 0". Genes unidirecionais com sobreposição de fase 0 não são considerados genes distintos, mas sim como locais de início alternativos do mesmo gene.
  • As sobreposições fora de fase ocorrem quando as sequências compartilhadas usam quadros de leitura diferentes. Isso pode ocorrer na "fase 1" ou na "fase 2", dependendo se os quadros de leitura são deslocados por 1 ou 2 nucleotídeos. Como um códon tem três nucleotídeos de comprimento, um deslocamento de três nucleotídeos é um quadro de fase 0 em fase.

Evolução

Genes sobrepostos são particularmente comuns em genomas de evolução rápida, como os de vírus , bactérias e mitocôndrias . Eles podem se originar de três maneiras:

  1. Por extensão de uma estrutura de leitura aberta (ORF) existente a jusante em um gene contíguo devido à perda de um códon de parada ;
  2. Por extensão de uma ORF existente a montante em um gene contíguo devido à perda de um códon de iniciação ;
  3. Pela geração de uma nova ORF dentro de uma existente devido a uma mutação pontual .

O uso da mesma sequência de nucleotídeos para codificar vários genes pode fornecer vantagem evolutiva devido à redução no tamanho do genoma e devido à oportunidade de co-regulação transcricional e translacional dos genes sobrepostos. As sobreposições de genes introduzem novas restrições evolutivas nas sequências das regiões de sobreposição.

Origens de novos genes

Um cladograma que indica a provável trajetória evolutiva da região pX densa de genes no vírus T-linfotrópico humano 1 (HTLV1), um deltaretrovírus associado a cânceres sanguíneos. Esta região contém numerosos genes sobrepostos, vários dos quais provavelmente se originaram de novo por meio de impressão sobreposta.

Em 1977, Pierre-Paul Grassé propôs que um dos genes do par poderia ter se originado de novo por mutações para introduzir novas ORFs em quadros de leitura alternados; ele descreveu o mecanismo como impressão sobreposta . Posteriormente, foi comprovado por Susumu Ohno , que identificou um gene candidato que pode ter surgido por esse mecanismo. Alguns genes de novo originados dessa forma podem não permanecer sobrepostos, mas subfuncionalizar após a duplicação do gene , contribuindo para a prevalência de genes órfãos . Qual membro de um par de genes sobrepostos é mais jovem pode ser identificado bioinformaticamente por uma distribuição filogenética mais restrita ou pelo uso de códons menos otimizado . Os membros mais jovens do par tendem a ter maior desordem estrutural intrínseca do que os membros mais velhos, mas os membros mais velhos também são mais desordenados do que outras proteínas, presumivelmente como uma forma de aliviar as crescentes restrições evolutivas impostas pela sobreposição. As sobreposições têm maior probabilidade de se originar em proteínas que já apresentam alto distúrbio.

Distribuição taxonômica

Genes sobrepostos no genoma do bacteriófago ΦX174. Existem 11 genes neste genoma (A, A *, BH, J, K). Os genes B, K, E se sobrepõem aos genes A, C, D.

A sobreposição de genes ocorre em todos os domínios da vida , embora com frequências variáveis. Eles são especialmente comuns em genomas virais .

Vírus

O supressor de silenciamento de RNA p19 do vírus dublê de tomate , uma proteína codificada por um gene sobreimpresso. A proteína se liga especificamente a siRNAs produzidos como parte da defesa silenciadora de RNA da planta contra vírus.

A existência de genes sobrepostos foi identificada pela primeira vez em vírus; o primeiro genoma de DNA já sequenciado, do bacteriófago ΦX174 , continha vários exemplos. Outro exemplo é o gene ORF3d no vírus SARS-CoV 2 . Genes sobrepostos são particularmente comuns em genomas virais . Alguns estudos atribuem essa observação à pressão seletiva para pequenos tamanhos de genoma mediados pelas restrições físicas de empacotar o genoma em um capsídeo viral , particularmente um de geometria icosaédrica . No entanto, outros estudos contestam essa conclusão e argumentam que a distribuição de sobreposições em genomas virais é mais provável de refletir a sobreposição como a origem evolutiva de genes virais sobrepostos. A impressão sobreposta é uma fonte comum de genes de novo em vírus.

Estudos de genes virais sobreimpressos sugerem que seus produtos proteicos tendem a ser proteínas acessórias que não são essenciais para a proliferação viral, mas contribuem para a patogenicidade . As proteínas sobreimpressas geralmente têm distribuições incomuns de aminoácidos e altos níveis de distúrbio intrínseco . Em alguns casos, as proteínas impressas têm estruturas tridimensionais bem definidas, mas novas; um exemplo é o supressor de silenciamento de RNA p19 encontrado em Tombusvírus , que tem uma nova dobra de proteína e um novo modo de ligação no reconhecimento de siRNAs .

Procariontes

As estimativas de sobreposição de genes em genomas bacterianos normalmente descobrem que cerca de um terço dos genes bacterianos estão sobrepostos, embora geralmente apenas por alguns pares de bases. A maioria dos estudos de sobreposição em genomas bacterianos encontra evidências de que a sobreposição tem uma função na regulação do gene , permitindo que os genes sobrepostos sejam co-regulados transcricionalmente e traducionalmente . Em genomas procarióticos, as sobreposições unidirecionais são mais comuns, possivelmente devido à tendência dos genes procarióticos adjacentes de compartilharem a orientação. Entre as sobreposições unidirecionais, as sobreposições longas são mais comumente lidas com um deslocamento de um nucleotídeo no quadro de leitura (ou seja, fase 1) e as sobreposições curtas são mais comumente lidas na fase 2. As sobreposições longas de mais de 60 pares de bases são mais comuns para genes convergentes ; no entanto, as sobreposições longas putativas têm taxas muito altas de erros de anotação . São raros os exemplos fortemente validados de sobreposições longas em genomas bacterianos; no organismo modelo bem estudado Escherichia coli , apenas quatro pares de genes são bem validados como tendo sobreposições longas e sobrepostas.

Eucariotos

Em comparação com os genomas procarióticos, os genomas eucarióticos são frequentemente mal anotados e, portanto, identificar sobreposições genuínas é relativamente desafiador. No entanto, exemplos de sobreposições de genes validados foram documentados em uma variedade de organismos eucarióticos, incluindo mamíferos como camundongos e humanos. Os eucariotos diferem dos procariontes na distribuição dos tipos de sobreposição: enquanto as sobreposições unidirecionais (isto é, mesma fita) são mais comuns em procariotos, as sobreposições de fita oposta ou antiparalela são mais comuns em eucariotos. Entre as sobreposições de fitas opostas, a orientação convergente é a mais comum. A maioria dos estudos de sobreposição de genes eucarióticos descobriram que genes sobrepostos estão extensivamente sujeitos à reorganização genômica, mesmo em espécies intimamente relacionadas e, portanto, a presença de uma sobreposição nem sempre é bem conservada. A sobreposição com genes mais antigos ou menos restritos taxonomicamente também é uma característica comum de genes que provavelmente se originaram de novo em uma determinada linhagem eucariótica.

Função

As funções precisas dos genes sobrepostos parecem variar entre os domínios da vida, mas vários experimentos mostraram que eles são importantes para os ciclos de vida do vírus por meio da expressão protéica adequada e estequiometria, bem como desempenham um papel no enovelamento adequado das proteínas. Uma versão do bacteriófago ΦX174 também foi criada, em que todas as sobreposições de genes foram removidas, provando que não eram necessárias para a replicação.

Referências