ARN não codificante longo - Long non-coding RNA

Diferentes tipos de RNAs não codificantes longos.

RNAs não codificantes longos ( ncRNAs longos , lncRNA ) são um tipo de RNA , definido como transcrições de mais de 200 nucleotídeos que não são traduzidos em proteínas. Este limite arbitrário distingue ncRNAs longos de pequenos RNAs não codificantes, como microRNAs (miRNAs), pequenos RNAs de interferência (siRNAs), RNAs de interação com Piwi (piRNAs), pequenos RNAs nucleolares (snoRNAs) e outros RNAs curtos. Os RNAs não codificadores intergênicos de longa intervenção (lincRNAs) são sequências de lncRNA que não se sobrepõem aos genes codificadores de proteínas.

Abundância

Em 2007, um estudo descobriu que apenas um quinto da transcrição no genoma humano está associado a genes codificadores de proteínas, indicando pelo menos quatro vezes mais sequências não codificantes longas do que sequências de RNA codificantes. Projetos de sequenciamento de DNA complementar em larga escala (cDNA), como o FANTOM, revelam a complexidade dessa transcrição. O projeto FANTOM3 identificou ~ 35.000 transcrições não codificantes que carregam muitas assinaturas de RNAs mensageiros , incluindo capping 5 ' , splicing e poliadenilação, mas têm pouca ou nenhuma estrutura de leitura aberta (ORF). Este número representa uma estimativa inferior conservadora, uma vez que omitiu muitos transcritos singleton e transcritos não poliadenilados (os dados da matriz tiling mostram que mais de 40% dos transcritos são não poliadenilados). Identificar ncRNAs dentro dessas bibliotecas de cDNA é um desafio, uma vez que pode ser difícil distinguir transcritos codificadores de proteínas de transcritos não codificantes. Foi sugerido por meio de vários estudos que os testículos e os tecidos neurais expressam a maior quantidade de RNAs não codificantes longos de qualquer tipo de tecido . Usando FANTOM5, 27.919 ncRNAs longos foram identificados em várias fontes humanas.

Quantitativamente, os lncRNAs demonstram abundância ~ 10 vezes menor do que os mRNAs , o que é explicado pela maior variação célula a célula dos níveis de expressão dos genes lncRNA nas células individuais, quando comparados aos genes codificadores de proteínas. Em geral, a maioria (~ 78%) dos lncRNAs são caracterizados como específicos do tecido , em oposição a apenas ~ 19% dos mRNAs. Além de maior especificidade de tecido, lncRNAs são caracterizados por maior especificidade de estágio de desenvolvimento e especificidade de subtipo celular em tecidos como o neocórtex humano . Em 2018, uma integração abrangente de lncRNAs de bancos de dados existentes, literatura publicada e novos conjuntos de RNA com base na análise de dados de RNA-seq , revelou que há 270.044 transcritos de lncRNA em humanos.

Em comparação com mamíferos, relativamente poucos estudos enfocaram a prevalência de lncRNAs em plantas . No entanto, um estudo extenso considerando 37 espécies de plantas superiores e seis algas identificou ~ 200.000 transcrições não codificantes usando uma abordagem in-silico , que também estabeleceu o Green Non-Coding Database ( GreeNC ) associado , um repositório de lncRNAs de plantas.

Organização genômica

Em 2005, a paisagem do genoma dos mamíferos foi descrita como numerosos 'focos' de transcrição separados por longos trechos de espaço intergênico . Enquanto alguns ncRNAs longos estão localizados dentro dos trechos intergênicos, a maioria são transcritos sense e antisense sobrepostos que frequentemente incluem genes codificadores de proteínas, dando origem a uma hierarquia complexa de isoformas sobrepostas. As sequências genômicas dentro desses focos transcricionais são frequentemente compartilhadas dentro de uma série de transcritos codificantes e não codificantes nas direções sense e antisense. Por exemplo, 3012 de 8961 cDNAs previamente anotados como sequências de codificação truncadas dentro de FANTOM2 foram posteriormente designados como variantes genuínas de ncRNA da proteína -codificação de cDNAs. Embora a abundância e a conservação desses arranjos sugiram que eles têm relevância biológica, a complexidade desses focos impede uma avaliação fácil.

O consórcio GENCODE coletou e analisou um conjunto abrangente de anotações de lncRNA humano e sua organização genômica , modificações, localizações celulares e perfis de expressão em tecidos. Sua análise indica que os lncRNAs humanos apresentam uma tendência para os transcritos de dois exons .

Ferramentas de identificação de RNA não codificantes longas

Nome Espécies Servidor web Repositório Arquivo de entrada Modelo Principal / Algoritmo Conjunto de treinamento Ano publicado Referência
RNAsamba Tudo RNAsamba RNAsamba FASTA Redes neurais SIM 2020
LGC Planta / Animal LGC FASTA / BED / GTF Relação entre comprimento ORF e conteúdo GC NÃO 2019
CPAT Humano / Fly / Mouse / Zebrafish CPAT CPAT FASTA / BED Regressão Logística SIM 2013
VIR Planta / Humano / Rato / Mosca / Verme VIR VIR GTF Floresta Aleatória Equilibrada SIM 2017
lncRScan-SVM Humano N / D FASTA / BED / GTF / GFF Máquina de vetores de suporte SIM 2015
CNCI Planta / Animal N / D FASTA / GTF Máquina de vetores de suporte NÃO 2013
PLEK Vertebrado N / D PLEK FASTA Máquina de vetores de suporte NÃO 2014
SENTIR Tudo N / D SENTIR FASTA / GTF Floresta Aleatória SIM 2017
PhyloCSF Vertebrado / Mosca / Mosquito / Levedura / Verme N / D FASTA Modelo de Codon Filogenético SIM 2011
PLIT Plantar N / D FASTA LASSO / Floresta Aleatória SIM 2018
RNAplonc Plantar N / D FASTA REPTree SIM 2018
PLncPRO Planta / Animal N / D FASTA Floresta Aleatória SIM 2017
CREMA Planta / Animal N / D FASTA Abordagem de conjunto SIM 2018
slncky Tudo N / D slncky FASTA / BED Conservação evolutiva SIM 2016

Tradução

Tem havido um debate considerável sobre se os lncRNAs foram mal anotados e de fato codificam proteínas . Verificou-se que vários lncRNAs codificam de fato para peptídeos com função biologicamente significativa. Estudos de perfis de ribossomos sugeriram que algo em torno de 40% a 90% dos lncRNAs anotados são de fato traduzidos , embora haja discordância sobre o método correto para analisar os dados de perfis de ribossomos. Além disso, acredita-se que muitos dos peptídeos produzidos por lncRNAs podem ser altamente instáveis ​​e sem função biológica.

Conservação

Estudos iniciais sobre a conservação de lncRNA observaram que, como uma classe, eles foram enriquecidos para elementos de sequência conservados , esgotados nas taxas de substituição e inserção / deleção e esgotados em variantes de frequência raras, indicativo de seleção purificadora mantendo a função de lncRNA. No entanto, investigações adicionais em lncRNAs de vertebrados revelaram que, embora os lncRNAs sejam conservados na sequência, eles não são conservados na transcrição . Em outras palavras, mesmo quando a sequência de um lncRNA humano é conservada em outra espécie de vertebrado, muitas vezes não há transcrição de um lncRNA na região genômica ortóloga . Alguns argumentam que essas observações sugerem a não funcionalidade da maioria dos lncRNAs, enquanto outros argumentam que podem ser indicativas de uma rápida seleção adaptativa específica da espécie .

Embora o turnover da transcrição do lncRNA seja muito maior do que o inicialmente esperado, é importante observar que, ainda assim, centenas de lncRNAs são conservados no nível da sequência. Houve várias tentativas de delinear as diferentes categorias de assinaturas de seleção vistas entre lncRNAs, incluindo: lncRNAs com conservação de sequência forte em todo o comprimento do gene , lncRNAs em que apenas uma parte do transcrito (por exemplo , extremidade 5 ' , locais de splice ) é conservado, e lncRNAs que são transcritos de regiões sintênicas do genoma, mas não têm similaridade de sequência reconhecível. Além disso, tem havido tentativas de identificar estruturas secundárias conservadas em lncRNAs, embora esses estudos atualmente tenham dado lugar a resultados conflitantes.

Funções

Apesar do acúmulo de evidências de que a maioria dos longos RNAs não codificantes em mamíferos são provavelmente funcionais, apenas uma proporção relativamente pequena demonstrou ser biologicamente relevante. Alguns lncRNAs foram anotados funcionalmente no LncRNAdb (um banco de dados da literatura descrito como lncRNAs), com a maioria deles descritos em humanos . As funções de outros lncRNAs com evidências experimentais foram com curadoria da comunidade em LncRNAWiki (uma plataforma de conteúdo aberto, publicamente editável e baseada em wiki para curadoria comunitária de lncRNAs humanos) em relação aos mecanismos funcionais e associações de doenças, que também podem ser acessados em LncBook. De acordo com a curadoria de mecanismos funcionais de lncRNAs com base na literatura, relata-se extensivamente que os lncRNAs estão envolvidos na regulação da transcrição . Um outro estudo de sequenciamento em grande escala fornece evidências de que muitos transcritos considerados lncRNAs podem, de fato, ser traduzidos em proteínas .

Na regulação da transcrição gênica

Na transcrição específica do gene

Em eucariotos , a transcrição de RNA é um processo rigidamente regulado. Os RNAs não codificadores atuam sobre diferentes aspectos desse processo, visando moduladores transcricionais, RNA polimerase (RNAP) II e até mesmo o duplex de DNA para regular a expressão gênica.

Os NcRNAs modulam a transcrição por vários mecanismos, incluindo o funcionamento de si próprios como co-reguladores, modificando a atividade do fator de transcrição ou regulando a associação e a atividade dos co-reguladores. Por exemplo, o RNA não codificador Evf-2 funciona como um coativador para o fator de transcrição homeobox Dlx2 , que desempenha papéis importantes no desenvolvimento do prosencéfalo e na neurogênese . Hedgehog Sonic induz a transcrição de Evf-2 a partir de um elemento de ultra-conservado localizado entre as Dlx5 e DLX6 genes durante o desenvolvimento do cérebro anterior. Evf-2 então recruta o fator de transcrição Dlx2 para o mesmo elemento ultraconservado pelo qual Dlx2 subsequentemente induz a expressão de Dlx5. A existência de outros elementos similares ultra ou altamente conservados dentro do genoma de mamíferos que são transcritos e cumprem funções intensificadoras sugere que o Evf-2 pode ser ilustrativo de um mecanismo generalizado que regula genes de desenvolvimento com padrões de expressão complexos durante o crescimento de vertebrados. De fato, a transcrição e a expressão de elementos ultraconservados não codificantes semelhantes mostraram ser anormais na leucemia humana e contribuir para a apoptose em células de câncer de cólon , sugerindo seu envolvimento na tumorigênese .

Os ncRNAs locais também podem recrutar programas de transcrição para regular a expressão de genes codificadores de proteínas adjacentes . Por exemplo, lncRNAs divergentes que são transcritos na direção oposta aos genes codificadores de proteínas próximos (~ 20% do total de lncRNAs em genomas de mamíferos) possivelmente regulam a transcrição de genes reguladores de desenvolvimento essenciais adjacentes próximos em células pluripotentes .

A proteína de ligação ao RNA TLS se liga e inibe a proteína de ligação CREB e as atividades da histona acetiltransferase p300 em um gene alvo reprimido, a ciclina D1 . O recrutamento de TLS para o promotor da ciclina D1 é dirigido por ncRNAs longos expressos em níveis baixos e amarrados às regiões reguladoras 5 'em resposta a sinais de danos ao DNA. Além disso, esses ncRNAs locais atuam cooperativamente como ligantes para modular as atividades de TLS. Em sentido amplo, esse mecanismo permite que a célula aproveite proteínas de ligação a RNA , que constituem uma das maiores classes dentro do proteoma de mamíferos , e integre sua função em programas de transcrição. Foi demonstrado que os ncRNAs nascentes longos aumentam a atividade da proteína de ligação ao CREB, que por sua vez aumenta a transcrição desse ncRNA. Um estudo descobriu que um lncRNA na direção antisense da Apolipoproteína A1 (APOA1) regula a transcrição de APOA1 por meio de modificações epigenéticas .

Evidências recentes levantaram a possibilidade de que a transcrição de genes que escapam da inativação do X possa ser mediada pela expressão de longo RNA não codificante dentro dos domínios cromossômicos escapantes.

Regulando a maquinaria de transcrição basal

Os NcRNAs também têm como alvo os fatores de transcrição gerais necessários para a transcrição RNAP II de todos os genes. Esses fatores gerais incluem componentes do complexo de iniciação que se agrupam em promotores ou envolvidos no alongamento da transcrição. Um ncRNA transcrito de um promotor menor a montante do gene di-hidrofolato redutase (DHFR) forma um triplex de RNA-DNA estável dentro do promotor principal de DHFR para prevenir a ligação do cofator de transcrição TFIIB . Este novo mecanismo de regulação da expressão gênica pode representar um método difundido de controlar o uso do promotor, uma vez que existem milhares de triplexes de RNA-DNA no cromossomo eucariótico . O U1 ncRNA pode induzir a transcrição ligando-se e estimulando TFIIH para fosforilar o domínio C-terminal de RNAP II. Em contraste, o ncRNA 7SK é capaz de reprimir o alongamento da transcrição, em combinação com HEXIM1 / 2 , formando um complexo inativo que impede PTEFb de fosforilar o domínio C-terminal de RNAP II, reprimindo o alongamento global sob condições estressantes. Esses exemplos, que contornam modos específicos de regulação em promotores individuais, fornecem um meio de afetar rapidamente as mudanças globais na expressão gênica .

A capacidade de mediar rapidamente mudanças globais também é aparente na rápida expressão de sequências repetitivas não codificantes . Os elementos Alu nucleares intercalados curtos ( SINE ) em humanos e elementos B1 e B2 análogos em camundongos conseguiram se tornar os elementos móveis mais abundantes dentro dos genomas, compreendendo ~ 10% do genoma humano e ~ 6% do camundongo , respectivamente. Esses elementos são transcritos como ncRNAs por RNAP III em resposta a estresses ambientais, como choque térmico , onde se ligam a RNAP II com alta afinidade e evitam a formação de complexos de pré-iniciação ativos. Isso permite a repressão ampla e rápida da expressão gênica em resposta ao estresse.

Uma dissecção das sequências funcionais dentro dos transcritos de RNA Alu traçou uma estrutura modular análoga à organização de domínios em fatores de transcrição de proteínas. O RNA Alu contém dois 'braços', cada um dos quais pode se ligar a uma molécula RNAP II, bem como dois domínios reguladores que são responsáveis ​​pela repressão transcricional de RNAP II in vitro. Esses dois domínios fracamente estruturados podem até mesmo ser concatenados a outros ncRNAs, como elementos B1, para transmitir seu papel repressivo. A abundância e distribuição de elementos Alu e elementos repetitivos semelhantes ao longo do genoma dos mamíferos podem ser parcialmente devido a esses domínios funcionais serem cooptados em outros ncRNAs longos durante a evolução, com a presença de domínios de sequência de repetição funcional sendo uma característica comum de vários longos ncRNAs incluindo Kcnq1ot1 , Xlsirt e Xist .

Além do choque térmico , a expressão dos elementos SINE (incluindo RNAs Alu, B1 e B2) aumenta durante o estresse celular, como a infecção viral em algumas células cancerosas, onde podem regular de forma semelhante mudanças globais na expressão gênica. A capacidade do RNA Alu e B2 de se ligar diretamente ao RNAP II fornece um amplo mecanismo para reprimir a transcrição. No entanto, há exceções específicas a essa resposta global, em que RNAs Alu ou B2 não são encontrados em promotores ativados de genes em indução, como os genes de choque térmico . Essa hierarquia adicional de regulação que isenta genes individuais da repressão generalizada também envolve um ncRNA longo, RNA de choque térmico-1 (HSR-1). Foi argumentado que HSR-1 está presente em células de mamíferos em um estado inativo, mas sob estresse é ativado para induzir a expressão de genes de choque térmico . Essa ativação envolve uma alteração conformacional do HSR-1 em resposta ao aumento da temperatura, permitindo sua interação com o ativador transcricional HSF-1, que trimeriza e induz a expressão de genes de choque térmico. Em sentido amplo, estes exemplos ilustram um circuito regulador aninhado em ncRNAs em que os RNAs Alu ou B2 reprimem a expressão gênica geral , enquanto outros ncRNAs ativam a expressão de genes específicos .

Transcrito por RNA polimerase III

Muitos dos ncRNAs que interagem com fatores de transcrição gerais ou o próprio RNAP II (incluindo 7SK , Alu e B1 e B2 RNAs) são transcritos por RNAP III, desacoplando assim a expressão desses ncRNAs da reação de transcrição RNAP II que eles regulam. RNAP III também transcreve uma série de novos ncRNAs adicionais, como BC2, BC200 e alguns microRNAs e snoRNAs, além dos genes de ncRNA de ' manutenção ' de infraestruturas altamente expressos , como tRNAs , 5S rRNAs e snRNAs . A existência de um transcriptoma de ncRNA dependente de RNAP III que regula sua contraparte dependente de RNAP II foi apoiada por um estudo recente que descreveu um novo conjunto de ncRNAs transcritos por RNAP III com homologia de sequência para genes codificadores de proteínas. Isso levou os autores a postular uma rede regulatória funcional 'cogene / gene', mostrando que um desses ncRNAs, 21A, regula a expressão de seu gene parceiro antisense, CENP-F em trans.

Na regulação pós-transcricional

Além de regular a transcrição, os ncRNAs também controlam vários aspectos do processamento de mRNA pós-transcricional . Semelhante a pequenos RNAs reguladores, como microRNAs e snoRNAs , essas funções geralmente envolvem o emparelhamento de bases complementares com o mRNA alvo. A formação de duplexes de RNA entre o ncRNA complementar e o mRNA pode mascarar elementos-chave dentro do mRNA necessários para ligar fatores de ação trans, potencialmente afetando qualquer etapa da expressão gênica pós-transcricional, incluindo processamento e splicing pré-mRNA , transporte, tradução e degradação.

Em emenda

O splicing de mRNA pode induzir sua tradução e diversificar funcionalmente o repertório de proteínas que ele codifica. O mRNA Zeb2 , que tem um 5'UTR particularmente longo , requer a retenção de um intron 5'UTR que contém um local de entrada do ribossomo interno para uma tradução eficiente. No entanto, a retenção do íntron é dependente da expressão de um transcrito antisense que complementa o local de splice 5 'intrônico . Portanto, a expressão ectópica do transcrito antisense reprime o splicing e induz a tradução do mRNA de Zeb2 durante o desenvolvimento mesenquimal . Da mesma forma, a expressão de um transcrito de Rev-ErbAa2 antisense sobreposto controla o splicing alternativo do mRNA do receptor ErbAa2 do hormônio tireoidiano para formar duas isoformas antagonistas.

Em tradução

O NcRNA também pode aplicar pressões regulatórias adicionais durante a tradução , uma propriedade particularmente explorada em neurônios onde a tradução dendrítica ou axonal do mRNA em resposta à atividade sináptica contribui para mudanças na plasticidade sináptica e a remodelação das redes neuronais. Os ncRNAs BC1 e BC200 transcritos RNAP III, que anteriormente derivados de tRNAs , são expressos no sistema nervoso central de camundongo e humano , respectivamente. A expressão de BC1 é induzida em resposta à atividade sináptica e sinaptogênese e é direcionada especificamente para dendritos em neurônios. A complementaridade da sequência entre BC1 e regiões de vários mRNAs específicos de neurônios também sugere um papel para BC1 na repressão translacional direcionada. De fato, foi recentemente demonstrado que BC1 está associado à repressão translacional em dendritos para controlar a eficiência da transmissão mediada pelo receptor D2 da dopamina no corpo estriado e camundongos com RNA de BC1 deletado exibem mudanças comportamentais com exploração reduzida e aumento da ansiedade .

Na regulação gênica dirigida por siRNA

Além de mascarar elementos-chave dentro do RNA de fita simples , a formação de duplexes de RNA de fita dupla também pode fornecer um substrato para a geração de siRNAs endógenos (endo-siRNAs) em Drosophila e oócitos de camundongo . O emparelhamento de sequências complementares, como regiões anti-sentido ou repetitivas entre os transcritos , forma um duplex de RNA que pode ser processado por Dicer-2 em endo-siRNAs. Além disso, ncRNAs longos que formam hairpins intramoleculares estendidos podem ser processados ​​em siRNAs, convincentemente ilustrados pelos transcritos esi-1 e esi-2. Endo-siRNAs gerados a partir desses transcritos parecem particularmente úteis na supressão da propagação de elementos de transposon móveis dentro do genoma na linha germinativa. No entanto, a geração de endo-siRNAs a partir de transcritos antisense ou pseudogenes também pode silenciar a expressão de suas contrapartes funcionais via complexos efetores RISC, agindo como um nó importante que integra vários modos de regulação de RNA longo e curto, conforme exemplificado por Xist e Tsix (Veja acima).

Na regulação epigenética

Modificações epigenéticas, incluindo metilação de histona e DNA , acetilação e sumoilação de histonas , afetam muitos aspectos da biologia cromossômica, principalmente incluindo a regulação de um grande número de genes por meio da remodelação de amplos domínios da cromatina . Embora já se saiba há algum tempo que o RNA é um componente integral da cromatina, só recentemente começamos a avaliar os meios pelos quais o RNA está envolvido nas vias de modificação da cromatina. Por exemplo, Oplr16 induz epigeneticamente a ativação de fatores centrais de células-tronco coordenando a alça intracromossômica e o recrutamento de DNA desmetilase TET2 .

Em Drosophila , ncRNAs longos induzem a expressão do gene homeótico, Ubx , ao recrutar e direcionar as funções modificadoras da cromatina da proteína tritórax Ash1 para elementos reguladores Hox . Modelos semelhantes foram propostos em mamíferos, onde se acredita que fortes mecanismos epigenéticos estão subjacentes aos perfis de expressão embrionária dos genes Hox que persistem ao longo do desenvolvimento humano. Na verdade, os genes Hox humanos estão associados a centenas de ncRNAs que são sequencialmente expressos ao longo dos eixos espacial e temporal do desenvolvimento humano e definem domínios de cromatina de metilação diferencial de histonas e acessibilidade de RNA polimerase . Um ncRNA, denominado HOTAIR , que se origina do locus HOXC reprime a transcrição em 40 kb do locus HOXD alterando o estado de trimetilação da cromatina. Acredita-se que HOTAIR atinja isso direcionando a ação dos complexos de remodelação da cromatina Polycomb em trans para governar o estado epigenético das células e a expressão gênica subsequente . Os componentes do complexo Polycomb, incluindo Suz12 , EZH2 e EED, contêm domínios de ligação de RNA que podem potencialmente ligar HOTAIR e provavelmente outros ncRNAs semelhantes. Este exemplo ilustra bem um tema mais amplo pelo qual os ncRNAs recrutam a função de um conjunto genérico de proteínas modificadoras da cromatina para loci genômicos específicos , ressaltando a complexidade dos mapas genômicos publicados recentemente. De fato, a prevalência de ncRNAs longos associados a genes codificadores de proteínas pode contribuir para padrões localizados de modificações da cromatina que regulam a expressão gênica durante o desenvolvimento. Por exemplo, a maioria dos genes que codificam proteínas têm parceiros antisense, incluindo muitos genes supressores de tumor que são frequentemente silenciados por mecanismos epigenéticos no câncer. Um estudo recente observou um perfil de expressão inversa do gene p15 e um ncRNA antisense na leucemia. Uma análise detalhada mostrou que o ncRNA antisense p15 ( CDKN2BAS ) foi capaz de induzir alterações no estado de heterocromatina e metilação do DNA de p15 por um mecanismo desconhecido, regulando assim a expressão de p15. Portanto, a expressão incorreta dos ncRNAs antisense associados pode, subsequentemente, silenciar o gene supressor de tumor que contribui para o câncer .

Imprinting

Muitos temas emergentes da modificação da cromatina dirigida por ncRNA foram aparentes pela primeira vez dentro do fenômeno de imprinting , pelo qual apenas um alelo de um gene é expresso tanto do cromossomo materno quanto paterno . Em geral, os genes impressos são agrupados nos cromossomos, sugerindo que o mecanismo de impressão atua nos domínios cromossômicos locais, em vez de nos genes individuais. Esses agrupamentos também são frequentemente associados a ncRNAs longos, cuja expressão está correlacionada com a repressão do gene codificador de proteína ligada no mesmo alelo. Na verdade, uma análise detalhada revelou um papel crucial para os ncRNAs Kcnqot1 e Igf2r / Air no direcionamento da impressão.

Quase todos os genes nos loci Kcnq1 são herdados pela mãe, exceto o ncRNA antisense expresso paternalmente Kcnqot1. Camundongos transgênicos com Kcnq1ot truncado não conseguem silenciar os genes adjacentes, sugerindo que Kcnqot1 é crucial para a impressão de genes no cromossomo paterno. Parece que Kcnqot1 é capaz de direcionar a trimetilação da lisina 9 ( H3K9me3 ) e 27 da histona 3 ( H3K27me3 ) para um centro de impressão que se sobrepõe ao promotor Kcnqot1 e realmente reside dentro de um exon sentido Kcnq1. Semelhante ao HOTAIR (ver acima), os complexos Eed-Ezh2 Polycomb são recrutados para o cromossomo paterno do loci Kcnq1, possivelmente por Kcnqot1, onde eles podem mediar o silenciamento do gene por meio da metilação repressiva das histonas. Um centro de impressão diferencialmente metilado também se sobrepõe ao promotor de um longo antisense ncRNA Air que é responsável pelo silenciamento de genes vizinhos no locus Igf2r no cromossomo paterno. A presença de metilação de histona específica de alelo no locus Igf2r sugere que o ar também medeia o silenciamento via modificação da cromatina.

Inativação do cromossomo Xist e X

A inativação de um cromossomo X em mamíferos da placenta feminina é dirigida por um dos primeiros e mais bem caracterizados ncRNAs longos, Xist . A expressão de Xist a partir do futuro cromossomo X inativo, e seu subsequente revestimento do cromossomo X inativo, ocorre durante a diferenciação de células-tronco embrionárias no início . A expressão de Xist é seguida por camadas irreversíveis de modificações da cromatina que incluem a perda da acetilação da histona (H3K9) e metilação de H3K4 que estão associadas à cromatina ativa e a indução de modificações repressivas da cromatina, incluindo hipoacetilação H4, trimetilação H3K27 , hipermetilação H3K9 e H4K20 bem como a monoubiquitilação de H2AK119. Essas modificações coincidem com o silenciamento transcricional dos genes ligados ao X. O RNA Xist também localiza a variante histona macroH2A no cromossomo X inativo . Existem ncRNAs adicionais que também estão presentes nos loci Xist, incluindo um transcrito antisense Tsix , que é expresso a partir do futuro cromossomo ativo e capaz de reprimir a expressão de Xist pela geração de siRNA endógeno. Juntos, esses ncRNAs garantem que apenas um cromossomo X esteja ativo nas fêmeas de mamíferos.

RNAs não codificantes teloméricos

Os telômeros formam a região terminal dos cromossomos dos mamíferos e são essenciais para a estabilidade e o envelhecimento e desempenham papéis centrais em doenças como o câncer . Os telômeros têm sido considerados complexos DNA-proteína transcricionalmente inertes, até que foi demonstrado no final dos anos 2000 que as repetições teloméricas podem ser transcritas como RNAs teloméricos (TelRNAs) ou RNAs contendo repetições teloméricas . Esses ncRNAs são heterogêneos em comprimento, transcritos de vários loci subteloméricos e fisicamente localizados em telômeros. Sua associação com a cromatina, que sugere um envolvimento na regulação das modificações heterocromatinas específicas dos telômeros, é reprimida pelas proteínas SMG que protegem as extremidades dos cromossomos da perda dos telômeros. Além disso, os TelRNAs bloqueiam a atividade da telomerase in vitro e podem, portanto, regular a atividade da telomerase. Embora iniciais, esses estudos sugerem um envolvimento de ncRNAs teloméricos em vários aspectos da biologia dos telômeros.

Na regulação do tempo de replicação do DNA e estabilidade cromossômica

Os RNAs autossômicos de replicação assíncrona (ASARs) são RNAs não codificantes muito longos (~ 200kb) que não são spliced, não poliadenilados e são necessários para o tempo normal de replicação do DNA e estabilidade cromossômica. A deleção de qualquer um dos loci genéticos contendo ASAR6, ASAR15 ou ASAR6-141 resulta no mesmo fenótipo de tempo de replicação retardado e condensação mitótica retardada (DRT / DMC) de todo o cromossomo. DRT / DMC resulta em erros de segregação cromossômica que levam ao aumento da frequência de rearranjos secundários e um cromossomo instável. Semelhante a Xist , ASARs mostram expressão monoalélica aleatória e existem em domínios de replicação de DNA assíncronos. Embora o mecanismo de função do ASAR ainda esteja sob investigação, existe a hipótese de que eles funcionam por meio de mecanismos semelhantes aos do lncRNA Xist, mas em domínios autossômicos menores, resultando em alterações específicas de alelos na expressão gênica.

A reparação incorreta de quebras de fita dupla de DNA (DSB), levando a rearranjos cromossômicos, é uma das principais causas da oncogênese. Vários lncRNAs são cruciais nos diferentes estágios das principais vias de reparo de DSB em células eucarióticas : união de extremidades não homólogas ( NHEJ ) e reparo direcionado por homologia ( HDR ). Mutações genéticas ou variação nos níveis de expressão de tais RNAs podem levar a defeitos locais de reparo do DNA, aumentando a frequência de aberrações cromossômicas. Além disso, foi demonstrado que alguns RNAs podem estimular rearranjos cromossômicos de longo alcance.

No envelhecimento e na doença

O reconhecimento recente de que os ncRNAs longos funcionam em vários aspectos da biologia celular tem focado cada vez mais atenção em seu potencial de contribuir para a etiologia da doença. 97.998 lncRNAs estão potencialmente associados a doenças com base em evidências multiômicas . Um punhado de estudos implicou ncRNAs longos em uma variedade de estados de doença e apóia um envolvimento e cooperação em doenças neurológicas e câncer.

O primeiro relatório publicado de uma alteração na abundância de lncRNA no envelhecimento e na doença neurológica humana foi fornecido por Lukiw et al. em um estudo utilizando curto intervalo post-mortem de doença de Alzheimer e tecidos não-demência do tipo Alzheimer da (NAD); este trabalho inicial foi baseado na identificação prévia de um transcrito citoplasmático específico do cérebro de primata da família de repetições Alu por Watson e Sutcliffe em 1987 conhecido como BC200 (cérebro, citoplasmático, 200 nucleotídeo).

Embora muitos estudos de associação tenham identificado a expressão incomum de ncRNAs longos em estados de doença, há pouca compreensão de seu papel em causar doenças. As análises de expressão que comparam células tumorais e células normais revelaram mudanças na expressão de ncRNAs em várias formas de câncer . Por exemplo, em tumores de próstata , PCGEM1 (um dos dois ncRNAs superexpressos) está correlacionado com o aumento da proliferação e formação de colônias, sugerindo um envolvimento na regulação do crescimento celular. MALAT1 (também conhecido como NEAT2) foi originalmente identificado como um ncRNA expresso abundantemente que é regulado positivamente durante a metástase de câncer de pulmão de células não pequenas em estágio inicial e sua superexpressão é um marcador de prognóstico precoce para taxas de sobrevida de pacientes pobres. Mais recentemente, verificou-se que o homólogo de camundongo altamente conservado de MALAT1 era altamente expresso no carcinoma hepatocelular . Também foram relatados ncRNAs antisense intrônicos com expressão correlacionada ao grau de diferenciação tumoral em amostras de câncer de próstata. Apesar de vários ncRNAs longos terem expressão aberrante no câncer, sua função e papel potencial na tumorigênese são relativamente desconhecidos. Por exemplo, os ncRNAs HIS-1 e BIC foram implicados no desenvolvimento do câncer e no controle do crescimento, mas sua função em células normais é desconhecida. Além do câncer, os ncRNAs também exibem expressão aberrante em outros estados de doença. A superexpressão de PRINS está associada à suscetibilidade à psoríase , com a expressão de PRINS elevada na epiderme não envolvida de pacientes com psoríase em comparação com lesões psoriáticas e epiderme saudável.

O perfil do genoma revelou que muitas regiões ultraconservadas não codificantes transcritas exibem perfis distintos em vários estados de câncer humano. Uma análise de leucemia linfocítica crônica , carcinoma colorretal e carcinoma hepatocelular descobriu que todos os três cânceres exibiram perfis de expressão aberrante para ncRNAs ultraconservados em relação às células normais. Uma análise mais aprofundada de um ncRNA ultraconservado sugeriu que ele se comportou como um oncogene ao mitigar a apoptose e, subsequentemente, expandir o número de células malignas em cânceres colorretais. Muitos desses locais ultraconservados transcritos que exibem assinaturas distintas no câncer são encontrados em locais frágeis e regiões genômicas associadas ao câncer. Parece provável que a expressão aberrante desses ncRNAs ultraconservados em processos malignos resulta de funções importantes que eles desempenham no desenvolvimento humano normal .

Recentemente, vários estudos de associação examinando polimorfismos de nucleotídeo único (SNPs) associados a estados de doença foram mapeados para ncRNAs longos. Por exemplo, os SNPs que identificaram um locus de suscetibilidade para infarto do miocárdio mapeados para um longo ncRNA, MIAT (transcrição associada ao infarto do miocárdio). Da mesma forma, estudos de associação de todo o genoma identificaram uma região associada à doença arterial coronariana que englobava um longo ncRNA, ANRIL . ANRIL é expresso em tecidos e tipos de células afetados pela aterosclerose e sua expressão alterada está associada a um haplótipo de alto risco para doença arterial coronariana.

A complexidade do transcriptoma e nossa compreensão em evolução de sua estrutura podem informar uma reinterpretação da base funcional para muitos polimorfismos naturais associados a estados de doença. Muitos SNPs associados a certas condições de doença são encontrados em regiões não codificantes e as redes complexas de transcrição não codificadora nessas regiões tornam particularmente difícil elucidar os efeitos funcionais dos polimorfismos . Por exemplo, um SNP na forma truncada de ZFAT e no promotor de um transcrito antisense aumenta a expressão de ZFAT não por meio do aumento da estabilidade do mRNA , mas sim pela repressão da expressão do transcrito antisense.

A capacidade de ncRNAs longos para regular genes codificadores de proteínas associados pode contribuir para a doença se a expressão incorreta de um ncRNA longo desregula um gene codificador de proteínas com significado clínico. De maneira semelhante, um ncRNA longo antisense que regula a expressão do gene BACE1 sentido , uma enzima crucial na etiologia da doença de Alzheimer , exibe expressão elevada em várias regiões do cérebro em indivíduos com doença de Alzheimer. A alteração da expressão de ncRNAs também pode mediar mudanças em um nível epigenético para afetar a expressão gênica e contribuir para a etiologia da doença. Por exemplo, a indução de um transcrito antisense por uma mutação genética levou à metilação do DNA e ao silenciamento dos genes sense, causando β-talassemia em um paciente.

Ao lado de seu papel na mediação de processos patológicos, longos RNAs não codificantes desempenham um papel na resposta imune à vacinação , conforme identificado tanto para a vacina contra influenza quanto para a vacina contra a febre amarela .

Veja também

Referências