E-box - E-box

Uma E-box ( caixa intensificadora) é um elemento de resposta do DNA encontrado em alguns eucariotos que atua como um sítio de ligação de proteínas e que regula a expressão gênica em neurônios , músculos e outros tecidos. Sua sequência de DNA específica, CANNTG (onde N pode ser qualquer nucleotídeo ), com uma sequência canônica palindrômica de CACGTG, é reconhecida e ligada por fatores de transcrição para iniciar a transcrição do gene . Uma vez que os fatores de transcrição se ligam aos promotores através da E-box, outras enzimas podem se ligar ao promotor e facilitar a transcrição de DNA para mRNA .

Descoberta

A E-box foi descoberta em uma colaboração entre os laboratórios de Susumu Tonegawa e Walter Gilbert em 1985 como um elemento de controle no intensificador de cadeia pesada de imunoglobulina . Eles descobriram que uma região de 140 pares de bases no elemento intensificador da transcrição específico do tecido era suficiente para diferentes níveis de intensificação da transcrição em diferentes tecidos e sequências. Eles sugeriram que proteínas feitas por tecidos específicos agiam sobre esses estimuladores para ativar conjuntos de genes durante a diferenciação celular.

Em 1989, o laboratório de David Baltimore descobriu as duas primeiras proteínas de ligação E-box , E12 e E47. Esses intensificadores de imunoglobulina podem se ligar como heterodímeros a proteínas por meio de domínios bHLH . Em 1990, outra proteína E, ITF-2A (mais tarde renomeada E2-2Alt) foi descoberta que pode se ligar a intensificadores de cadeia leve de imunoglobulina . Dois anos depois, a terceira proteína de ligação da E-box, HEB, foi descoberta por meio da triagem de uma biblioteca de cDNA de células HeLa . Uma variante do splice do E2-2 foi descoberta em 1997 e foi encontrada para inibir o promotor de um gene específico do músculo.

Desde então, os pesquisadores estabeleceram que a E-box afeta a transcrição do gene em vários eucariotos e encontraram fatores de ligação da E-box que identificam as sequências de consenso da E-box . Em particular, vários experimentos mostraram que a E-box é parte integrante do ciclo de realimentação da transcrição-tradução que compreende o relógio circadiano .

Obrigatório

As proteínas de ligação à E-box desempenham um papel importante na regulação da atividade transcricional. Estas proteínas contêm normalmente a hélice-volta-hélice proteína motivo estrutural , o que lhes permite ligar-se como dímeros . Este motivo consiste em duas α-hélices anfipáticas , separadas por uma pequena sequência de aminoácidos , que formam uma ou mais β-voltas. As interações hidrofóbicas entre essas hélices α estabilizam a dimerização. Além disso, cada monômero bHLH possui uma região básica, que ajuda a mediar o reconhecimento entre o monômero bHLH e a E-box (a região básica interage com o sulco principal do DNA ). Dependendo do motivo do DNA ("CAGCTG" versus "CACGTG"), a proteína bHLH tem um conjunto diferente de resíduos básicos.

Posição relativa do CTRR e E-Box

A ligação da E-box é modulada por Zn 2+ em camundongos. As regiões ricas em CT (CTRR) localizadas a cerca de 23 nucleotídeos a montante da E-box são importantes na ligação da E-box, transativação (aumento da taxa de expressão genética) e transcrição dos genes circadianos BMAL1 / NPAS2 e complexos BMAL1 / CLOCK .

A especificidade de ligação de diferentes caixas-E é considerada essencial para a sua função. As caixas eletrónicas com funções diferentes têm um número e tipo de fator de ligação diferente.

A sequência de consenso da caixa-E geralmente é CANNTG; entretanto, existem outras caixas-E de sequências semelhantes chamadas caixas-E não-canônicas. Estes incluem, mas não estão limitados a:

  • Sequência CACGTT 20 pb a montante do gene Period2 ( PER2 ) de camundongo e regula sua expressão
  • Sequência CAGCTT encontrada dentro do intensificador de núcleo MyoD
  • Sequência CACCTCGTGAC na região proximal do promotor da APOE humana e de rato , que é um componente proteico das lipoproteínas .

Papel no relógio circadiano

A ligação entre os genes regulados pela E-box e o relógio circadiano foi descoberta em 1997, quando Hao, Allen e Hardin (Departamento de Biologia da Texas A&M University ) analisaram a ritmicidade no período ( por ) gene em Drosophila melanogaster . Eles descobriram um intensificador transcricional circadiano a montante do gene per dentro de um fragmento de DNA de 69 pb. Dependendo dos níveis de proteína PER, o potenciador conduziu a altos níveis de transcrição de mRNA em ambas as condições LD (claro-escuro) e DD (escuridão constante). O intensificador foi considerado necessário para a expressão gênica de alto nível, mas não para a ritmicidade circadiana. Ele também funciona independentemente como um destino do complexo BMAL1 / CLOCK.

A E-box desempenha um papel importante nos genes circadianos; até agora, nove genes circadianos controlados por E / E'BOX foram identificados: PER1 , PER2, BHLHB2 , BHLHB3 , CRY1 , DBP , Nr1d1 , Nr1d2 e RORC. Como a E-box está conectada a vários genes circadianos, é possível que os genes e proteínas associados a ela sejam "pontos cruciais e vulneráveis ​​no sistema (circadiano)".

A E-box é uma das cinco principais famílias de fatores de transcrição associadas à fase circadiana e é encontrada na maioria dos tecidos. Um total de 320 genes controlados por E-box são encontrados no SCN ( núcleo supraquiasmático ), fígado , aorta , adrenal , WAT ( tecido adiposo branco ), cérebro , átrios , ventrículo , córtex pré-frontal , músculo esquelético , BAT ( tecido adiposo marrom ) e osso calvarial.

E-box como elementos relacionados ao CLOCK (EL-box; GGCACGAGGC) também são importantes na manutenção da ritmicidade circadiana em genes controlados por relógio. Da mesma forma que a E-box, a E-box como o elemento relacionado a CLOCK também pode induzir a transcrição de BMAL1 / CLOCK, que pode então levar à expressão em outra caixa EL contendo genes (Ank, DBP, Nr1d1). No entanto, existem diferenças entre a EL-box e a E-box normal. Suprimir DEC1 e DEC2 tem um efeito mais forte na caixa E do que na caixa EL. Além disso, HES1, que pode se ligar a uma sequência de consenso diferente (CACNAG, conhecida como a caixa-N), mostra efeito de supressão na caixa-EL, mas não na caixa-E.

Tanto as E-box não canônicas quanto as sequências semelhantes a E-box são cruciais para a oscilação circadiana. Uma pesquisa recente sobre isso forma uma hipótese de que uma caixa-E canônica ou não-canônica seguida por uma sequência semelhante a uma caixa-E com intervalo de 6 pares de bases entre eles é uma combinação necessária para a transcrição circadiana. A análise in silico também sugere que esse intervalo existia em outros genes controlados por relógio conhecidos.


Papel das proteínas que se ligam às caixas-E

Existem várias proteínas que se ligam à E-box e afetam a transcrição do gene.

Complexo CLOCK-ARNTL

O complexo CLOCK- ARNTL (BMAL1) é parte integrante do ciclo circadiano dos mamíferos e é vital para a manutenção da ritmicidade circadiana.

Sabendo que a ligação ativa a transcrição do gene per na região promotora, os pesquisadores descobriram em 2002 que DEC1 e DEC2 (fatores de transcrição bHLH) reprimiram o complexo CLOCK-BMAL1 por meio da interação direta com BMAL1 e / ou competição por elementos E-box. Eles concluíram que DEC1 e DEC2 eram reguladores do relógio molecular dos mamíferos.

Em 2006, Ripperger e Schibler descobriram que a ligação deste complexo à E-box impulsionava a transcrição DBP circadiana e as transições da cromatina (uma mudança de cromatina para heterocromatina facultativa ). Concluiu-se que CLOCK regula a expressão de DBP ligando-se a motivos E-box em regiões potenciadoras localizadas no primeiro e segundo íntrons .

MYC (c-Myc, um oncogene )

MYC ( c-Myc ), um gene que codifica um fator de transcrição Myc , é importante na regulação da proliferação e apoptose de células de mamíferos .

Em 1991, os pesquisadores testaram se o c-Myc poderia se ligar ao DNA dimerizando-o em E12. Dímeros de E6, a proteína quimérica , foram capazes de se ligar a um elemento E-box (GGCCACGTGACC) que foi reconhecido por outras proteínas HLH. A expressão de E6 suprimiu a função de c-Myc, que mostrou uma ligação entre os dois.

Em 1996, verificou-se que Myc heterodimeriza com MAX e que este complexo heterodimérico poderia se ligar à sequência CAC (G / A) TG E-box e ativar a transcrição.

Em 1998, concluiu-se que a função de c-Myc depende da ativação da transcrição de genes específicos por meio de elementos E-box.

MYOD1 (MyoD)

MyoD vem da família Mrf bHLH e sua principal função é a miogênese , a formação de tecido muscular. Outros membros desta família incluem miogenina , Myf5 , Myf6 , Mist1 e Nex-1.

Quando o MyoD se liga ao motivo E-box CANNTG, a diferenciação muscular e a expressão de proteínas específicas do músculo são iniciadas. Os pesquisadores realizaram a ablação de várias partes da sequência MyoD recombinante e concluíram que o MyoD usava elementos abrangentes para ligar a E-box e a estrutura do tetralplex da sequência promotora do gene específico do músculo α7 integrina e sMtCK sarcomérico .

MyoD regula o HB-EGF ( fator de crescimento semelhante ao EGF de ligação à heparina ), um membro da família EGF ( fator de crescimento epidérmico ) que estimula o crescimento e a proliferação celular. Ela desempenha um papel no desenvolvimento de carcinoma hepatocelular , cancro da próstata , cancro da mama , cancro do esófago , e cancro gástrico .

MyoD também pode se ligar a caixas E não canônicas de MyoG e regular sua expressão.

MyoG (miogenina)

MyoG pertence à família de fatores de transcrição MyoD. A ligação de MyoG-E-Box é necessária para a formação de sinapses neuromusculares , pois uma via de sinalização de HDAC-Dach2- miogenina na expressão gênica do músculo esquelético foi identificada. Expressão diminuída de MyoG foi demonstrada em pacientes com sintoma de perda de massa muscular.

MyoG e MyoD também mostraram envolver na diferenciação de mioblastos . Eles agem transativando a atividade do promotor da catepsina B e induzindo sua expressão de mRNA.

TCF3 (E47)

E47 é produzido por E2A com splicing alternativo em exões de codificação de bHLH específicos de E47 . Seu papel é regular a expressão e diferenciação de genes específicos de tecidos. Muitas quinases foram associadas ao E47, incluindo 3pk e MK2. Essas 2 proteínas formam um complexo com E47 e reduzem sua atividade de transcrição. CKII e PKA também são mostrados para fosforilar E47 in vitro.

Semelhante a outras proteínas de ligação da E-box, E47 também se liga à sequência CANNTG na E-box. Em camundongos knock-out E2A homozigotos, o desenvolvimento das células B para antes do estágio de arranjo DJ e as células B não amadurecem. E47 demonstrou se ligar como heterodímero (com E12) ou como homodímero (mas mais fraco).

Pesquisa recente

Embora a base estrutural de como BMAL1 / CLOCK interage com a E-box seja desconhecida, pesquisas recentes mostraram que os domínios de proteína bHLH de BMAL1 / CLOCK são altamente semelhantes a outras proteínas contendo bHLH, por exemplo, Myc / Max, que foram cristalizadas com E-boxes. É presumido que bases específicas são necessárias para suportar esta ligação de alta afinidade. Além disso, as restrições de sequência na região em torno da caixa E circadiana não são totalmente compreendidas: acredita-se que seja necessário, mas não suficiente, que as caixas E sejam espaçadas aleatoriamente umas das outras na sequência genética para que a transcrição circadiana ocorra . Uma pesquisa recente envolvendo a E-box tem como objetivo tentar encontrar mais proteínas de ligação, bem como descobrir mais mecanismos para inibir a ligação.

Pesquisadores da Faculdade de Medicina da Universidade de Nanjing descobriram que a amplitude de FBXL3 (F-box / proteína de repetição rica em leucina) é expressa por meio de uma E-box. Eles estudaram camundongos com deficiência de FBXL3 e descobriram que ele regula os loops de feedback nos ritmos circadianos, afetando a duração do período circadiano.

Um estudo publicado em 4 de abril de 2013 por pesquisadores da Harvard Medical School descobriu que os nucleotídeos em ambos os lados de uma E-box influenciam quais fatores de transcrição podem se ligar à própria E-box. Esses nucleotídeos determinam o arranjo espacial 3-D da fita de DNA e restringem o tamanho dos fatores de transcrição de ligação . O estudo também encontrou diferenças nos padrões de ligação entre fitas in vivo e in vitro .

Referências

links externos