Gene - Gene

A imagem acima contém links clicáveis
Um gene é uma região do DNA que codifica uma função. Um cromossomo consiste em uma longa fita de DNA contendo muitos genes. Um cromossomo humano pode ter até 500 milhões de pares de bases de DNA com milhares de genes.

Em biologia , um gene (de genos ( grego ) que significa geração ou nascimento ou gênero ) é uma unidade básica de hereditariedade e uma sequência de nucleotídeos no DNA que codifica a síntese de um produto gênico , seja RNA ou proteína .

Durante a expressão do gene , o DNA é primeiro copiado em RNA . O RNA pode ser diretamente funcional ou ser o modelo intermediário para uma proteína que desempenha uma função. A transmissão de genes à descendência de um organismo é a base da herança de características fenotípicas . Esses genes formam diferentes sequências de DNA chamadas genótipos . Os genótipos, juntamente com os fatores ambientais e de desenvolvimento, determinam quais serão os fenótipos. A maioria das características biológicas está sob a influência de poligenes (muitos genes diferentes), bem como de interações gene-ambiente . Algumas características genéticas são instantaneamente visíveis, como a cor dos olhos ou o número de membros, e outras não, como o tipo de sangue , o risco de doenças específicas ou os milhares de processos bioquímicos básicos que constituem a vida .

Os genes podem adquirir mutações em sua sequência, levando a diferentes variantes, conhecidas como alelos , na população . Esses alelos codificam versões ligeiramente diferentes de uma proteína, que causam características fenotípicas diferentes . O uso do termo "tendo um gene" (por exemplo, "genes bons", "gene da cor do cabelo") normalmente se refere a conter um alelo diferente do mesmo gene compartilhado. Os genes evoluem devido à seleção natural / sobrevivência do mais apto e à deriva genética dos alelos.

O conceito de gene continua a ser refinado à medida que novos fenômenos são descobertos. Por exemplo, as regiões regulatórias de um gene podem ser muito removidas de suas regiões de codificação e as regiões de codificação podem ser divididas em vários exons . Alguns vírus armazenam seu genoma em RNA em vez de DNA e alguns produtos gênicos são RNAs não codificantes funcionais . Portanto, uma definição ampla e moderna de um gene é qualquer locus discreto de sequência genômica hereditária que afeta as características de um organismo ao ser expresso como um produto funcional ou pela regulação da expressão do gene .

O termo gene foi introduzido pelo botânico dinamarquês , fisiologista vegetal e geneticista Wilhelm Johannsen em 1909. É inspirado no grego antigo : γόνος, gonos , que significa prole e procriação.

História

Fotografia de Gregor Mendel
Gregor mendel

Descoberta de unidades herdadas discretas

A existência de unidades herdáveis ​​discretas foi sugerida pela primeira vez por Gregor Mendel (1822-1884). De 1857 a 1864, em Brno , Império Austríaco (atual República Tcheca), ele estudou os padrões de herança em 8.000 ervilhas comestíveis comuns , rastreando características distintas de pais para filhos. Ele descreveu isso matematicamente como 2 n  combinações, onde n é o número de características diferentes nas ervilhas originais. Embora não tenha usado o termo gene , ele explicou seus resultados em termos de unidades herdadas discretas que dão origem a características físicas observáveis. Esta descrição prefigurou a distinção de Wilhelm Johannsen entre genótipo (o material genético de um organismo) e fenótipo (as características observáveis ​​desse organismo). Mendel também foi o primeiro a demonstrar o sortimento independente , a distinção entre traços dominantes e recessivos , a distinção entre um heterozigoto e homozigoto e o fenômeno da herança descontínua.

Antes do trabalho de Mendel, a teoria dominante da hereditariedade era a da herança combinada, que sugeria que cada pai contribuía com fluidos para o processo de fertilização e que as características dos pais se misturavam e se misturavam para produzir a prole. Charles Darwin desenvolveu uma teoria da herança que ele chamou de pangênese , do grego pan ("tudo, todo") e gênesis ("nascimento") / genos ("origem"). Darwin usou o termo gemmule para descrever partículas hipotéticas que se misturariam durante a reprodução.

O trabalho de Mendel passou despercebido após sua primeira publicação em 1866, mas foi redescoberto no final do século 19 por Hugo de Vries , Carl Correns e Erich von Tschermak , que (alegou ter) chegado a conclusões semelhantes em suas próprias pesquisas. Especificamente, em 1889, Hugo de Vries publicou seu livro Intracellular Pangenesis , no qual postulou que personagens diferentes têm portadores hereditários individuais e que a herança de traços específicos nos organismos vem em partículas. De Vries chamou essas unidades de " pangenes " ( Pangens em alemão), de acordo com a teoria da pangênese de Darwin de 1868.

Vinte anos depois, em 1909, Wilhelm Johannsen introduziu o termo 'gene' e em 1906, William Bateson , o da ' genética ', enquanto Eduard Strasburger , entre outros, ainda usava o termo 'pangene' para a unidade física e funcional fundamental da hereditariedade .

Descoberta de DNA

Os avanços na compreensão dos genes e da herança continuaram ao longo do século XX. O ácido desoxirribonucléico (DNA) mostrou ser o repositório molecular da informação genética por experimentos nas décadas de 1940 a 1950. A estrutura do DNA foi estudada por Rosalind Franklin e Maurice Wilkins usando cristalografia de raios-X , o que levou James D. Watson e Francis Crick a publicar um modelo da molécula de DNA de fita dupla cujas bases de nucleotídeos emparelhadas indicaram uma hipótese convincente para o mecanismo de replicação genética.

No início da década de 1950, a visão predominante era que os genes em um cromossomo agiam como entidades discretas, indivisíveis por recombinação e dispostos como contas em um cordão. Os experimentos de Benzer usando mutantes defeituosos na região rII do bacteriófago T4 (1955–1959) mostraram que genes individuais têm uma estrutura linear simples e provavelmente são equivalentes a uma seção linear de DNA.

Coletivamente, esse corpo de pesquisa estabeleceu o dogma central da biologia molecular , que afirma que as proteínas são traduzidas do RNA , que é transcrito do DNA . Desde então, este dogma tem mostrado exceções, como a transcrição reversa em retrovírus . O estudo moderno da genética no nível do DNA é conhecido como genética molecular .

Em 1972, Walter Fiers e sua equipe foram os primeiros a determinar a sequência de um gene: o da proteína capsidial do bacteriófago MS2 . O desenvolvimento subsequente do sequenciamento de DNA de terminação de cadeia em 1977 por Frederick Sanger melhorou a eficiência do sequenciamento e o transformou em uma ferramenta de laboratório de rotina. Uma versão automatizada do método Sanger foi usada nas fases iniciais do Projeto Genoma Humano .

Síntese moderna e seus sucessores

As teorias desenvolvidas no início do século 20 para integrar a genética mendeliana com a evolução darwiniana são chamadas de síntese moderna , um termo introduzido por Julian Huxley .

Os biólogos evolucionários subsequentemente modificado este conceito, tal como George C. Williams ' vista gene centrada de evolução . Ele propôs um conceito evolutivo do gene como uma unidade de seleção natural com a definição: "aquilo que segregou e recombina com frequência apreciável". Nessa visão, o gene molecular se transcreve como uma unidade e o gene evolucionário herda como uma unidade. Ideias relacionadas enfatizando a centralidade dos genes na evolução foram popularizadas por Richard Dawkins .

Base molecular

Diagrama da estrutura química do DNA mostrando como a dupla hélice consiste em duas cadeias de esqueleto açúcar-fosfato com bases apontando para dentro e, especificamente, emparelhamento de bases A a T e C a G com ligações de hidrogênio.
A estrutura química de um fragmento de quatro pares de bases de uma dupla hélice de DNA . As cadeias de esqueleto de açúcar - fosfato correm em direções opostas com as bases apontando para dentro, emparelhamento de bases A a T e C a G com ligações de hidrogênio .

DNA

A grande maioria dos organismos codifica seus genes em longas fitas de DNA (ácido desoxirribonucléico). O DNA consiste em uma cadeia feita de quatro tipos de subunidades de nucleotídeos , cada uma composta por: um açúcar de cinco carbonos ( 2-desoxirribose ), um grupo fosfato e uma das quatro bases adenina , citosina , guanina e timina .

Duas cadeias de DNA giram em torno uma da outra para formar uma dupla hélice de DNA com a espinha dorsal do açúcar fosfato espiralando ao redor do lado de fora, e as bases apontando para dentro com o par de bases de adenina para timina e guanina para citosina. A especificidade do emparelhamento de bases ocorre porque a adenina e a timina se alinham para formar duas ligações de hidrogênio , enquanto a citosina e a guanina formam três ligações de hidrogênio. As duas fitas em uma dupla hélice devem, portanto, ser complementares , com sua sequência de bases combinando de modo que as adeninas de uma fita sejam emparelhadas com as tinas da outra fita, e assim por diante.

Devido à composição química dos resíduos de pentose das bases, as fitas de DNA têm direcionalidade. Uma extremidade de um polímero de DNA contém um grupo hidroxila exposto na desoxirribose ; isso é conhecido como a extremidade 3 ' da molécula. A outra extremidade contém um grupo fosfato exposto ; este é o 5 'final . As duas fitas de uma dupla hélice correm em direções opostas. A síntese de ácido nucleico, incluindo replicação e transcrição de DNA, ocorre na direção 5 '→ 3', porque novos nucleotídeos são adicionados por meio de uma reação de desidratação que usa o hidroxil 3 'exposto como um nucleófilo .

A expressão de genes codificados no DNA começa pela transcrição do gene em RNA , um segundo tipo de ácido nucléico muito semelhante ao DNA, mas cujos monômeros contêm o açúcar ribose em vez de desoxirribose . O RNA também contém a base uracila no lugar da timina . As moléculas de RNA são menos estáveis ​​do que o DNA e são tipicamente de fita simples. Os genes que codificam proteínas são compostos por uma série de sequências de três nucleotídeos chamadas códons , que servem como "palavras" na "linguagem" genética. O código genético especifica a correspondência durante a tradução de proteínas entre códons e aminoácidos . O código genético é quase o mesmo para todos os organismos conhecidos.

Cromossomos

Uma imagem microscópica de 46 cromossomos listrados com faixas vermelhas e verdes
Imagem de microscopia fluorescente de um cariótipo feminino humano , mostrando 23 pares de cromossomos. O DNA é tingido de vermelho, com regiões ricas em genes de manutenção também tingidas de verde. Os maiores cromossomos têm cerca de 10 vezes o tamanho dos menores.

O complemento total de genes em um organismo ou célula é conhecido como seu genoma , que pode ser armazenado em um ou mais cromossomos . Um cromossomo consiste em uma única hélice de DNA muito longa na qual milhares de genes são codificados. A região do cromossomo em que um determinado gene está localizado é chamada de locus . Cada locus contém um alelo de um gene; no entanto, os membros de uma população podem ter alelos diferentes no locus, cada um com uma sequência de genes ligeiramente diferente.

A maioria dos genes eucarióticos é armazenada em um conjunto de grandes cromossomos lineares. Os cromossomos são empacotados dentro do núcleo em um complexo com proteínas de armazenamento chamadas histonas para formar uma unidade chamada nucleossomo . O DNA empacotado e condensado dessa forma é chamado de cromatina . A maneira pela qual o DNA é armazenado nas histonas, bem como as modificações químicas da própria histona, regulam se uma determinada região do DNA está acessível para a expressão gênica . Além dos genes, os cromossomos eucarióticos contêm sequências envolvidas em garantir que o DNA seja copiado sem degradação das regiões finais e classificado em células-filhas durante a divisão celular: origens de replicação , telômeros e centrômero . As origens de replicação são as regiões de sequência onde a replicação do DNA é iniciada para fazer duas cópias do cromossomo. Os telômeros são trechos longos de sequências repetitivas que cobrem as extremidades dos cromossomos lineares e evitam a degradação das regiões codificantes e regulatórias durante a replicação do DNA . O comprimento dos telômeros diminui cada vez que o genoma é replicado e está implicado no processo de envelhecimento . O centrômero é necessário para ligar as fibras do fuso para separar as cromátides irmãs em células-filhas durante a divisão celular .

Os procariotos ( bactérias e arquéias ) normalmente armazenam seus genomas em um único cromossomo grande e circular . Da mesma forma, algumas organelas eucarióticas contêm um cromossomo circular remanescente com um pequeno número de genes. Os procariontes às vezes complementam seus cromossomos com pequenos círculos adicionais de DNA chamados plasmídeos , que geralmente codificam apenas alguns genes e são transferíveis entre indivíduos. Por exemplo, os genes para resistência a antibióticos são geralmente codificados em plasmídeos bacterianos e podem ser transmitidos entre células individuais, mesmo aquelas de espécies diferentes, por meio de transferência horizontal de genes .

Enquanto os cromossomos dos procariontes são relativamente densos em genes, os dos eucariotos geralmente contêm regiões de DNA que não desempenham nenhuma função óbvia. Os eucariotos unicelulares simples têm quantidades relativamente pequenas desse DNA, enquanto os genomas de organismos multicelulares complexos , incluindo humanos, contêm uma maioria absoluta de DNA sem uma função identificada. Este DNA tem sido freqüentemente referido como " DNA lixo ". No entanto, análises mais recentes sugerem que, embora o DNA codificador de proteínas constitua apenas 2% do genoma humano , cerca de 80% das bases no genoma podem ser expressas, portanto, o termo "DNA lixo" pode ser um nome impróprio.

Estrutura e função

Estrutura

A imagem acima contém links clicáveis
A estrutura de um gene codificador de proteína eucariótica . A sequência reguladora controla quando e onde ocorre a expressão da região codificadora da proteína (vermelho). As regiões promotoras e intensificadoras (amarelo) regulam a transcrição do gene em um pré-mRNA que é modificado para remover os íntrons (cinza claro) e adicionar uma capa 5 'e cauda poli-A (cinza escuro). As regiões não traduzidas 5 ' e 3' do mRNA (azul) regulam a tradução no produto final da proteína.

A estrutura de um gene consiste em muitos elementos, dos quais a sequência codificadora da proteína real costuma ser apenas uma pequena parte. Estes incluem regiões de DNA que não são transcritas, bem como regiões não traduzidas do RNA.

Flanqueando o quadro de leitura aberto, os genes contêm uma sequência regulatória necessária para sua expressão. Primeiro, os genes requerem uma sequência promotora . O promotor é reconhecido e ligado por fatores de transcrição que recrutam e ajudam a RNA polimerase a se ligar à região para iniciar a transcrição. O reconhecimento normalmente ocorre como uma sequência de consenso, como a caixa TATÁ . Um gene pode ter mais de um promotor, resultando em RNAs mensageiros ( mRNA ) que diferem em até que ponto se estendem na extremidade 5 '. Genes altamente transcritos têm sequências promotoras "fortes" que formam fortes associações com fatores de transcrição, iniciando assim a transcrição em uma taxa alta. Outros genes têm promotores "fracos" que formam associações fracas com fatores de transcrição e iniciam a transcrição com menos frequência. As regiões promotoras eucarióticas são muito mais complexas e difíceis de identificar do que os promotores procarióticos .

Além disso, os genes podem ter regiões regulatórias de muitos quilobases a montante ou a jusante da estrutura de leitura aberta que alteram a expressão. Estes atuam ligando-se a fatores de transcrição que, então, fazem com que o DNA dê uma volta, de modo que a sequência reguladora (e o fator de transcrição ligado) se aproxime do local de ligação da RNA polimerase. Por exemplo, os estimuladores aumentam a transcrição ligando-se a uma proteína ativadora que ajuda a recrutar a RNA polimerase para o promotor; inversamente, os silenciadores ligam-se às proteínas repressoras e tornam o DNA menos disponível para a RNA polimerase.

O transcrito de pré-ARNm contém regiões não traduzidas em ambas as extremidades que contêm locais de ligação para os ribossomas , proteínas de ligação de ARN- , miARN , bem como terminador , e iniciar e codões de paragem . Além disso, a maioria dos quadros de leitura aberta eucariótica contém íntrons não traduzidos , que são removidos e exons , que são conectados em um processo conhecido como splicing de RNA . Finalmente, as extremidades dos transcritos de genes são definidas por locais de clivagem e poliadenilação (CPA) , onde o pré-mRNA recém-produzido é clivado e uma sequência de ~ 200 monofosfatos de adenosina é adicionada na extremidade 3 '. A cauda poli (A) protege o mRNA maduro da degradação e tem outras funções, afetando a tradução, localização e transporte do transcrito do núcleo. O splicing, seguido por CPA, gera o mRNA maduro final , que codifica a proteína ou produto de RNA. Embora os mecanismos gerais que definem as localizações dos genes humanos sejam conhecidos, a identificação dos fatores exatos que regulam esses processos celulares é uma área de pesquisa ativa. Por exemplo, características de sequência conhecidas no 3'-UTR podem explicar apenas metade de todas as extremidades de genes humanos.

Muitos genes procarióticos são organizados em operons , com várias sequências codificadoras de proteínas que são transcritas como uma unidade. Os genes em um operon são transcritos como um RNA mensageiro contínuo , conhecido como mRNA policistrônico . O termo cistron neste contexto é equivalente a gene. A transcrição do mRNA de um operon é freqüentemente controlada por um repressor que pode ocorrer em um estado ativo ou inativo dependendo da presença de metabólitos específicos. Quando ativo, o repressor se liga a uma sequência de DNA no início do operon, chamada de região do operador , e reprime a transcrição do operon ; quando o repressor está inativo, a transcrição do operon pode ocorrer (ver, por exemplo, operon Lac ). Os produtos dos genes do operon normalmente têm funções relacionadas e estão envolvidos na mesma rede regulatória .

Definições funcionais

Definir exatamente qual seção de uma sequência de DNA compreende um gene é difícil. As regiões regulatórias de um gene, como os potenciadores , não precisam necessariamente estar próximas da sequência de codificação na molécula linear porque o DNA interveniente pode ser executado em loop para trazer o gene e sua região reguladora para a proximidade. Da mesma forma, os íntrons de um gene podem ser muito maiores do que seus exons. As regiões regulatórias podem até estar em cromossomos inteiramente diferentes e operar em trans para permitir que as regiões regulatórias de um cromossomo entrem em contato com genes-alvo em outro cromossomo.

Os primeiros trabalhos em genética molecular sugeriram o conceito de que um gene produz uma proteína . Esse conceito (originalmente chamado de hipótese de um gene-uma enzima ) surgiu de um influente artigo de 1941 de George Beadle e Edward Tatum sobre experimentos com mutantes do fungo Neurospora crassa . Norman Horowitz , um dos primeiros colegas da pesquisa Neurospora , lembrou em 2004 que “esses experimentos fundaram a ciência do que Beadle e Tatum chamam de genética bioquímica . Na realidade, eles provaram ser a arma de abertura no que se tornou a genética molecular e todos os desenvolvimentos que se seguiram a partir daí . ” O conceito de um gene e uma proteína foi refinado desde a descoberta de genes que podem codificar várias proteínas por splicing alternativo e sequências de codificação divididas em seções curtas no genoma cujos mRNAs são concatenados por trans-splicing .

Uma ampla definição operacional é às vezes usada para abranger a complexidade desses diversos fenômenos, onde um gene é definido como uma união de sequências genômicas que codificam um conjunto coerente de produtos funcionais potencialmente sobrepostos. Essa definição categoriza os genes por seus produtos funcionais (proteínas ou RNA) em vez de seus loci de DNA específicos, com elementos regulatórios classificados como regiões associadas a genes .

Sobreposição entre genes

Também é possível que os genes se sobreponham à mesma sequência de DNA e sejam considerados genes distintos, mas sobrepostos . A definição atual de um gene sobreposto é diferente entre eucariotos, procariotos e vírus. Em eucariotos, eles foram definidos recentemente como "quando pelo menos um nucleotídeo é compartilhado entre os limites mais externos dos transcritos primários de dois ou mais genes, de modo que uma mutação de base de DNA no ponto de sobreposição afetaria os transcritos de todos os genes envolvidos no sobreposição." Em procariotos e vírus, eles foram definidos recentemente como "quando as sequências de codificação de dois genes compartilham um nucleotídeo na mesma fita ou em fitas opostas".

Expressão genetica

Em todos os organismos, duas etapas são necessárias para ler as informações codificadas no DNA de um gene e produzir a proteína que ele especifica. Primeiro, o DNA do gene é transcrito em RNA mensageiro ( mRNA ). Em segundo lugar, esse mRNA é traduzido em proteína. Os genes codificadores de RNA ainda precisam passar pela primeira etapa, mas não são traduzidos em proteínas. O processo de produção de uma molécula biologicamente funcional de RNA ou proteína é chamado de expressão gênica , e a molécula resultante é chamada de produto gênico .

Código genético

Uma molécula de RNA que consiste em nucleotídeos.  Grupos de três nucleotídeos são indicados como códons, com cada um correspondendo a um aminoácido específico.
Esquema de uma molécula de RNA de fita simples ilustrando uma série de códons de três bases . Cada códon de três nucleotídeos corresponde a um aminoácido quando traduzido em proteína

A sequência de nucleotídeos do DNA de um gene especifica a sequência de aminoácidos de uma proteína por meio do código genético . Conjuntos de três nucleotídeos, conhecidos como códons , cada um corresponde a um aminoácido específico. O princípio de que três bases sequenciais de DNA codificam para cada aminoácido foi demonstrado em 1961 usando mutações frameshift no gene rIIB do bacteriófago T4 (ver experimento de Crick, Brenner et al. ).

Além disso, um " códon de início " e três " códons de parada " indicam o início e o fim da região de codificação da proteína . Existem 64 códons possíveis (quatro nucleotídeos possíveis em cada uma das três posições, portanto, 4 3  códons possíveis) e apenas 20 aminoácidos padrão; portanto, o código é redundante e vários códons podem especificar o mesmo aminoácido. A correspondência entre códons e aminoácidos é quase universal entre todos os organismos vivos conhecidos.

Transcrição

A transcrição produz uma molécula de RNA de fita simples conhecida como RNA mensageiro , cuja sequência de nucleotídeos é complementar ao DNA a partir do qual foi transcrita. O mRNA atua como um intermediário entre o gene do DNA e seu produto proteico final. O DNA do gene é usado como molde para gerar um mRNA complementar . O mRNA corresponde à sequência da fita codificadora do DNA do gene porque é sintetizado como complemento da fita modelo . A transcrição é realizada por uma enzima chamada RNA polimerase , que lê a fita modelo na  direção 3 ' para 5' e sintetiza o RNA de 5 ' para 3' . Para iniciar a transcrição, a polimerase primeiro reconhece e se liga a uma região promotora do gene. Assim, um dos principais mecanismos de regulação gênica é o bloqueio ou sequestro da região promotora, seja por ligação forte por moléculas repressoras que bloqueiam fisicamente a polimerase ou organizando o DNA de modo que a região promotora não seja acessível.

Em procariotos , a transcrição ocorre no citoplasma ; para transcrições muito longas, a tradução pode começar na extremidade 5 'do RNA, enquanto a extremidade 3' ainda está sendo transcrita. Nos eucariotos , a transcrição ocorre no núcleo, onde o DNA da célula é armazenado. A molécula de RNA produzida pela polimerase é conhecida como transcrito primário e sofre modificações pós-transcricionais antes de ser exportada para o citoplasma para tradução. Uma das modificações realizadas é o splicing de íntrons, que são sequências na região transcrita que não codificam uma proteína. Mecanismos de splicing alternativos podem resultar em transcritos maduros do mesmo gene com sequências diferentes e, portanto, codificando para proteínas diferentes. Esta é a principal forma de regulação em células eucarióticas e também ocorre em alguns procariotos.

Tradução

Um gene codificador de proteína no DNA sendo transcrito e traduzido para uma proteína funcional ou um gene não codificador de proteína sendo transcrito para um RNA funcional
Os genes que codificam proteínas são transcritos para um intermediário de mRNA e , em seguida, traduzidos para uma proteína funcional . Genes codificadores de RNA são transcritos para um RNA não codificante funcional . ( PDB : 3BSE , 1OBB , 3TRA )

Tradução é o processo pelo qual uma molécula de mRNA madura é usada como modelo para a síntese de uma nova proteína . A tradução é realizada por ribossomos , grandes complexos de RNA e proteínas responsáveis ​​por realizar as reações químicas para adicionar novos aminoácidos a uma cadeia polipeptídica em crescimento pela formação de ligações peptídicas . O código genético é lido três nucleotídeos por vez, em unidades chamadas códons , por meio de interações com moléculas de RNA especializadas chamadas RNA de transferência (tRNA). Cada tRNA tem três bases desemparelhadas conhecidas como anticódon, que são complementares ao códon que ele lê no mRNA. O tRNA também está covalentemente ligado ao aminoácido especificado pelo códon complementar. Quando o tRNA se liga a seu códon complementar em uma fita de mRNA, o ribossomo anexa sua carga de aminoácidos à nova cadeia polipeptídica, que é sintetizada do terminal amino ao terminal carboxila . Durante e após a síntese, a maioria das novas proteínas deve dobrar-se à sua estrutura tridimensional ativa antes que possam realizar suas funções celulares.

Regulamento

Os genes são regulados para que sejam expressos apenas quando o produto é necessário, uma vez que a expressão se baseia em recursos limitados. Uma célula regula sua expressão gênica dependendo de seu ambiente externo (por exemplo , nutrientes disponíveis , temperatura e outros estresses ), seu ambiente interno (por exemplo , ciclo de divisão celular , metabolismo , estado de infecção ) e seu papel específico se em um organismo multicelular . A expressão do gene pode ser regulada em qualquer etapa: da iniciação da transcrição ao processamento do RNA e à modificação pós-tradução da proteína. A regulação dos genes do metabolismo da lactose em E. coli ( operon lac ) foi o primeiro mecanismo descrito em 1961.

Genes de RNA

Um gene codificador de proteína típico é primeiro copiado para o RNA como um intermediário na fabricação do produto proteico final. Em outros casos, as moléculas de RNA são os verdadeiros produtos funcionais, como na síntese de RNA ribossômico e RNA de transferência . Alguns RNAs conhecidos como ribozimas são capazes de função enzimática , e o microRNA tem um papel regulador. As sequências de DNA a partir das quais esses RNAs são transcritos são conhecidas como genes de RNA não codificantes .

Alguns vírus armazenam seus genomas inteiros na forma de RNA e não contêm DNA algum. Por usarem o RNA para armazenar genes, seus hospedeiros celulares podem sintetizar suas proteínas assim que são infectados e sem o atraso da espera pela transcrição. Por outro lado, retrovírus de RNA , como o HIV , requerem a transcrição reversa de seu genoma de RNA em DNA antes que suas proteínas possam ser sintetizadas. Herança epigenética mediada por RNA também foi observada em plantas e muito raramente em animais.

Herança

Ilustração de herança autossômica recessiva.  Cada pai tem um alelo azul e um alelo branco.  Cada um de seus 4 filhos herda um alelo de cada pai, de modo que um filho acaba com dois alelos azuis, um filho tem dois alelos brancos e dois filhos têm um de cada alelo.  Apenas a criança com ambos os alelos azuis mostra o traço porque o traço é recessivo.
Herança de um gene que possui dois alelos diferentes (azul e branco). O gene está localizado em um cromossomo autossômico . O alelo branco é recessivo ao alelo azul. A probabilidade de cada resultado na geração dos filhos é de um quarto, ou 25 por cento.

Os organismos herdam seus genes de seus pais. Os organismos assexuados simplesmente herdam uma cópia completa do genoma de seus pais. Os organismos sexuais têm duas cópias de cada cromossomo porque herdam um conjunto completo de cada pai.

Herança mendeliana

De acordo com a herança mendeliana , variações no fenótipo de um organismo ( características físicas e comportamentais observáveis) são devidas em parte a variações em seu genótipo (conjunto particular de genes). Cada gene especifica uma característica particular com uma sequência diferente de um gene ( alelos ) dando origem a diferentes fenótipos. A maioria dos organismos eucarióticos (como as plantas de ervilha nas quais Mendel trabalhou) tem dois alelos para cada característica, um herdado de cada pai.

Os alelos em um locus podem ser dominantes ou recessivos ; os alelos dominantes dão origem aos seus fenótipos correspondentes quando emparelhados com qualquer outro alelo para o mesmo traço, ao passo que os alelos recessivos dão origem ao seu fenótipo correspondente apenas quando emparelhados com outra cópia do mesmo alelo. Se você conhece os genótipos dos organismos, pode determinar quais alelos são dominantes e quais são recessivos. Por exemplo, se o alelo que especifica caules altos em plantas de ervilha é dominante sobre o alelo que especifica caules curtos, então as plantas de ervilha que herdam um alelo alto de um dos pais e um alelo curto do outro pai também terão hastes altas. O trabalho de Mendel demonstrou que os alelos se agrupam independentemente na produção de gametas , ou células germinativas , garantindo variação na próxima geração. Embora a herança de Mendel permaneça um bom modelo para muitas características determinadas por genes únicos (incluindo uma série de distúrbios genéticos bem conhecidos ), ela não inclui os processos físicos de replicação do DNA e divisão celular.

Replicação de DNA e divisão celular

O crescimento, desenvolvimento e reprodução dos organismos dependem da divisão celular ; o processo pelo qual uma única célula se divide em duas células-filhas geralmente idênticas . Isso requer primeiro fazer uma cópia duplicada de cada gene do genoma em um processo chamado replicação de DNA . As cópias são feitas por enzimas especializadas conhecidas como DNA polimerases , que "lêem" uma fita do DNA em dupla hélice, conhecida como fita modelo, e sintetizam uma nova fita complementar. Como a dupla hélice do DNA é mantida unida por emparelhamento de bases , a sequência de uma fita especifica completamente a sequência de seu complemento; portanto, apenas uma fita precisa ser lida pela enzima para produzir uma cópia fiel. O processo de replicação do DNA é semiconservativo ; ou seja, a cópia do genoma herdado por cada célula filha contém uma fita original e uma fita de DNA recém-sintetizada.

A taxa de replicação do DNA em células vivas foi medida pela primeira vez como a taxa de alongamento do DNA do fago T4 em E. coli infectada por fago e descobriu-se que era impressionantemente rápida. Durante o período de aumento exponencial do DNA a 37 ° C, a taxa de alongamento foi de 749 nucleotídeos por segundo.

Depois que a replicação do DNA estiver completa, a célula deve separar fisicamente as duas cópias do genoma e se dividir em duas células distintas ligadas à membrana. Em procariotos  ( bactérias e arquéias ), isso geralmente ocorre por meio de um processo relativamente simples chamado fissão binária , em que cada genoma circular se liga à membrana celular e é separado nas células filhas à medida que a membrana se invagina para dividir o citoplasma em duas porções ligadas à membrana . A fissão binária é extremamente rápida em comparação com as taxas de divisão celular em eucariotos . A divisão celular eucariótica é um processo mais complexo conhecido como ciclo celular ; A replicação do ADN ocorre durante uma fase do ciclo conhecido como a fase S , enquanto que o processo de segregação de cromossomas e divisão do citoplasma ocorre durante a fase M .

Herança molecular

A duplicação e a transmissão do material genético de uma geração de células para a seguinte é a base para a herança molecular e a ligação entre as imagens clássicas e moleculares dos genes. Os organismos herdam as características de seus pais porque as células da prole contêm cópias dos genes nas células de seus pais. Em organismos de reprodução assexuada , a prole será uma cópia genética ou clone do organismo parental. Em organismos que se reproduzem sexualmente , uma forma especializada de divisão celular chamada meiose produz células chamadas gametas ou células germinativas que são haplóides ou contêm apenas uma cópia de cada gene. Os gametas produzidos pelas fêmeas são chamados de óvulos ou óvulos, e os produzidos pelos machos são chamados de esperma . Dois gametas se fundem para formar um óvulo fertilizado diplóide , uma única célula que possui dois conjuntos de genes, com uma cópia de cada gene da mãe e uma do pai.

Durante o processo de divisão celular meiótica, um evento denominado recombinação genética ou crossing-over pode às vezes ocorrer, no qual um comprimento de DNA em uma cromátide é trocado por um comprimento de DNA na cromátide homóloga correspondente não-irmã. Isso pode resultar no rearranjo de alelos de outra forma vinculados. O princípio de Mendel de classificação independente afirma que cada um dos dois genes de um pai para cada característica será classificado independentemente em gametas; qual alelo um organismo herda para uma característica não está relacionado a qual alelo ele herda para outra característica. Na verdade, isso só é verdade para genes que não residem no mesmo cromossomo ou estão localizados muito distantes um do outro no mesmo cromossomo. Quanto mais próximos dois genes estão no mesmo cromossomo, mais intimamente eles estarão associados nos gametas e mais frequentemente eles aparecerão juntos (conhecido como ligação genética ). Genes que estão muito próximos essencialmente nunca são separados porque é extremamente improvável que um ponto de cruzamento ocorra entre eles.

Evolução molecular

Mutação

A replicação do DNA é em sua maior parte extremamente precisa, no entanto, erros ( mutações ) ocorrem. A taxa de erro em células eucarióticas pode ser tão baixa quanto 10-8 por nucleotídeo por replicação, enquanto para alguns vírus de RNA pode ser tão alta quanto 10-3 . Isso significa que cada geração, cada genoma humano acumula 1-2 novas mutações. Pequenas mutações podem ser causadas pela replicação do DNA e as conseqüências do dano ao DNA e incluem mutações pontuais nas quais uma única base é alterada e mutações de deslocamento de quadro nas quais uma única base é inserida ou deletada. Qualquer uma dessas mutações pode alterar o gene por sentido incorreto (alterar um códon para codificar um aminoácido diferente) ou sem sentido (um códon de parada prematuro ). Mutações maiores podem ser causadas por erros na recombinação para causar anormalidades cromossômicas, incluindo duplicação , deleção, rearranjo ou inversão de grandes seções de um cromossomo. Além disso, os mecanismos de reparo do DNA podem introduzir erros mutacionais ao reparar danos físicos à molécula. O reparo, mesmo com mutação, é mais importante para a sobrevivência do que restaurar uma cópia exata, por exemplo, ao reparar quebras de fita dupla .

Quando vários alelos diferentes para um gene estão presentes na população de uma espécie, ele é chamado de polimórfico . A maioria dos alelos diferentes são funcionalmente equivalentes, no entanto, alguns alelos podem dar origem a diferentes características fenotípicas . O alelo mais comum de um gene é chamado de tipo selvagem e os alelos raros são chamados de mutantes . A variação genética nas frequências relativas de diferentes alelos em uma população se deve tanto à seleção natural quanto à deriva genética . O alelo de tipo selvagem não é necessariamente o ancestral de alelos menos comuns, nem é necessariamente mais adequado .

A maioria das mutações dentro dos genes é neutra , não tendo efeito no fenótipo do organismo ( mutações silenciosas ). Algumas mutações não alteram a sequência de aminoácidos porque vários códons codificam o mesmo aminoácido ( mutações sinônimas ). Outras mutações podem ser neutras se levarem a mudanças na sequência de aminoácidos, mas a proteína ainda funciona de forma semelhante com o novo aminoácido (por exemplo, mutações conservativas ). Muitas mutações, no entanto, são deletérias ou mesmo letais e são removidas das populações por seleção natural. Os distúrbios genéticos resultam de mutações deletérias e podem ser decorrentes de mutação espontânea no indivíduo afetado ou podem ser hereditários. Finalmente, uma pequena fração das mutações é benéfica , melhorando a aptidão do organismo e é extremamente importante para a evolução, uma vez que sua seleção direcional leva à evolução adaptativa .

Homologia de sequência

Um alinhamento de sequcias, produzido por ClustalO , de mameros de histona proteínas

Os genes com um ancestral comum mais recente e, portanto, uma ancestralidade evolutiva compartilhada, são conhecidos como homólogos . Esses genes aparecem ou a partir da duplicação de genes dentro do genoma de um organismo, onde são conhecidos como genes parálogos, ou são o resultado da divergência dos genes após um evento de especiação , onde são conhecidos como genes ortólogos e muitas vezes desempenham as mesmas funções ou funções semelhantes em organismos relacionados. Freqüentemente, presume-se que as funções dos genes ortólogos são mais semelhantes do que as dos genes parálogos, embora a diferença seja mínima.

A relação entre os genes pode ser medida comparando o alinhamento da sequência de seu DNA. O grau de similaridade de sequência entre genes homólogos é denominado sequência conservada . A maioria das mudanças na sequência de um gene não afeta sua função e, portanto, os genes acumulam mutações ao longo do tempo pela evolução molecular neutra . Além disso, qualquer seleção em um gene fará com que sua sequência divirja em uma taxa diferente. Os genes sob seleção estabilizadora são restringidos e, portanto, mudam mais lentamente, enquanto os genes sob seleção direcional mudam a sequência mais rapidamente. As diferenças de sequência entre os genes podem ser usadas para análises filogenéticas para estudar como esses genes evoluíram e como os organismos de onde eles vêm estão relacionados.

Origens de novos genes

Destino evolucionário de genes duplicados.

A fonte mais comum de novos genes em linhagens eucarióticas é a duplicação de genes , que cria uma variação no número de cópias de um gene existente no genoma. Os genes resultantes (parálogos) podem então divergir na sequência e na função. Conjuntos de genes formados dessa maneira compõem uma família de genes . Duplicações e perdas de genes dentro de uma família são comuns e representam uma importante fonte de biodiversidade evolutiva . Às vezes, a duplicação do gene pode resultar em uma cópia não funcional de um gene, ou uma cópia funcional pode estar sujeita a mutações que resultam em perda de função; esses genes não funcionais são chamados de pseudogenes .

Genes "órfãos" , cuja sequência não mostra nenhuma semelhança com os genes existentes, são menos comuns do que duplicatas de genes. O genoma humano contém uma estimativa de 18 a 60 genes sem homólogos identificáveis ​​fora dos humanos. Os genes órfãos surgem principalmente da emergência de novo de uma sequência anteriormente não codificadora ou da duplicação do gene seguida por uma mudança tão rápida na sequência que a relação original se torna indetectável. Genes de novo são tipicamente mais curtos e mais simples em estrutura do que a maioria dos genes eucarióticos, com poucos ou nenhum íntron. Durante longos períodos evolutivos, o nascimento do gene de novo pode ser responsável por uma fração significativa de famílias de genes restritas taxonomicamente.

A transferência horizontal de genes se refere à transferência de material genético por meio de um mecanismo diferente da reprodução . Esse mecanismo é uma fonte comum de novos genes em procariotos , às vezes pensada para contribuir mais para a variação genética do que a duplicação de genes. É um meio comum de disseminar resistência a antibióticos , virulência e funções metabólicas adaptativas . Embora a transferência horizontal de genes seja rara em eucariotos, exemplos prováveis ​​foram identificados de genomas de protistas e algas contendo genes de origem bacteriana.

Genoma

O genoma é o material genético total de um organismo e inclui os genes e as sequências não codificantes . Genes eucarióticos podem ser anotados usando FINDER.

Número de genes

Representação de números de genes para plantas representativas (verde), vertebrados (azul), invertebrados (laranja), fungos (amarelo), bactérias (roxo) e vírus (cinza). Uma inserção à direita mostra os genomas menores expandidos 100 vezes em área.

O tamanho do genoma e o número de genes que ele codifica variam amplamente entre os organismos. Os menores genomas ocorrem em vírus e viróides (que atuam como um único gene de RNA não codificador). Por outro lado, as plantas podem ter genomas extremamente grandes, com arroz contendo> 46.000 genes codificadores de proteínas. O número total de genes codificadores de proteínas (o proteoma da Terra ) é estimado em 5 milhões de sequências.

Embora o número de pares de bases de DNA no genoma humano seja conhecido desde 1960, o número estimado de genes mudou ao longo do tempo conforme as definições dos genes, e os métodos de detectá-los foram refinados. As previsões teóricas iniciais do número de genes humanos chegavam a 2.000.000. As primeiras medidas experimentais indicaram que havia de 50.000 a 100.000 genes transcritos ( tags de sequência expressa ). Posteriormente, o sequenciamento no Projeto Genoma Humano indicou que muitos desses transcritos eram variantes alternativas dos mesmos genes, e o número total de genes codificadores de proteínas foi revisado para ~ 20.000 com 13 genes codificados no genoma mitocondrial . Com o projeto de anotação GENCODE , essa estimativa continuou a cair para 19.000. Do genoma humano, apenas 1–2% consiste em sequências codificadoras de proteínas, com o restante sendo DNA 'não codificador' , como íntrons , retrotransposons e RNAs não codificantes . Todo organismo multicelular tem todos os seus genes em cada célula de seu corpo, mas nem todos os genes funcionam em todas as células.

Genes essenciais

Funções do gene no genoma mínimo do organismo sintético , Syn 3 .

Genes essenciais são o conjunto de genes considerados críticos para a sobrevivência de um organismo. Esta definição pressupõe a disponibilidade abundante de todos os nutrientes relevantes e a ausência de estresse ambiental. Apenas uma pequena porção dos genes de um organismo é essencial. Em bactérias, cerca de 250-400 genes são essenciais para Escherichia coli e Bacillus subtilis , o que representa menos de 10% de seus genes. Metade desses genes são ortólogos em ambos os organismos e estão amplamente envolvidos na síntese de proteínas . Na levedura Saccharomyces cerevisiae, o número de genes essenciais é ligeiramente maior, com 1000 genes (~ 20% de seus genes). Embora o número seja mais difícil de medir em eucariotos superiores, estima-se que camundongos e humanos tenham cerca de 2.000 genes essenciais (~ 10% de seus genes). O organismo sintético, Syn 3 , tem um genoma mínimo de 473 genes essenciais e genes quase essenciais (necessários para crescimento rápido), embora 149 tenham função desconhecida.

Os genes essenciais incluem genes de manutenção (críticos para funções celulares básicas), bem como genes que são expressos em momentos diferentes no desenvolvimento ou ciclo de vida do organismo . Os genes domésticos são usados ​​como controles experimentais ao analisar a expressão gênica , uma vez que são expressos constitutivamente em um nível relativamente constante.

Nomenclatura genética e genômica

A nomenclatura do gene foi estabelecida pelo HUGO Gene Nomenclature Committee (HGNC), um comitê da Organização do Genoma Humano , para cada gene humano conhecido na forma de um nome de gene aprovado e símbolo ( abreviatura ), que pode ser acessado através de um banco de dados mantido pelo HGNC. Os símbolos são escolhidos para serem únicos e cada gene tem apenas um símbolo (embora os símbolos aprovados às vezes mudem). Os símbolos são preferencialmente mantidos consistentes com outros membros de uma família de genes e com homólogos em outras espécies, particularmente o camundongo devido ao seu papel como um organismo modelo comum .

Engenharia genética

Comparação do melhoramento genético convencional com a modificação genética transgênica e cisgênica.

A engenharia genética é a modificação do genoma de um organismo por meio da biotecnologia . Desde a década de 1970, uma variedade de técnicas foi desenvolvida para adicionar, remover e editar genes especificamente em um organismo. Técnicas de engenharia de genoma desenvolvidas recentemente usam enzimas de nuclease projetadas para criar reparo de DNA direcionado em um cromossomo para interromper ou editar um gene quando a quebra é reparada. O termo relacionado biologia sintética é algumas vezes usado para se referir à extensa engenharia genética de um organismo.

A engenharia genética é agora uma ferramenta de pesquisa de rotina com organismos-modelo . Por exemplo, genes são facilmente adicionados a bactérias e linhagens de camundongos knockout com a função de um gene específico interrompida são usadas para investigar a função desse gene. Muitos organismos foram geneticamente modificados para aplicações na agricultura , biotecnologia industrial e medicina .

Para organismos multicelulares, normalmente o embrião é modificado e se transforma no organismo adulto geneticamente modificado . No entanto, os genomas das células em um organismo adulto podem ser editados usando técnicas de terapia genética para tratar doenças genéticas.

Veja também

Referências

Citações

Fontes

Livro didático principal

Leitura adicional

links externos