Relógio molecular mitocondrial humano - Human mitochondrial molecular clock

O relógio molecular mitocondrial humano é a taxa na qual as mutações têm se acumulado no genoma mitocondrial dos hominídeos durante o curso da evolução humana . O registro arqueológico da atividade humana desde os primeiros períodos da pré-história humana é relativamente limitado e sua interpretação tem sido controversa. Por causa das incertezas do registro arqueológico, os cientistas se voltaram para as técnicas de datação molecular para refinar a linha do tempo da evolução humana. Um dos principais objetivos dos cientistas da área é desenvolver um relógio molecular mitocondrial hominídeo preciso, que poderia então ser usado para datar com segurança eventos que ocorreram durante o curso da evolução humana.

As estimativas da taxa de mutação do DNA mitocondrial humano (mtDNA) variam muito, dependendo dos dados disponíveis e do método usado para a estimativa. Os dois métodos principais de estimativa, métodos baseados em filogenia e métodos baseados em linhagem, produziram taxas de mutação que diferem em quase uma ordem de magnitude. A pesquisa atual tem se concentrado em resolver a alta variabilidade obtida a partir de diferentes estimativas de taxas.

Variabilidade da taxa

Uma das principais suposições da teoria do relógio molecular é que as mutações dentro de um sistema genético específico ocorrem a uma taxa estatisticamente uniforme e essa taxa uniforme pode ser usada para datar eventos genéticos. Na prática, a suposição de uma única taxa uniforme é uma simplificação exagerada. Embora uma única taxa de mutação seja frequentemente aplicada, geralmente é um composto ou uma média de várias taxas de mutação diferentes. Muitos fatores influenciam as taxas de mutação observadas e esses fatores incluem o tipo de amostras, a região do genoma estudada e o período de tempo coberto.

Taxas reais vs. observadas

A taxa na qual as mutações ocorrem durante a reprodução, a taxa de mutação da linha germinativa , é considerada mais alta do que todas as taxas de mutação observadas, porque nem todas as mutações são transmitidas com sucesso às gerações subsequentes. O mtDNA é transmitido apenas ao longo da linha matrilinear e, portanto, as mutações transmitidas aos filhos são perdidas. A deriva genética aleatória também pode causar a perda de mutações. Por essas razões, a taxa de mutação real não será equivalente à taxa de mutação observada em uma amostra da população.

Tamanho da população

Acredita-se que a dinâmica da população influencia as taxas de mutação observadas. Quando uma população está se expandindo, mais mutações germinativas são preservadas na população. Como resultado, as taxas de mutação observadas tendem a aumentar em uma população em expansão. Quando as populações se contraem, como em um gargalo populacional , mais mutações germinativas são perdidas. Os gargalos populacionais, portanto, tendem a desacelerar as taxas de mutação observadas. Desde o surgimento da espécie homo sapiens há cerca de 200.000 anos, a população humana se expandiu de alguns milhares de indivíduos que vivem na África para mais de 6,5 bilhões em todo o mundo. No entanto, a expansão não foi uniforme, então a história das populações humanas pode consistir em gargalos e expansões.

Variabilidade estrutural

A taxa de mutação no genoma mitocondrial não é uniformemente distribuída. Certas regiões do genoma são conhecidas por sofrer mutações mais rapidamente do que outras. As regiões hipervariáveis são conhecidas por serem altamente polimórficas em relação a outras partes do genoma.

A taxa na qual as mutações se acumulam nas regiões codificantes e não codificantes do genoma também difere, pois as mutações na região codificadora estão sujeitas à seleção de purificação . Por esse motivo, alguns estudos evitam regiões codificantes ou mutações não sinônimas ao calibrar o relógio molecular. Loogvali et al. (2009) consideram apenas mutações sinônimas, eles recalibraram o relógio molecular do mtDNA humano como 7990 anos por mutação sinônima no genoma mitocondrial. Soares et al. (2009) consideram as mutações da região codificadora e não codificadora para chegar a uma única taxa de mutação, mas aplicam um fator de correção para contabilizar a seleção na região codificadora.

Variabilidade temporal

Observou-se que a taxa de mutação varia com o tempo. As taxas de mutação na espécie humana são mais rápidas do que as observadas ao longo da linhagem do macaco humano. A taxa de mutação também é considerada mais rápida nos últimos tempos, desde o início do Holoceno, 11.000 anos atrás.

Mutações paralelas e saturação

A mutação paralela (às vezes chamada de homoplasia) ou evolução convergente ocorre quando linhagens separadas têm a mesma mutação e ocorrem independentemente no mesmo local do genoma. A saturação ocorre quando um único site sofre múltiplas mutações. As mutações paralelas e a saturação resultam na subestimação da taxa de mutação, pois é provável que passem despercebidas.

Heteroplasmia

Os indivíduos afetados pela heteroplasmia apresentam uma mistura de tipos de mtDNA, alguns com novas mutações e outros sem. As novas mutações podem ou não ser transmitidas às gerações subsequentes. Assim, a presença de indivíduos heteroplasmáticos em uma amostra pode complicar o cálculo das taxas de mutação.

Métodos

Com base no pedigree

Os métodos de linhagem estimam a taxa de mutação comparando as sequências de mtDNA de uma amostra de pares de pais / filhos ou analisando as sequências de mtDNA de indivíduos de uma genealogia profundamente enraizada. O número de novas mutações na amostra é contado e dividido pelo número total de eventos de transmissão de DNA de pai para filho para chegar a uma taxa de mutação.

Baseado em filogenia

Métodos baseados em filogenia são estimados reconstruindo primeiro o haplótipo do ancestral comum mais recente (MRCA) de uma amostra de duas ou mais linhagens genéticas. Um requisito é que o tempo até o ancestral comum mais recente ( TMRCA ) da amostra de linhagens já deve ser conhecido de outras fontes independentes, geralmente o registro arqueológico. O número médio de mutações que se acumularam desde o MRCA é então calculado e dividido pelo TMRCA para chegar à taxa de mutação. A taxa de mutação humana é geralmente estimada comparando as sequências de humanos modernos e chimpanzés e, em seguida, reconstruindo o haplótipo ancestral do ancestral comum chimpanzé-humano. De acordo com o registro paleontológico, o último ancestral comum dos humanos pode ter vivido há cerca de 6 milhões de anos.

Comparação entre pedigree e filogenia

Taxas obtidas por métodos de linhagem são cerca de 10 vezes mais rápidas do que aquelas obtidas por métodos filogenéticos. Vários fatores atuando em conjunto podem ser responsáveis ​​por essa diferença. Como os métodos de linhagem registram mutações em indivíduos vivos, as taxas de mutação dos estudos de linhagem estão mais próximas da taxa de mutação da linhagem germinativa. Os estudos de linhagem usam genealogias com apenas algumas gerações de profundidade, enquanto os métodos baseados em filogenia usam escalas de tempo com milhares ou milhões de anos de profundidade. De acordo com Henn et al. 2009, os métodos baseados em filogenia levam em consideração eventos que ocorrem em escalas de tempo longas e, portanto, são menos afetados por flutuações estocásticas. Howell et al. 2003 sugere que seleção, saturação, mutações paralelas e deriva genética são responsáveis ​​pelas diferenças observadas entre métodos baseados em linhagem e métodos baseados em filogenia.

Estimativa baseada na arqueologia AMH

Métodos / parâmetros para datas arqueologicamente estimadas da Eva mitocondrial
Estude
Tipo de sequência
Âncora T
(localização)
Método de referência
(método de correção)
Cann, Stoneking & Wilson (1987) Fragmentos de restrição 40, 30 e 12 Ka
(Austrália,
Nova Guiné,
Novo Mundo)

migrações definidas arqueologicamente combinadas com
taxas de divergência de sequência estimadas
Endicott & Ho (2008) Genômico 40 a 55 Ka
(Papua-Nova Guiné)
14,5 a 21,5 Ka
(Haps H1 e H3)
PNG seguindo
Haplogrupo P

Humanos anatômicos modernos (AMH) se espalharam pela África e por uma grande área da Eurásia e deixaram artefatos ao longo da costa norte do sudoeste, sul, sudeste e leste da Ásia. Cann, Stoneking & Wilson (1987) não se baseou em um T CHLCA previsto para estimar as taxas de polimorfismo de nucleotídeo único (SNP). Em vez disso, eles usaram evidências de colonização no sudeste da Ásia e na Oceania para estimar as taxas de mutação. Além disso, eles usaram a tecnologia RFLP ( polimorfismo de comprimento de fragmento de restrição ) para examinar as diferenças entre o DNA. Usando essas técnicas, esse grupo chegou a um T MRCA de 140.000 a 290.000 anos. Cann et al. (1987) estimou o TMRCA de humanos em aproximadamente 210 ky e as estimativas mais recentes de Soares et al. 2009 (usando o mtDNA MRCA humano de chimpanzé de 7 milhões de anos) diferem em apenas 9%, o que é relativamente próximo considerando a ampla faixa de confiança para ambas as estimativas e chamadas para T CHLCA mais antigo .

Endicott & Ho (2008) reavaliaram as migrações previstas globalmente e as compararam com as evidências reais. Este grupo usou as regiões codificantes das sequências. Eles postulam que o relógio molecular baseado em comparações entre chimpanzés e humanos não é confiável, particularmente na previsão de migrações recentes, como migrações iniciais para a Europa, Austrália e os americanos. Com essa técnica, esse grupo chegou a um T MRCA de 82.000 a 134.000 anos.

Estimativa baseada em CHLCA

Como os chimpanzés e os humanos compartilham um ancestral matrilinear, estabelecer a idade geológica desse último ancestral permite estimar a taxa de mutação. O último ancestral comum chimpanzé-humano (CHLCA) é frequentemente aplicado como uma âncora para estudos de MRCA mt-T com intervalos entre 4 e 13 milhões de anos citados na literatura. Esta é uma fonte de variação nas estimativas de tempo. A outra fraqueza é o acúmulo não semelhante ao relógio de SNPs, que tenderia a fazer os branches mais recentes parecerem mais antigos do que realmente são.

As taxas de SNP descritas por Soares et al. (2009)
Regiões Sub-regiões
(ou site dentro do códon)
Taxa SNP
(por site * ano)

Região de controle
HVR I 1,6 × 10 -7
HVR II 2,3 × 10 −7
restante 1,5 × 10 −8

Codificação de proteína
( 1ª e 2ª ) 8,8 × 10 −9
( ) 1,9 × 10 −8
DNA que codifica rRNA (rDNA) 8,2 × 10 -9
DNA que codifica tRNA (tDNA) 6,9 × 10 −9
de outros 2,4 × 10 -8
T CHLCA assumiu 6,5 Ma, taxa relativa para 1o e 2o códons

Essas duas fontes podem se equilibrar ou se amplificar, dependendo da direção do erro T CHLCA . Existem duas razões principais pelas quais esse método é amplamente empregado. Em primeiro lugar, as taxas baseadas no gráfico de linhagem são inadequadas para estimativas por longos períodos de tempo. Em segundo lugar, embora as taxas ancoradas pela arqueologia representem o intervalo intermediário, as evidências arqueológicas da colonização humana geralmente ocorrem bem após a colonização. Por exemplo, acredita-se que a colonização da Eurásia de oeste para leste tenha ocorrido ao longo do Oceano Índico. No entanto, os sítios arqueológicos mais antigos que também demonstram humanos anatomicamente modernos (AMH) estão na China e na Austrália, com mais de 42.000 anos de idade. No entanto, o sítio indígena mais antigo com AMH permanece há 34.000 anos, e outro sítio com arqueologia compatível com AMH tem mais de 76.000 anos de idade. Portanto, a aplicação da âncora é uma interpretação subjetiva de quando os humanos estiveram presentes pela primeira vez.

Uma medida simples da divergência de sequência entre humanos e chimpanzés pode ser determinada pela observação dos SNPs. Dado que o mitogenoma tem cerca de 16553 pares de bases de comprimento (cada par de bases que pode ser alinhado com referências conhecidas é chamado de sítio), a fórmula é:

O '2' no denominador é derivado das 2 linhagens, humana e chimpanzé, que se separaram da CHLCA. Idealmente, ele representa o acúmulo de mutações em ambas as linhagens, mas em posições diferentes (SNPs). Desde que o número de SNP observado se aproxime do número de mutações, esta fórmula funciona bem. No entanto, em locais de rápida evolução, as mutações são obscurecidas por efeitos de saturação. Classificar as posições dentro do mitogenoma por taxa e compensar a saturação são abordagens alternativas.

Como o T CHLCA está sujeito a alterações com mais informações paleontológicas, a equação descrita acima permite a comparação do TMRCA de diferentes estudos.

Métodos / parâmetros para estimar a data da Eva mitocondrial
Estude
Tipo de sequência
T CHLCA
(tempo de classificação)
Método de referência
(método de correção)
Vigilant et al. (1991) HVR 4 a 6 ma Transversões CH,
(transição 15: 1: transversão)
Ingman et al. (2000) genômico
(não HVR)
5 ma
Comparação genômica CH
Endicott & Ho (2008) genômico
(não HVR)
5 a 7,5 Ma CH
(taxa relaxada, taxa definida por classe)
Gonder et al. (2007) genômico
(não HVR)
6,0 Ma
(+ 0,5 Ma)
CH
(classe de tarifa definida)
Mishmar et al. (2003) genômico
(não HVR)
6,5 Ma
(+ 0,5 Ma)
CH
(classe de tarifa definida)
Soares et al. (2009) genômico 6,5
Ma (+ 0,5 Ma)
CHLCA ancorado, (seleção examinada por
Ka / (Ks + k))
Chimpanzé para Humano = CH, LCA = último ancestral comum

Métodos iniciais, HVR, baseados em sequência

Para superar os efeitos da saturação , a análise de HVR baseou-se na distância transversal entre humanos e chimpanzés. Uma transição para a razão de transversão foi aplicada a esta distância para estimar a divergência de sequência no HVR entre chimpanzés e humanos, e dividida por um T CHLCA assumido de 4 a 6 milhões de anos. Com base em 26,4 substituições entre chimpanzés e humanos e na proporção de 15: 1, as 396 transições estimadas em 610 pares de bases demonstraram divergência de sequência de 69,2% (taxa * T CHLCA de 0,369), produzindo taxas de divergência de aproximadamente 11,5% a 17,3% por milhão anos .

HVR é excepcionalmente propenso à saturação, levando à subestimação da taxa de SNP ao comparar linhagens relacionadas muito distantes

Vigilant et al. (1991) também estimaram a taxa de divergência de sequência para os locais nas regiões HVR I e HVR II de evolução rápida. Conforme observado na tabela acima, a taxa de evolução é tão alta que a saturação do local ocorre em comparações diretas entre chimpanzés e humanos. Consequentemente, este estudo usou transversões, que evoluem em uma taxa mais lenta do que os polimorfismos de transição mais comuns. Comparando chimpanzés e mitogenomas humanos, eles notaram 26,4 transversões dentro das regiões HVR, no entanto, eles não fizeram nenhuma correção para a saturação. À medida que mais sequência de HVR foi obtida após este estudo, notou-se que o sítio de dinucleotídeo CRS: 16181-16182 experimentou numerosas transversões na análise de parcimônia, muitas delas foram consideradas erros de sequenciamento. No entanto, o sequenciamento de Feldhofer I Neanderthal revelou que também havia uma transversão entre humanos e Neanderthals neste local. Além disso, Soares et al. (2009) observaram três locais em que ocorreram transversões recorrentes em linhagens humanas, dois dos quais em HVR I, 16265 (12 ocorrências) e 16318 (8 ocorrências). Portanto, 26,4 transversões era uma subestimativa do número provável de eventos de transversão. O estudo do ano de 1991 também usou uma razão de transição para transversão do estudo de macacos do velho mundo de 15: 1. No entanto, o exame de HVR de chimpanzés e gorilas revela uma taxa que é mais baixa, e o exame de humanos coloca a taxa em 34: 1. Portanto, este estudo subestimou esse nível de divergência de sequência entre chimpanzés e humanos. A divergência de sequência estimada de 0,738 / local (inclui transversões) é significativamente menor do que ~ 2,5 por local sugerido por Soares et al. (2009). Esses dois erros resultariam em uma superestimativa do TMRCA mitocondrial humano. No entanto, eles falharam em detectar a linhagem L0 basal na análise e também falharam em detectar transições recorrentes em muitas linhagens, que também subestimam o TMRCA. Além disso, Vigilant et al. (1991) usaram uma âncora CHLCA mais recente de 4 a 6 milhões de anos.

Métodos baseados em sequência de região de codificação

Haplogrupos de mtDNA africanos
L0

L0d

L0k

L0f

L0b

L0a

L1

L1b

L1c

L5

L2

L6

L3

L4

A sequência parcial da região codificadora originalmente suplementou os estudos de HVR porque a sequência completa da região codificadora era incomum. Havia suspeitas de que os estudos de HVR haviam perdido ramos principais com base em alguns estudos anteriores de RFLP e região de codificação. Ingman et al. (2000) foi o primeiro estudo a comparar sequências genômicas para análise de coalescência. A sequência da região de codificação discriminou haplogrupos M e N e macrohaplogrupos L0 e L1 . Como o sequenciamento de DNA genômico resolveu os dois ramos mais profundos, melhorou alguns aspectos estimando TMRCA sobre a sequência HVR sozinha. Excluindo o D-loop e usando um T CHLCA de 5 milhões de anos , Ingman et al. (2000) estimou a taxa de mutação em 1,70 × 10 -8 por local por ano (taxa * T CHLCA = 0,085, 15.435 locais).

No entanto, a região codificadora do DNA foi questionada porque as sequências codificantes estão sob seleção purificadora para manter a estrutura e função, ou sob seleção regional para desenvolver novas capacidades. O problema com as mutações na região codificadora foi descrito como tal: mutações que ocorrem na região codificadora que não são letais para a mitocôndria podem persistir, mas são negativamente seletivas para o hospedeiro; ao longo de algumas gerações, eles persistirão, mas ao longo de milhares de gerações, eles serão lentamente eliminados da população, deixando os SNPs. No entanto, ao longo de milhares de gerações, mutações regionalmente seletivas não podem ser discriminadas dessas mutações transitórias da região codificadora. O problema com mutações raras nos mitogenomas humanos é significativo o suficiente para levar a meia dúzia de estudos recentes sobre o assunto.

Ingman et al. (2000) estimaram a evolução da região não-D loop 1,7 × 10 -8 por ano por local com base em 53 sequências genômicas não idênticas que superrepresentam a África em uma amostra global. Apesar desta representação excessiva, a resolução das sub-ramificações L0 estava faltando e uma outra ramificação L1 profunda foi encontrada. Apesar dessas limitações, a amostragem foi adequada para o estudo de referência. Hoje, L0 está restrito às populações africanas, enquanto L1 é o haplogrupo ancestral de todos os não-africanos, bem como da maioria dos africanos. A sequência da Eva mitocondrial pode ser aproximada comparando uma sequência de L0 com uma sequência de L1. Ao reconciliar as mutações em L0 e L1. As sequências de mtDNA de populações humanas contemporâneas geralmente diferem da sequência da Eva mitocondrial em cerca de 50 mutações. As taxas de mutação não foram classificadas de acordo com o local (exceto excluindo as regiões HVR). O T CHLCA usado no estudo do ano 2000 de 5 Ma também foi menor do que os valores usados ​​nos estudos mais recentes.

Estimativas do DNA antigo

Uma vez que se tornou possível sequenciar um grande número de mitogenomas antigos, vários estudos estimaram a taxa de mutação mitocondrial medindo quantas mutações mais, em média, se acumularam nos genomas modernos (ou posteriores) em comparação com os antigos (ou anteriores) descendentes dos mesmos. nó filogenético. Esses estudos obtiveram resultados semelhantes: estimativas centrais para todo o cromossomo, em substituições por local por ano: 2,47 × 10 -8 ; 2,14 × 10 −8 ; 2,53 × 10 −8 ; e 2,74 × 10 −8 .

Comparando taxas e estudos

O relógio molecular do DNA mitocondrial tem sido criticado por causa de seu relógio molecular inconsistente. Uma análise retrospectiva de qualquer processo pioneiro revelará inadequações. Com mitocondrial, as inadequações são o argumento da ignorância da variação da taxa e excesso de confiança em relação ao T CHLCA de 5 Ma. A falta de perspectiva histórica pode explicar a segunda questão, o problema da variação da taxa é algo que só poderia ser resolvido pelo estudo massivo das mitocôndrias que se seguiu. O número de sequências HVR que se acumularam de 1987 a 2000 aumentou em magnitudes. Soares et al. (2009) usaram 2196 sequências mitogenômicas e descobriram 10.683 eventos de substituição dentro dessas sequências. Onze dos 16.560 locais no mitogenoma produziram mais de 11% de todas as substituições com variação de taxa estatisticamente significativa dentro dos 11 locais. Eles argumentam que há uma taxa de mutação de local neutro que é uma magnitude mais lenta do que a taxa observada para o local mais rápido, CRS 16519. Consequentemente, purificando a seleção à parte, a própria taxa de mutação varia entre os locais, com alguns locais muito mais propensos a sofrem novas mutações em relação a outros. Soares et al. (2009) observaram dois spans de DNA, CRS 2651-2700 e 3028-3082, que não tinham SNPs nas 2196 sequências mitogenômicas.

Árvore filogenética de haplogrupos de DNA mitocondrial humano (mtDNA)

  Eva mitocondrial ( L )    
L0 L1-6  
L1 L2   L3     L4 L5 L6
M N  
CZ D E G Q   O UMA S R   eu C X Y
C Z B F R0   pré-JT   P   você
HV JT K
H V J T

Notas

Notas de rodapé

Referências