Estrutura primária da proteína - Protein primary structure

Protein primary structure Protein secondary structure Protein tertiary structure Protein quaternary structure
A imagem acima contém links clicáveis
Diagrama interativo da estrutura da proteína , usando PCNA como exemplo. ( PDB : 1AXC )

A estrutura primária da proteína é a sequência linear de aminoácidos em um peptídeo ou proteína . Por convenção, a estrutura primária de uma proteína é relatada a partir da extremidade do terminal amino (N) até a extremidade do terminal carboxila (C). A biossíntese de proteínas é mais comumente realizada pelos ribossomos nas células. Os peptídeos também podem ser sintetizados em laboratório. Estruturas primárias de proteínas podem ser sequenciadas diretamente ou inferidas a partir de sequências de DNA .

Formação

Biológico

Os aminoácidos são polimerizados por meio de ligações peptídicas para formar uma estrutura longa , com as diferentes cadeias laterais de aminoácidos projetando-se ao longo dela. Em sistemas biológicos, as proteínas são produzidas durante a tradução pelos ribossomos de uma célula . Alguns organismos também podem fazer peptídeos curtos por síntese de peptídeos não ribossomais , que frequentemente usam aminoácidos diferentes do padrão 20, e podem ser ciclizados, modificados e reticulados.

Químico

Os peptídeos podem ser sintetizados quimicamente por meio de uma variedade de métodos de laboratório. Métodos químicos normalmente sintetizam peptídeos na ordem oposta (começando no terminal C) para a síntese de proteínas biológicas (começando no terminal N).

Notação

A sequência da proteína é tipicamente notada como uma seqüência de letras, listando os aminoácidos começando na extremidade do terminal amino até a extremidade do terminal carboxila . Um código de três letras ou um código de uma letra pode ser usado para representar os 20 aminoácidos de ocorrência natural, bem como misturas ou aminoácidos ambíguos (semelhante à notação de ácido nucleico ).

Os peptídeos podem ser sequenciados diretamente ou inferidos a partir de sequências de DNA . Agora existem grandes bancos de dados de sequências que agrupam sequências de proteínas conhecidas.

Notação de 20 aminoácidos naturais
Aminoácido 3 letras 1 letra
Alanina Ala UMA
Arginina Arg R
Asparagina Asn N
Ácido aspártico Asp D
Cisteína Cys C
Ácido glutâmico Glu E
Glutamina Gln Q
Glicina Gly G
Histidina Seu H
Isoleucina Ile eu
Leucina Leu eu
Lisina Lys K
Metionina Conheceu M
Fenilalanina Phe F
Proline Pró P
Serine Ser S
Treonina Thr T
Triptofano Trp C
Tirosina Tyr Y
Valine Val V
Notação ambígua de aminoácidos
Símbolo Descrição Resíduos representados
X Qualquer aminoácido ou desconhecido Tudo
B Aspartato ou Asparagina D, N
Z Glutamato ou Glutamina E, Q
J Leucina ou Isoleucina I, L
Φ Hidrofóbico V, I, L, F, W, M
Ω Aromático F, W, Y, H
Ψ Alifático V, I, L, M
π Pequeno P, G, A, S
ζ Hidrofílico S, T, H, N, Q, E, D, K, R, Y
+ Carregado positivamente K, R, H
- Cobrado negativamente D, E

Modificação

Em geral, os polipeptídeos são polímeros não ramificados, de modo que sua estrutura primária pode frequentemente ser especificada pela sequência de aminoácidos ao longo de sua estrutura. No entanto, as proteínas podem se tornar reticuladas, mais comumente por ligações dissulfeto , e a estrutura primária também requer a especificação dos átomos de reticulação, por exemplo, especificando as cisteínas envolvidas nas ligações dissulfeto da proteína. Outras ligações cruzadas incluem desmosina .

Isomerização

Os centros quirais de uma cadeia polipeptídica podem sofrer racemização . Embora não mude a sequência, ele afeta as propriedades químicas da sequência. Em particular, os L- aminoácidos normalmente encontrados em proteínas podem isomerizar espontaneamente no átomo para formar D- aminoácidos, que não podem ser clivados pela maioria das proteases . Além disso, a prolina pode formar isômeros trans estáveis ​​na ligação peptídica.

Modificação pós-tradução

Finalmente, a proteína pode sofrer uma variedade de modificações pós-tradução , que são resumidas aqui.

O grupo amino N-terminal de um polipeptídeo pode ser modificado covalentemente, por exemplo,

Fig. 1 acetilação N-terminal
  • acetilação
A carga positiva no grupo amino N-terminal pode ser eliminada mudando-o para um grupo acetil (bloqueio N-terminal).
  • formilação
A metionina N-terminal geralmente encontrada após a tradução tem um N-terminal bloqueado com um grupo formil. Este grupo formil (e às vezes o próprio resíduo de metionina, se seguido por Gly ou Ser) é removido pela enzima deformilase .
  • piroglutamato
Fig. 2 Formação de piroglutamato a partir de uma glutamina N-terminal
Uma glutamina N-terminal pode atacar a si mesma, formando um grupo piroglutamato cíclico.
  • miristoilação
Semelhante à acetilação. Em vez de um simples grupo metil, o grupo miristoil tem uma cauda de 14 carbonos hidrofóbicos, o que o torna ideal para ancorar proteínas às membranas celulares .

O grupo carboxilato C-terminal de um polipeptídeo também pode ser modificado, por exemplo,

Fig. 3 amidação C-terminal
  • aminação (ver Figura)
O terminal C também pode ser bloqueado (assim, neutralizando sua carga negativa) por aminação.
  • anexo de glicosil fosfatidilinositol (GPI)
Glicosil fosfatidilinositol (GPI) é um grande grupo protético fosfolipídico hidrofóbico que ancora proteínas às membranas celulares . Ele é ligado ao polipeptídeo C-terminal através de uma ligação amida que então se conecta à etanolamina, daí a diversos açúcares e finalmente à porção fosfatidilinositol lipídica.

Finalmente, as cadeias laterais do peptídeo também podem ser modificadas covalentemente, por exemplo,

  • fosforilação
Além da clivagem, a fosforilação é talvez a modificação química mais importante das proteínas. Um grupo fosfato pode ser ligado ao grupo hidroxila da cadeia lateral de resíduos de serina, treonina e tirosina, adicionando uma carga negativa naquele local e produzindo um aminoácido não natural. Essas reações são catalisadas por quinases e a reação reversa é catalisada por fosfatases. As tirosinas fosforiladas são freqüentemente usadas como "alças" pelas quais as proteínas podem se ligar umas às outras, enquanto a fosforilação de Ser / Thr freqüentemente induz mudanças conformacionais, presumivelmente por causa da carga negativa introduzida. Os efeitos da fosforilação de Ser / Thr podem às vezes ser simulados por mutação do resíduo Ser / Thr em glutamato.
Um nome abrangente para um conjunto de modificações químicas muito comuns e muito heterogêneas. As porções de açúcar podem ser ligadas aos grupos hidroxil de cadeia lateral de Ser / Thr ou aos grupos amida de cadeia lateral de Asn. Esses acessórios podem servir a muitas funções, desde aumentar a solubilidade até o reconhecimento complexo. Toda a glicosilação pode ser bloqueada com certos inibidores, como a tunicamicina .
Nesta modificação, uma cadeia lateral de asparagina ou aspartato ataca a seguinte ligação peptídica, formando um intermediário succinimida simétrico. A hidrólise do intermediário produz aspartato ou o β-aminoácido iso (Asp). Para a asparagina, qualquer um dos produtos resulta na perda do grupo amida, portanto "desamidação".
Os resíduos de prolina podem ser hidroxilatos em qualquer um dos dois átomos, assim como a lisina (em um átomo). A hidroxiprolina é um componente crítico do colágeno , que se torna instável após sua perda. A reação de hidroxilação é catalisada por uma enzima que requer ácido ascórbico (vitamina C), deficiências que levam a muitas doenças do tecido conjuntivo, como o escorbuto .
Vários resíduos de proteínas podem ser metilados, mais notavelmente os grupos positivos de lisina e arginina . Os resíduos de arginina interagem com a estrutura de fosfato de ácido nucleico e comumente formam ligações de hidrogênio com os resíduos de base, particularmente guanina , em complexos de proteína-DNA. Os resíduos de lisina podem ser simples, duplamente e até triplamente metilados. A metilação não altera a carga positiva na cadeia lateral, no entanto.
A acetilação dos grupos amino da lisina é quimicamente análoga à acetilação do N-terminal. Funcionalmente, no entanto, a acetilação de resíduos de lisina é usada para regular a ligação de proteínas aos ácidos nucléicos. O cancelamento da carga positiva na lisina enfraquece a atração eletrostática pelos ácidos nucléicos (carregados negativamente).
  • sulfatação
As tirosinas podem se tornar sulfatadas em seu átomo. De forma um tanto incomum, essa modificação ocorre no aparelho de Golgi , não no retículo endoplasmático . Semelhante às tirosinas fosforiladas, as tirosinas sulfatadas são usadas para reconhecimento específico, por exemplo, em receptores de quimiocinas na superfície da célula. Tal como acontece com a fosforilação, a sulfatação adiciona uma carga negativa a um local anteriormente neutro.
  • prenilação e palmitoilação
O isopreno hidrofóbico (por exemplo, grupos farnesil, geranil e geranilgeranil) e os grupos palmitoil podem ser adicionados ao átomo de resíduos de cisteína para ancorar proteínas às membranas celulares . Ao contrário das âncoras GPI e miritoíla, esses grupos não são necessariamente adicionados aos terminais.
  • carboxilação
Uma modificação relativamente rara que adiciona um grupo carboxilato extra (e, portanto, uma carga negativa dupla) a uma cadeia lateral de glutamato, produzindo um resíduo Gla. Isso é usado para fortalecer a ligação aos íons de metal "duro", como o cálcio .
  • ADP-ribosilação
O grande grupo ADP-ribosil pode ser transferido para vários tipos de cadeias laterais dentro das proteínas, com efeitos heterogêneos. Essa modificação é um alvo para as toxinas poderosas de bactérias díspares, por exemplo, Vibrio cholerae , Corynebacterium diphtheriae e Bordetella pertussis .
Várias proteínas dobradas de comprimento total podem ser anexadas em seus terminais C aos grupos de amônio da cadeia lateral de lisinas de outras proteínas. Ubiquitina é a mais comum delas e geralmente sinaliza que a proteína marcada com ubiquitina deve ser degradada.

A maioria das modificações polipeptídicas listadas acima ocorrem pós-tradução , ou seja, após a proteína ter sido sintetizada no ribossomo , ocorrendo normalmente no retículo endoplasmático , uma organela subcelular da célula eucariótica.

Muitas outras reações químicas (por exemplo, cianilação) foram aplicadas a proteínas por químicos, embora não sejam encontradas em sistemas biológicos.

Clivagem e ligadura

Além das listadas acima, a modificação mais importante da estrutura primária é a clivagem do peptídeo (por hidrólise química ou por proteases ). As proteínas são freqüentemente sintetizadas em uma forma precursora inativa; tipicamente, um segmento N-terminal ou C-terminal bloqueia o sítio ativo da proteína, inibindo sua função. A proteína é ativada pela clivagem do peptídeo inibitório.

Algumas proteínas ainda têm o poder de se clivar. Normalmente, o grupo hidroxil de uma serina (raramente, treonina) ou o grupo tiol de um resíduo de cisteína atacará o carbono carbonil da ligação peptídica anterior, formando um intermediário ligado tetraedricamente [classificado como uma hidroxioxazolidina (Ser / Thr) ou hidroxitiazolidina ( Cys) intermediário]. Esse intermediário tende a reverter para a forma amida, expelindo o grupo de ataque, uma vez que a forma amida costuma ser favorecida por energia livre (presumivelmente devido à forte estabilização de ressonância do grupo peptídico). No entanto, interações moleculares adicionais podem tornar a forma de amida menos estável; o grupo amino é expelido em vez disso, resultando em uma ligação éster (Ser / Thr) ou tioéster (Cys) no lugar da ligação peptídica. Essa reação química é chamada de deslocamento de NO acil .

A ligação éster / tioéster pode ser resolvida de várias maneiras:

  • A hidrólise simples irá dividir a cadeia polipeptídica, onde o grupo amino deslocado torna-se o novo N-terminal. Isso é visto na maturação da glicosilasparaginase.
  • Uma reação de eliminação β também divide a cadeia, mas resulta em um grupo piruvoil no novo N-terminal. Este grupo piruvoílo pode ser usado como um co-fator catalítico covalentemente ligado em algumas enzimas, especialmente descarboxilases como S-adenosilmetionina descarboxilase (SAMDC) que explora o poder de retirada de elétrons do grupo piruvoílo.
  • Transesterificação intramolecular, resultando em um polipeptídeo ramificado . Em inteins , a nova ligação éster é quebrada por um ataque intramolecular pela asparagina C-terminal em breve.
  • A transesterificação intermolecular pode transferir um segmento inteiro de um polipeptídeo para outro, como é visto no autoprocessamento da proteína Hedgehog.

Compressão de sequência

A compressão de sequências de aminoácidos é uma tarefa comparativamente desafiadora. Os compressores de sequência de aminoácidos especializados existentes são baixos em comparação com os compressores de sequência de DNA, principalmente por causa das características dos dados. Por exemplo, modelar inversões é mais difícil devido à perda reversa de informações (dos aminoácidos para a sequência de DNA). O atual compressor de dados sem perdas que fornece maior compactação é o AC2. AC2 combina vários modelos de contexto usando redes neurais e codifica os dados usando codificação aritmética.

História

A proposta de que as proteínas eram cadeias lineares de α-aminoácidos foi feita quase simultaneamente por dois cientistas na mesma conferência em 1902, a 74ª reunião da Sociedade de Cientistas e Médicos Alemães, realizada em Karlsbad. Franz Hofmeister fez a proposta pela manhã, com base em suas observações da reação do biureto nas proteínas. Hofmeister foi seguido algumas horas depois por Emil Fischer , que acumulou uma riqueza de detalhes químicos que sustentam o modelo de ligação peptídica. Para completar, a proposta de que as proteínas continham ligações amida foi feita já em 1882 pelo químico francês E. Grimaux.

Apesar desses dados e evidências posteriores de que proteínas digeridas proteoliticamente produziam apenas oligopeptídeos, a ideia de que as proteínas eram polímeros lineares e não ramificados de aminoácidos não foi aceita imediatamente. Alguns cientistas respeitados, como William Astbury, duvidaram que as ligações covalentes fossem fortes o suficiente para manter essas moléculas longas juntas; eles temiam que as agitações térmicas separassem essas moléculas longas. Hermann Staudinger enfrentou preconceitos semelhantes na década de 1920, quando argumentou que a borracha era composta de macromoléculas .

Assim, várias hipóteses alternativas surgiram. A hipótese da proteína coloidal afirmava que as proteínas eram montagens coloidais de moléculas menores. Essa hipótese foi refutada na década de 1920 por medidas de ultracentrifugação por Theodor Svedberg, que mostraram que as proteínas tinham um peso molecular bem definido e reproduzível, e por medidas eletroforéticas de Arne Tiselius, que indicaram que as proteínas eram moléculas únicas. Uma segunda hipótese, a cyclol hipótese avançada por Dorothy Wrinch , proposto que o polipéptido linear foram submetidos a um rearranjo químico cyclol C = O + HN C (OH) -N reticulado que seus grupos de espinha dorsal de amida, formando um bi-dimensional tecido . Outras estruturas primárias de proteínas foram propostas por vários pesquisadores, como o modelo de dicetopiperazina de Emil Abderhalden e o modelo de pirrol / piperidina de Troensegaard em 1942. Embora nunca tenham dado muito crédito, esses modelos alternativos foram finalmente refutados quando Frederick Sanger sequenciou com sucesso a insulina e por a determinação cristalográfica de mioglobina e hemoglobina por Max Perutz e John Kendrew .

Estrutura primária em outras moléculas

Pode-se dizer que qualquer heteropolímero de cadeia linear tem uma "estrutura primária" por analogia ao uso do termo para proteínas, mas esse uso é raro em comparação com o uso extremamente comum em referência a proteínas. No RNA , que também tem uma estrutura secundária extensa , a cadeia linear de bases é geralmente referida apenas como a "sequência", assim como no DNA (que geralmente forma uma dupla hélice linear com pouca estrutura secundária). Outros polímeros biológicos, como polissacarídeos, também podem ser considerados como tendo uma estrutura primária, embora o uso não seja padrão.

Relação com a estrutura secundária e terciária

A estrutura primária de um polímero biológico determina em grande medida a forma tridimensional ( estrutura terciária ). A sequência de proteínas pode ser usada para prever características locais , como segmentos de estrutura secundária ou regiões transmembranares. No entanto, a complexidade do enovelamento de proteínas atualmente proíbe a previsão da estrutura terciária de uma proteína apenas a partir de sua sequência. Conhecer a estrutura de uma sequência homóloga semelhante (por exemplo, um membro da mesma família de proteínas ) permite uma previsão altamente precisa da estrutura terciária por modelagem de homologia . Se a sequência proteica de comprimento total estiver disponível, é possível estimar suas propriedades biofísicas gerais , como seu ponto isoelétrico .

As famílias de sequências são frequentemente determinadas por agrupamento de sequências , e os projetos de genômica estrutural visam produzir um conjunto de estruturas representativas para cobrir o espaço de sequência de possíveis sequências não redundantes.

Veja também

Notas e referências