Nomenclatura de ácido nucléico - Nucleic acid nomenclature
Os biólogos moleculares usam vários termos abreviados ao se referir a moléculas de ácido nucleico , como DNA e RNA , coletivamente chamadas de nomenclatura de ácido nucleico .
O mais comum é a representação dos pares de base como letras uma adenina nucleótido é abreviado como A , guanina como L , citosina como C , timina como T , e em ARN, uracilo como L .
Além disso, as posições dos carbonos no açúcar ribose que forma a espinha dorsal da cadeia de ácido nucleico são numeradas e são usadas para indicar a direção dos ácidos nucleicos (5 '-> 3' versus 3 '-> 5'). Isso é conhecido como direcionalidade .
Código de letras expandidas
Além dos símbolos GATC convencionais, há um código de letras expandido para indicar uma posição dentro de uma sequência que pode ser flexível ao definir sequências.
Carta | Nucleotídeo (s) incluído (s) |
---|---|
UMA | UMA |
T | T |
G | G |
C | C |
você | você |
R | G ou A |
Y | T ou C |
M | A ou C |
K | G ou T |
S | G ou C |
C | A ou T |
H | A ou C ou T |
B | G ou T ou C |
V | G ou C ou A |
D | G ou T ou A |
N | G ou T ou A ou C |
Por exemplo, se as sequências conhecidas por se ligar à proteína X são conhecidas como AAAAAAGAAA, AAAAAACAAA, AAAAAATAAA e AAAAAAAAAA, isso pode ser expresso como AAAAAANAAA.
Emparelhamento de bases de hélice tripla
Os pares de bases Watson e Crick são indicados por um "•" ou um "-" ou um "." (exemplo: A • T ou poli (rC) • 2poly (rC)).
Os pares de bases de hélice tripla Hoogsteen são indicados por um "*" ou um ":" (exemplo: C • G * G +, ou T • A * T, ou C • G * G, ou T • A * A).