MGC50722 - MGC50722
MGC50722 | |||||||
---|---|---|---|---|---|---|---|
Identificadores | |||||||
Apelido | |||||||
IDs externos | GeneCards : [1] | ||||||
Ortólogos | |||||||
Espécies | Humano | Mouse | |||||
Entrez |
|
|
|||||
Conjunto |
|
|
|||||
UniProt |
|
||||||
RefSeq (mRNA) |
|
|
|||||
RefSeq (proteína) |
|
|
|||||
Localização (UCSC) | n / D | n / D | |||||
Pesquisa PubMed | n / D | n / D | |||||
Wikidata | |||||||
|
MGC50722 , também conhecida como proteína não caracterizada LOC399693 , é uma proteína que em humanos é codificada pelo gene MGC50722 (Mammalian Gene Collection Project Gene 50722). Esta proteína humana de 965 aminoácidos tem um peso molecular de 104,495 kDa e um domínio de função desconhecida (DUF390). Geralmente conservado em mamíferos, este gene de evolução rápida mostra expressão relativamente baixa na maioria dos tecidos humanos, exceto nos testículos .
Gene
Todo o gene humano tem 40.364 pares de bases de comprimento, enquanto o mRNA não processado tem 25.960 pares de bases. Após o splicing dos íntrons, o gene de 10 exons tem um comprimento de mRNA final de 3.596 pares de bases que codifica 965 aminoácidos.
Locus
MGC50722 humano está localizado na fita negativa do cromossomo 9 na região q34 do genoma humano (NCBI Gene ID: 399693). O gene mais caracterizado nessa região do genoma humano é o GPSM1 , que codifica a proteína G moduladora de sinalização da proteína 1.
Homologia e evolução
Paralogs
Verificou-se que a proteína 350 associada ao centrossoma ( CEP350 ) era o único parálogo possível à proteína MGC50722 em humanos. CEP350 é uma proteína longa de 3117 aminoácidos e se alinha com a proteína MGC50722 em seu N-terminal. Isso indica que o espaçamento paralog está muito distante para quando MGC50722 se separou de CEP350 .
Ortólogos
Ortólogos concorrentes para a proteína MGC50722 são encontrados apenas em mamíferos , onde a maior parte da conservação é encontrada dentro do terminal N e DUF390.
Homólogos distantes
O homólogo mais distante detectável é em peixes cartilaginosos (462,5 MYA).
Domínios homólogos
O domínio de função desconhecida 390 (pfam04094: DUF390) faz parte de uma família de proteínas que só foram identificadas no genoma do arroz. Embora a função desse domínio seja desconhecida, pode ser algum tipo de elemento transponível.
Proteína
Sequência primária e isoformas
A proteína humana MGC50722 tem 104,495 kDa, com um ponto isoelétrico de 10,24. Um aglomerado de aminoácidos com carga mista está presente entre as posições 146 e 182, que parece ser conservado em primatas, mas não está presente em outros mamíferos. Existem também 6 isoformas previstas encontradas em humanos.
Sinais de localização subcelualar
Os servidores PSORTII prevêem 5 sinais de localização nuclear na proteína humana MGC50722. Quando as sequências ortológicas para a proteína humana foram executadas através do PSORT II, a localização subcelular nuclear prevista foi uma previsão de consenso.
Tipo de Sinal | Resíduo Span | Sequência de Aminoácidos |
---|---|---|
pat4 | 46-49 | RPRK |
pat4 | 148-151 | KPKR |
pat7 | 43-49 | PQQRPRK |
pat7 | 149-155 | PKRVKSS |
pat7 | 302-308 | PSKRRLQ |
Modificações pós-traducionais
O ortólogo da proteína humana MGC50722 em camundongos, a proteína 4932418E24Rik, determinou experimentalmente os locais de fosforilação em S588, S591 e S670 no testículo ( pTestis ID: PT-MM-02686 ). Os servidores de previsão na ExPASy também prevêem mais sites de fosforilação ( NetPhos 2.0 Server ), um site de acetilação N-terminal ( NetAcet 1.0 Server ), sites de glicação ( NetGlycate 1.0 Server ) e um site de O-glicosilação GalNAc ( NetOGlyc 4.0 Server ) em resíduos conservados na proteína humana MGC50722.
Estrutura secundária
Os modelos de previsão caracterizaram a proteína MGC50722 como principalmente desordenada, mas duas regiões de bobinas enroladas.
Estrutura e características internas da proteína
Recurso | Resíduo Span |
---|---|
Região de Baixa Complexidade | 11-26 |
DUF390 | 405-690 |
Região de Baixa Complexidade | 410-423 |
Região de Baixa Complexidade | 546-556 |
Coiled-Coil | 546-566 |
Região de Baixa Complexidade | 606-621 |
Coiled-Coil | 720-753 |
Região de Baixa Complexidade | 771-791 |
Região de Baixa Complexidade | 871-884 |
Função potencial
A função da proteína MGC50722 é desconhecida. Dado que se expressa preferencialmente no testículo e parece estar subcelularmente localizado no núcleo, pode desempenhar um papel importante nas células de gametas.
Proteínas em interação
Devido à recente identificação desse gene e de sua proteína, os bancos de dados de interação ( MINT , STRING , IntAct e BioGRID ) não identificaram nenhuma interação. Mais dados iriam expandir a caracterização de MGC50722 .
Expressão
Os níveis de expressão de MGC50722 humano parecem baixos / ausentes na maioria dos tipos de células, com a expressão mais elevada e abundante mostrada no testículo (IDs de perfil GEO: 48997768 e 49895282 ). Um estudo de câncer de pulmão também mostrou que MGC50722 foi expresso em células T CD4 + de amostras de tecido humano normal.
Promotor
O local de início da transcrição para MGC50722 se alinha melhor com os locais de ligação do fator de transcrição SPZ1 , SORY , SP1F e FAST.
Significado clínico
Um perfil GEO significativo relacionado ao MGC50722 foi um estudo feito sobre a fertilidade masculina em humanos observando a doença teratozoospermia (ID do perfil GEO: 38113951 ). A teratozoospermia é uma condição em que durante o desenvolvimento dos espermatozoides maduros a morfologia é alterada, levando, em alguns casos, à infertilidade masculina. A expressão do gene mostra que em indivíduos humanos normais o MGC50722 é expresso, enquanto em indivíduos com teratozoospermia os níveis de expressão caem significativamente ou desligam.
Referências
Leitura sugerida
- Wagner F, French L, Veh RW (setembro de 2014). "A análise transcriptômica-anatômica da habenula do rato revela uma alta heterogeneidade molecular entre os neurônios no complexo lateral, enquanto a expressão gênica no complexo medial obedece amplamente aos limites subnucleares". Estrutura e função do cérebro . 221 (1): 39–58. doi : 10.1007 / s00429-014-0891-9 . PMID 25244943 . S2CID 18004946 .
- Foong RE, Bosco A, Jones AC, Gout A, Gorman S, Hart PH, Zosky GR (abril de 2015). "A deficiência de vitamina D no útero aumenta a massa muscular lisa das vias aéreas e prejudica a função pulmonar". American Journal of Respiratory Cell and Molecular Biology . 53 (5): 664–75. doi : 10.1165 / rcmb.2014-0356OC . PMID 25867172 .
- Dobrin, Radu, et al. (2009). "Redes de coexpressão de vários tecidos revelam sub-redes inesperadas associadas a doenças" . Artigos e publicações do corpo docente em ciência animal . 10 (5): R55. doi : 10.1186 / gb-2009-10-5-r55 . PMC 2718521 . PMID 19463160 .
- Ediger, BN, Du, A, Liu, J, Hunter, CS, Walp, ER, Schug, J, maio, CL (dezembro de 2014). "Ilhota-1 é essencial para a função das células β pancreáticas" . Diabetes . 63 (12): 4206–17. doi : 10.2337 / db14-0096 . PMC 4237994 . PMID 25028525 .
- Vamathevan, JJ (janeiro de 2009). Análise evolutiva de genomas de mamíferos e associações a doenças humanas (Tese). University College London.