MGC50722 - MGC50722

MGC50722
Identificadores
Apelido
IDs externos GeneCards : [1]
Ortólogos
Espécies Humano Mouse
Entrez
Conjunto
UniProt
RefSeq (mRNA)

n / D

n / D

RefSeq (proteína)

n / D

n / D

Localização (UCSC) n / D n / D
Pesquisa PubMed n / D n / D
Wikidata
Ver / Editar Humano

MGC50722 , também conhecida como proteína não caracterizada LOC399693 , é uma proteína que em humanos é codificada pelo gene MGC50722 (Mammalian Gene Collection Project Gene 50722). Esta proteína humana de 965 aminoácidos tem um peso molecular de 104,495 kDa e um domínio de função desconhecida (DUF390). Geralmente conservado em mamíferos, este gene de evolução rápida mostra expressão relativamente baixa na maioria dos tecidos humanos, exceto nos testículos .

Gene

Todo o gene humano tem 40.364 pares de bases de comprimento, enquanto o mRNA não processado tem 25.960 pares de bases. Após o splicing dos íntrons, o gene de 10 exons tem um comprimento de mRNA final de 3.596 pares de bases que codifica 965 aminoácidos.

Locus

MGC50722 humano está localizado na fita negativa do cromossomo 9 na região q34 do genoma humano (NCBI Gene ID: 399693). O gene mais caracterizado nessa região do genoma humano é o GPSM1 , que codifica a proteína G moduladora de sinalização da proteína 1.

Homologia e evolução

Divergência do gene MGC50722 humano representado graficamente contra a divergência do Fibrinogênio e do Citocromo C. Cada ponto de dados no gráfico representa uma espécie diferente e o gene homólogo dessa espécie conforme identificado por meio do BLAST . As pesquisas BLAST foram conduzidas usando o gene humano MGC50722, Fibrinogênio e Citocromo C e as identidades percentuais foram representadas graficamente contra a divergência real de humanos para o gene homólogo dessa espécie.

Paralogs

Verificou-se que a proteína 350 associada ao centrossoma ( CEP350 ) era o único parálogo possível à proteína MGC50722 em humanos. CEP350 é uma proteína longa de 3117 aminoácidos e se alinha com a proteína MGC50722 em seu N-terminal. Isso indica que o espaçamento paralog está muito distante para quando MGC50722 se separou de CEP350 .

Ortólogos

Ortólogos concorrentes para a proteína MGC50722 são encontrados apenas em mamíferos , onde a maior parte da conservação é encontrada dentro do terminal N e DUF390.

Homólogos distantes

O homólogo mais distante detectável é em peixes cartilaginosos (462,5 MYA).

Domínios homólogos

O domínio de função desconhecida 390 (pfam04094: DUF390) faz parte de uma família de proteínas que só foram identificadas no genoma do arroz. Embora a função desse domínio seja desconhecida, pode ser algum tipo de elemento transponível.

Proteína

Sequência primária e isoformas

A proteína humana MGC50722 tem 104,495 kDa, com um ponto isoelétrico de 10,24. Um aglomerado de aminoácidos com carga mista está presente entre as posições 146 e 182, que parece ser conservado em primatas, mas não está presente em outros mamíferos. Existem também 6 isoformas previstas encontradas em humanos.

Sinais de localização subcelualar

Os servidores PSORTII prevêem 5 sinais de localização nuclear na proteína humana MGC50722. Quando as sequências ortológicas para a proteína humana foram executadas através do PSORT II, ​​a localização subcelular nuclear prevista foi uma previsão de consenso.

Sinais de localização nuclear previstos na proteína humana MGC50722
Tipo de Sinal Resíduo Span Sequência de Aminoácidos
pat4 46-49 RPRK
pat4 148-151 KPKR
pat7 43-49 PQQRPRK
pat7 149-155 PKRVKSS
pat7 302-308 PSKRRLQ

Modificações pós-traducionais

O ortólogo da proteína humana MGC50722 em camundongos, a proteína 4932418E24Rik, determinou experimentalmente os locais de fosforilação em S588, S591 e S670 no testículo ( pTestis ID: PT-MM-02686 ). Os servidores de previsão na ExPASy também prevêem mais sites de fosforilação ( NetPhos 2.0 Server ), um site de acetilação N-terminal ( NetAcet 1.0 Server ), sites de glicação ( NetGlycate 1.0 Server ) e um site de O-glicosilação GalNAc ( NetOGlyc 4.0 Server ) em resíduos conservados na proteína humana MGC50722.

Estrutura secundária

Os modelos de previsão caracterizaram a proteína MGC50722 como principalmente desordenada, mas duas regiões de bobinas enroladas.

Estrutura e características internas da proteína

Recurso Resíduo Span
Região de Baixa Complexidade 11-26
DUF390 405-690
Região de Baixa Complexidade 410-423
Região de Baixa Complexidade 546-556
Coiled-Coil 546-566
Região de Baixa Complexidade 606-621
Coiled-Coil 720-753
Região de Baixa Complexidade 771-791
Região de Baixa Complexidade 871-884
Sequência de aminoácidos primária da proteína MGC50722 e suas características / estruturas internas.

Função potencial

A função da proteína MGC50722 é desconhecida. Dado que se expressa preferencialmente no testículo e parece estar subcelularmente localizado no núcleo, pode desempenhar um papel importante nas células de gametas.

Proteínas em interação

Devido à recente identificação desse gene e de sua proteína, os bancos de dados de interação ( MINT , STRING , IntAct e BioGRID ) não identificaram nenhuma interação. Mais dados iriam expandir a caracterização de MGC50722 .

Expressão

Os níveis de expressão de MGC50722 humano parecem baixos / ausentes na maioria dos tipos de células, com a expressão mais elevada e abundante mostrada no testículo (IDs de perfil GEO: 48997768 e 49895282 ). Um estudo de câncer de pulmão também mostrou que MGC50722 foi expresso em células T CD4 + de amostras de tecido humano normal.

Promotor

O local de início da transcrição para MGC50722 se alinha melhor com os locais de ligação do fator de transcrição SPZ1 , SORY , SP1F e FAST.

Significado clínico

Um perfil GEO significativo relacionado ao MGC50722 foi um estudo feito sobre a fertilidade masculina em humanos observando a doença teratozoospermia (ID do perfil GEO: 38113951 ). A teratozoospermia é uma condição em que durante o desenvolvimento dos espermatozoides maduros a morfologia é alterada, levando, em alguns casos, à infertilidade masculina. A expressão do gene mostra que em indivíduos humanos normais o MGC50722 é expresso, enquanto em indivíduos com teratozoospermia os níveis de expressão caem significativamente ou desligam.

Referências

Leitura sugerida