CCDC94

šablon Wikimedia

Protein 94 domena upredene zavojnice (CCDC94) je protein koji je kod ljudi kodiran genom CCDC94.[5] Protein CCDC94 sadrži upredenu zavojnicu, domena nepoznate funkcije (DUF572), neokarakterizirani konzervirani protein (COG5134) i nedostaje mu transmembranski domen.

CCDC94
Identifikatori
AliasiYJU2
Vanjski ID-jeviMGI: 1920136 HomoloGene: 6350 GeneCards: YJU2
Lokacija gena (čovjek)
Hromosom 19 (čovjek)
Hrom.Hromosom 19 (čovjek)[1]
Hromosom 19 (čovjek)
Genomska lokacija za CCDC94
Genomska lokacija za CCDC94
Bend19p13.3Početak4,247,080 bp[1]
Kraj4,269,088 bp[1]
Lokacija gena (miš)
Hromosom 17 (miš)
Hrom.Hromosom 17 (miš)[2]
Hromosom 17 (miš)
Genomska lokacija za CCDC94
Genomska lokacija za CCDC94
Bend17|17 DPočetak56,266,099 bp[2]
Kraj56,275,285 bp[2]
Ontologija gena
Molekularna funkcija GO:0001948, GO:0016582 vezivanje za proteine
vezivanje iona metala
Ćelijska komponenta U2-type catalytic step 1 spliceosome
jedro
spliceosomal complex
Biološki proces negative regulation of DNA damage response, signal transduction by p53 class mediator
mRNA processing
Prerada RNK
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_018074

NM_028381

RefSeq (bjelančevina)

NP_060544

NP_082657

Lokacija (UCSC)Chr 19: 4.25 – 4.27 MbChr 17: 56.27 – 56.28 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Pregled

uredi
 
Genomska lokacija CCDC94 na lokusu 19p13.3[6]

CCDC94 je dug 21.975 baznih parova, orijentiran na plus lancu hromoosma 19 od 4.247.111. – 4.269.085. baznog para.[5] Genski produkt dug je 1,441 baznih parova iRNK sa osam predviđenih egzona u ljudskom genu. Kao što je predvidio Ensembl, postoji jedan alternativni oblik prerade koji kodira protein.[7] Ovaj prerađeni oblik sadrži pet egzona, a četiri od njih su kodirajući. Predviđanje i analiza promotora izvedena je pomoću programa ElDorado.[8] Predviđena promotorska regija obuhvata 714 baznih parova, od 4.246.532. do 4.247.245., na plus lancu hromosoma 19.

 
Tercijarna struktura CCDC94 prema PHYRE2-u.[9]

Gensko susjedstvo

uredi

CCDC94 nalazi se neposredno uz gen EBI3 (4,229,540-4,237,525) na pozitivnom polulancu DNK. Gen SH2 domena (4,278,598-4,290,720) leži uzvodno od CCDC94 na pozitivnom polulancu.[10]

 
Profil ekspresije CCDC94 Geo u normalnim tkivima.[11]

CCDC94 eksprimiran je u niskim do umjerenim nivoima u većini dijelova tijela. Međutim, blago povišeni nivoi CCDC94 izraženi su u štitnjači, plućima, dendritskim ćelijama i limfoblastima. Podaci o ekspresiji dostupni su na BioGPS.[12] GEO expression data is available from NCBI.[11]

Protein

uredi

Obilježavajuća svojstva

uredi

CCDC94 pripada porodici CWC16 [13] a njegova funkcija nije dobro shvaćena. Ljudski oblik ima 323 aminokiselinska ostataka, sa izoelektričnom tačkom 5,618 i molekulsom masom 37,086 daltona . Ne postoje predviđeni transmembranski domeni.[14] Jedan oblik alternativne prerade CCDC94 kodira protein sa 161 aminokiselinom.[15] Domeni DUF572 i COG5134 nalaze se na ostacima 1-319 , odnodno 7-108.[16] Područje domena upredene zavojnice nalazi se na ostacima 105–206.[17] Unutarćelijska lokalizacija CCDC94 još nije eksperimentalno utvrđena, ali bioinformatička analiza pomoću PSORT-a visoko sugerira da je CCDC94 u jedru, zbog prisustva jedarnih lokalizacijskih signala.[18]

 
Konstrukt proteina CCDC94, uključujući COG5134, DUF572 i domene upredene zavojnice

Aminokiselinmska sekvenca

uredi
1020304050
MSERKVLNKYYPPDFDPSKIPKLKLPKDRQYVVRLMAPFNMRCKTCGEYI
YKGKKFNARKETVQNEVYLGLPIFRFYIKCTRCLAEITFKTDPENTDYTM
EHGATRNFQAEKLLEEEEKRVQKEREDEELNNPMKVLENRTKDSKLEMEV
LENLQELKDLNQRQAHVDFEAMLRQHRLSEEERRRQQQEEDEQETAALLE
EARKRRLLEDSDSEDEAAPSPLQPALRPNPTAILDEAPKPKRKVEVWEQS
VGSLGSRPPLSRLVVVKKAKADPDCSNGQPQAAPTPGAPQNRKEANPTPL
TPGASSLSQLGAYLDSDDSNGSN

Proreinske interakcije

uredi

Analiza interakcije proteina sa CCDC94 provedena je pomoću računarskih alata. Preko baze podataka MINT nisu identificirane bilo kakve interakcije.[19] Pokazano je da CCDC94 komunicira sa CDC5L, PLRG1 i PRPF19, sa najvećim rezultatom na osnovu testa koimmunoprecipitacije protiv tagova.[20] Pronađeno je šest dodatnih interaktivnih proteina. Bliža analiza pokazuje vrlo mali potencijal da ove interakcije budu stvarne, zbog čega nijednu ne treba smatrati stvarnom interakcijom protein-protein. Prikazana je interakcija proteina prema STRING-ovoj analizi.

Faktori transkripcije

uredi

CCDC94 ima promotorsku regiju koja sadrži mjesta za faktor transkripcije vezanja. Značajni faktori transkripcije, generirani su programom ElDorado na Genomatixu:[21]

Bioinformatička analiza CCDC94 pomoću NetPhos[22] predvidila je sedam mjesta fosforilacije na ostacima serina, tri na ostacima treonina i tri na ostacima tirozina. Dva fosforilirana ostatka treonina i svi tirozini su visoko konzervirani, što potkrepljuje njihova pojava na istom mjestu u nekoliko analiziranih ortologa. Predviđeni fosforilirani tirozini s visokim rezultatima dogodili su se na polovini N-kraja CCDC94, dok su ostaci serina fosforilirani na polovini [[C-kraja. Sulfinator je predvidio samo jedno mjesto sulfonizacije tirozina na aminokiselini 98.[23] Vrlo vjerovatno mjesta sumoilacije na ostacima 90, 24 i 270 predvidio je SUMOplot.[24]

Tercijarna struktura

uredi

Pokazalo se da tercijarna struktura CCDC94 ima nekoliko regiona beta-listova i samo jedan visoko predviđeni alfa heliks . Analiza PHYRE2 s 65 ostataka CCDC94, 20% cijele sekvence aminokiselina, modelirana je s 87,9% pouzdanosti.[9]

Homologija

uredi

Ortholozi

uredi

CCDC94 je vrlo dobro konzerviran kod mnogih vrsta, a cjelokupni protein je konzerviran u svim svojim ortolozima.[25] Međutim, konzervacija se ne proteže toliko unatrag kao do bakterija. Filogenetsko stablo, generirano prema Biology WorkBench[26] pokazuje evolucijske odnose između CCDC94 vrste Homo sapiens i njegovih ortologa. Tabela u nastavku prikazuje konzerviranje CCDC94 među ortolozima:

Rod Vrsta Uobičajeno ime organizma Divergencija od ljudi (milioni godina) [27] Pristup proteinu u NCBI Sličnost sekvence [25] Dužima proteina
Pan panicus Bonobo (patuljasti čimpanza) 6.3 XP_003819321.1 99% 323
Gorilla gorilla gorilla Gorila 8,8 XP_004059817.1 98% 286
Callithrix jacchus Obični marmozet 42,6 XP_002761642.1 83% 278
Mus musculus Miš 92,3 NP_082657.1 87% 314
Rattus norvegicus Pacov 92,4 NP_001103143.1 87% 313
Cricetulus griseus Kineski hrčak 92,4 XP_003501789.1 85% 321
Bos taurus Goveče 94,4 NP_001069159.1 89% 320
Felis catus Mačka 94,4 XP_003981794.1 73% 363
Sarcophilus harrisii Tasmanijski šejtan 163,9 XP_003760628.1 78% 326
Monodelphis domestica Oposum 163.9 XP_001374444.1 86% 326
Gallus gallus Crvena kokoška 296,4 XP_423475.3 84% 291
Anolis carolinensis Gušter 324,5 XP_003230268.1 72% 311
Xenopou tropicalis Zapadna kandžasta žaba 342,7 NP_001017176.1 73% 345
Xenopus laevis Afrička kandžasta žaba 371,2 NP_001087648.1 83% 280
Takifugu rubripes Pufer-riba 454,6 XP_003962830.1 64% 348
Acyrthosiphon pisum Graškova uš (insekt) 910 NP_001155925.1 49% 278
Harpegnathos saltor Mrav 910 EFN80619.1 47% 351

Paralozi

uredi

CCDC94 ima samo jednpog paraloga, CCDC130 ili MGC10471.[28] CCDC130 je vrlo sličan CCDC94-u, jer sadrži i domene DUF572 i COG5134.[29]

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000105248 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000003208 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b "Coiled-coil domain-containing 94 Homo sapiens". NCBI. Pristupljeno 10. 5. 2013.
  6. ^ "Coiled-coil domain-containing 94". GeneCards. Pristupljeno 12. 5. 2013.
  7. ^ "Transcript variants". Ensemble. Pristupljeno 10. 5. 2013.
  8. ^ "ElDorado:Genomes and Annotation". Genomatix. Arhivirano s originala, 22. 5. 2021. Pristupljeno 11. 5. 2013.
  9. ^ a b "CCDC94 Tertiary Structure Prediction". Pristupljeno 11. 5. 2013.
  10. ^ "Coiled-coil domain-containing 94 Homo sapiens". NCBI. Pristupljeno 11. 5. 2013.
  11. ^ a b "CCDC94:Multiple Normal Tissues". NCBI. Pristupljeno 12. 5. 2013.
  12. ^ "Tissue-specific mRNA expression". BioGPS. Pristupljeno 11. 5. 2013.
  13. ^ "GeneCards:CCDC94". GeneCards. Pristupljeno 10. 5. 2013.
  14. ^ "Biology WorkBench SAPS Program". Biology WorkBench. Arhivirano s originala, 11. 8. 2003. Pristupljeno 11. 5. 2013.
  15. ^ "Transcript: CCDC94". Ensemble. Pristupljeno 11. 5. 2013.
  16. ^ "Coiled-coil domain-containing 94". NCBI. Pristupljeno 11. 5. 2013.
  17. ^ "UniProt CCDC94". UniProt. Pristupljeno 11. 5. 2013.
  18. ^ "PSORT Prediction". PSORT. Pristupljeno 11. 5. 2013.
  19. ^ "MINT Protein Interactions". MINT.
  20. ^ "Relevant datasets in Homo sapiens". STRING. Pristupljeno 11. 5. 2013.
  21. ^ "ElDorado:Genome and Annotation". Geonmatix. Arhivirano s originala, 22. 5. 2021. Pristupljeno 11. 5. 2013.
  22. ^ "NetPhos 2.0 server". ExPasy. Pristupljeno 12. 5. 2013.
  23. ^ "The Sulfinator". ExPasy. Pristupljeno 12. 5. 2013.
  24. ^ "SUMOplot Analysis Program". ABGENT. Pristupljeno 12. 5. 2013.
  25. ^ a b "BLAST". NCBI. Pristupljeno 12. 5. 2013.
  26. ^ "Protein Analysis Tools". Biology WorkBench. Arhivirano s originala, 11. 8. 2003. Pristupljeno 12. 5. 2013.
  27. ^ "Time Tree".
  28. ^ "coiled-coil domain-containing 94". GeneCards. Pristupljeno 11. 5. 2013.
  29. ^ "Coiled-coil domain-containing 130 Homo sapiens". NCBI. Pristupljeno 11. 5. 2013.

Vanjski linkovi

uredi