CCDC94
Protein 94 domena upredene zavojnice (CCDC94) je protein koji je kod ljudi kodiran genom CCDC94.[5] Protein CCDC94 sadrži upredenu zavojnicu, domena nepoznate funkcije (DUF572), neokarakterizirani konzervirani protein (COG5134) i nedostaje mu transmembranski domen.
CCDC94 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | YJU2 | ||||||||||||||||||||||||
Vanjski ID-jevi | MGI: 1920136 HomoloGene: 6350 GeneCards: YJU2 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 19: 4.25 – 4.27 Mb | Chr 17: 56.27 – 56.28 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Gen
urediPregled
urediCCDC94 je dug 21.975 baznih parova, orijentiran na plus lancu hromoosma 19 od 4.247.111. – 4.269.085. baznog para.[5] Genski produkt dug je 1,441 baznih parova iRNK sa osam predviđenih egzona u ljudskom genu. Kao što je predvidio Ensembl, postoji jedan alternativni oblik prerade koji kodira protein.[7] Ovaj prerađeni oblik sadrži pet egzona, a četiri od njih su kodirajući. Predviđanje i analiza promotora izvedena je pomoću programa ElDorado.[8] Predviđena promotorska regija obuhvata 714 baznih parova, od 4.246.532. do 4.247.245., na plus lancu hromosoma 19.
Gensko susjedstvo
urediCCDC94 nalazi se neposredno uz gen EBI3 (4,229,540-4,237,525) na pozitivnom polulancu DNK. Gen SH2 domena (4,278,598-4,290,720) leži uzvodno od CCDC94 na pozitivnom polulancu.[10]
CCDC94 eksprimiran je u niskim do umjerenim nivoima u većini dijelova tijela. Međutim, blago povišeni nivoi CCDC94 izraženi su u štitnjači, plućima, dendritskim ćelijama i limfoblastima. Podaci o ekspresiji dostupni su na BioGPS.[12] GEO expression data is available from NCBI.[11]
Protein
urediObilježavajuća svojstva
urediCCDC94 pripada porodici CWC16 [13] a njegova funkcija nije dobro shvaćena. Ljudski oblik ima 323 aminokiselinska ostataka, sa izoelektričnom tačkom 5,618 i molekulsom masom 37,086 daltona . Ne postoje predviđeni transmembranski domeni.[14] Jedan oblik alternativne prerade CCDC94 kodira protein sa 161 aminokiselinom.[15] Domeni DUF572 i COG5134 nalaze se na ostacima 1-319 , odnodno 7-108.[16] Područje domena upredene zavojnice nalazi se na ostacima 105–206.[17] Unutarćelijska lokalizacija CCDC94 još nije eksperimentalno utvrđena, ali bioinformatička analiza pomoću PSORT-a visoko sugerira da je CCDC94 u jedru, zbog prisustva jedarnih lokalizacijskih signala.[18]
Aminokiselinmska sekvenca
urediC: Cistein
D: Asparaginska kiselina
E: Glutaminska kiselina
F: Fenilalanin
G: Glicin
H: Histidin
I: Izoleucin
K: Lizin
L: Leucin
M: Metionin
N: Asparagin
P: Prolin
Q: Glutamin
R: Arginin
S: Serin
T: Treonin
V: Valin
W: Triptofan
Y: Tirozin
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MSERKVLNKY | YPPDFDPSKI | PKLKLPKDRQ | YVVRLMAPFN | MRCKTCGEYI | ||||
YKGKKFNARK | ETVQNEVYLG | LPIFRFYIKC | TRCLAEITFK | TDPENTDYTM | ||||
EHGATRNFQA | EKLLEEEEKR | VQKEREDEEL | NNPMKVLENR | TKDSKLEMEV | ||||
LENLQELKDL | NQRQAHVDFE | AMLRQHRLSE | EERRRQQQEE | DEQETAALLE | ||||
EARKRRLLED | SDSEDEAAPS | PLQPALRPNP | TAILDEAPKP | KRKVEVWEQS | ||||
VGSLGSRPPL | SRLVVVKKAK | ADPDCSNGQP | QAAPTPGAPQ | NRKEANPTPL | ||||
TPGASSLSQL | GAYLDSDDSN | GSN |
Proreinske interakcije
urediAnaliza interakcije proteina sa CCDC94 provedena je pomoću računarskih alata. Preko baze podataka MINT nisu identificirane bilo kakve interakcije.[19] Pokazano je da CCDC94 komunicira sa CDC5L, PLRG1 i PRPF19, sa najvećim rezultatom na osnovu testa koimmunoprecipitacije protiv tagova.[20] Pronađeno je šest dodatnih interaktivnih proteina. Bliža analiza pokazuje vrlo mali potencijal da ove interakcije budu stvarne, zbog čega nijednu ne treba smatrati stvarnom interakcijom protein-protein. Prikazana je interakcija proteina prema STRING-ovoj analizi.
Faktori transkripcije
urediCCDC94 ima promotorsku regiju koja sadrži mjesta za faktor transkripcije vezanja. Značajni faktori transkripcije, generirani su programom ElDorado na Genomatixu:[21]
- Mijeloidni protein cinkovog prsta (MZF1)
- Boks vilica H1 (Foxh1)
- Poboljšavač poliomavirusa A koji veže protein 3 (ETV4)
- E2F-myc aktivator/regulator ćelijskog ciklusa (E2F)
- SPI-1 proto-onkogen; hematopoetski transkripcijski faktor (PU1)
Bioinformatička analiza CCDC94 pomoću NetPhos[22] predvidila je sedam mjesta fosforilacije na ostacima serina, tri na ostacima treonina i tri na ostacima tirozina. Dva fosforilirana ostatka treonina i svi tirozini su visoko konzervirani, što potkrepljuje njihova pojava na istom mjestu u nekoliko analiziranih ortologa. Predviđeni fosforilirani tirozini s visokim rezultatima dogodili su se na polovini N-kraja CCDC94, dok su ostaci serina fosforilirani na polovini [[C-kraja. Sulfinator je predvidio samo jedno mjesto sulfonizacije tirozina na aminokiselini 98.[23] Vrlo vjerovatno mjesta sumoilacije na ostacima 90, 24 i 270 predvidio je SUMOplot.[24]
Tercijarna struktura
urediPokazalo se da tercijarna struktura CCDC94 ima nekoliko regiona beta-listova i samo jedan visoko predviđeni alfa heliks . Analiza PHYRE2 s 65 ostataka CCDC94, 20% cijele sekvence aminokiselina, modelirana je s 87,9% pouzdanosti.[9]
Homologija
urediOrtholozi
urediCCDC94 je vrlo dobro konzerviran kod mnogih vrsta, a cjelokupni protein je konzerviran u svim svojim ortolozima.[25] Međutim, konzervacija se ne proteže toliko unatrag kao do bakterija. Filogenetsko stablo, generirano prema Biology WorkBench[26] pokazuje evolucijske odnose između CCDC94 vrste Homo sapiens i njegovih ortologa. Tabela u nastavku prikazuje konzerviranje CCDC94 među ortolozima:
Rod Vrsta | Uobičajeno ime organizma | Divergencija od ljudi (milioni godina) [27] | Pristup proteinu u NCBI | Sličnost sekvence [25] | Dužima proteina |
---|---|---|---|---|---|
Pan panicus | Bonobo (patuljasti čimpanza) | 6.3 | XP_003819321.1 | 99% | 323 |
Gorilla gorilla gorilla | Gorila | 8,8 | XP_004059817.1 | 98% | 286 |
Callithrix jacchus | Obični marmozet | 42,6 | XP_002761642.1 | 83% | 278 |
Mus musculus | Miš | 92,3 | NP_082657.1 | 87% | 314 |
Rattus norvegicus | Pacov | 92,4 | NP_001103143.1 | 87% | 313 |
Cricetulus griseus | Kineski hrčak | 92,4 | XP_003501789.1 | 85% | 321 |
Bos taurus | Goveče | 94,4 | NP_001069159.1 | 89% | 320 |
Felis catus | Mačka | 94,4 | XP_003981794.1 | 73% | 363 |
Sarcophilus harrisii | Tasmanijski šejtan | 163,9 | XP_003760628.1 | 78% | 326 |
Monodelphis domestica | Oposum | 163.9 | XP_001374444.1 | 86% | 326 |
Gallus gallus | Crvena kokoška | 296,4 | XP_423475.3 | 84% | 291 |
Anolis carolinensis | Gušter | 324,5 | XP_003230268.1 | 72% | 311 |
Xenopou tropicalis | Zapadna kandžasta žaba | 342,7 | NP_001017176.1 | 73% | 345 |
Xenopus laevis | Afrička kandžasta žaba | 371,2 | NP_001087648.1 | 83% | 280 |
Takifugu rubripes | Pufer-riba | 454,6 | XP_003962830.1 | 64% | 348 |
Acyrthosiphon pisum | Graškova uš (insekt) | 910 | NP_001155925.1 | 49% | 278 |
Harpegnathos saltor | Mrav | 910 | EFN80619.1 | 47% | 351 |
Paralozi
urediCCDC94 ima samo jednpog paraloga, CCDC130 ili MGC10471.[28] CCDC130 je vrlo sličan CCDC94-u, jer sadrži i domene DUF572 i COG5134.[29]
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000105248 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000003208 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ a b "Coiled-coil domain-containing 94 Homo sapiens". NCBI. Pristupljeno 10. 5. 2013.
- ^ "Coiled-coil domain-containing 94". GeneCards. Pristupljeno 12. 5. 2013.
- ^ "Transcript variants". Ensemble. Pristupljeno 10. 5. 2013.
- ^ "ElDorado:Genomes and Annotation". Genomatix. Arhivirano s originala, 22. 5. 2021. Pristupljeno 11. 5. 2013.
- ^ a b "CCDC94 Tertiary Structure Prediction". Pristupljeno 11. 5. 2013.
- ^ "Coiled-coil domain-containing 94 Homo sapiens". NCBI. Pristupljeno 11. 5. 2013.
- ^ a b "CCDC94:Multiple Normal Tissues". NCBI. Pristupljeno 12. 5. 2013.
- ^ "Tissue-specific mRNA expression". BioGPS. Pristupljeno 11. 5. 2013.
- ^ "GeneCards:CCDC94". GeneCards. Pristupljeno 10. 5. 2013.
- ^ "Biology WorkBench SAPS Program". Biology WorkBench. Arhivirano s originala, 11. 8. 2003. Pristupljeno 11. 5. 2013.
- ^ "Transcript: CCDC94". Ensemble. Pristupljeno 11. 5. 2013.
- ^ "Coiled-coil domain-containing 94". NCBI. Pristupljeno 11. 5. 2013.
- ^ "UniProt CCDC94". UniProt. Pristupljeno 11. 5. 2013.
- ^ "PSORT Prediction". PSORT. Pristupljeno 11. 5. 2013.
- ^ "MINT Protein Interactions". MINT.
- ^ "Relevant datasets in Homo sapiens". STRING. Pristupljeno 11. 5. 2013.
- ^ "ElDorado:Genome and Annotation". Geonmatix. Arhivirano s originala, 22. 5. 2021. Pristupljeno 11. 5. 2013.
- ^ "NetPhos 2.0 server". ExPasy. Pristupljeno 12. 5. 2013.
- ^ "The Sulfinator". ExPasy. Pristupljeno 12. 5. 2013.
- ^ "SUMOplot Analysis Program". ABGENT. Pristupljeno 12. 5. 2013.
- ^ a b "BLAST". NCBI. Pristupljeno 12. 5. 2013.
- ^ "Protein Analysis Tools". Biology WorkBench. Arhivirano s originala, 11. 8. 2003. Pristupljeno 12. 5. 2013.
- ^ "Time Tree".
- ^ "coiled-coil domain-containing 94". GeneCards. Pristupljeno 11. 5. 2013.
- ^ "Coiled-coil domain-containing 130 Homo sapiens". NCBI. Pristupljeno 11. 5. 2013.
Vanjski linkovi
uredi- Lokacija ljudskog genoma CCDC94 i stranica sa detaljima o genu CCDC94 u UCSC Genome Browseru.