C2orf16 jest protein koji je kod ljudi kodiran genom C2orf16 sa hromosoma 2. Izoforma 2 ovog proteina (NCBI ID: CAH18189.1[4] od sada se naziva C2orf16) duga je 1.984 aminokiseline.[5] Gen sadrži jedan egzon i nalazi se na poziciji 2p23.3.[6] Aliasi C2orf16 uključuju otvoreni okvir čitanja 16 hromozoma 2 i sekvencu koja sadrži ponavljanja P-S-E-R-S-H-H-S na 2p23.3.[6][7] Po ovom genu poznato je 68 ortologs, uključujući mišjje i ovčije, ali paralozi nisu pronađen.[8]

C2orf16
Identifikatori
AliasiC2orf16
Vanjski ID-jeviHomoloGene: 82476 GeneCards: C2orf16
Lokacija gena (čovjek)
Hromosom 2 (čovjek)
Hrom.Hromosom 2 (čovjek)[1]
Hromosom 2 (čovjek)
Genomska lokacija za C2orf16
Genomska lokacija za C2orf16
Bend2p23.3Početak27,537,386 bp[1]
Kraj27,582,720 bp[1]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_032266

XM_017321194

RefSeq (bjelančevina)

NP_115642

n/a

Lokacija (UCSC)Chr 2: 27.54 – 27.58 Mbn/a
PubMed pretraga[2][3]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Amiokiselininska sekvenca

uredi

Dužina polipeptidnog lanca je 1.984 aminokiseline, a molekulska težina 224.321 Da.[9]

1020304050
MELTPGAQQQGINYQELTSGWQDVKSMMLVPEPTRKFPSGPLLTSVRFSN
LSPESQQQDVKSLEFTVEPKLQSVKHVKLSSVSLQQTIKSVELAPGSLPQ
RVKYGEQTPRTNYQIMESSELIPRPGHQFAKYAEMIPQPKYQIPKSANLI
SIPIYHATESSEMAQGLAYKGIDTVEKSVGLTPKLTGRAKESLGMLLQPD
LQVPKFVDLTPMVRDQGSKFLGLTPEKSYQILETMELLSQSRPRVKDVGE
LYMKPLQQTVEYEGITPELKHYFTEAMGLTAEARIQANEFFGMTPKPTSQ
ATGFAERSPRLCPQNLECVEVISEKRLQGEESVVLIPKSLHHVPDSASGM
TPGLGHRVPESVELTSKSGVQVEKTLQLTPKPQHHVGSPGIISGLGHQVP
ESVNLTCKQWLQMEESLEVPLKQTSQVIGHEESVELTSEARQHREVSMGL
TKSKNQSMKSPGTTPGPLGRIVEFMRISPEPLDQVTESARTQLQVAQSEE
VILIDVPKVVQSVKVTPGPPFQIVKSVTIPRPTPQMVEYIELTPKLQYVR
PSEHHTGPCLQDVKSTKLITKPKHQILETVELTGFQIVKTMLIPGPSLQI
VKSEELAPGPIPQVVEPIGVALESGIEAINCVDLLPRPHLQELIVPAELT
PSPCTQVKSAELTSPQTSPFEEHTILTHKQGLQAVKSTVIKTEPPKVMET
EDLNLGHVCQNRDCQKLTSEELQVGTDFSRFLQSSSTTLISSSVRTASEL
GGLWDSGIQEVSRALDIKNPGTDILQPEETYIDPTMIQSLTFPLALHNQS
SDKTANIVENPCPEILGVDVISKETTKRKQMEELENSLQRHLPQSWRSRS
RTFQAESGVQKGLIKSFPGRQHNVWESHAWRQRLPRKYLSTMLMLGNILG
TTMERKLCSQTSLAERATADTCQSIQNLFGIPAELMEPSQSLPEKGPVTI
SQPSVVKNYIQRHTFYHGHKKRMALRIWTRGSTSSIIQQYSGTRVRIKKT
NSTFNGISQEVIQHMPVSCAGGQLPVLVKSESSLSIFYDREDLVPMEESE
DSQSDSQTRISESQHSLKPNYLSQAKTDFSEQFQLLEDLQLKIAAKLLRS
QIPPDVPPPLASGLVLKYPICLQCGRCSGLNCHHKLQTTSGPYLLIYPQL
HLVRTPEGHGEVRLHLGFRLRIGKRSQISKYRERDRPVIRRSPISPSQRK
AKIYTQASKSPTSTIDLQSGPSQSPAPVQVYIRRGQRSRPDLVEKTKTRA
PGHYEFTQVHNLPESDSESTQNEKRAKVRTKKTSDSKYPMKRITKRLRKH
RKFYTNSRTTIESPSRELAAHLRRKRIGATQTSTASLKRQPKKPSQPKFM
QLLFQSLKRAFQTAHRVIASVGRKPVDGTRPDNLWASKNYYPKQNARDYC
LPSSIKRDKRSADKLTPAGSTIKQEDILWGGTVQCRSAQQPRRAYSFQPR
PLRLPKPTDSQSGIAFQTASVGQPLRTVQKDSSSRSKKNFYRNETSSQES
KNLSTPGTRVQARGRILPGSPVKRTWHRHLKDKLTHKEHNHPSFYRERTP
RGPSERTRHNPSWRNHRSPSERSQRSSLERRHHSPSQRSHCSPSRKNHSS
PSERSWRSPSQRNHCSPPERSCHSLSERGLHSPSQRSHRGPSQRRHHSPS
ERSHRSPSERSHRSSSERRHRSPSQRSHRGPSERSHCSPSERRHRSPSQR
SHRGPSERRHHSPSKRSHRSPARRSHRSPSERSHHSPSERSHHSPSERRH
HSPSERSHCSPSERSHCSPSERRHRSPSERRHHSPSEKSHHSPSERSHHS
PSERRRHSPLERSRHSLLERSHRSPSERRSHRSFERSHRRISERSHSPSE
KSHLSPLERSRCSPSERRGHSSSGKTCHSPSERSHRSPSGMRQGRTSERS
HRSSCERTRHSPSEMRPGRPSGRNHCSPSERSRRSPLKEGLKYSFPGERP
SHSLSRDFKNQTTLLGTTHKNPKAGQVWRPEATR

C2orf16 izoforma 2 gena ima 6,2 kb, jedan egzon na lokusu 2p23.3, i sadrži P-S-E-R-S-H-H-S ponavljanja na C-terminalnoj strani gena od 1.559. do 1.903. aminokiseline. Čini se da su ova ponavljanja nastala kao transpozibilni elementi. Primati pokazuju više ponavljanja P-S-E-R-S-H-H-S nego drugi sisarskii ortolozi.[6]

Ekspresija

uredi

Utvrđeno je da je C2orf16 visoko eksprimiran u sjemenicima[10] i retinojsloj kiselini i mitogen-tretiranoj liniji ljudskih embriondkih matičnijh ćelija,[11] ali nije poznato da se drugačije fenotipski izražava po dobima ili bolestima.[12] Također se vidi da C2orf16 ima visoku ekspresiju u preImplantaciji ljudskih embriona od 4-ćelijskog supnja embriona do stadija blastocista.[13]

Ne vidi se da C2orf16 ima ekspresiju osjetljivu na rapamicin.[14] Takođe se vidi da C2orf16 značajno povećava ekspresiju u c-MYC nokdauniranim ćelijama raka dojke.[15]

Izoforme

uredi

Postoje dvije izoforme C2orf16. Izoforma 1 je dugačka 5.388 aminokiselina kodiranih u pet egzona sa preko 16.401 parova baza. Izoforma 2 koristi alternativno početno mjesto transkripcije i znatno je kraća sa 1.984 aminokiseline kodirane u egzonu 1sa preko 6.200 baznih parova.[8]

Regulacija ekspresije

uredi

Predviđa se da se jedna miRNK veže za 3' UTR C2orf16, pristupni broj MI0005564.[16][17]

Protein

uredi

C2orf16 ima predviđenu molekulsku težinu od 224 kD i predviđenu izoelektričnu tačku od 10,08,[18] koje vrijednosti su relativno konstantne između ortologa. Protein uključuje veći od prosječnog sastava serina, histidina i arginina i niži od prosječnog sastava alanina.[19]

Kompozicijske karakteristike

uredi

Klaster pozitivnog naboja pronađen je od aminokiselinskih ostataka 1.274 do 1.302.[19]

Regija bogata arginin omnalazi se od aminokiselina 1.545 do 1.933, bogata serin od aminokiselina 1.568 do 1.934, a regija bogata histidin omnalazi se od aminokiselina 1.630 do 1853.[19]

Matrična analiza[20] otkriva jako ponovljeno područje od približno od 1.500 do 1.984 ostatka, što je ponavljanje P-S-E-R-S-H-H-S. mala traka tačaka na približno 1.200 aminokiselina označava polovinu ponavljanja PSERSHHS sekvence.

 
Matrična analiza nekarakteriziranog proteina C2orf16 izoforme 2. PSERSHHS sekvenca ponavljanja sekvence vizualizira se preko tamnijeg područja matrice između aminokiselina 1500 i 1984, a polovina PSERSHHS ponavljanja sekvence vidi se kao traka blizu aminokiseline 1200.

C2orf16 izoforma 2 nema transmembranski domen,[21] i predviđa se da se nakon translacije nalazi na jedru zbog dvije sekvence jedarne lokalizacije predviđene na ostacima 1,233 i 1,281.[22] Među ortolozima nije nađena ni jedna konzervirana eksportna jedarna sekcvenca,[23] što sugerira da C2orf16 nije namijenjen da nakon importa napusti jedro. Nisu predviđene modifikacije N- ili C-terminala.[24][25][26][27]

Subćelijska lokalizacija

uredi

Predviđeno je nakon transkripcije C2orf16 lokaliziran u jedru.[8]

Struktura

uredi
 
Predviđena 3D struktura izoforme 2 C2orf16 sa tri glavna domena proteina. Domen 3 sadrži sekvencu ponavljanja P-S-E-R-S-H-H-S.

Predviđa se da 3D struktura C2orf16 ima tri glavna domena. Domen 1 je od aminokiselina 1 do 662, domen 2 je od aminokiselina 674 do 1.487, a domen 3 je od aminokiseline 1.488 do 1.984.[28] Predviđeno je da će domen 1 i 2 biti povezani preko niza od 12 aminokiselina koje inače nisu organizirane u sekundarnu strukturu, što omogućava fleksibilnost između domena 1 i 2. Predviđeno je da domen 2 ima domene u interakciji s proteinima za transkripcijske faktore.[28] Predviđeno je da domen 3 slijedi strukturu "loptice na niti"[28] i ima mnogo mjesta za moguću fosforilaciju.[29]

Proteinske interakcije

uredi

Pokazalo se da C2orf16 ima fizičku interakciju sa protoonkogenom Myc pomoću tandemskog afinitetnog prečišćavanja.[30]

Filogenija ortologa

uredi

Poznato je 68 ortologa za C2orf16.[8] Čini se da se protein pojavio u evolucionoj istoriji sisara prije 320 miliona godina, oko divergencije sisara od reptila. Ova historija bi objasnila zašto ortolozi ne postoje kod vodozemaca, gmizavaca, ptica, niti drugih daljih srodnih vrsta.[31]

Bilo koji ortolozi iz vrsta koje su udaljenije od ljudi od drugih sisara vjerovatno nisu povezani u funkciji, međutim, PSERSHHS ponavljanje je prisutno u koščljoriba, rakova, stramenopilima uključujući Phytophthora infestans (krompirska plamenjača), biljke i prokariote.[31]

Transpozonsko ponavljanje je možda ponovo uvedeno kod sisara pomoću virusnog vektora.

Ponavljanje sekvence

uredi
 
Logo ponavljajuće sekvence P-S-E-R-S-H-H-S

Vidi se da je sekvenca ponavljanja P-S-E-R-S-H-H-S konzervirana u ortolozima za C2orf16 i u organizmima koji su tako udaljeni kao Oomycete (sluzave plijesni)[32] i biljke, uključujući hloroplaste Acacia ashbyae.[33] Dio ponavljanja S-P-S-E-R je najkonzerviraniji što se može uočiti i na poravnavanju sekvenci uklučenih u njihov prikazani logo.[34]

Konzervacijska analiza ponavljanja pokazuje da je početni SPS visoko konzerviran, vjerovatno za fosforilaciju(S) i strukturu (P), a R je gotovo potpuno konzerviran, mutirajući u lizin u nekim ortolozima,[33] što implicira da je za ponavljanje neophodan pozitivan naboj.

3D oblik sekvence ponavljanja je nejasan jer se predviđa da će biti ili kuglice na žici[35] ili stukturno antiparalelni beta-list [6].

Funkcija

uredi

Predviđa se da izoforma 2 C2orf16 ima moguću funkciju u regulaciji mitoza zbog svoje jedarne lokalizacije,[8][22] predviđeno mjesto vezanja faktora transkripcije,[28] fizička povezanost sa Myc,[30] i povećana ekspresija u c-MYC nokdaun ćelijama raka dojke.[15]

Klinički značaj

uredi

Postoje četiri zabilježena patenta za C2orf16, po jedan koji uključuje: kancerogene mutacije PPP2RIA i ARID1A,[36] predidpoziciju zaAlzheimerovu bolest,[37] diverzitet virusne vakcine[38] i varijacije broja kopija odnos prema uobičjenoj varijabli imunodeficijencije.[39] Također se pokazalo da C2orf16 ima povećanu ekspresiju u nekim linijama raka dojke,[15] kao i da je uključen u Myc[30] uobičajeni onkogen, što čini C2orf16 mogućim onkogenom za ciljanje u liječenju raka.

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000221843 - Ensembl, maj 2017
  2. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  3. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "hypothetical protein [Homo sapiens] – Protein – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 2. 5. 2019.
  5. ^ "C2orf16 Gene". GeneCards Human Gene Database. Weizmann Institute of Science, Life Map Sciences. Pristupljeno Feb 5, 2019.
  6. ^ a b c d "C2orf16 – Uncharacterized protein C2orf16 – Homo sapiens (Human) – C2orf16 gene & protein". www.uniprot.org. Pristupljeno 2. 5. 2019.
  7. ^ "C2orf16 Gene". GeneCards Human Gene Database. Weizmann Institute of Science, Life Map Sciences. Pristupljeno Feb 5, 2019.
  8. ^ a b c d e Zerbino DR, Achuthan P, Akanni W, Amode MR, Barrell D, Bhai J, et al. (januar 2018). "Ensembl 2018". Nucleic Acids Research. 46 (D1): D754–D761. doi:10.1093/nar/gkx1098. PMC 5753206. PMID 29155950.
  9. ^ "UniProt, Q68DN1" (jezik: engleski). Pristupljeno 14. 11. 2021.
  10. ^ Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, Shoemaker DD (decembar 2003). "Genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays". Science. 302 (5653): 2141–4. Bibcode:2003Sci...302.2141J. doi:10.1126/science.1090100. PMID 14684825. S2CID 10007258.
  11. ^ "Homo sapiens gene C2orf16, encoding chromosome 2 open reading frame 16". AceView. NCBI National Institute of Health. Pristupljeno Feb 5, 2019.
  12. ^ "EST Profile – Hs.131021". www.ncbi.nlm.nih.gov. Pristupljeno 2. 5. 2019.
  13. ^ Xie D, Chen CC, Ptaszek LM, Xiao S, Cao X, Fang F, Ng HH, Lewin HA, Cowan C, Zhong S (juni 2010). "Rewirable gene regulatory networks in the preimplantation embryonic development of three mammalian species". Genome Research. 20 (6): 804–15. doi:10.1101/gr.100594.109. PMC 2877577. PMID 20219939.
  14. ^ Petrich AM, Leshchenko V, Kuo PY, Xia B, Thirukonda VK, Ulahannan N, Gordon S, Fazzari MJ, Ye BH, Sparano JA, Parekh S (maj 2012). "Akt inhibitors MK-2206 and nelfinavir overcome mTOR inhibitor resistance in diffuse large B-cell lymphoma". Clinical Cancer Research. 18 (9): 2534–44. doi:10.1158/1078-0432.CCR-11-1407. PMC 3889476. PMID 22338016.
  15. ^ a b c Cappellen D, Schlange T, Bauer M, Maurer F, Hynes NE (januar 2007). "Novel c-MYC target genes mediate differential effects on cell proliferation and migration". EMBO Reports. 8 (1): 70–6. doi:10.1038/sj.embor.7400849. PMC 1796762. PMID 17159920.
  16. ^ Agarwal V, Bell GW, Nam JW, Bartel DP (august 2015). Izaurralde E (ured.). "Predicting effective microRNA target sites in mammalian mRNAs". eLife. 4: e05005. doi:10.7554/eLife.05005. PMC 4532895. PMID 26267216.
  17. ^ "miRNA Entry for MI0005564". www.mirbase.org. Arhivirano s originala, 23. 9. 2020. Pristupljeno 5. 5. 2019.
  18. ^ "ExPASy – Compute pI/Mw tool". web.expasy.org. Pristupljeno 2. 5. 2019.
  19. ^ a b c Madeira F, Park YM, Lee J, Buso N, Gur T, Madhusoodanan N, Basutkar P, Tivey AR, Potter SC, Finn RD, Lopez R (april 2019). "The EMBL-EBI search and sequence analysis tools APIs in 2019". Nucleic Acids Research. 47 (W1): W636–W641. doi:10.1093/nar/gkz268. PMC 6602479. PMID 30976793.
  20. ^ "EMBOSS: dotmatcher". www.bioinformatics.nl. Arhivirano s originala, 18. 4. 2019. Pristupljeno 2. 5. 2019.
  21. ^ Cserzö M, Eisenhaber F, Eisenhaber B, Simon I (septembar 2002). "On filtering false positive transmembrane protein predictions". Protein Engineering. 15 (9): 745–52. doi:10.1093/protein/15.9.745. PMID 12456873.
  22. ^ a b Sigrist CJ, Cerutti L, de Castro E, Langendijk-Genevaux PS, Bulliard V, Bairoch A, Hulo N (januar 2010). "PROSITE, a protein domain database for functional characterization and annotation". Nucleic Acids Research. 38 (Database issue): D161-6. doi:10.1093/nar/gkp885. PMC 2808866. PMID 19858104.
  23. ^ la Cour T, Kiemer L, Mølgaard A, Gupta R, Skriver K, Brunak S (juni 2004). "Analysis and prediction of leucine-rich nuclear export signals". Protein Engineering, Design & Selection. 17 (6): 527–36. doi:10.1093/protein/gzh062. PMID 15314210.
  24. ^ Kiemer L, Bendtsen JD, Blom N (april 2005). "NetAcet: prediction of N-terminal acetylation sites". Bioinformatics. 21 (7): 1269–70. doi:10.1093/bioinformatics/bti130. PMID 15539450.
  25. ^ Bologna G, Yvon C, Duvaud S, Veuthey AL (juni 2004). "N-Terminal myristoylation predictions by ensembles of neural networks". Proteomics. 4 (6): 1626–32. doi:10.1002/pmic.200300783. PMID 15174132. S2CID 20289352.
  26. ^ Chuang GY, Boyington JC, Joyce MG, Zhu J, Nabel GJ, Kwong PD, Georgiev I (septembar 2012). "Computational prediction of N-linked glycosylation incorporating structural properties and patterns". Bioinformatics. 28 (17): 2249–55. doi:10.1093/bioinformatics/bts426. PMC 3426846. PMID 22782545.
  27. ^ Julenius K (august 2007). "NetCGlyc 1.0: prediction of mammalian C-mannosylation sites". Glycobiology. 17 (8): 868–76. doi:10.1093/glycob/cwm050. PMID 17494086.
  28. ^ a b c d Yang J, Zhang Y (juli 2015). "I-TASSER server: new development for protein structure and function predictions". Nucleic Acids Research. 43 (W1): W174-81. doi:10.1093/nar/gkv342. PMC 4489253. PMID 25883148.
  29. ^ Blom N, Gammeltoft S, Brunak S (decembar 1999). "Sequence and structure-based prediction of eukaryotic protein phosphorylation sites". Journal of Molecular Biology. 294 (5): 1351–62. doi:10.1006/jmbi.1999.3310. PMID 10600390.
  30. ^ a b c "PSICQUIC View". www.ebi.ac.uk. Pristupljeno 2. 5. 2019.
  31. ^ a b Madden, Tom (13. 8. 2003). The BLAST Sequence Analysis Tool (jezik: engleski). National Center for Biotechnology Information (US).
  32. ^ "cyst germination specific acidic repeat protein precursor [Phytophthora infestans]". NCBI. Pristupljeno 2. 5. 2019.
  33. ^ a b "accD (chloroplast) [Acacia ashbyae] – Protein – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 2. 5. 2019.
  34. ^ "WebLogo – Create Sequence Logos". weblogo.berkeley.edu. Pristupljeno 2. 5. 2019.
  35. ^ Zhang Y (januar 2008). "I-TASSER server for protein 3D structure prediction". BMC Bioinformatics. 9 (1): 40. doi:10.1186/1471-2105-9-40. PMC 2245901. PMID 18215316.
  36. ^ Vogelstein B, Kinzler KW, Velculescu V, Papadopoulous N, Jones S (31. 5. 2012). "US Patent 9,982,304" (US 20130210900 A1). Pristupljeno Feb 5, 2019. journal zahtijeva |journal= (pomoć)[mrtav link]
  37. ^ Nagy, Zsuzsanna (Jan 16, 2014). "US Patent 9,944,986" (US 20150141491 A1). Pristupljeno Feb 5, 2019. journal zahtijeva |journal= (pomoć)[mrtav link]
  38. ^ Shenk T, Wang D (16. 4. 2009). "US Patent 9,439,960" (US 20100285059 A1). Pristupljeno Feb 5, 2019. journal zahtijeva |journal= (pomoć)[mrtav link]
  39. ^ Hakonarson H, Glessner J, Orange J (Nov 28, 2013). "US Patent 9,109,254" (US 20130315858 A1). Pristupljeno Feb 5, 2019. journal zahtijeva |journal= (pomoć)[mrtav link]