C2orf16
C2orf16 jest protein koji je kod ljudi kodiran genom C2orf16 sa hromosoma 2. Izoforma 2 ovog proteina (NCBI ID: CAH18189.1[4] od sada se naziva C2orf16) duga je 1.984 aminokiseline.[5] Gen sadrži jedan egzon i nalazi se na poziciji 2p23.3.[6] Aliasi C2orf16 uključuju otvoreni okvir čitanja 16 hromozoma 2 i sekvencu koja sadrži ponavljanja P-S-E-R-S-H-H-S na 2p23.3.[6][7] Po ovom genu poznato je 68 ortologs, uključujući mišjje i ovčije, ali paralozi nisu pronađen.[8]
C2orf16 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | C2orf16 | ||||||||||||||||||||||||
Vanjski ID-jevi | HomoloGene: 82476 GeneCards: C2orf16 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl |
| ||||||||||||||||||||||||
UniProt |
| ||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) |
| ||||||||||||||||||||||||
Lokacija (UCSC) | Chr 2: 27.54 – 27.58 Mb | n/a | |||||||||||||||||||||||
PubMed pretraga | [2] | [3] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Amiokiselininska sekvenca
urediDužina polipeptidnog lanca je 1.984 aminokiseline, a molekulska težina 224.321 Da.[9]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MELTPGAQQQ | GINYQELTSG | WQDVKSMMLV | PEPTRKFPSG | PLLTSVRFSN | ||||
LSPESQQQDV | KSLEFTVEPK | LQSVKHVKLS | SVSLQQTIKS | VELAPGSLPQ | ||||
RVKYGEQTPR | TNYQIMESSE | LIPRPGHQFA | KYAEMIPQPK | YQIPKSANLI | ||||
SIPIYHATES | SEMAQGLAYK | GIDTVEKSVG | LTPKLTGRAK | ESLGMLLQPD | ||||
LQVPKFVDLT | PMVRDQGSKF | LGLTPEKSYQ | ILETMELLSQ | SRPRVKDVGE | ||||
LYMKPLQQTV | EYEGITPELK | HYFTEAMGLT | AEARIQANEF | FGMTPKPTSQ | ||||
ATGFAERSPR | LCPQNLECVE | VISEKRLQGE | ESVVLIPKSL | HHVPDSASGM | ||||
TPGLGHRVPE | SVELTSKSGV | QVEKTLQLTP | KPQHHVGSPG | IISGLGHQVP | ||||
ESVNLTCKQW | LQMEESLEVP | LKQTSQVIGH | EESVELTSEA | RQHREVSMGL | ||||
TKSKNQSMKS | PGTTPGPLGR | IVEFMRISPE | PLDQVTESAR | TQLQVAQSEE | ||||
VILIDVPKVV | QSVKVTPGPP | FQIVKSVTIP | RPTPQMVEYI | ELTPKLQYVR | ||||
PSEHHTGPCL | QDVKSTKLIT | KPKHQILETV | ELTGFQIVKT | MLIPGPSLQI | ||||
VKSEELAPGP | IPQVVEPIGV | ALESGIEAIN | CVDLLPRPHL | QELIVPAELT | ||||
PSPCTQVKSA | ELTSPQTSPF | EEHTILTHKQ | GLQAVKSTVI | KTEPPKVMET | ||||
EDLNLGHVCQ | NRDCQKLTSE | ELQVGTDFSR | FLQSSSTTLI | SSSVRTASEL | ||||
GGLWDSGIQE | VSRALDIKNP | GTDILQPEET | YIDPTMIQSL | TFPLALHNQS | ||||
SDKTANIVEN | PCPEILGVDV | ISKETTKRKQ | MEELENSLQR | HLPQSWRSRS | ||||
RTFQAESGVQ | KGLIKSFPGR | QHNVWESHAW | RQRLPRKYLS | TMLMLGNILG | ||||
TTMERKLCSQ | TSLAERATAD | TCQSIQNLFG | IPAELMEPSQ | SLPEKGPVTI | ||||
SQPSVVKNYI | QRHTFYHGHK | KRMALRIWTR | GSTSSIIQQY | SGTRVRIKKT | ||||
NSTFNGISQE | VIQHMPVSCA | GGQLPVLVKS | ESSLSIFYDR | EDLVPMEESE | ||||
DSQSDSQTRI | SESQHSLKPN | YLSQAKTDFS | EQFQLLEDLQ | LKIAAKLLRS | ||||
QIPPDVPPPL | ASGLVLKYPI | CLQCGRCSGL | NCHHKLQTTS | GPYLLIYPQL | ||||
HLVRTPEGHG | EVRLHLGFRL | RIGKRSQISK | YRERDRPVIR | RSPISPSQRK | ||||
AKIYTQASKS | PTSTIDLQSG | PSQSPAPVQV | YIRRGQRSRP | DLVEKTKTRA | ||||
PGHYEFTQVH | NLPESDSEST | QNEKRAKVRT | KKTSDSKYPM | KRITKRLRKH | ||||
RKFYTNSRTT | IESPSRELAA | HLRRKRIGAT | QTSTASLKRQ | PKKPSQPKFM | ||||
QLLFQSLKRA | FQTAHRVIAS | VGRKPVDGTR | PDNLWASKNY | YPKQNARDYC | ||||
LPSSIKRDKR | SADKLTPAGS | TIKQEDILWG | GTVQCRSAQQ | PRRAYSFQPR | ||||
PLRLPKPTDS | QSGIAFQTAS | VGQPLRTVQK | DSSSRSKKNF | YRNETSSQES | ||||
KNLSTPGTRV | QARGRILPGS | PVKRTWHRHL | KDKLTHKEHN | HPSFYRERTP | ||||
RGPSERTRHN | PSWRNHRSPS | ERSQRSSLER | RHHSPSQRSH | CSPSRKNHSS | ||||
PSERSWRSPS | QRNHCSPPER | SCHSLSERGL | HSPSQRSHRG | PSQRRHHSPS | ||||
ERSHRSPSER | SHRSSSERRH | RSPSQRSHRG | PSERSHCSPS | ERRHRSPSQR | ||||
SHRGPSERRH | HSPSKRSHRS | PARRSHRSPS | ERSHHSPSER | SHHSPSERRH | ||||
HSPSERSHCS | PSERSHCSPS | ERRHRSPSER | RHHSPSEKSH | HSPSERSHHS | ||||
PSERRRHSPL | ERSRHSLLER | SHRSPSERRS | HRSFERSHRR | ISERSHSPSE | ||||
KSHLSPLERS | RCSPSERRGH | SSSGKTCHSP | SERSHRSPSG | MRQGRTSERS | ||||
HRSSCERTRH | SPSEMRPGRP | SGRNHCSPSE | RSRRSPLKEG | LKYSFPGERP | ||||
SHSLSRDFKN | QTTLLGTTHK | NPKAGQVWRP | EATR |
Gen
urediC2orf16 izoforma 2 gena ima 6,2 kb, jedan egzon na lokusu 2p23.3, i sadrži P-S-E-R-S-H-H-S ponavljanja na C-terminalnoj strani gena od 1.559. do 1.903. aminokiseline. Čini se da su ova ponavljanja nastala kao transpozibilni elementi. Primati pokazuju više ponavljanja P-S-E-R-S-H-H-S nego drugi sisarskii ortolozi.[6]
Ekspresija
urediUtvrđeno je da je C2orf16 visoko eksprimiran u sjemenicima[10] i retinojsloj kiselini i mitogen-tretiranoj liniji ljudskih embriondkih matičnijh ćelija,[11] ali nije poznato da se drugačije fenotipski izražava po dobima ili bolestima.[12] Također se vidi da C2orf16 ima visoku ekspresiju u preImplantaciji ljudskih embriona od 4-ćelijskog supnja embriona do stadija blastocista.[13]
Ne vidi se da C2orf16 ima ekspresiju osjetljivu na rapamicin.[14] Takođe se vidi da C2orf16 značajno povećava ekspresiju u c-MYC nokdauniranim ćelijama raka dojke.[15]
Izoforme
urediPostoje dvije izoforme C2orf16. Izoforma 1 je dugačka 5.388 aminokiselina kodiranih u pet egzona sa preko 16.401 parova baza. Izoforma 2 koristi alternativno početno mjesto transkripcije i znatno je kraća sa 1.984 aminokiseline kodirane u egzonu 1sa preko 6.200 baznih parova.[8]
Regulacija ekspresije
urediPredviđa se da se jedna miRNK veže za 3' UTR C2orf16, pristupni broj MI0005564.[16][17]
Protein
urediC2orf16 ima predviđenu molekulsku težinu od 224 kD i predviđenu izoelektričnu tačku od 10,08,[18] koje vrijednosti su relativno konstantne između ortologa. Protein uključuje veći od prosječnog sastava serina, histidina i arginina i niži od prosječnog sastava alanina.[19]
Kompozicijske karakteristike
urediKlaster pozitivnog naboja pronađen je od aminokiselinskih ostataka 1.274 do 1.302.[19]
Regija bogata arginin omnalazi se od aminokiselina 1.545 do 1.933, bogata serin od aminokiselina 1.568 do 1.934, a regija bogata histidin omnalazi se od aminokiselina 1.630 do 1853.[19]
Matrična analiza[20] otkriva jako ponovljeno područje od približno od 1.500 do 1.984 ostatka, što je ponavljanje P-S-E-R-S-H-H-S. mala traka tačaka na približno 1.200 aminokiselina označava polovinu ponavljanja PSERSHHS sekvence.
C2orf16 izoforma 2 nema transmembranski domen,[21] i predviđa se da se nakon translacije nalazi na jedru zbog dvije sekvence jedarne lokalizacije predviđene na ostacima 1,233 i 1,281.[22] Među ortolozima nije nađena ni jedna konzervirana eksportna jedarna sekcvenca,[23] što sugerira da C2orf16 nije namijenjen da nakon importa napusti jedro. Nisu predviđene modifikacije N- ili C-terminala.[24][25][26][27]
Subćelijska lokalizacija
urediPredviđeno je nakon transkripcije C2orf16 lokaliziran u jedru.[8]
Struktura
urediPredviđa se da 3D struktura C2orf16 ima tri glavna domena. Domen 1 je od aminokiselina 1 do 662, domen 2 je od aminokiselina 674 do 1.487, a domen 3 je od aminokiseline 1.488 do 1.984.[28] Predviđeno je da će domen 1 i 2 biti povezani preko niza od 12 aminokiselina koje inače nisu organizirane u sekundarnu strukturu, što omogućava fleksibilnost između domena 1 i 2. Predviđeno je da domen 2 ima domene u interakciji s proteinima za transkripcijske faktore.[28] Predviđeno je da domen 3 slijedi strukturu "loptice na niti"[28] i ima mnogo mjesta za moguću fosforilaciju.[29]
Proteinske interakcije
urediPokazalo se da C2orf16 ima fizičku interakciju sa protoonkogenom Myc pomoću tandemskog afinitetnog prečišćavanja.[30]
Filogenija ortologa
urediPoznato je 68 ortologa za C2orf16.[8] Čini se da se protein pojavio u evolucionoj istoriji sisara prije 320 miliona godina, oko divergencije sisara od reptila. Ova historija bi objasnila zašto ortolozi ne postoje kod vodozemaca, gmizavaca, ptica, niti drugih daljih srodnih vrsta.[31]
Bilo koji ortolozi iz vrsta koje su udaljenije od ljudi od drugih sisara vjerovatno nisu povezani u funkciji, međutim, PSERSHHS ponavljanje je prisutno u koščljoriba, rakova, stramenopilima uključujući Phytophthora infestans (krompirska plamenjača), biljke i prokariote.[31]
Transpozonsko ponavljanje je možda ponovo uvedeno kod sisara pomoću virusnog vektora.
Ponavljanje sekvence
urediVidi se da je sekvenca ponavljanja P-S-E-R-S-H-H-S konzervirana u ortolozima za C2orf16 i u organizmima koji su tako udaljeni kao Oomycete (sluzave plijesni)[32] i biljke, uključujući hloroplaste Acacia ashbyae.[33] Dio ponavljanja S-P-S-E-R je najkonzerviraniji što se može uočiti i na poravnavanju sekvenci uklučenih u njihov prikazani logo.[34]
Konzervacijska analiza ponavljanja pokazuje da je početni SPS visoko konzerviran, vjerovatno za fosforilaciju(S) i strukturu (P), a R je gotovo potpuno konzerviran, mutirajući u lizin u nekim ortolozima,[33] što implicira da je za ponavljanje neophodan pozitivan naboj.
3D oblik sekvence ponavljanja je nejasan jer se predviđa da će biti ili kuglice na žici[35] ili stukturno antiparalelni beta-list [6].
Funkcija
urediPredviđa se da izoforma 2 C2orf16 ima moguću funkciju u regulaciji mitoza zbog svoje jedarne lokalizacije,[8][22] predviđeno mjesto vezanja faktora transkripcije,[28] fizička povezanost sa Myc,[30] i povećana ekspresija u c-MYC nokdaun ćelijama raka dojke.[15]
Klinički značaj
urediPostoje četiri zabilježena patenta za C2orf16, po jedan koji uključuje: kancerogene mutacije PPP2RIA i ARID1A,[36] predidpoziciju zaAlzheimerovu bolest,[37] diverzitet virusne vakcine[38] i varijacije broja kopija odnos prema uobičjenoj varijabli imunodeficijencije.[39] Također se pokazalo da C2orf16 ima povećanu ekspresiju u nekim linijama raka dojke,[15] kao i da je uključen u Myc[30] uobičajeni onkogen, što čini C2orf16 mogućim onkogenom za ciljanje u liječenju raka.
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000221843 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "hypothetical protein [Homo sapiens] – Protein – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 2. 5. 2019.
- ^ "C2orf16 Gene". GeneCards Human Gene Database. Weizmann Institute of Science, Life Map Sciences. Pristupljeno Feb 5, 2019.
- ^ a b c d "C2orf16 – Uncharacterized protein C2orf16 – Homo sapiens (Human) – C2orf16 gene & protein". www.uniprot.org. Pristupljeno 2. 5. 2019.
- ^ "C2orf16 Gene". GeneCards Human Gene Database. Weizmann Institute of Science, Life Map Sciences. Pristupljeno Feb 5, 2019.
- ^ a b c d e Zerbino DR, Achuthan P, Akanni W, Amode MR, Barrell D, Bhai J, et al. (januar 2018). "Ensembl 2018". Nucleic Acids Research. 46 (D1): D754–D761. doi:10.1093/nar/gkx1098. PMC 5753206. PMID 29155950.
- ^ "UniProt, Q68DN1" (jezik: engleski). Pristupljeno 14. 11. 2021.
- ^ Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, Shoemaker DD (decembar 2003). "Genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays". Science. 302 (5653): 2141–4. Bibcode:2003Sci...302.2141J. doi:10.1126/science.1090100. PMID 14684825. S2CID 10007258.
- ^ "Homo sapiens gene C2orf16, encoding chromosome 2 open reading frame 16". AceView. NCBI National Institute of Health. Pristupljeno Feb 5, 2019.
- ^ "EST Profile – Hs.131021". www.ncbi.nlm.nih.gov. Pristupljeno 2. 5. 2019.
- ^ Xie D, Chen CC, Ptaszek LM, Xiao S, Cao X, Fang F, Ng HH, Lewin HA, Cowan C, Zhong S (juni 2010). "Rewirable gene regulatory networks in the preimplantation embryonic development of three mammalian species". Genome Research. 20 (6): 804–15. doi:10.1101/gr.100594.109. PMC 2877577. PMID 20219939.
- ^ Petrich AM, Leshchenko V, Kuo PY, Xia B, Thirukonda VK, Ulahannan N, Gordon S, Fazzari MJ, Ye BH, Sparano JA, Parekh S (maj 2012). "Akt inhibitors MK-2206 and nelfinavir overcome mTOR inhibitor resistance in diffuse large B-cell lymphoma". Clinical Cancer Research. 18 (9): 2534–44. doi:10.1158/1078-0432.CCR-11-1407. PMC 3889476. PMID 22338016.
- ^ a b c Cappellen D, Schlange T, Bauer M, Maurer F, Hynes NE (januar 2007). "Novel c-MYC target genes mediate differential effects on cell proliferation and migration". EMBO Reports. 8 (1): 70–6. doi:10.1038/sj.embor.7400849. PMC 1796762. PMID 17159920.
- ^ Agarwal V, Bell GW, Nam JW, Bartel DP (august 2015). Izaurralde E (ured.). "Predicting effective microRNA target sites in mammalian mRNAs". eLife. 4: e05005. doi:10.7554/eLife.05005. PMC 4532895. PMID 26267216.
- ^ "miRNA Entry for MI0005564". www.mirbase.org. Arhivirano s originala, 23. 9. 2020. Pristupljeno 5. 5. 2019.
- ^ "ExPASy – Compute pI/Mw tool". web.expasy.org. Pristupljeno 2. 5. 2019.
- ^ a b c Madeira F, Park YM, Lee J, Buso N, Gur T, Madhusoodanan N, Basutkar P, Tivey AR, Potter SC, Finn RD, Lopez R (april 2019). "The EMBL-EBI search and sequence analysis tools APIs in 2019". Nucleic Acids Research. 47 (W1): W636–W641. doi:10.1093/nar/gkz268. PMC 6602479. PMID 30976793.
- ^ "EMBOSS: dotmatcher". www.bioinformatics.nl. Arhivirano s originala, 18. 4. 2019. Pristupljeno 2. 5. 2019.
- ^ Cserzö M, Eisenhaber F, Eisenhaber B, Simon I (septembar 2002). "On filtering false positive transmembrane protein predictions". Protein Engineering. 15 (9): 745–52. doi:10.1093/protein/15.9.745. PMID 12456873.
- ^ a b Sigrist CJ, Cerutti L, de Castro E, Langendijk-Genevaux PS, Bulliard V, Bairoch A, Hulo N (januar 2010). "PROSITE, a protein domain database for functional characterization and annotation". Nucleic Acids Research. 38 (Database issue): D161-6. doi:10.1093/nar/gkp885. PMC 2808866. PMID 19858104.
- ^ la Cour T, Kiemer L, Mølgaard A, Gupta R, Skriver K, Brunak S (juni 2004). "Analysis and prediction of leucine-rich nuclear export signals". Protein Engineering, Design & Selection. 17 (6): 527–36. doi:10.1093/protein/gzh062. PMID 15314210.
- ^ Kiemer L, Bendtsen JD, Blom N (april 2005). "NetAcet: prediction of N-terminal acetylation sites". Bioinformatics. 21 (7): 1269–70. doi:10.1093/bioinformatics/bti130. PMID 15539450.
- ^ Bologna G, Yvon C, Duvaud S, Veuthey AL (juni 2004). "N-Terminal myristoylation predictions by ensembles of neural networks". Proteomics. 4 (6): 1626–32. doi:10.1002/pmic.200300783. PMID 15174132. S2CID 20289352.
- ^ Chuang GY, Boyington JC, Joyce MG, Zhu J, Nabel GJ, Kwong PD, Georgiev I (septembar 2012). "Computational prediction of N-linked glycosylation incorporating structural properties and patterns". Bioinformatics. 28 (17): 2249–55. doi:10.1093/bioinformatics/bts426. PMC 3426846. PMID 22782545.
- ^ Julenius K (august 2007). "NetCGlyc 1.0: prediction of mammalian C-mannosylation sites". Glycobiology. 17 (8): 868–76. doi:10.1093/glycob/cwm050. PMID 17494086.
- ^ a b c d Yang J, Zhang Y (juli 2015). "I-TASSER server: new development for protein structure and function predictions". Nucleic Acids Research. 43 (W1): W174-81. doi:10.1093/nar/gkv342. PMC 4489253. PMID 25883148.
- ^ Blom N, Gammeltoft S, Brunak S (decembar 1999). "Sequence and structure-based prediction of eukaryotic protein phosphorylation sites". Journal of Molecular Biology. 294 (5): 1351–62. doi:10.1006/jmbi.1999.3310. PMID 10600390.
- ^ a b c "PSICQUIC View". www.ebi.ac.uk. Pristupljeno 2. 5. 2019.
- ^ a b Madden, Tom (13. 8. 2003). The BLAST Sequence Analysis Tool (jezik: engleski). National Center for Biotechnology Information (US).
- ^ "cyst germination specific acidic repeat protein precursor [Phytophthora infestans]". NCBI. Pristupljeno 2. 5. 2019.
- ^ a b "accD (chloroplast) [Acacia ashbyae] – Protein – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 2. 5. 2019.
- ^ "WebLogo – Create Sequence Logos". weblogo.berkeley.edu. Pristupljeno 2. 5. 2019.
- ^ Zhang Y (januar 2008). "I-TASSER server for protein 3D structure prediction". BMC Bioinformatics. 9 (1): 40. doi:10.1186/1471-2105-9-40. PMC 2245901. PMID 18215316.
- ^ Vogelstein B, Kinzler KW, Velculescu V, Papadopoulous N, Jones S (31. 5. 2012). "US Patent 9,982,304" (US 20130210900 A1). Pristupljeno Feb 5, 2019. journal zahtijeva
|journal=
(pomoć)[mrtav link] - ^ Nagy, Zsuzsanna (Jan 16, 2014). "US Patent 9,944,986" (US 20150141491 A1). Pristupljeno Feb 5, 2019. journal zahtijeva
|journal=
(pomoć)[mrtav link] - ^ Shenk T, Wang D (16. 4. 2009). "US Patent 9,439,960" (US 20100285059 A1). Pristupljeno Feb 5, 2019. journal zahtijeva
|journal=
(pomoć)[mrtav link] - ^ Hakonarson H, Glessner J, Orange J (Nov 28, 2013). "US Patent 9,109,254" (US 20130315858 A1). Pristupljeno Feb 5, 2019. journal zahtijeva
|journal=
(pomoć)[mrtav link]