C11orf49
C11orf49 je gen koji kod ljudi kodira protein C11orf49. Jako je eksprimiran u moždanom tkivu i monojadarnim ćelijama periferne krvi, pri čemu su potonje važne komponente imunskog sustema.[5][6] Predviđeno je da protein C11orf49 djeluje kao kinaza, te je pokazano da je u interakciji s HTT-om (određujuči proteina za Huntingtonovu bolest) i APOE2 (protein rizika za Alzheimerovu bolest).[7][8]
C11orf49 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | CSTPP1 | ||||||||||||||||||||||||
Vanjski ID-jevi | MGI: 1915079 HomoloGene: 11471 GeneCards: CSTPP1 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 11: 46.94 – 47.16 Mb | Chr 2: 91.11 – 91.28 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Aminokiselinska sekvenca
urediDužina polipeptidnog lanca je 331 aminokiselina, a molekulska težina 37.353 Da.[9]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MLSPERLALP | DYEYLAQRHV | LTYMEDAVCQ | LLENREDISQ | YGIARFFTEY | ||||
FNSVCQGTHI | LFREFSFVQA | TPHNRVSFLR | AFWRCFRTVG | KNGDLLTMKE | ||||
YHCLLQLLCP | DFPLELTQKA | ARIVLMDDAM | DCLMSFSDFL | FAFQIQFYYS | ||||
EFLDSVAAIY | EDLLSGKNPN | TVIVPTSSSG | QHRQRPALGG | AGTLEGVEAS | ||||
LFYQCLENLC | DRHKYSCPPP | ALVKEALSNV | QRLTFYGFLM | ALSKHRGINQ | ||||
ALGALPDKGD | LMHDPAMDEE | LERLLAQVPG | LVNSVTASPE | ASCLPSRTPP | ||||
RVGSPWRPLH | HSRKVDGESD | GSTEETDESE | T |
Gen
urediC11orf49 se nalazi u lokusu p11.2 na ljudskom hromosomu 11, sa plus orijentacijom. Dugačak 224.830 bp, uključujući introne, a i proteže se od položaja 46,936.806 do 47,161.635 .[10]
Poznati alijasi ovog gena su UPF0705, FLJ22210 i MGC4707.
Varijante transkripta
urediPostoji sedam poznatih varijanti transkripta za iRNK C11orf49, s varijantom 2 koja kodira najkompletniji protein. Varijanti 1 nedostaje 3 'UTR, što rezultira skraćenim 3' terminalom u odnosu na varijantu 2. Varijanta 3 na 3 'kraju sadrži mjesto alternativne prerade, kojem nedostaje unutrašnja regija blizu 3' terminala, u usporedbi sa varijantom 2. Varijanta 4 ima alternativni 3 'terminalni egzon, što rezultira skraćenim 3' terminalom u odnosu na varijantu 2. Varijanti 5 nedostaje egzon u 5' kodirajućoj regiji što rezultira uzlaznim start kodonom, i ima alternativno mjesto prerade u blizini područja 3 '. Ovo rezultira različitim N-terminalom i nedostajućom unutrašnjom regijom u blizini 3 'terminala u odnosu na varijantu 2. Varijante 6 i 7 su predstavljene kao kandidati za nonsens posredovanu razgradnju iRNK (NMD) i ne kodiraju održive proteine.[11]
Tabela 1: Poznate varijante transkripta iRNK ljudskog gena C11orf49
Ime | Pristupni broj | Broj egzona | Veličina (bp) |
Varijanta 1 | NM_001003676.3 | 8 | 1.923 |
Varijanta 2 | NM_001003677.3 | 9 | 1.668 |
Varijanta 3 | NM_024113.5 | 8 | 1.650 |
Varijanta 4 | NM_001003678.3 | 9 | 1.159 |
Varijanta 5 | NM_001278222.1 | 8 | 1.619 |
Varijanta 6 | NR_103471.2 | 10 | 1.895 |
Varijanta 7 | NR_103472.2 | 8 | 1.519 |
Protein
urediIzoforme
urediPostoji 5 poznatih izoformi za protein C11orf49, a izoform 2 je najcjelovitiji protein, kodiran varijantom transkripta 2.
Tabela 2: Poznate proteinske izoforme ljudskog proteina C11orf49
Ime | Pristupni broj | Veličina (AA) |
Izoforma 1 | NP_001003676.1 | 274 |
Izoforma 2 | NP_001003677.1 | 337 |
Izoforma 3 | NP_077018.1 | 331 |
Izoforma 4 | NP_001003678.1 | 326 |
Izoforma 5 | NP_001265151.1 | 322 |
Kompozicija
urediC11orf49 protein ima molekulsku težinu od 38,1 kD, i izolektričnu tačku od oko pH = 5.[12] Sastav proteina pada ispod normalnih razina za svaku aminokiselinu, i nema konzerviranih ponavljanja, uzoraka ili nabijenih nakupina koje bi se mogle vidjeti. Ne postoje uočljivi hidrofobni ili transmembranski regioni.[13]
Proteinski domen
urediPredviđeno je da protein C11orf49 sadrži domen protein-kinaze u blizini N' kraja (ostaci 12-51)[7]
Sekundarna struktura
urediZa sekundarnu strukturu alati za predviđanje poput Ali2D, Phyre2 i i-Tasser predviđaju da se protein C11orf49 uglavnom sastoji od alfa-heliksa, bez predviđanja beta-listova.[7][14][15] Informacije o tome gdje se nalaze ovi alfa-heliksi mogu se vidjeti na slici desno.
Tercijarna struktura
urediPredviđena i-Tasser tercijarna struktura proteina uključena je s desne strane mjesta.
Fosforilacija
urediPredviđa se da će protein C11orf49 biti fosforiliran na četiri različita mjesta, uglavnom na ostacima serina, ali i na jednom treoninskom ostatku.[16]
Tabela 3: Predviđena mjesta fosforilacija ljudskog proteina C11orf49
Pozicija | Aminokiseline | Kinaza |
310 | Serin | AGC/Akt |
48 | Treonin | AGC/Akt/AKT1 |
66 | Serin | AGC/Akt |
318 | Serin | AGC/Akt |
Sumoilacija
urediPredviđa se da će protein C11orf49 biti sumoiliran na pozicijama 119 i 320, oba lizinska ostatka.[16]
Subćelijska lokalizacija
urediPredviđa se da se ljudski protein C11orf49 lokaliziraju u citoplazmi.[17]
Genska razina tregulacije
urediPromotori
urediNa Genomatixu je navedeno sedam promotora, ali samo jedan od njih (GXP_204543) počinje na početku ljudskog gena C11orf49 , a ima i najveći broj kodiranih transkripata.[18]
Tabela 4: Lista pridruženih promotora ljudskog gena C11orf49
Promotorski ID | Startni položaj | Položaj kraja | Veličina (bp) | Orijentacija | Ukupni broj transkripata |
GXP_204543 | 46935524 | 46936819 | 1296 | Plus lanac | 32 |
GXP_3162280 | 47050923 | 47051962 | 1040 | Plus lanac | 1 |
GXP_3162281 | 47051454 | 47052500 | 1047 | Plus lanac | 2 |
GXP_3162283 | 47136696 | 47137735 | 1040 | Plus lanac | 1 |
GXP_3162284 | 47153395 | 47154434 | 1040 | Plus lanac | 1 |
GXP_3162285 | 47153944 | 47154983 | 1040 | Plus lanac | 1 |
GXP_204542 | 47159105 | 47160144 | 1040 | Plus lanac | 1 |
Faktori transkripcije
urediPredviđeno je da će se sljedeći transkripcijski faktori vezati za promotor GXP_204543.[19] Što je veći rezultat matrice, veća je verovatnoća da se transkripcijski faktor veže za promotor. Podaci o tome gdje se ovi transkripcijski faktori vezuju za promotor GXP_204543 prikazani su na slici desno od stranice.
Tabela 5: Lista veznih transkripcijskih faktora za promotor GXP_204543
Matriksna porodica | Detaaljne informacije o porodici | Detaljnije informacije o matriksu | Matriksni rezultat |
V$NKXH | NKX homeodomenski faktoru | Homeodomenski faktor NKX-2.5 | 1 |
V$GATA | GATA vezujući faktor | GATA-vezujući faktor 3 | 0,992 |
V$LEFF | LEF1/TCF | Uključen u Wnt signalni put | 0,991 |
O$VTBP | Kičmenjački TATA-vezujući faktor | Ćelijski i virusni TATA-boksni elementi | 0,99 |
V$KLFS | Krueppeloliki TFs | Dobronabijeni Krueppeloliki TF | 0,982 |
V$MYBL | Ćelijski i virusni myb-oliki TFs | V-Myb | 0,978 |
V$E2FF | E2F-myc aktivator | E2F TF 1 | 0,976 |
V$MEF3 | MEF3-vezujuća mjesta | Homeoboksni homolog 2Sine oculis | 0,972 |
V$XBBF | X-boks vezujući fsktori | X-boks vezujući protein RFX1 | 0,966 |
V$ETSF | Ljudski i mišji faktori ETS1 | Elk-1 | 0,958 |
V$PBXC | PBX-MEIS-kompleksi | Homeoboksna 3Pre-B-ćelijska leukemija | 0,949 |
V$CAAT | CCAAT binding factors | Ćelijski i virusi CCAAT-boks | 0,927 |
V$HEAT | Faktori toplotnog šoka | Faktor 1 toplotnog šoka | 0,927 |
V$MYT1 | MYT1 C2HC zinc finger protein | Mijelinski TF 1-liki, neuronski C2H2 ZF 1 | 0,925 |
V$GCMF | Horion-specifični TFs | Nedostajući homolog 1 glijinih ćelija | 0,902 |
V$ZF04 | C2H2 cinkov prst TF 4 | Cinkov prst i domen BTB | 0,9 |
V$MAZF | Myc pridruženi cinkovi prsti (MAZ) | MAZ | 0,875 |
V$PAX9 | Pax-9 vezujuće mjesto sites | Zebricino Pax-9 vezujuće mjesto | 0,848 |
V$DMRT | DM TFs sa domenom | Mab-3 srodni TF 1 | 0,817 |
Tkivno specifična ekspresija
urediObrasci ekspresije mikrozraka i RNA-Seq podaci pokazuju vrlo visoke nivoe ekspresije u mozgu.[11][20] Prema podacima RNK-Seq, visoka ekspresije nađena je i u fetusnom tkivu pluća.[11] Dodatnw informacije za ostala tkiva uklučene su u sliku desno.
Uvjeti diferencirane ekspresije
urediEkspresija C11orf49 značajno se povećava nakon prekomjerne ekspresije klaudina-1 u ćelijskim linijama adenokarcinoma pluća.[21] Klaudin-1 posebno sprječava paraćelijsku difuziju malih molekula kroz uske spojeve u epidermi.
Ekspresija C11orf49 značajno se smanjuje nakon liječenja kamptotecinom na epitelnoj ćelijskoj liniji bubrega.[22] Kamptotecin je alkaloid koji inhibira jedarni enzim DNK-topoizomeraza i ima antitumorsko djelovanje. Takođe je pokazao sposobnost da izazove apoptozu promenom propustljivosti mitohondrijske membrane, oslobađajući citokrom C.
Regulacija posttranskripcije
uredi5' UTR
urediPredviđena je struktura matične petlje u 5 'UTR transkripta C11orf49 iz nukleotida 15-26, prikazanih desno.[23]
3' UTR
urediPredviđene su strukture matične petlje i miRNK mjesta vezivanja za 3' UTR transkripta C11orf49, prikazana desno.[23][24]
Baza podataka koju pruža PSICQUIC ukazuje na to da ljudski protein C11orf49 stupa u interakciju sa sljedećim proteinima navedenim u Tabeli 6. Sve interakcije su određene pomoću eksperimenata dvohibridnog skrininga.[8]
Tabela 6: Lista of proteina koji komunicirfaju sa ljudskin proteinom C11orf49
Protein | Opis |
HTT | Huntingtinski protein |
APOE | Apolipoprotein E |
PRKAR1A | Regulacijska podjedinica cAMP-ovisne protein-kinaze tip I-alfa |
FH | Fumarat-hidrataza |
GCA | Grancalcin |
PHF1 | PHD prstov protein 1 |
VPS54 | Pridruženi protein 54 proteina vakuolskog sortiranja |
ZFHX3 | Homeoboksni protein 3 cinkovog prsta |
RAB7L1 | Porodica RAS-olikog onkogena 1 |
NDRG1 | Stresno odgovorni protein |
PNMA5 | Paraneoplazijski antigenoliki protein 5 |
TXN2 | Tioredoksin |
Homologija i evolucija
urediOrtolozi i paralozi
urediC11orf49 se može naći među raznim taksonomskim grupama, uključujući, ali se ne ograničavajući na njih: Mammalia, Aves, Reptilia, Amphibia, Platyhelminthes, Cyprinidae, Hemichordata, Cnidaria, Arthropoda, Placozoa, Choanoflagellata, Spizellomyces i Oomycota.[25][26] Međutim, C11orf49 nije moguće pronaći u Insecta ili Plantae. Nema poznatih paraloga C11orf49.
Tabela 7: Lista odabranih ortologa C11orf49
Rod i vrsta | Uobičajeno ime | Taksonomska grupa | Datiranje diveergencije (minioni godina) | Pristupni broj | Dužina (aminokiseline) | Identitet (%) | Sličnost (%) |
Mus musculus | Miš | Rodentia | 89 | NP_780332.1 | 331 | 92 | 95,5 |
Gallus gallus | Kokoš | Aves | 318 | XP_015142672.1 | 331 | 76,7 | 83,5 |
Chelonia mydas | Zelena morska kornjača | Reptilia | 318 | XP_007054360.2 | 362 | 73,4 | 79,9 |
Geotrypetes seraphini | Gabonska cecilija | Amphibia | 352 | XP_033784118.1 | 329 | 69,9 | 81,7 |
Xenopus tropicalis | Tropska kandžasta žaba | Amphibia | 352 | NM_001079316.1 | 330 | 61,9 | 77,3 |
Danio rerio | Zebrica | Cyprinoidae | 433 | NP_001002479.1 | 331 | 54,7 | 72,2 |
Sacoglossus kowalevskii | Žirolika glista | Hemichordata | 627 | XP_006821066.1 | 299 | 43,6 | 58,2 |
Nematostella vectensis | Starletna morska anemona | Cnidaria | 687 | XP_032240720.1 | 300 | 42,4 | 57,3 |
Macrostomum lignano | Pljosnata glista | Platyhelminthes | 692 | PAA77967.1 | 404 | 29,7 | 42,3 |
Stegodyphus mimosarum | Afrički baršunasti pauk | Arthropoda | 736 | KFM74201.1 | 321 | 24,3 | 38,5 |
Trichoplax adhaerens | Trihoplaks | Placozoa | 747 | XP_002108042.1 | 263 | 24,7 | 39,6 |
Salpingoeca rosetta | N/A | Choanoflagellate | 928 | XP_004994083.1 | 231 | 15,5 | 25,5 |
Spizellomyces palustris | Australijska gljiva | Spizellomyces | 1017 | TPX67906.1 | 298 | 21,4 | 32,7 |
Saprolegnia diclina | Pamučna plijesan | Oomycota | 1552 | XP_008621502.1 | 314 | 22,9 | 35,6 |
Evolucija
urediHistorija
urediSaprolegnia diclina je najudaljeniji ortolog od poznatih C11orf49, sa divergencijom od ljudskih predaka od približno 1.552 miliona godina.[25][27]
Evolucijska stopa
urediPrema molekulskom satu, C11orf49 je evoluirao brže nego Citohrom c, ali sporije od fibrinogena alfa. Grafikon koji sadrži ovu analizu nalazi se s desne strane.
Funkcija
urediAktivnost protein-kinaze
urediPredviđeno je da će C11orf49 djelovati kao cAMP-ovisna protein-kinaza.[7]
Klinički značaj
urediPokazalo se da C11orf49 stupa u interakciju s proteinima HTT i APOE2, koji su povezani s Huntingtonovom i Alzheimerovom bolešću.[8] Zbog predviđene funkcije C11orf49, ova interakcija bi mogla biti orijentirana na kinazu.
Ekspresija C11orf49 značajno se povećava nakon prekomjerne ekspresije klaudina-1 u ćelijama adenokarcinoma pluća.[21]
Ekspresija C11orf49 značajno se smanjuje nakon liječenja kamptotecinom na ćelijskoj epitelnoj ćelijskoj liniji bubrega.[22]
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000149179 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000040591 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "GDS596 / 203257_s_at". www.ncbi.nlm.nih.gov. Pristupljeno 17. 12. 2020.
- ^ "C11orf49 Gene - GeneCards | CK049 Protein | CK049 Antibody". www.genecards.org. Pristupljeno 17. 12. 2020.
- ^ a b c d "Phyre 2 Results for Undefined". www.sbg.bio.ic.ac.uk. Pristupljeno 17. 12. 2020.[mrtav link]
- ^ a b c "PSICQUIC View". www.ebi.ac.uk. Pristupljeno 17. 12. 2020.
- ^ "UniProt, Q9H6J7". Pristupljeno 18. 8. 2021.
- ^ "Human BLAT Search". genome.ucsc.edu. Pristupljeno 17. 12. 2020.
- ^ a b c "C11orf49 chromosome 11 open reading frame 49 [Homo sapiens (human)] - Gene - NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 17. 12. 2020.
- ^ "ExPASy - Compute pI/Mw tool". web.expasy.org. Pristupljeno 17. 12. 2020.
- ^ "SAPS < Sequence Statistics < EMBL-EBI". www.ebi.ac.uk. Pristupljeno 18. 12. 2020.
- ^ "Bioinformatics Toolkit". toolkit.tuebingen.mpg.de. Pristupljeno 18. 12. 2020.
- ^ "I-TASSER results". zhanglab.ccmb.med.umich.edu. Pristupljeno 18. 12. 2020.[mrtav link]
- ^ a b "SIB Swiss Institute of Bioinformatics | Expasy". www.expasy.org. Pristupljeno 18. 12. 2020.
- ^ "PSORT II Prediction". psort.hgc.jp. Pristupljeno 18. 12. 2020.
- ^ "Genomatix: Retrieve and analyze promoters: Query Input". www.genomatix.de. Pristupljeno 18. 12. 2020.[mrtav link]
- ^ "Genomatix: MatInspector Input". www.genomatix.de. Pristupljeno 18. 12. 2020.[mrtav link]
- ^ "GDS596 / 203257_s_at". www.ncbi.nlm.nih.gov. Pristupljeno 18. 12. 2020.
- ^ a b "59175105 - GEO Profiles - NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 19. 12. 2020.
- ^ a b "14476184 - GEO Profiles - NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 19. 12. 2020.
- ^ a b "RNAfold web server". rna.tbi.univie.ac.at. Pristupljeno 19. 12. 2020.
- ^ "TargetScanHuman 7.2 predicted targeting of Human C11orf49". www.targetscan.org. Pristupljeno 19. 12. 2020.
- ^ a b "BLAST: Basic Local Alignment Search Tool". blast.ncbi.nlm.nih.gov. Pristupljeno 19. 12. 2020.
- ^ "Human BLAT Search". genome.ucsc.edu. Pristupljeno 19. 12. 2020.
- ^ "TimeTree :: The Timescale of Life". www.timetree.org. Pristupljeno 19. 12. 2020.