C11orf49 je gen koji kod ljudi kodira protein C11orf49. Jako je eksprimiran u moždanom tkivu i monojadarnim ćelijama periferne krvi, pri čemu su potonje važne komponente imunskog sustema.[5][6] Predviđeno je da protein C11orf49 djeluje kao kinaza, te je pokazano da je u interakciji s HTT-om (određujuči proteina za Huntingtonovu bolest) i APOE2 (protein rizika za Alzheimerovu bolest).[7][8]

C11orf49
Identifikatori
AliasiCSTPP1
Vanjski ID-jeviMGI: 1915079 HomoloGene: 11471 GeneCards: CSTPP1
Lokacija gena (čovjek)
Hromosom 11 (čovjek)
Hrom.Hromosom 11 (čovjek)[1]
Hromosom 11 (čovjek)
Genomska lokacija za C11orf49
Genomska lokacija za C11orf49
Bend11p11.2Početak46,936,689 bp[1]
Kraj47,164,385 bp[1]
Lokacija gena (miš)
Hromosom 2 (miš)
Hrom.Hromosom 2 (miš)[2]
Hromosom 2 (miš)
Genomska lokacija za C11orf49
Genomska lokacija za C11orf49
Bend2|2 E1Početak91,105,413 bp[2]
Kraj91,275,049 bp[2]
Obrazac RNK ekspresije
Više referentnih podataka o ekspresiji
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_001003676
NM_001003677
NM_001003678
NM_001278222
NM_024113

NM_175123
NM_001311144
NM_153797

RefSeq (bjelančevina)

NP_001003676
NP_001003677
NP_001003678
NP_001265151
NP_077018

NP_001298073
NP_780332

Lokacija (UCSC)Chr 11: 46.94 – 47.16 MbChr 2: 91.11 – 91.28 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Aminokiselinska sekvenca

uredi

Dužina polipeptidnog lanca je 331 aminokiselina, a molekulska težina 37.353 Da.[9]

1020304050
MLSPERLALPDYEYLAQRHVLTYMEDAVCQLLENREDISQYGIARFFTEY
FNSVCQGTHILFREFSFVQATPHNRVSFLRAFWRCFRTVGKNGDLLTMKE
YHCLLQLLCPDFPLELTQKAARIVLMDDAMDCLMSFSDFLFAFQIQFYYS
EFLDSVAAIYEDLLSGKNPNTVIVPTSSSGQHRQRPALGGAGTLEGVEAS
LFYQCLENLCDRHKYSCPPPALVKEALSNVQRLTFYGFLMALSKHRGINQ
ALGALPDKGDLMHDPAMDEELERLLAQVPGLVNSVTASPEASCLPSRTPP
RVGSPWRPLHHSRKVDGESDGSTEETDESET

C11orf49 se nalazi u lokusu p11.2 na ljudskom hromosomu 11, sa plus orijentacijom. Dugačak 224.830 bp, uključujući introne, a i proteže se od položaja 46,936.806 do 47,161.635 .[10]

Poznati alijasi ovog gena su UPF0705, FLJ22210 i MGC4707.

Varijante transkripta

uredi

Postoji sedam poznatih varijanti transkripta za iRNK C11orf49, s varijantom 2 koja kodira najkompletniji protein. Varijanti 1 nedostaje 3 'UTR, što rezultira skraćenim 3' terminalom u odnosu na varijantu 2. Varijanta 3 na 3 'kraju sadrži mjesto alternativne prerade, kojem nedostaje unutrašnja regija blizu 3' terminala, u usporedbi sa varijantom 2. Varijanta 4 ima alternativni 3 'terminalni egzon, što rezultira skraćenim 3' terminalom u odnosu na varijantu 2. Varijanti 5 nedostaje egzon u 5' kodirajućoj regiji što rezultira uzlaznim start kodonom, i ima alternativno mjesto prerade u blizini područja 3 '. Ovo rezultira različitim N-terminalom i nedostajućom unutrašnjom regijom u blizini 3 'terminala u odnosu na varijantu 2. Varijante 6 i 7 su predstavljene kao kandidati za nonsens posredovanu razgradnju iRNK (NMD) i ne kodiraju održive proteine.[11]

Tabela 1: Poznate varijante transkripta iRNK ljudskog gena C11orf49

Ime Pristupni broj Broj egzona Veličina (bp)
Varijanta 1 NM_001003676.3 8 1.923
Varijanta 2 NM_001003677.3 9 1.668
Varijanta 3 NM_024113.5 8 1.650
Varijanta 4 NM_001003678.3 9 1.159
Varijanta 5 NM_001278222.1 8 1.619
Varijanta 6 NR_103471.2 10 1.895
Varijanta 7 NR_103472.2 8 1.519

Protein

uredi
 
Konceptna translacija C11orf49 Homo sapiens Conceptual Translation
 
Predviđena sekundarna struktura Phyre2
 
Predviđedna trakasta tercijerna struktura, prema i-Tasser-u
 
Predviđena sferna tercijerna struktura, i-Tasser

Izoforme

uredi

Postoji 5 poznatih izoformi za protein C11orf49, a izoform 2 je najcjelovitiji protein, kodiran varijantom transkripta 2.

Tabela 2: Poznate proteinske izoforme ljudskog proteina C11orf49

Ime Pristupni broj Veličina (AA)
Izoforma 1 NP_001003676.1 274
Izoforma 2 NP_001003677.1 337
Izoforma 3 NP_077018.1 331
Izoforma 4 NP_001003678.1 326
Izoforma 5 NP_001265151.1 322

Kompozicija

uredi

C11orf49 protein ima molekulsku težinu od 38,1 kD, i izolektričnu tačku od oko pH = 5.[12] Sastav proteina pada ispod normalnih razina za svaku aminokiselinu, i nema konzerviranih ponavljanja, uzoraka ili nabijenih nakupina koje bi se mogle vidjeti. Ne postoje uočljivi hidrofobni ili transmembranski regioni.[13]

Proteinski domen

uredi

Predviđeno je da protein C11orf49 sadrži domen protein-kinaze u blizini N' kraja (ostaci 12-51)[7]

Sekundarna struktura

uredi

Za sekundarnu strukturu alati za predviđanje poput Ali2D, Phyre2 i i-Tasser predviđaju da se protein C11orf49 uglavnom sastoji od alfa-heliksa, bez predviđanja beta-listova.[7][14][15] Informacije o tome gdje se nalaze ovi alfa-heliksi mogu se vidjeti na slici desno.

Tercijarna struktura

uredi

Predviđena i-Tasser tercijarna struktura proteina uključena je s desne strane mjesta.

Fosforilacija

uredi

Predviđa se da će protein C11orf49 biti fosforiliran na četiri različita mjesta, uglavnom na ostacima serina, ali i na jednom treoninskom ostatku.[16]

Tabela 3: Predviđena mjesta fosforilacija ljudskog proteina C11orf49

Pozicija Aminokiseline Kinaza
310 Serin AGC/Akt
48 Treonin AGC/Akt/AKT1
66 Serin AGC/Akt
318 Serin AGC/Akt

Sumoilacija

uredi

Predviđa se da će protein C11orf49 biti sumoiliran na pozicijama 119 i 320, oba lizinska ostatka.[16]

Subćelijska lokalizacija

uredi

Predviđa se da se ljudski protein C11orf49 lokaliziraju u citoplazmi.[17]

Genska razina tregulacije

uredi

Promotori

uredi
 
Lokacije promotora na ljudskom genu C11orf49

Na Genomatixu je navedeno sedam promotora, ali samo jedan od njih (GXP_204543) počinje na početku ljudskog gena C11orf49 , a ima i najveći broj kodiranih transkripata.[18]

Tabela 4: Lista pridruženih promotora ljudskog gena C11orf49

Promotorski ID Startni položaj Položaj kraja Veličina (bp) Orijentacija Ukupni broj transkripata
GXP_204543 46935524 46936819 1296 Plus lanac 32
GXP_3162280 47050923 47051962 1040 Plus lanac 1
GXP_3162281 47051454 47052500 1047 Plus lanac 2
GXP_3162283 47136696 47137735 1040 Plus lanac 1
GXP_3162284 47153395 47154434 1040 Plus lanac 1
GXP_3162285 47153944 47154983 1040 Plus lanac 1
GXP_204542 47159105 47160144 1040 Plus lanac 1

Faktori transkripcije

uredi
 
Vezna mjesta faktora transkripcije za ljudski promotor C11orf49

Predviđeno je da će se sljedeći transkripcijski faktori vezati za promotor GXP_204543.[19] Što je veći rezultat matrice, veća je verovatnoća da se transkripcijski faktor veže za promotor. Podaci o tome gdje se ovi transkripcijski faktori vezuju za promotor GXP_204543 prikazani su na slici desno od stranice.

Tabela 5: Lista veznih transkripcijskih faktora za promotor GXP_204543

Matriksna porodica Detaaljne informacije o porodici Detaljnije informacije o matriksu Matriksni rezultat
V$NKXH NKX homeodomenski faktoru Homeodomenski faktor NKX-2.5 1
V$GATA GATA vezujući faktor GATA-vezujući faktor 3 0,992
V$LEFF LEF1/TCF Uključen u Wnt signalni put 0,991
O$VTBP Kičmenjački TATA-vezujući faktor Ćelijski i virusni TATA-boksni elementi 0,99
V$KLFS Krueppeloliki TFs Dobronabijeni Krueppeloliki TF 0,982
V$MYBL Ćelijski i virusni myb-oliki TFs V-Myb 0,978
V$E2FF E2F-myc aktivator E2F TF 1 0,976
V$MEF3 MEF3-vezujuća mjesta Homeoboksni homolog 2Sine oculis 0,972
V$XBBF X-boks vezujući fsktori X-boks vezujući protein RFX1 0,966
V$ETSF Ljudski i mišji faktori ETS1 Elk-1 0,958
V$PBXC PBX-MEIS-kompleksi Homeoboksna 3Pre-B-ćelijska leukemija 0,949
V$CAAT CCAAT binding factors Ćelijski i virusi CCAAT-boks 0,927
V$HEAT Faktori toplotnog šoka Faktor 1 toplotnog šoka 0,927
V$MYT1 MYT1 C2HC zinc finger protein Mijelinski TF 1-liki, neuronski C2H2 ZF 1 0,925
V$GCMF Horion-specifični TFs Nedostajući homolog 1 glijinih ćelija 0,902
V$ZF04 C2H2 cinkov prst TF 4 Cinkov prst i domen BTB 0,9
V$MAZF Myc pridruženi cinkovi prsti (MAZ) MAZ 0,875
V$PAX9 Pax-9 vezujuće mjesto sites Zebricino Pax-9 vezujuće mjesto 0,848
V$DMRT DM TFs sa domenom Mab-3 srodni TF 1 0,817
 
Obrazac mikrozračne ekspresije C11orf49
 
Podatak C11orf49 RNK-Seq

Tkivno specifična ekspresija

uredi

Obrasci ekspresije mikrozraka i RNA-Seq podaci pokazuju vrlo visoke nivoe ekspresije u mozgu.[11][20] Prema podacima RNK-Seq, visoka ekspresije nađena je i u fetusnom tkivu pluća.[11] Dodatnw informacije za ostala tkiva uklučene su u sliku desno.

Uvjeti diferencirane ekspresije

uredi

Ekspresija C11orf49 značajno se povećava nakon prekomjerne ekspresije klaudina-1 u ćelijskim linijama adenokarcinoma pluća.[21] Klaudin-1 posebno sprječava paraćelijsku difuziju malih molekula kroz uske spojeve u epidermi.

Ekspresija C11orf49 značajno se smanjuje nakon liječenja kamptotecinom na epitelnoj ćelijskoj liniji bubrega.[22] Kamptotecin je alkaloid koji inhibira jedarni enzim DNK-topoizomeraza i ima antitumorsko djelovanje. Takođe je pokazao sposobnost da izazove apoptozu promenom propustljivosti mitohondrijske membrane, oslobađajući citokrom C.

Regulacija posttranskripcije

uredi
 
5' UTR drška-petljasta struktura C11orf49
 
Transcript 3' UTR drška-petlja struktura C11orf49 i miRNK mjesta vezanja

5' UTR

uredi

Predviđena je struktura matične petlje u 5 'UTR transkripta C11orf49 iz nukleotida 15-26, prikazanih desno.[23]

3' UTR

uredi

Predviđene su strukture matične petlje i miRNK mjesta vezivanja za 3' UTR transkripta C11orf49, prikazana desno.[23][24]

Baza podataka koju pruža PSICQUIC ukazuje na to da ljudski protein C11orf49 stupa u interakciju sa sljedećim proteinima navedenim u Tabeli 6. Sve interakcije su određene pomoću eksperimenata dvohibridnog skrininga.[8]

Tabela 6: Lista of proteina koji komunicirfaju sa ljudskin proteinom C11orf49

Protein Opis
HTT Huntingtinski protein
APOE Apolipoprotein E
PRKAR1A Regulacijska podjedinica cAMP-ovisne protein-kinaze tip I-alfa
FH Fumarat-hidrataza
GCA Grancalcin
PHF1 PHD prstov protein 1
VPS54 Pridruženi protein 54 proteina vakuolskog sortiranja
ZFHX3 Homeoboksni protein 3 cinkovog prsta
RAB7L1 Porodica RAS-olikog onkogena 1
NDRG1 Stresno odgovorni protein
PNMA5 Paraneoplazijski antigenoliki protein 5
TXN2 Tioredoksin

Homologija i evolucija

uredi

Ortolozi i paralozi

uredi

C11orf49 se može naći među raznim taksonomskim grupama, uključujući, ali se ne ograničavajući na njih: Mammalia, Aves, Reptilia, Amphibia, Platyhelminthes, Cyprinidae, Hemichordata, Cnidaria, Arthropoda, Placozoa, Choanoflagellata, Spizellomyces i Oomycota.[25][26] Međutim, C11orf49 nije moguće pronaći u Insecta ili Plantae. Nema poznatih paraloga C11orf49.

Tabela 7: Lista odabranih ortologa C11orf49

Rod i vrsta Uobičajeno ime Taksonomska grupa Datiranje diveergencije (minioni godina) Pristupni broj Dužina (aminokiseline) Identitet (%) Sličnost (%)
Mus musculus Miš Rodentia 89 NP_780332.1 331 92 95,5
Gallus gallus Kokoš Aves 318 XP_015142672.1 331 76,7 83,5
Chelonia mydas Zelena morska kornjača Reptilia 318 XP_007054360.2 362 73,4 79,9
Geotrypetes seraphini Gabonska cecilija Amphibia 352 XP_033784118.1 329 69,9 81,7
Xenopus tropicalis Tropska kandžasta žaba Amphibia 352 NM_001079316.1 330 61,9 77,3
Danio rerio Zebrica Cyprinoidae 433 NP_001002479.1 331 54,7 72,2
Sacoglossus kowalevskii Žirolika glista Hemichordata 627 XP_006821066.1 299 43,6 58,2
Nematostella vectensis Starletna morska anemona Cnidaria 687 XP_032240720.1 300 42,4 57,3
Macrostomum lignano Pljosnata glista Platyhelminthes 692 PAA77967.1 404 29,7 42,3
Stegodyphus mimosarum Afrički baršunasti pauk Arthropoda 736 KFM74201.1 321 24,3 38,5
Trichoplax adhaerens Trihoplaks Placozoa 747 XP_002108042.1 263 24,7 39,6
Salpingoeca rosetta N/A Choanoflagellate 928 XP_004994083.1 231 15,5 25,5
Spizellomyces palustris Australijska gljiva Spizellomyces 1017 TPX67906.1 298 21,4 32,7
Saprolegnia diclina Pamučna plijesan Oomycota 1552 XP_008621502.1 314 22,9 35,6

Evolucija

uredi
 
Evolucijska C11orf49

Historija

uredi

Saprolegnia diclina je najudaljeniji ortolog od poznatih C11orf49, sa divergencijom od ljudskih predaka od približno 1.552 miliona godina.[25][27]

Evolucijska stopa

uredi

Prema molekulskom satu, C11orf49 je evoluirao brže nego Citohrom c, ali sporije od fibrinogena alfa. Grafikon koji sadrži ovu analizu nalazi se s desne strane.

Funkcija

uredi

Aktivnost protein-kinaze

uredi

Predviđeno je da će C11orf49 djelovati kao cAMP-ovisna protein-kinaza.[7]

Klinički značaj

uredi

Pokazalo se da C11orf49 stupa u interakciju s proteinima HTT i APOE2, koji su povezani s Huntingtonovom i Alzheimerovom bolešću.[8] Zbog predviđene funkcije C11orf49, ova interakcija bi mogla biti orijentirana na kinazu.

Ekspresija C11orf49 značajno se povećava nakon prekomjerne ekspresije klaudina-1 u ćelijama adenokarcinoma pluća.[21]

Ekspresija C11orf49 značajno se smanjuje nakon liječenja kamptotecinom na ćelijskoj epitelnoj ćelijskoj liniji bubrega.[22]

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000149179 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000040591 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ "GDS596 / 203257_s_at". www.ncbi.nlm.nih.gov. Pristupljeno 17. 12. 2020.
  6. ^ "C11orf49 Gene - GeneCards | CK049 Protein | CK049 Antibody". www.genecards.org. Pristupljeno 17. 12. 2020.
  7. ^ a b c d "Phyre 2 Results for Undefined". www.sbg.bio.ic.ac.uk. Pristupljeno 17. 12. 2020.[mrtav link]
  8. ^ a b c "PSICQUIC View". www.ebi.ac.uk. Pristupljeno 17. 12. 2020.
  9. ^ "UniProt, Q9H6J7". Pristupljeno 18. 8. 2021.
  10. ^ "Human BLAT Search". genome.ucsc.edu. Pristupljeno 17. 12. 2020.
  11. ^ a b c "C11orf49 chromosome 11 open reading frame 49 [Homo sapiens (human)] - Gene - NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 17. 12. 2020.
  12. ^ "ExPASy - Compute pI/Mw tool". web.expasy.org. Pristupljeno 17. 12. 2020.
  13. ^ "SAPS < Sequence Statistics < EMBL-EBI". www.ebi.ac.uk. Pristupljeno 18. 12. 2020.
  14. ^ "Bioinformatics Toolkit". toolkit.tuebingen.mpg.de. Pristupljeno 18. 12. 2020.
  15. ^ "I-TASSER results". zhanglab.ccmb.med.umich.edu. Pristupljeno 18. 12. 2020.[mrtav link]
  16. ^ a b "SIB Swiss Institute of Bioinformatics | Expasy". www.expasy.org. Pristupljeno 18. 12. 2020.
  17. ^ "PSORT II Prediction". psort.hgc.jp. Pristupljeno 18. 12. 2020.
  18. ^ "Genomatix: Retrieve and analyze promoters: Query Input". www.genomatix.de. Pristupljeno 18. 12. 2020.[mrtav link]
  19. ^ "Genomatix: MatInspector Input". www.genomatix.de. Pristupljeno 18. 12. 2020.[mrtav link]
  20. ^ "GDS596 / 203257_s_at". www.ncbi.nlm.nih.gov. Pristupljeno 18. 12. 2020.
  21. ^ a b "59175105 - GEO Profiles - NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 19. 12. 2020.
  22. ^ a b "14476184 - GEO Profiles - NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 19. 12. 2020.
  23. ^ a b "RNAfold web server". rna.tbi.univie.ac.at. Pristupljeno 19. 12. 2020.
  24. ^ "TargetScanHuman 7.2 predicted targeting of Human C11orf49". www.targetscan.org. Pristupljeno 19. 12. 2020.
  25. ^ a b "BLAST: Basic Local Alignment Search Tool". blast.ncbi.nlm.nih.gov. Pristupljeno 19. 12. 2020.
  26. ^ "Human BLAT Search". genome.ucsc.edu. Pristupljeno 19. 12. 2020.
  27. ^ "TimeTree :: The Timescale of Life". www.timetree.org. Pristupljeno 19. 12. 2020.