Protein upredene zavojnice 142 (CCDC142) je gen koji kod ljudi kodira protein CCDC142. Gen CCDC142 se nalazi na hromosomu 2 (na 2p13), obuhvata 4.339 parova baza i sadrži devet egzona. Gen kodira domen upredene zavojnice 142 (CCDC142), čija funkcija još nije dobro shvaćena.[1][2] Postoje dvije poznate izoforme CCDC142.[1] CCDC142 proteini proizvedeni iz ovih transkripata imaju veličinu od 743 do 665 aminokiselina i sadrže signale koji ukazuju na kretanje proteina između citosola i jedra.[1] Iako funkcija ovog proteina nije dobro shvaćena, zna se da sadrži domen upredene zavojnice i RINT1 TIP1 motiv koji se nalazi unutar domena upredene zavojnice.[3][4]

CCDC142
Identifikatori
Aliasi
Vanjski ID-jeviGeneCards: [1]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

n/a

n/a

RefSeq (bjelančevina)

n/a

n/a

Lokacija (UCSC)n/an/a
PubMed pretragan/an/a
Wikipodaci
Pogledaj/uredi – čovjek

Lokus

uredi
 
Genski lokus CCDC142[1]

CCDC142 se nalazi na 2p13.1 lancu hromosoma 2, sa genomskom sekvencom koja obuhvata baze od 74,472,832 do 74,483,230.[1] Kodirajuća regija duga je 8.292 bazna para, koja kodira dvije izoforme proteina dužine od 743 do 665 aminokiselina.]]|[1] Na telomernoj strani, CCDC142 praćen je genima MOGS i MRPL53, a na centromernoj, slijede geni C31, LBX2, LBX2-AS1 i PCGF1.[1]

U Homo sapiens, gen CCDC142 kodira dvije alternativno prerađene izoforme iRNK, zvane izoforma 1 i izoforma 2.[3] Obje ove izoforme imaju 9 egzona. Izoforma 1 je duža od ta dva, duga je 4339bp, dok je izoforma 2 duga 2253bp.[3] Obje izoforme imaju po devet egzona. Izoforma 1 je duža i ima 4.339 bp, dok je izoforma 2 duga 2253 bp.[3] Glavna razlika između dviju izoformi je što izoforma 2 ima kraći egzon 9 and 3' UTR.[3] Izoforma 1 je duža varijanta gena i kodiranog proteina, na koje se ovaj članak i odnosi.[1]

Protein

uredi
 
Struktura proteinskog domena CCDC142. Visoko konzervirane regije izvan motiva RINT1_TIP1 su u crnoj boji. Pretpostavljeni signal jedarne lokalizacije je crven.

Glavna izoforma proteina CCDC142 duga je 743 aminokiseline, a druga 665 aminokiselina. Razliku u dužini u potpunosti čine aminokiseline koje nedostaju na C-terminalu izoforme 2.[1]

Domeni i motivi

uredi
Koncept translacije CCDC142
Oznake koncepta translacije CCDC142

Predviđeni domen upredene zavojnice CCDC142 je od aminokiselina 308–719.[2] RINT1 TIP1 motiv je također prisutan od aminokiselina 490–621 . RINT1 TIP1 je porodica koja uključuje RINT-1 (protein uključen u kontrolu kontrolnih tačaka izazvanih radijacijom) i TIP-1 (protein kvasca koji je uključen u Golgijev transport).[4] Dodatnih ~250 aminokiselina koje se nalaze u udaljenom ortologu CCDC142 proteina ne nalazi se u ljudskom genomu blizu gena CCDC142.

Predviđeno je da CCDC142 ima šest mjesta fosforilacija, četiri mjesta metilacija , jedno mjesto palmitoilacija, [jedno [SUMO protein|sumoilacija]] i jeda slabi jedarno lokalizacijski signal.[5][6][7][8][9] Ove modifikacije ukazuju da je CCDC142 lokalizovan u nukleusu i citosolu.

Predviđanje strukture

uredi

Sekundarna struktura CCDC142 sadrži samo α-heliks kako je predviđeno programima Quick2D i Phyre2 .[10][11] Predviđeno je da CCDC142 sadrži osam konzerviranih α-heliksa, od kojih se šest nalazi u području zavojnice proteina.[10][11] Predviđena tercijarna struktura CCDC142 sadrži veliki zavojni domen od aminokiselina 308–719.[2][12]

 
I-TASSER-ska predviđena tercijarna struktura CCDC142.[12] Ova struktura ima C-rezultat od –0,75 (mjereno na skali od −5 do 2, s višim vrijednostima koje izjednačavaju veću pouzdanost) i gustinu klastera od 0,375 (na skali od 0 do 1, sa više vrijednosti koje ukazuju na veću pokrivenost predviđanjem proteina). C-rezultat uzima u obzir i značaj strukture modela i kvalitet pokrivenosti predviđanja drugih proteina.[12]

Ekspresija

uredi

Promotori i regulatorni faktori

uredi

Region promotora za CCDC142 identifikovan je korištenjem programa El Dorado na Genomatixu, obuhvata baze 74482896–74483908 u hromosomu 2.[13] Ova regija od 1.013 bp proteže se uzvodno 1071–58 bp od startnog kodona CCDC142.[13] Postoji regija u promotoru koja vezuje veliki broj Krueppelolike transkripcijske faktore i BED-proteina cinkovog prsta.[13] Ova regija nema jednonukleotidnih polimorfizama (SNP).[14] Mnogi transkripcijski faktori koji se vezuju za promotorsku regiju CCDC142 imaju funkcije u supresiji tumora, neurogenezi, oštećenju DNK i fotorecepciji.[13] Ova promotorska regija također ima ulogu u radu LTR-TATA kutije sisarskog C-tipa koji se preklapa sa početnom lokacijom transkripcije gena.[13]

RNK vezujući proteini

uredi

Brojni su mogući proteini koji se vezuju za RNK; vezuju se i za 3' UTR i neprevedene regije iRNK CCDC142. Mjesta vezanja za proteine PABPC1 i RBMX javljaju se na visokoj frekvenciji u 3’ UTR, sa 49. odnosno 21. mjestom.[15]

Ekspresija

uredi

Iznad su podaci o ekspresiji Alenovog atlasa ljudskog mozga, ekspresiji na CCDC142, pri čemu crvena označava nižu ekspresiju, a zelena označava veću.[16] U ljudskom mozgu otkriveno je da je CCDC142 slabo eksprimiran u cerebelumskoj kori, talamusu i hipotalamusu. CCDC142 je takođe visoko izražen u substantia nigra, ponsu, klaustrumu i mezencefalonu.[16] Također postoji relativno viši nivo ekspresija CCDC142 u ustima i timusu.[17]

Gore navedeni eksperimentalni podaci pokazuju mnoge moguće nalaze za CCDC142.[18] Prekomjerna ekspresija SNAI1, proteina cinkovog prsta, povezana je sa smanjenjem ekspresije u ljudskom CCDC142.[19] Mišji nokaut-gen MEKK 2/3, koji pomaže u regulaciji diferencijacije T-pomoćnih ćelija, također je pokazao smanjenu ekspresiju CCDC142.[20] Još jedan eksperiment na Mus musculus fokusiran na kardiomiopatiju kod miševa pokazao je niže nivoe CCDC142 kod miševa sa oštećenim ćelijama miokarda.[19]

Funkcija i biohemija

uredi

Kompozicija

uredi

CCDC142 ima relativno tipsku raspodjelu aminokiselina, u poređenju sa drugim proteinima Homo sapiens.[21] Međutim, neke varijacije su zabeležene među ortolozima.[21] Leucin je prisutan u velikim količinama u odnosu na druge proteine (na preko 15% proteina), a asparagin u malim količinama u odnosu na druge proteine (sa manje od 0,7% proteina).[21]

Upredenozavojnički domen i motiv RINT1_TP1 CCDC142 sadrže veće količine leucina u odnosu na ostatak proteina (na preko 16,6% regije), veće količine glutamina (na preko 8,4% regije) i slično niske količine asparagina (na manje od 0,7% regije).[21]

Interaktivni proteini

uredi

Nisu pronađene interakcije proteina sa CCDC142.

Konzervacija

uredi

Paralozi

uredi

CCDC142 nema paraloga u Homo sapiens.

Ortolozi

uredi

Ispod je tabela raznih ortologa CCDC142 čiji je identitet proteinske sekvence upoređen sa sekvencom aminokiselina proteina Homo sapiens. CCDC142 ima više od 73% sličnosti aminokiselina kod ostalih sisara, ali je manje konzerviran kod drugih kičmenjaka i beskičmenjaka.[21]

Rod i vrsta Uobičajeno ime Datiranje divergencije od ljudske loze (milioni godina) Identitet (%)
Homo sapiens Čovjek 0 100
Pan troglodytes Obični čimpanza 6,6 96
Gorilla gorilla gorilla Gorila 8,9 98
Jaculus jaculus Mali egipatski skočimiš 90,9 73
Bos mutus Jak 97,5 74
Eptesicus fuscus Veliki smeđi šišmiš 97,5 74
Python bivittatus Mjanmarski piton 320,5 36
Gallus gallus Kokoš 320,5 35
Haliaeetus leucocephalus Ćelavi orao 320,5 33
Anolis carolinensis Gušter karolinska anola 320,5 33
Calidris pugnax Ptica ruf 320,5 32
Xenopus tropicalis Zapadna kandžasta žaba 355,7 33
Callorhinchus milii Australijska duh-ajkula 429,6 36
Lepisosteus oculatus Pjegava riba gar 429,6 34
Esox lucius Sjeverna štuka 429,6 33
Danio rerio Zebrica 429,6 33
Lingula anatina Repasta dagnja 847 29
Crassostrea gigas Pacifička ostriga 847 29
Octopus bimaculoides Kalifornijski dvopjegi oktopus 847 27
Drosophila melanogaster Vinska mušica 847 23

Filogenija

uredi

CCDC142 je blisko srodan kod sisara, mehkušaca, vodozemaca, gmizavaca i ptica i riba.[21] Gen CCDC142 datira još od Drosophila melanogaster, koji se odvojio od ljudske loze prije 847 miliona godina. CCDC142 je mutirao većom brzinom i od citohroma C (visoko konzervirani protein) i fibrinogena A (protein koji brzo mutira). Ovo ukazuje da je CCDC142 gen koji brzo mutira sa sve većom stopom mutacije (odnosno, evolucije) tokom vremena.

 
Stopa mutacije CCDC142 u poređenju sa referentnim proteinima, citohrom C i fibrinogen A, koji mutiraju sporo i brzo. Stopa mutacije, m, koja je ispravljeni postotak promjena aminokiselina između ljudskih proteina i njegovih ortologa, ucrtana je u odnosu na logaritam broja miliona godina od datuma divergencije ljudske loze i loze vrste u kojoj postoji ortolog . Tačke na grafikonu su izračunate prema m/100 = –ln(1–n/100), gdje je m ukupan broj promjena aminokiselina koje su se dogodile u 100-aminokiselinskom segmentu proteina i n je opaženi broj promjena aminokiselina na 100 ostataka, u poređenju sa sekvencom ljudskog proteina.

Klinički značaj

uredi

Patologija i bolesti

uredi

Povećanje broja kopija u lokusima CCDC142, uključujući 25 drugih gena, eksprimiralo je fenotip kašnjenja u razvoju i značajne razvojne ili morfološke promjene.[22] Jedan rezultat sa gubitkom broja kopija u lokusima CCDC142, uključujući 29 drugih gena, pokazao je fenotipove nizak rast, abnormalni oblik lica, odgođeni razvoj govora i jezika, preklapanje prstiju, unutarmaternično ograničenje rasta, otvoreni ductus arteriosus i odložen razvoj grube motorike.[22] Međutim, efekt CCDC142 je možda bio zbunjujući za ove fenotipove jer su postojale i abnormalnosti u mnogim drugim dijelovima genoma.

Mutacije

uredi

Postoji veliki broj jednonukleotidnih polimorfizama koji se nalaze u genu CCDC142. Neki od njih u regiji promotora i 5' UTR-a su unutar sidrenih sekvenci za transkripcijski faktor i utiču na vezivanje transkripcionog faktora ako se promijene.

Postoji mnogo SNP-ova u kodirajućoj sekvenci proteina koji mijenjaju aminokiselinski sastav CCDC142. Jedan od SNP-ova sa visokom stopom prevalencije u populaciji (1,8%) je značajan po hemijskim promjenama, sa tirozinskim pomakom u asparagin na 548. aminokiselini.[14]

Postoje i brojni SNP-ovi koji se nalaze u velikoj neprevedenoj 3' UTR gena, pri čemu se mnogi od njih vezuju za područja koja sadrže strukture drška petlja u iRNK. SNP sa stopom prevalencije od 7,7% (guanin do adenozina na bp 4285.) je u 3' UTR-u, ali nije lociran u konzerviranoj regiji petlja-drška.[14]

Ovi SNP-ovi su označeni u konceptnom prevodu koji se nalazi u odeljku protein iznad.

U višestrukom poravnavanju sekvenci iznad (kreiranom pomoću programa CLUSTALW i TEXSHADE na SDSC Biology Workbench), organizmi su označeni prvim slovom njihovog roda i prva dva slova njihove vrste. Cijeli protein CCDC142 je visoko konzerviran kod sisara.[21] Regije koje sadrže ljudski domen upredene zavojnice i region motiva RINT1_TIP1 su visoko konzervirane u udaljenim homolozima.[21] Čak 12 od 15 aminokiselina koje se poklapaju sa svim organizmima u ovoj regiji su nepolarne.[21] Konzervirano područje 1 sadrži uglavnom nepolarne aminokiseline,[21] područje 2 sadrži uglavnom nepolarne i bazne aminokiseline. Konzervirana regija 3 sadrži i polarne i nepolarne aminokiseline.[21] Konzervirana regija 5 sadrži uglavnom nepolarne i bazne aminokiseline.[21]

Dodatne informacije o transkripcijskom faktoru

uredi
Oznake mjesta vezanja faktora transkripcije
Oznake mjesta vezanja

Reference

uredi
  1. ^ a b c d e f g h i "CCDC142 coiled-coil domain containing 142 [Homo sapiens (human)] – Gene – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  2. ^ a b c "coiled-coil domain-containing protein 142 [Homo sapiens] – Protein – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  3. ^ a b c d e "CCDC142 – Coiled-coil domain-containing protein 142 – Homo sapiens (Human) – CCDC142 gene & protein". www.uniprot.org. Pristupljeno 1. 5. 2016.
  4. ^ a b "SSDB Motif Search Result: hsa:84865". www.kegg.jp. Pristupljeno 1. 5. 2016.
  5. ^ "NetPhos 2.0 Server". www.cbs.dtu.dk. Pristupljeno 1. 5. 2016.
  6. ^ "Memo:Protein Methylation Prediction". www.bioinfo.tsinghua.edu.cn. Arhivirano s originala, 14. 3. 2016. Pristupljeno 1. 5. 2016.
  7. ^ ":::NBA-Palm – Prediction of Palmitoylation Site Implemented In Naive Bayesian Algorithm:::". www.bioinfo.tsinghua.edu.cn. Arhivirano s originala, 9. 6. 2016. Pristupljeno 1. 5. 2016.
  8. ^ "SUMOplot™ Analysis Program | Abgent". www.abgent.com. Pristupljeno 1. 5. 2016.
  9. ^ "NLS_Mapper". nls-mapper.iab.keio.ac.jp. Arhivirano s originala, 22. 11. 2021. Pristupljeno 1. 5. 2016.
  10. ^ a b Kelley, Lawrence. "PHYRE2 Protein Fold Recognition Server". www.sbg.bio.ic.ac.uk. Pristupljeno 1. 5. 2016.
  11. ^ a b Remmert, Michael. "Quick2D". toolkit.tuebingen.mpg.de. Pristupljeno 1. 5. 2016.
  12. ^ a b c "I-TASSER server for protein structure and function prediction". zhanglab.ccmb.med.umich.edu. Pristupljeno 1. 5. 2016.
  13. ^ a b c d e "Genomatix – NGS Data Analysis & Personalized Medicine". www.genomatix.de. Arhivirano s originala, 24. 2. 2001. Pristupljeno 1. 5. 2016.
  14. ^ a b c snpdev. "SNP linked to Gene (geneID:84865) Via Contig Annotation". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  15. ^ "RBPDB: The database of RNA-binding specificities". rbpdb.ccbr.utoronto.ca. Pristupljeno 1. 5. 2016.
  16. ^ a b "Microarray Data :: Allen Brain Atlas: Human Brain". human.brain-map.org. Pristupljeno 1. 5. 2016.
  17. ^ "EST Profile – Hs.430199". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  18. ^ geo. "Home – GEO – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  19. ^ a b "GDS3596 / 1451178_at". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  20. ^ "GDS4795 / ILMN_3023885". www.ncbi.nlm.nih.gov. Pristupljeno 1. 5. 2016.
  21. ^ a b c d e f g h i j k l "SDSC Biology Workbench".
  22. ^ a b ClinVar. "No items found – ClinVar – NCBI". www.ncbi.nlm.nih.gov. Pristupljeno 5. 5. 2016.

Dopunska literatura

uredi
  • Orekhova, A. S.; Sverdlova, P. S.; Spirin, P. V.; Leonova, O. G.; Popenko, V. I.; Prasolov, V. S.; Rubtsov, P. M. (1. 6. 2011). "Novel bidirectional promoter from human genome". Molekuliarnaia Biologiia. 45 (3): 486–495. ISSN 0026-8984. PMID 21790010.