Tetratrikopeptid-ponavljajući protein 39B je protein koji je kod ljudi kodiran genom TTC39B, poznatim i kao C9orf52 ili FLJ33868. Glavno obilježje unutar tetratrikopeptidnog ponavljanja 39B je domen nepoznate funkcije 3808 (DUF3808), koji obuhvata većinu proteina.

TTC39B
Identifikatori
AliasiTTC39B
Vanjski ID-jeviOMIM: 613574 MGI: 1917113 HomoloGene: 25228 GeneCards: TTC39B
Lokacija gena (čovjek)
Hromosom 9 (čovjek)
Hrom.Hromosom 9 (čovjek)[1]
Hromosom 9 (čovjek)
Genomska lokacija za TTC39B
Genomska lokacija za TTC39B
Bend9p22.3Početak15,163,622 bp[1]
Kraj15,307,360 bp[1]
Lokacija gena (miš)
Hromosom 4 (miš)
Hrom.Hromosom 4 (miš)[2]
Hromosom 4 (miš)
Genomska lokacija za TTC39B
Genomska lokacija za TTC39B
Bend4|4 C3Početak83,138,537 bp[2]
Kraj83,242,492 bp[2]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_001168339
NM_001168340
NM_001168341
NM_001168342
NM_152574

NM_025782
NM_027238

RefSeq (bjelančevina)

NP_001161811
NP_001161812
NP_001161813
NP_001161814
NP_689787

NP_081514

Lokacija (UCSC)Chr 9: 15.16 – 15.31 MbChr 4: 83.14 – 83.24 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Aminokiselinska sekvenca uredi

Dužina polipeptidnog lanca je 682 aminokiseline, а molekulska težina 76.956 Da.[5]

1020304050
MDAVLACRLRGRGNRVAALRPRPRPGGSAGPSPFALLCAGLSPEPRAGVG
SEFPAWFLGGSSQRRNMALLGSRAELEADEDVFEDALETISISSHSDMAT
SSLHFASCDTQQAPRQRGASTVSSSSSTKVDLKSGLEECAVALNLFLSNK
FTDALELLRPWAKESMYHALGYSTIVVLQAVLTFEQQDIQNGISAMKDAL
QTCQKYRKKYTVVESFSSLLSRGSLEQLSEEEMHAEICYAECLLQKAALT
FVQDENMINFIKGGLKIRTSYQIYKECLSILHEIQKNKLQQEFFYEFEGG
VKLGSGAFNLMLSLLPARIIRLLEFIGFSGNRELGLLQLREGASGRSMRS
ALCCLTILAFHTYISLILGTGEVNVAEAERLLAPFLQQFPNGSLVLFYHA
RIELLKGNLEEAQEVFQKCISVQEEWKQFHHLCYWELMWINVFQQNWMQA
YYYSDLLCKESKWSKATYVFLKAAILSMLPEEDVVATNENVVTLFRQVDS
LKQRIAGKSIPTEKFAVRKARRYSASLPAPVKLILPALEMMYVWNGFSIV
SKRKDLSENLLVTVEKAEAALQSQNFNSFSVDDECLVKLLKGCCLKNLQR
PLQAELCYNHVVESEKLLKYDHYLVPFTLFELASLYKSQGEIDKAIKFLE
TARNNYKDYSLESRLHFRIQAALHLWRKPSSD

Gen uredi

 
Lokacija gena TTC39B na hromosomu 9

Gen TTC39B nalazi se na kratkom kraku hrompsoma 9, sekvenca 9p22.3. Genomska DNK je duga 136.517 baza, sastoji se od 39 introna i 20 egzona i nalazi se na minus lancu. iRNK ima dužinu od 3,276 baza. TTC39B je okružen LOC100419056, hloridnim kanalom, osjetljivim na napon u tri pseudogena.[6]

Funkcija uredi

Očekuje se da TTC39B ima funkciju molekulnog vezivanja, kao i ulogu u regulaciji lipida; fenotip kao i funkcija in vivo su nepoznati.[7]

Homologija i evolucija uredi

Paralozi uredi

Postoje dva poznata paraloga TTC39B: TTC39A i TTC39C. TTC39A ima dvije prerađene izoforme, a TTC39C ima tri prerađene izoforme.

TTC39A je testiran na povezanost sa bolestima kao što su neoplazme dojke i očekuje se da će imati funkciju vezivanja molekula i lokaliziran je u različitim odjeljcima (vanćelijski prostor, ćelijska membrana, jedro) ).[8]

Očekuje se da se TTC39C lokalizira u citoplazmi. Nije otkriven nijedan fenotip, a funkcija gena in vivo je nepoznata.[9]

Ortolozi uredi

Rod i vrsta Uobičajeno ime Identitet RNK Datiranje divergencije od ljudi (milioni godina)
Pan paniscus Bonobo 99% 6,3
Pan troglodytes Čimpanze 99% 6,3
Gorilla gorilla gorilla Gorile 99% 8,8
Nomascus leucogenys Giboni 98% 20,4
Papio anubis Babun 97% 29,0
Pongo pygmaeus Orangutan 97% 15,7
Callithrix jacchus Marmozet 96% 42,6
Saimiri boliviensis boliviensis Vjeveričasti majmun 94% 42,6
Canis lupus familiaris Pas 91% 94,2
Otolemur garnettii Žbunasti lemur 90% 74,0
Felis catus Mačka 89% 94,2
Bos taurus Govedo 88% 94,2
Cricetulus griseus Hrčak 92,3
Ovis aries Ovca 85% 94,2
Rattus norvegicus Pacov 85% 92,3

Udaljeni homolozi uredi

Rod i vrsta Uobičajeno ime Identitet RNK Datiranje divergencije od ljudi (milioni godina)
Sarcophilus harrisii Tasmanijski đavo 78% 162,6
Gallus gallus Kokoš 75% 296.0 MYA
Taeniopygia guttata Zebrasta zeba 75% 296,0
Anolis carolinensis Gušter 75% 296,0
Xenopus laevis Žaba 74% 371,2

Filogenija uredi

TTC39B je konzerviranan u organizmima od ljudi do Platyhelminthes i nije konzerviran u kvascima i gljivama.

 
Neukprijenjeno filogenetsko stablo bliskih ortologa TTC39B
 
Neukorijenjeno filogenetsko stablo udaljenih homologa TTC39B

Protein uredi

Gen TTC39B ima pet različitih varijanti transkripta, od kojih svaka kodira različite proteine. Ovaj članak fokusira se na ponavljajući protein tetratrikopeptidne izoforme 139B, najduži od svih proteina. Kada se prevede, protein TTC39B sastoji se od 682 aminokiseline i ima molekulsku masu 76.955,64 kDa. Izoelektrična tačka proteina je 7,16 pH.[10]

Konzervacija uredi

Bliski ortolozi:

Rod i vrsta Uobičajeno ime Identitet RNK Datiranje divergencije od ljudi (milioni godina)
Pan troglodytes Čimpanza 99% 6,3
Pan paniscus Bonobo 99% 6,3
Nomascus leucogenys Gibon 98% 20,4
Papio anubis Babun 98% 29,0
Callithrix jacchus Marmozet 97% 42,6
Saimiri boliviensis boliviensis Vjeveričasti majmun 96% 42,6
Heterocephalus glaber Goli krtičasti pacov 92% 92,3
Canis lupus familiaris Pas 91% 94,2
Cricetulus griseus Hrčak 90% 92,3
Ovis aries Ovca 89% 94,2
Cavia porcellus Zamorac 86% 92,3

Udaljeni ortolozi:

Rod i vrsta Uobičajeno ime Identitet RNK Datiranje divergencije od ljudi (milioni godina)
Sarcophilus harrisii Tasmanijski đavo 73% 162.6 MYA
Taeniopygia guttata Zebrasta zeba 72% 296.0 MYA
Pteropus alecto Šišmiš 55% 94,2
Bos taurus Govedo 54% 94,2
Rattus norvegicus Pacov 54% 92,3
Gallus gallus Kokoš 54% 296,0
Danio rerio Zebrica 54% 400,1
Crassostrea gigas Ostriga 50% 782,7
Camponotus floridanus Mrav 43% 782,7
Nasonia vitripennis Vaš 42% 782,7
Ciona intestinalis Urochordata 40% 722,5
Clonorchis sinensis Jetreni metilj 35% 792,4

Domeni i motivi uredi

Domen nepoznate funkcije 3808 (DUF3808) je konzerviran od gljiva do ljudi i ima još nepoznatu funkciju. Nalazi se od aminokiselina 142 do 568 (dužine 427 aminokiselina). Proteini ove porodice na svom C-terminalu također sadrže domen TPR_2, koji također ima nepoznatu funkciju.[11]

Još jedno konzervirano područje u proteinu TTC39B je ponavljanje tetratrikopeptida TPR_12. Nalazi se od aminokiseline 600 do 658 (dužina 59 aminokiselina).[12] TPR domeni nalaze se u mnogim proteinima koji olakšavaju specifične interakcije s partnerskim proteinom. Trodimenzijski strukturni podaci pokazali su da TPR regija formira dvijs antiparalelna alfa-heliksa. TPR motivi koji su raspoređeni jedan ispred drugog stvaraju spiralnu strukturu desne ruke s amfipatskim kanalom koji bi mogao prihvatiti komplementarnu regiju ciljnog proteina. Većina proteina koji sadrže TPR povezani su s multiproteinskim kompleksima, a postoje opsežni dokazi koji ukazuju da su TPR motivi važni za funkcioniranje kompleksa šaperona, ćelijskog ciklusa, transkripcije i transportnih proteinskih kompleksa.[13] u proteinu TTC39B protein nađena su više dva TPR domena: TPR1 se proteže od aminokiseline 393 do 426 (dug 34 aminokiseline) i TPR2, između aminokiselina 626 i 659 (također dug 34 aminokiseline).[14]

TTC39B sadrži tri transmembranske regije, sve unutar regije DUF3808.[15] Budući da postoje tri transmembranske regije, N– i C-terminal proteina su na suprotnim stranama plazmamembrane.

Posttranslacijske modifikacije uredi

Mjesta fosforilacija:[16]

Aminokiselina Položaj
Serin (S) 28, 32, 42, 51, 61, 62, 72, 91, 93, 94, 96, 101, 102, 107, 120, 123, 124, 125, 126, 127, 134, 148, 165, 173, 194, 215, 217, 218, 221, 224, 229, 270, 279, 305, 313, 329, 344, 347, 350, 365, 393, 421, 454, 461, 464, 477, 500, 509, 524, 526, 548, 551, 557, 573, 578, 580, 614, 634, 638, 660, 663, 680, 681
Treonin (T) 89, 100, 110, 121, 128, 152, 174, 183, 202, 211, 250, 269, 356, 362, 370, 467, 487, 493, 512, 563, 628, 651
Tirozin (Y) 167, 172, 206, 210, 239, 271, 274, 295, 363, 398, 434, 451, 452, 453, 468, 523, 542, 608, 620, 623, 636, 656, 659

Vjerovatnoća mjesta sumoilacija [17] (bolded):

Broj Položaj Grupa Rezultat
1 619 ESEKL LKYD HYLVP 0,91
2 262 NMINF IKGG LKIRT 0,77
3 302 EFEGG VKLG SGAFN 0,76
4 133 STKVD LKSG LEECA 0,73

Postoji jedno moguće mjesto N-glikozilacija na aminokiselini 391; međutim, budući da protein TTC39B ne sadrži signalni peptid, malo je vjerovatno da se ta glikozilacija zaista događa.

Sekundarna struktura uredi

Prema analizi sekundarne strukture proteina, TTC39B će se najvjerovatnije eksprimirati u endoplazmatskom retikulumu, mitohondrijama i Golgijevom aparatu.[15]

Tercijarna i kvartarna struktura uredi

Protein TTC39B se savija u alfa-alfa superspiralu. Oko 40% njegove strukture podudara se s d1w3ba, superheliksnim domenom o-vezane GlcNAc transferaze. O-GlcNAc povezuje metabolički status s regulacijom širokog spektra ćelijskih signalnih puteva, djelujući kao senzor hranjivih tvari.[18]

Ekspresija uredi

Promotor i početno mjesto transkripcije uredi

Promotor za TTC39B počinje od baznog para 15,307.109 i završava pri baznom paru 15,307,858. Ima dužinu od 750 parova baza. Početno mjesto transkripcije za izoformu 1 proteina TTC39B nalazi se od parova baza 15,307.340 do 15,307.389 i ima dužinu od 50 bp.

Profil ekspresije uredi

TTC39B je dobro eksprimiran u mišićima, unutrašnjim organima, sekretornim organima, reproduktivnim organima, imunskom i nervnom sistemu.[7] TTC39B je eksprimiran u mnoštvu tkiva: sjemenici, pluća, Langerhansovi otočići, gušterača, bubrezi, pridruženi timori zametnih ćelija , karcinom dojke itd.[7]

Varijante transkripta uredi

Postoji pet različitih varijanti transkripta za gen TTC39B. Izoforma 1 je najduži transkript i kodira najduži aminokiselinski lanac. Izoforma 2 koristi mjesto alternativne prerade uokvirena u centralnom kodirajućem području, u usporedbi s varijantom 1, što rezultira kraćim proteinom. Izoforme 3 i 4 imaju višestruke razlike u središnjem kodirajućem području, ali održavaju otvoreni okvir čitanja u usporedbi s izoformom 1. Izoforma 5 razlikuje se u 5 'UTR i ima više razlika u regijama kodiranja, u usporedbi s varijantom 1. Ove razlike uzrokuju započinjanje translacije u okviru u nizu nizvodno AUG i rezultira time da izoforma 5 ima kraći N-kraj u usporedbi s izoformom 1.[19]

Interaktivni proteini uredi

Vezni transkripcijski faktori uredi

Mjesta vezanja za faktor transkripcije:[20]

Matriksna porodica Detaljnije informacije o porodici Od Do Lanac Sličnost sekvence Sekvenca (CAPITALS: jezgrena sekvenca)
V$PLAG Gen za pleomorfni adenom 51 73 (+) 1.000 taGGGGgaagtagaggagttcca
V$TALE TG motivna klasa prepoznavanja TALE homeodomena 157 173 (+) 1.000 ggtggtgtGTCAgaggc
V$ZF02 Transkripcijski faktori C2H2 cinkovog prsta 2 294 316 (-) 1.000 cagcgCCCCacctggggtccgtg
V$MIZ1 Myc-interaktivni protein cinkovog prsta 1 417 427 (–) 1.000 cacgcCCTCtg
O$TF2B Transkripcijski faktor IIB RNK-polimeraze II 517 523 (–) 1.000 ccgCGCC

Ćelijski proteini uredi

TTC39B stupa u interakciju sa ubikvitinom C (UBC), prekursorom poliubikvitina. Konjugacija ubikvitinskih monomera ili polimera dovodi do različitih učinaka unutar ćelije. Ubikvitinacija je povezana sa razgradnjom proteina, popravkom DNK, ćelijskim ciklusom regulacijom, modifikacijom kinaza, endocitozom i regulacijom drugih puteva ćelijske signalizacije.[21]

Klinički značaj uredi

Pridružene bolesti uredi

Na lokusu na hromosomu 9p22 za koji je utvrđeno da je povezan s lipoproteinom velike gustoće (HDL-C), TTC39B je jedini od nekoliko gena u lokusu koji ima eQTL u jetri, s alelom povezanim sa smanjenom ekspresijom u korelaciji s povećanjem HDL-C. Nokautiranje ortologa miša TTC39B, putem virusnog vektora (oboreno 50%) rezultiralo je značajno većim nivoima HDL-C u plazmi nakon četiri i sedam dana. Podaci ukazuju da je TTC39B uzročni gen za regulaciju lipida.[22]

Reference uredi

  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000155158 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000038172 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ "UniProt, Q5VTQ0". Pristupljeno 12. 9. 2021.
  6. ^ "LOC100419056 chloride channel, voltage-sensitive 3 pseudogene". NCBI. Pristupljeno 13. 5. 2013.
  7. ^ a b c "TTC39B, a comprehensive annotation of human, mouse, and worm genes with mRNAs or ESTsAceView". AceView. Pristupljeno 13. 5. 2013.
  8. ^ "TTC39A, a comprehensive annotation of human, mouse, and worm genes with mRNAs or ESTsAceView". AceView. Pristupljeno 13. 5. 2013.
  9. ^ "TTC39C, a comprehensive annotation of human, mouse, and worm genes with mRNAs or ESTsAceView". AceView. Pristupljeno 13. 5. 2013.
  10. ^ "Tetratricopeptide repeat protein 39B isoform 1 [Homo sapiens] - Protein - NCBI".
  11. ^ "NCBI". Pristupljeno 9. 5. 2013.[mrtav link]
  12. ^ "NCBI". Pristupljeno 9. 5. 2013.
  13. ^ Blatch GL, Lässle M (novembar 1999). "The tetratricopeptide repeat: a structural motif mediating protein-protein interactions". BioEssays. 21 (11): 932–9. doi:10.1002/(SICI)1521-1878(199911)21:11<932::AID-BIES5>3.0.CO;2-N. PMID 10517866.
  14. ^ "NP_689787.2: TTC39B gene product [Homo sapiens]". NCBI. Pristupljeno 13. 5. 2013.
  15. ^ a b "Biology Workbench". SDSC Biology Workbench. Pristupljeno 13. 5. 2013.
  16. ^ "NetPhos 2.0 Server". Center for Biological Sequence Analysis. Pristupljeno 13. 5. 2013.
  17. ^ "SUMOsp 2.0 - SUMOylation Site Prediction". The CUCKOO Workgroup. Arhivirano s originala, 10. 5. 2013. Pristupljeno 13. 5. 2013.
  18. ^ Lazarus MB, Nam Y, Jiang J, Sliz P, Walker S (januar 2011). "Structure of human O-GlcNAc transferase and its complex with a peptide substrate". Nature. 469 (7331): 564–7. Bibcode:2011Natur.469..564L. doi:10.1038/nature09638. PMC 3064491. PMID 21240259.
  19. ^ "TTC39B tetratricopeptide repeat domain 39B [Homo sapiens (human)]". NCBI. Pristupljeno 13. 5. 2013.
  20. ^ "GEMS Launcher: Matlnspector: Search for transcription factor binding sites". Genomatix Software Suite. Pristupljeno 13. 5. 2013.[mrtav link]
  21. ^ "UBC Gene - GeneCards". GeneCards. Pristupljeno 13. 5. 2013.
  22. ^ Teslovich TM, Musunuru K, Smith AV, et al. (august 2010). "Biological, clinical and population relevance of 95 loci for blood lipids". Nature. 466 (7307): 707–13. Bibcode:2010Natur.466..707T. doi:10.1038/nature09270. PMC 3039276. PMID 20686565.