TTC39B
Tetratrikopeptid-ponavljajući protein 39B je protein koji je kod ljudi kodiran genom TTC39B, poznatim i kao C9orf52 ili FLJ33868. Glavno obilježje unutar tetratrikopeptidnog ponavljanja 39B je domen nepoznate funkcije 3808 (DUF3808), koji obuhvata većinu proteina.
TTC39B | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | TTC39B | ||||||||||||||||||||||||
Vanjski ID-jevi | OMIM: 613574 MGI: 1917113 HomoloGene: 25228 GeneCards: TTC39B | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 9: 15.16 – 15.31 Mb | Chr 4: 83.14 – 83.24 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Aminokiselinska sekvenca
urediDužina polipeptidnog lanca je 682 aminokiseline, а molekulska težina 76.956 Da.[5]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MDAVLACRLR | GRGNRVAALR | PRPRPGGSAG | PSPFALLCAG | LSPEPRAGVG | ||||
SEFPAWFLGG | SSQRRNMALL | GSRAELEADE | DVFEDALETI | SISSHSDMAT | ||||
SSLHFASCDT | QQAPRQRGAS | TVSSSSSTKV | DLKSGLEECA | VALNLFLSNK | ||||
FTDALELLRP | WAKESMYHAL | GYSTIVVLQA | VLTFEQQDIQ | NGISAMKDAL | ||||
QTCQKYRKKY | TVVESFSSLL | SRGSLEQLSE | EEMHAEICYA | ECLLQKAALT | ||||
FVQDENMINF | IKGGLKIRTS | YQIYKECLSI | LHEIQKNKLQ | QEFFYEFEGG | ||||
VKLGSGAFNL | MLSLLPARII | RLLEFIGFSG | NRELGLLQLR | EGASGRSMRS | ||||
ALCCLTILAF | HTYISLILGT | GEVNVAEAER | LLAPFLQQFP | NGSLVLFYHA | ||||
RIELLKGNLE | EAQEVFQKCI | SVQEEWKQFH | HLCYWELMWI | NVFQQNWMQA | ||||
YYYSDLLCKE | SKWSKATYVF | LKAAILSMLP | EEDVVATNEN | VVTLFRQVDS | ||||
LKQRIAGKSI | PTEKFAVRKA | RRYSASLPAP | VKLILPALEM | MYVWNGFSIV | ||||
SKRKDLSENL | LVTVEKAEAA | LQSQNFNSFS | VDDECLVKLL | KGCCLKNLQR | ||||
PLQAELCYNH | VVESEKLLKY | DHYLVPFTLF | ELASLYKSQG | EIDKAIKFLE | ||||
TARNNYKDYS | LESRLHFRIQ | AALHLWRKPS | SD |
Gen
urediGen TTC39B nalazi se na kratkom kraku hrompsoma 9, sekvenca 9p22.3. Genomska DNK je duga 136.517 baza, sastoji se od 39 introna i 20 egzona i nalazi se na minus lancu. iRNK ima dužinu od 3,276 baza. TTC39B je okružen LOC100419056, hloridnim kanalom, osjetljivim na napon u tri pseudogena.[6]
Funkcija
urediOčekuje se da TTC39B ima funkciju molekulnog vezivanja, kao i ulogu u regulaciji lipida; fenotip kao i funkcija in vivo su nepoznati.[7]
Homologija i evolucija
urediParalozi
urediPostoje dva poznata paraloga TTC39B: TTC39A i TTC39C. TTC39A ima dvije prerađene izoforme, a TTC39C ima tri prerađene izoforme.
TTC39A je testiran na povezanost sa bolestima kao što su neoplazme dojke i očekuje se da će imati funkciju vezivanja molekula i lokaliziran je u različitim odjeljcima (vanćelijski prostor, ćelijska membrana, jedro) ).[8]
Očekuje se da se TTC39C lokalizira u citoplazmi. Nije otkriven nijedan fenotip, a funkcija gena in vivo je nepoznata.[9]
Ortolozi
urediRod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Pan paniscus | Bonobo | 99% | 6,3 |
Pan troglodytes | Čimpanze | 99% | 6,3 |
Gorilla gorilla gorilla | Gorile | 99% | 8,8 |
Nomascus leucogenys | Giboni | 98% | 20,4 |
Papio anubis | Babun | 97% | 29,0 |
Pongo pygmaeus | Orangutan | 97% | 15,7 |
Callithrix jacchus | Marmozet | 96% | 42,6 |
Saimiri boliviensis boliviensis | Vjeveričasti majmun | 94% | 42,6 |
Canis lupus familiaris | Pas | 91% | 94,2 |
Otolemur garnettii | Žbunasti lemur | 90% | 74,0 |
Felis catus | Mačka | 89% | 94,2 |
Bos taurus | Govedo | 88% | 94,2 |
Cricetulus griseus | Hrčak | 92,3 | |
Ovis aries | Ovca | 85% | 94,2 |
Rattus norvegicus | Pacov | 85% | 92,3 |
Udaljeni homolozi
urediRod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Sarcophilus harrisii | Tasmanijski đavo | 78% | 162,6 |
Gallus gallus | Kokoš | 75% | 296.0 MYA |
Taeniopygia guttata | Zebrasta zeba | 75% | 296,0 |
Anolis carolinensis | Gušter | 75% | 296,0 |
Xenopus laevis | Žaba | 74% | 371,2 |
Filogenija
urediTTC39B je konzerviranan u organizmima od ljudi do Platyhelminthes i nije konzerviran u kvascima i gljivama.
Protein
urediGen TTC39B ima pet različitih varijanti transkripta, od kojih svaka kodira različite proteine. Ovaj članak fokusira se na ponavljajući protein tetratrikopeptidne izoforme 139B, najduži od svih proteina. Kada se prevede, protein TTC39B sastoji se od 682 aminokiseline i ima molekulsku masu 76.955,64 kDa. Izoelektrična tačka proteina je 7,16 pH.[10]
Konzervacija
urediBliski ortolozi:
Rod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Pan troglodytes | Čimpanza | 99% | 6,3 |
Pan paniscus | Bonobo | 99% | 6,3 |
Nomascus leucogenys | Gibon | 98% | 20,4 |
Papio anubis | Babun | 98% | 29,0 |
Callithrix jacchus | Marmozet | 97% | 42,6 |
Saimiri boliviensis boliviensis | Vjeveričasti majmun | 96% | 42,6 |
Heterocephalus glaber | Goli krtičasti pacov | 92% | 92,3 |
Canis lupus familiaris | Pas | 91% | 94,2 |
Cricetulus griseus | Hrčak | 90% | 92,3 |
Ovis aries | Ovca | 89% | 94,2 |
Cavia porcellus | Zamorac | 86% | 92,3 |
Udaljeni ortolozi:
Rod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Sarcophilus harrisii | Tasmanijski đavo | 73% | 162.6 MYA |
Taeniopygia guttata | Zebrasta zeba | 72% | 296.0 MYA |
Pteropus alecto | Šišmiš | 55% | 94,2 |
Bos taurus | Govedo | 54% | 94,2 |
Rattus norvegicus | Pacov | 54% | 92,3 |
Gallus gallus | Kokoš | 54% | 296,0 |
Danio rerio | Zebrica | 54% | 400,1 |
Crassostrea gigas | Ostriga | 50% | 782,7 |
Camponotus floridanus | Mrav | 43% | 782,7 |
Nasonia vitripennis | Vaš | 42% | 782,7 |
Ciona intestinalis | Urochordata | 40% | 722,5 |
Clonorchis sinensis | Jetreni metilj | 35% | 792,4 |
Domeni i motivi
urediDomen nepoznate funkcije 3808 (DUF3808) je konzerviran od gljiva do ljudi i ima još nepoznatu funkciju. Nalazi se od aminokiselina 142 do 568 (dužine 427 aminokiselina). Proteini ove porodice na svom C-terminalu također sadrže domen TPR_2, koji također ima nepoznatu funkciju.[11]
Još jedno konzervirano područje u proteinu TTC39B je ponavljanje tetratrikopeptida TPR_12. Nalazi se od aminokiseline 600 do 658 (dužina 59 aminokiselina).[12] TPR domeni nalaze se u mnogim proteinima koji olakšavaju specifične interakcije s partnerskim proteinom. Trodimenzijski strukturni podaci pokazali su da TPR regija formira dvijs antiparalelna alfa-heliksa. TPR motivi koji su raspoređeni jedan ispred drugog stvaraju spiralnu strukturu desne ruke s amfipatskim kanalom koji bi mogao prihvatiti komplementarnu regiju ciljnog proteina. Većina proteina koji sadrže TPR povezani su s multiproteinskim kompleksima, a postoje opsežni dokazi koji ukazuju da su TPR motivi važni za funkcioniranje kompleksa šaperona, ćelijskog ciklusa, transkripcije i transportnih proteinskih kompleksa.[13] u proteinu TTC39B protein nađena su više dva TPR domena: TPR1 se proteže od aminokiseline 393 do 426 (dug 34 aminokiseline) i TPR2, između aminokiselina 626 i 659 (također dug 34 aminokiseline).[14]
TTC39B sadrži tri transmembranske regije, sve unutar regije DUF3808.[15] Budući da postoje tri transmembranske regije, N– i C-terminal proteina su na suprotnim stranama plazmamembrane.
Mjesta fosforilacija:[16]
Aminokiselina | Položaj |
---|---|
Serin (S) | 28, 32, 42, 51, 61, 62, 72, 91, 93, 94, 96, 101, 102, 107, 120, 123, 124, 125, 126, 127, 134, 148, 165, 173, 194, 215, 217, 218, 221, 224, 229, 270, 279, 305, 313, 329, 344, 347, 350, 365, 393, 421, 454, 461, 464, 477, 500, 509, 524, 526, 548, 551, 557, 573, 578, 580, 614, 634, 638, 660, 663, 680, 681 |
Treonin (T) | 89, 100, 110, 121, 128, 152, 174, 183, 202, 211, 250, 269, 356, 362, 370, 467, 487, 493, 512, 563, 628, 651 |
Tirozin (Y) | 167, 172, 206, 210, 239, 271, 274, 295, 363, 398, 434, 451, 452, 453, 468, 523, 542, 608, 620, 623, 636, 656, 659 |
Vjerovatnoća mjesta sumoilacija [17] (bolded):
Broj | Položaj | Grupa | Rezultat |
---|---|---|---|
1 | 619 | ESEKL LKYD HYLVP | 0,91 |
2 | 262 | NMINF IKGG LKIRT | 0,77 |
3 | 302 | EFEGG VKLG SGAFN | 0,76 |
4 | 133 | STKVD LKSG LEECA | 0,73 |
Postoji jedno moguće mjesto N-glikozilacija na aminokiselini 391; međutim, budući da protein TTC39B ne sadrži signalni peptid, malo je vjerovatno da se ta glikozilacija zaista događa.
Sekundarna struktura
urediPrema analizi sekundarne strukture proteina, TTC39B će se najvjerovatnije eksprimirati u endoplazmatskom retikulumu, mitohondrijama i Golgijevom aparatu.[15]
Tercijarna i kvartarna struktura
urediProtein TTC39B se savija u alfa-alfa superspiralu. Oko 40% njegove strukture podudara se s d1w3ba, superheliksnim domenom o-vezane GlcNAc transferaze. O-GlcNAc povezuje metabolički status s regulacijom širokog spektra ćelijskih signalnih puteva, djelujući kao senzor hranjivih tvari.[18]
Ekspresija
urediPromotor i početno mjesto transkripcije
urediPromotor za TTC39B počinje od baznog para 15,307.109 i završava pri baznom paru 15,307,858. Ima dužinu od 750 parova baza. Početno mjesto transkripcije za izoformu 1 proteina TTC39B nalazi se od parova baza 15,307.340 do 15,307.389 i ima dužinu od 50 bp.
Profil ekspresije
urediTTC39B je dobro eksprimiran u mišićima, unutrašnjim organima, sekretornim organima, reproduktivnim organima, imunskom i nervnom sistemu.[7] TTC39B je eksprimiran u mnoštvu tkiva: sjemenici, pluća, Langerhansovi otočići, gušterača, bubrezi, pridruženi timori zametnih ćelija , karcinom dojke itd.[7]
Varijante transkripta
urediPostoji pet različitih varijanti transkripta za gen TTC39B. Izoforma 1 je najduži transkript i kodira najduži aminokiselinski lanac. Izoforma 2 koristi mjesto alternativne prerade uokvirena u centralnom kodirajućem području, u usporedbi s varijantom 1, što rezultira kraćim proteinom. Izoforme 3 i 4 imaju višestruke razlike u središnjem kodirajućem području, ali održavaju otvoreni okvir čitanja u usporedbi s izoformom 1. Izoforma 5 razlikuje se u 5 'UTR i ima više razlika u regijama kodiranja, u usporedbi s varijantom 1. Ove razlike uzrokuju započinjanje translacije u okviru u nizu nizvodno AUG i rezultira time da izoforma 5 ima kraći N-kraj u usporedbi s izoformom 1.[19]
Interaktivni proteini
urediVezni transkripcijski faktori
urediMjesta vezanja za faktor transkripcije:[20]
Matriksna porodica | Detaljnije informacije o porodici | Od | Do | Lanac | Sličnost sekvence | Sekvenca (CAPITALS: jezgrena sekvenca) |
---|---|---|---|---|---|---|
V$PLAG | Gen za pleomorfni adenom | 51 | 73 | (+) | 1.000 | taGGGGgaagtagaggagttcca |
V$TALE | TG motivna klasa prepoznavanja TALE homeodomena | 157 | 173 | (+) | 1.000 | ggtggtgtGTCAgaggc |
V$ZF02 | Transkripcijski faktori C2H2 cinkovog prsta 2 | 294 | 316 | (-) | 1.000 | cagcgCCCCacctggggtccgtg |
V$MIZ1 | Myc-interaktivni protein cinkovog prsta 1 | 417 | 427 | (–) | 1.000 | cacgcCCTCtg |
O$TF2B | Transkripcijski faktor IIB RNK-polimeraze II | 517 | 523 | (–) | 1.000 | ccgCGCC |
Ćelijski proteini
urediTTC39B stupa u interakciju sa ubikvitinom C (UBC), prekursorom poliubikvitina. Konjugacija ubikvitinskih monomera ili polimera dovodi do različitih učinaka unutar ćelije. Ubikvitinacija je povezana sa razgradnjom proteina, popravkom DNK, ćelijskim ciklusom regulacijom, modifikacijom kinaza, endocitozom i regulacijom drugih puteva ćelijske signalizacije.[21]
Klinički značaj
urediPridružene bolesti
urediNa lokusu na hromosomu 9p22 za koji je utvrđeno da je povezan s lipoproteinom velike gustoće (HDL-C), TTC39B je jedini od nekoliko gena u lokusu koji ima eQTL u jetri, s alelom povezanim sa smanjenom ekspresijom u korelaciji s povećanjem HDL-C. Nokautiranje ortologa miša TTC39B, putem virusnog vektora (oboreno 50%) rezultiralo je značajno većim nivoima HDL-C u plazmi nakon četiri i sedam dana. Podaci ukazuju da je TTC39B uzročni gen za regulaciju lipida.[22]
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000155158 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000038172 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "UniProt, Q5VTQ0". Pristupljeno 12. 9. 2021.
- ^ "LOC100419056 chloride channel, voltage-sensitive 3 pseudogene". NCBI. Pristupljeno 13. 5. 2013.
- ^ a b c "TTC39B, a comprehensive annotation of human, mouse, and worm genes with mRNAs or ESTsAceView". AceView. Pristupljeno 13. 5. 2013.
- ^ "TTC39A, a comprehensive annotation of human, mouse, and worm genes with mRNAs or ESTsAceView". AceView. Pristupljeno 13. 5. 2013.
- ^ "TTC39C, a comprehensive annotation of human, mouse, and worm genes with mRNAs or ESTsAceView". AceView. Pristupljeno 13. 5. 2013.
- ^ "Tetratricopeptide repeat protein 39B isoform 1 [Homo sapiens] - Protein - NCBI".
- ^ "NCBI". Pristupljeno 9. 5. 2013.[mrtav link]
- ^ "NCBI". Pristupljeno 9. 5. 2013.
- ^ Blatch GL, Lässle M (novembar 1999). "The tetratricopeptide repeat: a structural motif mediating protein-protein interactions". BioEssays. 21 (11): 932–9. doi:10.1002/(SICI)1521-1878(199911)21:11<932::AID-BIES5>3.0.CO;2-N. PMID 10517866.
- ^ "NP_689787.2: TTC39B gene product [Homo sapiens]". NCBI. Pristupljeno 13. 5. 2013.
- ^ a b "Biology Workbench". SDSC Biology Workbench. Pristupljeno 13. 5. 2013.
- ^ "NetPhos 2.0 Server". Center for Biological Sequence Analysis. Pristupljeno 13. 5. 2013.
- ^ "SUMOsp 2.0 - SUMOylation Site Prediction". The CUCKOO Workgroup. Arhivirano s originala, 10. 5. 2013. Pristupljeno 13. 5. 2013.
- ^ Lazarus MB, Nam Y, Jiang J, Sliz P, Walker S (januar 2011). "Structure of human O-GlcNAc transferase and its complex with a peptide substrate". Nature. 469 (7331): 564–7. Bibcode:2011Natur.469..564L. doi:10.1038/nature09638. PMC 3064491. PMID 21240259.
- ^ "TTC39B tetratricopeptide repeat domain 39B [Homo sapiens (human)]". NCBI. Pristupljeno 13. 5. 2013.
- ^ "GEMS Launcher: Matlnspector: Search for transcription factor binding sites". Genomatix Software Suite. Pristupljeno 13. 5. 2013.[mrtav link]
- ^ "UBC Gene - GeneCards". GeneCards. Pristupljeno 13. 5. 2013.
- ^ Teslovich TM, Musunuru K, Smith AV, et al. (august 2010). "Biological, clinical and population relevance of 95 loci for blood lipids". Nature. 466 (7307): 707–13. Bibcode:2010Natur.466..707T. doi:10.1038/nature09270. PMC 3039276. PMID 20686565.