FAM203B

(Preusmjereno sa HGH1)

Član B porodice sa sličnošću sekvence 203 (FAM203B) je protein koji je kod ljudi kodiran genom FAM203B (pozicija 8q24.3).[5][6] Dok se FAM203B nalazi samo kod ljudi i možda primata koji nisu ljudi, njegov paralog, FAM203A,[7] je visoko konzerviran.[8] Protein FAM203B sadrži dva konzervirana domena nepoznate funkcije, DUF383 i DUF384,[8] a nema transmembranskih domena.[9] Ovaj protein još nema poznatu funkciju, iako se smatra da homolog FAM203A u Caenorhabditis elegans (Y54H5A.2) pomaže u regulaciji aktinskog citoskeleta.[10]

FAM203B
Identifikatori
AliasiHGH1
Vanjski ID-jeviMGI: 1930628 HomoloGene: 48742 GeneCards: HGH1
Lokacija gena (čovjek)
Hromosom 8 (čovjek)
Hrom.Hromosom 8 (čovjek)[1]
Hromosom 8 (čovjek)
Genomska lokacija za FAM203B
Genomska lokacija za FAM203B
Bend8q24.3Početak144,137,774 bp[1]
Kraj144,140,851 bp[1]
Lokacija gena (miš)
Hromosom 15 (miš)
Hrom.Hromosom 15 (miš)[2]
Hromosom 15 (miš)
Genomska lokacija za FAM203B
Genomska lokacija za FAM203B
Bend15 D3|15 35.78 cMPočetak76,253,098 bp[2]
Kraj76,255,637 bp[2]
Ontologija gena
Molekularna funkcija molekularna funkcija
Ćelijska komponenta ćelijska komponenta
Biološki proces GO:0022610 biološki proces
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_016458

NM_021555

RefSeq (bjelančevina)

NP_057542

NP_067530

Lokacija (UCSC)Chr 8: 144.14 – 144.14 MbChr 15: 76.25 – 76.26 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Aminokiselinska sekvenca

uredi

Dužina polipeptidnog lanca je 390 aminokiselina, а molekulska težina 42.129 Da.[11]

1020304050
MGEAGAGAGASGGPEASPEAEVVKLLPFLAPGARADLQAAAVRHVLALTG
CGPGRALLAGQAALLQALMELAPASAPARDAARALVNLAADPGLHETLLA
ADPGLPARLMGRALDPQWPWAEEAAAALANLSREPAPCAALMAALAAAEP
ADSGLERLVRALCTPGYNARAPLHYLAPLLSNLSQRPAARAFLLDPDRCV
VQRLLPLTQYPDSSVRRGGVVGTLRNCCFEHRHHEWLLGPEVDILPFLLL
PLAGPEDFSEEEMERLPVDLQYLPPDKQREPDADIRKMLVEAIMLLTATA
PGRQQVRDQGAYLILRELHSWEPEPDVRTACEKLIQVLIGDEPERGMENL
LEVQVPEDVEQQLQQLDCREQEQLERELAPEPWVERATPT

U ljudskom genomu, FAM203B nalazi se na pozitivnom lancu DNK dugog kraka hromosoma 8 na lokusu 24,3 (8q24,3) od 76,368.898 do 76,371,411 bp. Genski proizvod sadrži 2.402 bp iRNK sa 6 predviđenih egzona u ljudskom genu.[6][12] Nema poznetih izoformi.

 
Razine ekspresije FAM203B-ove iRNK u raznim tkivima

Gensko susjedstvo

uredi

Pseudogen TSSK5P2 nalazi se na negativnom lancu, nasuprot FAM203B (145,440.975 – 145,443.775 bp),[13] dok se LOC377711 nalazi odmah nizvodno, na pozitivnom lancu (145,445.755 - 145,485.896 bp).[14] FAM203A, MROH1 i SCXB nalaze se uzvodno FAM203B.[12][15]

Profil ekspresije: Ekspresija iRNK lokalizirana je u mnogim tipovima tkiva (imunskom, nervnom, mišićnom, utrobnom, sekretornom i reproduktivnom) u sličnim količinama i stoga može biti sveprisutna.[16]

Promotor: predviđena regija promotora FAM203B se nalazi između 145,437.380 i 145,438.015 bp na hromosomu 8 i ima dužinu od 636 bp.[17]

Protein

uredi

Funkcija FAM203B još uvijek nije razumljiva. Ima 390 aminokiselina,[5] a molecular weight of 42.1 kdal,[9] i izoelečnu tačku od 4,56.[18]

Struktura

uredi

FAM203B sadrži dva domena nepoznate funkcije: DUF383 (ostaci 110-288) i DUF384 (ostaci 292-349).[5] Bogat je alaninom, prolinom i leucinom, ali siromašan serinom, asparaginom, treoninom, izoleucinom, lizinom i fenilalaninom. Sljedeća interna ponavljanja mogu se pronaći u primarnom slijedu: LPFL (26-29, 245-248), ELAP (70-73), GRAL (54-57, 111-114) i LAADPGL (88-94, 99- 105). Nema pozitivnih, negativnih, mješovitih naboja ili hidrofobnih nakupina; nema transmembranskih domena ni nakupina aminokiselinskih multipleta.[9] Predviđanje sekundarne strukture koje generira bioinformatički server Phyre 2.0 prikazuje samo α-helikse, od kojih gotovo svi imaju visoke vrijednosti pouzdanosti. Ukupna vrijednost pouzdanosti modela je 99,5%.[19]

U FAM203B ima najmanje šest predviđenih mjesta fosforilacije: S17, S153, Y167, T223, S259 i S320.[20] Predviđeno je da se protein FAM203B nalazi u citoplazmi.[21]

Proteinske interakcije

uredi

U promotoru FAM203B postoji mnogo mogućih mjesta vezanja fakrora transkripcije. Ispod je tabela najboljih mogućnosti koje imaju visoke vrijednosti pouzdanosti, evolucijska konzerviranost i /ili više mogućih mjesta vezivanja u promotoru.[17]

Moguća mjesta vezanja faktora transkripcije u predviđenom promotoru FAM203B:[17]

Transkripcijski faktor Start Kraj Lanac Sekvenca
Faktor vezivanja pojačivača transkripcijskog faktora s krilatom spiralom IL-2, kutija viljuške K2 6 22 gacaggacAACAcaggg
Hipermetilacija u kanceru 1 49 61 + ccgTGCCagcctg
Transkripcijski faktor cinkovog prsta ZBP-89 94 116 + tggccactCCCCcattcagccct
Bubrežno-obogaćeni faktor nalik krupelu ,KLF15 142 158 + gagccGGGGcgcgggcc
Element prepoznavanja transkripcijskog faktora II B 149 155 ccgCGCC
Homolog 1 nedostatka glijinih ćelija, horion-specifični transkripcijski faktor GCMα 159 173 + tcagaCCCTcagggc
Transkripcijski faktor AP-2α 161 175 gggcCCTGagggtct
Smad4 transkripcijski faktor u signalizaciji TGFβ 245 255 gtaGTCTcggc
Jedarni faktor 1 278 298 gatTTGGccgcctgccgcgtc
ZF5 POZ domen cinkovog prsta, protein cinkovog prsta 161 295 309 + aatCGCGccgggcct
Smad3 transkripcijski faktor uključen u TGFβ signalizaciju 365 375 ggcGTCTggcc
Mijeloidni protein cinkovog prsta MZF1 384 394 gcGGGGagtta
X-vezani protein cinkovog prsta 397 407 + gcGGCCtggcc
Mijeloidni protein cinkovog prsta MZF1 406 416 gaGGGGagggg
Protein koji se vezuje za promotor jezgra sa pet cinkovih prstiju tipa krupel 423 445 + ccggtcCCGCcccttgagcccag
Promotorski element jezgra gena X 1 424 434 ggGCGGgaccg
Cinkov prst sa BTB domenom 7A 479 501 cgcaaCCCCgcccaccagaggag
Krupeloliki faktor 7 483 499 + tctggtgGGCGgggttg
Eritroidni krupeloliki faktor 533 549 + ggcaccggtcGGGTggc
Hipermetilirani u kanceru 1 541 553 tgcTGCCacccga

Postoji i nekoliko drugih proteina koji mogu direktno stupiti u interakciju s proteinom FAM203B, uključujući C1orf112, HEATR3, MRTO4, BYSL, GINS1, DKC1, TXNDC12, PWP2, IMP4 i NIP7.[22]

 
Mreža predviđenih interakcija FAM203B, STRING 9.05.[22]

Homologija i evolucija

uredi

FAM203A: Paralog

uredi

FAM203A je 99% identičan FAM203B sa samo jednom aminokiselinskom razlikom (E264Q) zbog tačkaste mutacije (G857C).[5][15][23] Ovo ukazuje da se događaj duplikacije koji je proizveo FAM203B od 242.266 bp nizvodno [12] od FAM203A pojavio skoto nedavno u evolucijskoj historiji . Protein FAM203A je visoko konzerviran i ima ortologe kod primata, glodara, papkara, torbara, vodozemaca, riba, gljiva, biljaka i najmanje jednog od monotremata, jednog gmizavca i jednog hemihordata.[8][24]

Ortolozi i homolozi

uredi

Paralozi i homolozi FAM203B:

Rod i vrsta Uobičajeno ime Datiranje divergencije od ljudi (prije miliona godina)[25] Pristup NCBI proteinu Oznaka gena Dužina proteina Sličnost sekvence
Homo sapiens Čovjek 0,0 NP_057542 FAM203A 390 100%
Macaca mulatta Rrzus-makak 29,2 XM_001090013 BRP16L 396 94%
Pan troglodytes Čimpanza 6,3 XP_520011 FAM203A 395 98%
Mus musculus Miš 92.3 NP_067530 FAM203A 393 86%
Sus scrofa Divlja svinja 94,2 XP_003125495 FAM203A-like 406 85%
Monodelphis domestica Sivi kratkorepi oposum 162.6 XP_003340757 FAM203A-like 483 78%
Columba livia Golub kamenjar 296,0 EMC87403 BRP16 (partial) 194 64%
Danio rerio Zebrica 400,1 NP_001002522 FAM203A 377 70%
Xenopus tropicalis Zapadna kandžasta žaba 371,2 AAI60980 LOC100145412 377 70%
Xenopus tropicalis Zapadna kandžasta žaba 371,2 NP_001007916 FAM203A 359 68%
Strongylocentrotus purpuratus Ljubičasti morski jež 742,9 XP_793139 FAM203A-like 372 62%
Anolis carolinensis Karolinska riba anolA 301,7 XP_003228921 BRP16L 286 57%
Saccoglossus kowglevski Žirasta glista 661,2 XP_002739897 BRP16L 362 61%
Danio rerio Zebrica 400,1 XP_002665502 BRP16L 181 57%
Saccharomyces cerevisiae Pupajući kvasac 1369.0 NP_011703 Hgh1p 394 52%
Arabidopsis thaliana Talova grbaštica 1369,0 NP_172882 Armadillo/beta-catenin-like repeats-containing 339 49%

Postoji jedan ortolog FAM203B, moždani protein sličan 16 (BRP16L) u Macaca mulatta,[8][24] iako se čini da nema drugih primata koji imaju ortologne proteine. Postoje dva moguća objašnjenja za ovu anomaliju:

  • (1) DNK ostalih primata nije dobro sekvencirana u genomskom području ortologa FAM203B ili
  • (2) FAM203B je rezultat duplikacije gena, događaja jedinstvenog za ljude, što znači da je BRP16L u M. mulatta posljedica prethodnog događaja duplikacija jedinstvenog za tu vrstu. Drugo objašnjenje potkrijepljeno je sljedećim dokazima:
  1. Kao i M. mulatta, Danio rerio ima i gen FAM203A i gen BRP16L . Veliki vremenski period od divergencije M. mulata i D. rerio sugerira da su ti geni BRP16L rezultat zasebnih događaja duplikacije.
  2. BRP16L protein u D. rerio ima značajno skraćenje u 3' u odnosu na protein M. mulatta, dodatno potvrđujući hipotezu da su ti proteini evoluirali odvojeno.[23][26][27]
  3. Ako su geni BRP16 u "M mulatti" i "D. rerio" rezultat zasebnih događaja duplikacija, tada je također moguće da su FAM203B i BRP16L u M. mulatta" rezultat zasebnih događanja duplickacija.
  4. BRP16 (moždani protein 16) je pseudonim FAM203A, a BRP16L (moždani protein sličan 16) je pseudonim FAM203B. Gen pod imenom BRP16L jednostavno znači da je gen povezan s FAM203A, ali ne nužno s FAM203B.
  5. FAM203A i FAM203B nalaze se u telomernoj regiji hromosoma 8, području u kojem se često događaju rekombinacije.

Međutim, budući da su FAM203A i FAM203B toliko slični, teško je utvrditi jesu li proteini ortolozi ili samo jednostavno homolozi.

 
Neukorijenjeno filogenetsko stablo sa evolucijskim međuodnosima FAM203B i njegovih homologa.[23]

Filogenija

uredi

Filogenetsko stablo FAM203B i njegovi homolozi podudara se s ukupnom divergencijom odgovarajućih loza.[23][25]

Konzervirani domeni, motivi i ostaci

uredi
  1. ARM (sadrži armadilo/beta-kateninu slične ponavljanja): Pronađeno u dva homologa (FAM203A u Danio rerio i At1g14300 u Arabidopsis thaliana ) i blago se preklapa s početkom domena DUF383. Vezano za HEAT-domen, sastoji se od 40-aminokiselinskih tandemno ponovljenih motiva sekvence i smatra se da posreduje u interakcijama protein-protein. Nekoliko eukariotskih gena sadrži ARM domene, uključujući armadilo u Drosophila melanogaster, beta-katenin, plakoglobin i adenomatoznu polipozu koli u sisara.[8]
  2. DUF383: Domen nepoznate funkcije 383
  3. DUF384: Domen nepoznate funkcije 384

Konzervirani domeni proteina FAM203B

Svaki ortolog i homolog FAM203B ima domenu DUF383 i domenu DUF384 (osim Anolis carolinensis , kojoj nedostaje DUF384 zbog velikog skraćenja 3' [24][28]). Postoje značajne varijacije među sisarima, torbarima i monotrematama u pogledu toga gdje počinje domen nepoznate funkcije DUF383, dok je ta varijacija manja kod gmizavaca, vodozemaca, riba, beskičmenjaka, biljaka i gljiva. Osim toga, domen DUF383 završava na istoj lokaciji za sve homologe, dok domen DUF384 počinje i završava na približno istoj lokaciji u svim homolozima. Postoji velika homologija u domenu DUF384 (292..349) i u DUF383 (154..288), a nekoliko aminokiselina je potpuno konzervirano u kičmenjaka, beskičmenjaka, biljaka i gljiva, koje uključuju Arg190, Gly219, Asn226 , Lys273 i Lys338. Druge visoko konzervirane aminokiseline uključuju Asn87, Lys88, Arg216 i Phe229.[8][23]

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000235173 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000022554 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b c d "Predicted: protein FAM203B [Homo sapiens]". NCBI Protein. Pristupljeno 5. 2. 2013.
  6. ^ a b "Predicted: Homo sapiens family with sequence similarity 203, member B (FAM203B, mRNA". NCBI Nucleotide. 30. 10. 2012. Pristupljeno 5. 2. 2013. journal zahtijeva |journal= (pomoć)
  7. ^ "FAM203 family". NextProt Beta. Pristupljeno 5. 2. 2013.
  8. ^ a b c d e f "HomoloGene: 48742, gene conserved in Eukaryota". NCBI HomoloGene. Pristupljeno 18. 1. 2013.
  9. ^ a b c Brendel, Volker. "SAPS (Statistical Analysis of PS)".
  10. ^ Fievet BT, Rodriguez J, Naganathan S, Lee C, Zeiser E, Ishidate T, Shirayama M, Grill S, Ahringer J (januar 2013). "Systematic genetic interaction screens uncover cell polarity regulators and functional redundancy". Nature Cell Biology. 15 (1): 103–12. doi:10.1038/ncb2639. PMC 3836181. PMID 23242217.
  11. ^ "UniProt, Q9BTY7" (jezik: engleski). Pristupljeno 17. 9. 2021.
  12. ^ a b c "FAM203B family with sequence similarity 203, member B [Homo sapiens (human)]". NCBI Gene. Pristupljeno 5. 2. 2013.
  13. ^ "TSSK5P2 testis-specific serine kinase 5 pseudogene 2 [Homo sapiens (human)]". NCBI Gene. Pristupljeno 10. 5. 2013.
  14. ^ "LOC377711 HEAT repeat-containing protein 7A-like [Homo sapiens (human)]". NCBI Gene. Pristupljeno 10. 5. 2013.
  15. ^ a b "FAM203A family with sequence similarity 203, member A [Homo sapiens (human)]". NCBI Gene. Pristupljeno 10. 5. 2013.
  16. ^ "FAM203B Gene". Weizmann Institute of Science. Pristupljeno 9. 5. 2013.
  17. ^ a b c "Genomatix El Dorado". Arhivirano s originala, 2. 12. 2021. Pristupljeno 7. 4. 2013.
  18. ^ Toldo, Luca. "PI (Isoelectric Point Determination)".
  19. ^ Kelley LA, Sternberg MJ (2009). "Protein structure prediction on the Web: a case study using the Phyre server" (PDF). Nature Protocols. 4 (3): 363–71. doi:10.1038/nprot.2009.2. hdl:10044/1/18157. PMID 19247286. S2CID 12497300.
  20. ^ Blom N, Gammeltoft S, Brunak S (decembar 1999). "Sequence and structure-based prediction of eukaryotic protein phosphorylation sites". Journal of Molecular Biology. 294 (5): 1351–62. doi:10.1006/jmbi.1999.3310. PMID 10600390.
  21. ^ Horton, Paul. "PSORT II".
  22. ^ a b "C8orf30B Predicted Functional Partners". STRING: functional protein association networks. Pristupljeno 9. 5. 2013.[mrtav link]
  23. ^ a b c d e Higgins DG, Bleasby AJ, Fuchs R (april 1992). "CLUSTAL V: improved software for multiple sequence alignment". Computer Applications in the Biosciences. 8 (2): 189–91. doi:10.1093/bioinformatics/8.2.189. PMID 1591615.
  24. ^ a b c "BLAST: Basic Local Alignment Search Tool". NCBI BLAST. Pristupljeno 5. 2. 2013.
  25. ^ a b Hedges SB, Dudley J, Kumar S (decembar 2006). "TimeTree: a public knowledge-base of divergence times among organisms". Bioinformatics. 22 (23): 2971–2. doi:10.1093/bioinformatics/btl505. PMID 17021158.
  26. ^ "Predicted: brain protein 16-like [Macaca mulatta]". NCBI Protein. Pristupljeno 5. 2. 2013.
  27. ^ "Predicted: brain protein 16-like [Danio rerio]". NCBI Protein. Pristupljeno 5. 2. 2013.
  28. ^ "Predicted: brain protein 16-like [Anolis carolinensis]". NCBI Protein. Pristupljeno 10. 5. 2013.