Protein FAM214A, znan i kao porodica proteina sa sličnošći sekvence 214, A (FAM214A) je protein koji je kod ljudi kodiran genom FAM214A. FAM214A je gen nepoznate funkcije, na lokusu q21.2-q21.3 hromosoma 15.[5] Proteinski proizvod ovog gena ima dva konzervirana domena, jedan nepoznate funkcije (DUF4210) i drugu koja se zove hromosom_Seg.[6] Iako je funkcija proteina FAM214A neokarakterizirana, predviđa se da će i DUF4210 i hromosomu_Seg imati ulogu u segregaciji hromosoma za vrijeme mejoza.[7]

FAM214A
Identifikatori
AliasiFAM214A
Vanjski ID-jeviMGI: 2387648 HomoloGene: 35065 GeneCards: FAM214A
Lokacija gena (čovjek)
Hromosom 15 (čovjek)
Hrom.Hromosom 15 (čovjek)[1]
Hromosom 15 (čovjek)
Genomska lokacija za FAM214A
Genomska lokacija za FAM214A
Bend15q21.2-q21.3Početak52,581,317 bp[1]
Kraj52,709,817 bp[1]
Lokacija gena (miš)
Hromosom 9 (miš)
Hrom.Hromosom 9 (miš)[2]
Hromosom 9 (miš)
Genomska lokacija za FAM214A
Genomska lokacija za FAM214A
Bend9|9 DPočetak74,860,166 bp[2]
Kraj74,939,750 bp[2]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_001286495
NM_019600

NM_001113283
NM_153584
NM_001359816

RefSeq (bjelančevina)

NP_001273424
NP_062546

NP_001106754
NP_705812
NP_001346745

Lokacija (UCSC)Chr 15: 52.58 – 52.71 MbChr 9: 74.86 – 74.94 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Aminokiselinska sekvenca

uredi

Dužina polipeptidnog lanca je 1.076 aminokiselina, a molekulska težina 121.670 Da.[8]

1020304050
MKPDRDTLDEYFEYDAEEFLVSLALLITEGRTPECSVKGRTESFHCPPAQ
SCYPVTTKHECSDKLAQCRQARRTRSEVTLLWKNNLPIMVEMMLLPDCCY
SDDGPTTEGIDLNDPAIKQDALLLERWILEPVPRQNGDRFIEEKTLLLAV
RSFVFFSQLSAWLSVSHGAIPRNILYRISAADVDLQWNFSQTPIEHVFPV
PNVSHNVALKVSVQSLPRQSNYPVLTCSIHTNIGLYEKRIQQHKLKTHQH
HNPNEAEQCGTNSSQRLCSKQTWTMAPESVLHAKSGPSPEYTAAVKNIKL
YPGTGSKSDHGTSQANILGFSGIGDIKSQETSVRTLKSFSMVDSSISNRQ
SFWQSAGETNPLIGSLIQERQEIIARIAQHLIHCDPSTSHVSGRPFNTQE
SSSLHSKLFRVSQENENVGKGKEAFSMTFGSPEFSSPEDTNEGKIRLKPE
TPRSETCISNDFYSHMPVGETNPLIGSLLQERQDVIARIAQHLEHIDPTA
SHIPRQSFNMHDSSSVASKVFRSSYEDKNLLKKNKDESSVSISHTKCSLL
GDISDGKNLVPNKCFTSFKNNSKEKCSLKHQTRNQCQNNPSEIIQSTYQE
TQNKSSSLSTSSILSQHKENNLDLTSRFKEQEMSNGIDKQYSNCTTIDKQ
ICTNKYKEKIINENYNPKFFGNLQSDDSKKNDSKIKVTVLEMSEYLNKYE
SMSSNKDSKRPKTCEQNTQLNSIENYLNKDNEGFKCKKSDQLKNEQDKQE
DPTNEKSQNYSQRRSIKDCLSTCEQPKNTEVLRTTLKHSNVWRKHNFHSL
DGTSTRAFHPQTGLPLLSSPVPQRKTQSGCFDLDSSLLHLKSFSSRSPRP
CLNIEDDPDIHEKPFLSSSAPPITSLSLLGNFEESVLNYRFDPLGIVDGF
TAEVGASGAFCPTHLTLPVEVSFYSVSDDNAPSPYMGVITLESLGKRGYR
VPPSGTIQVTLFNPNKTVVKMFVVIYDLRDMPANHQTFLRQRTFSVPVKQ
EVKRSVNKENIRHTEERLLRYLIHLRFQSSKSGKIYLHRDVRLLFSRKSM
EVDSGAAYELKSYTESPTNPQFSPRC
Simboli

Pregled

uredi

Gen FAM214A nalazi se na negativnom lancu DNK (vidi Smislenost) hromosoma 15 između položaja 52,873,514 i 53,002,014; tako je gen dug 97.303 baznih parova (bp).[5][9][10] FAM214A je prethodno označen sa još dva pseudonima, poznata kao KIAA1370 i FLJ10980.[5] Predviđa se da sadrži 12 egzona koji sadrže konačni transkript iRNK od 4.231 bp, nakon transkripcije.[11] Upravo je ovaj iRNK proizvod preveden u konačni protein FAM214A uz pomoć promotorske sekvence i transkripcijskih faktora. Promotor za sekvencu iRNK FAM214A predvidio je i analizirao program El Dorado na Genomatixu.[12] Ovaj promotor dug je 601 bazni par i obuhvata dio 5 'UTR.[12]

 
Lokacija gena FAM214A na hromosomu 15[5]
 
Dijagram genaFAM214A sa intronima i egzonima na hromosomu 15[10]

Ekspresija gena

uredi
 
Ekspresija FAM214A prema bazi Gene Cards[13]

Smatra se da je FAM214A sveprisutan (ili vrlo blizu tom) eksprimiran u niskim nivoima, prema brojnim izvorima kao što su BioGPS i Expression Atlas.[13][14][15] Kao što se može videti na donjoj BioGPS slici, postoji značajno viši nivo ekspresije u imuno-povezanim ćelijama i tkivima, što sugerira imunsku ulogu; međutim, nije bilo konkretnih dokaza in situ koji podupiru ovu tvrdnju. Podaci o ekspresiji prikupljeni su iz brojnih studija izvedenih na širokom spektru gena, pa su neki podaci kontradiktorne prirode.

 
Podaci o ekspresiji FAM214A, prema BioGPS[14]

Protein

uredi

Pregled

uredi

Funkcija proteina FAM214A kod ljudi još uvijek nije poznata; međutim, postoje tri funkcionalna udružena pojma, uključujući biološki proces, ćelijsku komponentu i molekulsku funkciju, koji opisuju funkciju ovog proteina u bazi Gene Ontology koja predviđaju implikacije njegove primarne funkcije in vivo.[16][17] Proteinski proizvod FAM214A sastoji se od 1.076 aminokiselina (aa), a predviđa se da ima molekulsku masu od 121.700 Da i ima izoelektričnu tačku oko pH 7,7.[6][18][19] Predviđa se da će ovaj protein ostati u jedru i nakon transkripcije na osnovu nedostatka sekvence signalnog peptida i predviđenog programa PSORTII. Zbog alternativne prerade, dvije druge izoforme ( Q32MH5-2 i Q32MH5-3) neznatno se razlikuju od primarnog proizvoda.[8] Izoforma 2 ima četiri različite aminokiseline iz baza 960-960 i nedostaje joj kraj sekvence baza 964-1076. Izoforma 3 ima sedam dodatnih aminokiselina na početju sekvence, nakon metionina .[8]

Nakon translacije, predviđa se da će protein FAM214A ostati u jedru, pomoću više tipova potprograma na PSORT II.[20] Ovaj protein ima pat4 signal, jedan od dva "klasična" signala jedarne lokalizacije (NLS), počevši od ostatka 709.[21] Iako nema drugu "klasičnu" NLS, pat7, kao ni "neklasičnu" dvodijelnu NLS, i dalje se predviđa da će biti usmjerena na jedeu, prema rezultatu NCNN-a.[21][22] Ovaj rezultat, na osnovu aminokiselinske sekvence, predviđa da li je protein usmjeren na jedro ili citoplazmu. Za protein FAM214A, NCNN rezultat predviđa jedarnu lokalizaciju sa 94,1% sigurnosti. Na osnovu ovih informacija, PSORT generira sveukupno predviđanje subčelijsje lokalizacije proteina. Za FAM214A, predviđene vrijednosti bile su 69,6% za jedro, u odnosu na 13,0% za mitohondrije, 8,7% za citoplazmu i 4,3% za sekretorne vezikule i endoplazmatski retikulum.

 
Predviđena mjesta fosfoliracija u proteinu FAM214A [23]

Ovaj protein najvjerojatnije ne podliježe značajnom broju posttranslacijskih modifikacija zbog nedostatka signalnih peptidnih sekvenci, predviđenih prema NetNGlyc i NetOGlyc na ExPASy web serveru.[24][25] To je zato što velik dio unutarćelijskih mehanizama za posttranslacijske modifikacije zahtijeva da se protein kreće kroz organele kao što su endoplazmatski retikulum i Golgijev aparat. Bez signalne peptidne sekvence, protein uglavnom ne napušta jedro, što je predvidio PSORT II, kako je gore opisano.

SAPS analiza ovog proteina izvedena je prema bazi podataka swp23s.q, koja je ukazala na prisustvo abnormalno velikog broja serinskih aminokiselina i abnormalno malog broja aminokiseline alanina u ovom proteinu.[18] Prema preglednom članku Fayarda et al., fosfoinozitid-ovisna kinaza 2 (PDK2) je serin/treonin kinaza koja je važna za regulaciju ćelijskog ciklusa. Budući da protein FAM214A ima veći broj serinskih skupina nego što se smatra normalnim, postoji mogućnost da PDK2 ima važan učinak na ovaj protein.[26] Da bi se utvrdilo da li se pretjeranom broju serina zapravo predviđa fosforilacija, sekvenca proteina pokrenuta je kroz program NetPhos sa web servera ExPASy.[23] This program predicted the phosphorylation of 69 serines, 14 threonines, and 9 tyrosines.[23] Prema SAPS analizi, ima ukupno ili 134 serina, što ukazuje da se predviđa da će ih približno polovina biti fosforilirana in vivo. Dijagram predviđanja fosforilacije prikazan je desno.

Još jedan tip posttranslacijske modifikacije za protein FAM214A predvidio je program NetCorona na ExPASy.[27] Program je predvidio jedno mjesto cijepanja, između položaja 214 i 215 u sekvenci proteina FAM214A, nakon translacije.

Proteinske interakcije

uredi

Brojna su mjesta vezanja faktora transkripcije predviđeni za promotivnu sekvencu FAM214A.[12] Nekoliko od onih sa najvećim predviđenim pouzdanjem dato je u donjoj tabeli.[12]

Mogući faktori transkripcije sa predviđanjem da će se vezati za promotivnu sekvencu FAM214A

Predviđeni transkripcijski faktor Start Kraj Lanac Povjerljivost
Prepoznavajući element transcripcijskog faktora II B (TFIIB) 97 103 Negativni 1,0
Mijeloidni protein cinkovog prsta MZF1 151 161 Negativni 1,0
Mijelinski transkripcijski 1-liki faktor, nervni C2HC faktor 1 cinkovog prsta 388 400 Negativni 0,945
Vezujuće mjesto androgenog receptora, mjesto IR3 495 513 Negativni 0,923
Suprsor Wilmsovog tumora 1 17 Pozitivni 0,968
Vezno mjesto nepalindromskog jedarnog faktora I 27 47 Pozitivni 0,988
Varijanta alternativne prerade FOXP1, aktivirab+ne ESC-ima 383 383 Pozitivni 1,0
Gen 1 pleomorfnog adenoma 488 510 Pozitivni 1,0
ETS-liki gen 1 (ELK-1) 569 589 Pozitivni 0,961
 
Predviđene proteinske interakcije netranskripcijskog faktora FAM214A

Jedini protein za koji je predviđeno da STRING stupa u interakciju s proteinom FAM214A naziva se MFSD6L. Ovaj protein pripada glavnom facilitatoru za superporodicu za koju se predviđa da je transmembranski protein. Kao i FAM214A, funkcija ovog proteina još nije okarakterizirana eksperimentima ili istraživanjima.[28][29] Budući da je ovaj protein MFSD6L jedina interakcija proteina FAM214A koja se predviđa sa sigurnošću, sekvenca za njega pokrenuta je preko programa PSORT II. Podaci iz NLS potprograma predviđali su prisustvo jednog niza pat4 i dva pat7 NLS, što ukazuje na moguću jedarnu lokalizaciju. Rezultat NCNN-a, s druge strane, predviđao je lokalizaciju u citoplazmi, sa sigurnošću od 94,1%, ostavljajući tako ukupni rezultat PSORT II na 39,1% plazmamembrane, 39,1% endoplazmatskog retikuluma, 4,3% vakuolskog, 4,3% vezikulskog sekretornog sistema, 4,3% Golgijevog aparata, 4,3% mitohondrija i 4,3% jedarnih.[21][22] To je kontradiktorno, zato što postoje tri ukupna signala jedarne lokalizacije, ali to može biti zbog činjenice da je značajna transmembranska priroda proteina MFSD6L možda uzrokuje probleme s ovim predviđanjima.[21]

 
Mali postotak tercijarne strukture FAM214A[30]

Sekundarna i tercijarna struktura

uredi

Sekundarna struktura proteina FAM214A sastoji se od velikog broja alfa-heliks ai beta-listova kako su predviđali Biology Workbench i PHYRE (P rotein H omology / analog Y Recognition E ngine).[30][31] Program PHYRE predviđa da je 66% sekundarne strukture FAM214A poremećeno i stoga ne može biti analizirano i pretvoreno u predviđanje tercijarne strukture.[30] Bilo je; međutim, sposoban predvidjeti približno 10 posto strukture proteina sa 95 posto značajnosti.[30] Dijagram za to prikazan je slijeva.[30]

Konzervacija

uredi

Paralog

uredi

Jedini paralogni gen pronađen je na ljudskom hromozomu 9 u i nazvan je FAM214B (porodica sa sličnošću sekvenci,B).[32] Iako se smatra paralogom, FAM214B ima značajno drugačiju sekvencu proteina od one u FAM214A. Kada su njih dvije međusobno upoređene u bazama NCBI BLAST-a, jedina značajna uočena sličnost bila je unutar posljednjih 200 aminokiselina (gdje se nalaze domeni DUF4210 i hromosom_Seg).[33] Iako je sličnost između FAM214 A i B mala, oba su u istoj porodici proteina i sadrže ista dva konzervirana domena.[7][34]

Ortolozi

uredi

Protein FAM214A ima značajan broj ortologa u velikom broju taksonomskih grupa, uključujući Mammalia, Aves, Reptilia, Amphibia, Actinopterygii, Echinoidea, Insecta, Trematoda, Crustacea, Tricoplacia, Anthozoa i Eurotiomycetes.[35] To ukazuje na to da je protein FAM214A dobro konzerviran u eukariotima, ali čini se da nije konzerviran u Bacteria ili Archaea. U svim ortolozima, najkonzerviranija regija bila je pri kraju proteina, na kojoj su konzervirani domeni (vidi dolje). Ortolozi za ljudski protein FAM214A pronađeni su još prije u Tuber melanosporum, Talaromyces stipitatus i Aspergillus nidulans, koji su se svi razišli prije otprilike 1.215 miliona godina.

Ortolozi proteina FAM214A

Rod i vrsta Uobičajeno ime Datirana divergencija od ljudske loze (milioni godina) [36] Pristupni broj bazi NCBI]] Dužina sekvnce Identitet sa ljudskom sekvencom (%) [33] Naziv gena
Homo sapiens Čovjek - NP_062546.2 1076 100 FAM214A
Pan troglodytes Obični čimpanza 6,3 XP_003314724 1083 99 FAM214A
Pan paniscus Bonobo 6,3 XP_003827895.1 1076 100 FAM214A
Rattus norvegicus Pacov 92,3 NP_001100308 1074 100 LOC300836
Bos taurus Govedo 94,2 XP_601152 1087 100 KIAA1370
Canis lupus familiaris Pas 94,2 XP_544682 1081 100 KIAA1370
Ornithorhynchus anatinus Kljunar 167.4 XP_001515207 1169 95 KIAA1370
Gallus gallus Kokoš 296.0 NP_001005811 1093 99 FAM214A
Taeniopygia guttata Zebrasta zeba 296.0 XP_002196177 1112 99 FAM214A
Anolis carolinensis Karolinska anola 296.0 XP_003227400 1086 99 KIAA1370
Xenopus tropicalis Tropska kandžasta žaba 371,2 NP_001015702 946 98 FAM214A
Danio rerio Zebrica 400,1 NP_001189349 1021 75 FAM214A
Apis mellifera Medonosna pčela 782,7 XP_393903 1339 45 LOC410423
Strongylocentrotus purpuratus Morski rež 742.9 XP_799179 297 27 FAM214A-liki
Drosophila melanogaster Vinska mušica 782,7 NP_610688 1297 27 CG9005
Schistosoma mansoni Shistosoma parazit 792.4 XP_002579285 766 26 Hypothetical Protein
Daphnia pulex Obična vodena buha 782,7 EFX87516 200 18 Hipothetski protein DAPPUDRAFT_207300
Nematostella vectensis Morska sasa 855,3 mya XP_001633540 191 18 Hipotetski protein
Tuber melanosporum Tartuf 1215,8 XP_002841833 622 15 Hipotetski protein
Talaromyces stipitatus 1215,8 XP_002478567 797 25 Konservirani hipotetski protein
Aspergillus nidulans Nitasta gljivica 1215,8 XP_658605 728 15 Hipotetski protein AN1001.2

Filogenija

uredi
 
Evolucijski odnosi između FAM214A i njegovih ortolognih proteina[31]

Nekorijenjeno filogenetsko stablo od 20 ortologa generirano je programom CLUSTALW na Biology Workbenchu kako bi se pokazao evolucijski odnos između FAM214A i njegovih ortologa.[31]

Konzervirani domeni

uredi

Unutar proteina FAM214A postoje tri dobro konzervirane regije. To uključuje dobro konzerviranu regiju u blizini N-kraja proteina i dva konzervirana domena, uključujući domenu nepoznate funkcije 4210 (DUF4210) i domen hromosom_Seg u blizini C-krajs .[7] Shematski dijagram ove tri regije prikazan je u nastavku. Nije predviđeno da dobro konzervirano područje u blizini N-kraja proteina sadrži bilo kakve poznate domene ili motive; međutim, mjesto cijepanja koje je predviđao NetCorona gore nalazi se unutar ove regije i dobro je konzervirano u većini proteina ortologa FAM214A.[27] Dva konzervirana domena na kraju ovog proteina su najvažniji dio peptida, zasnovano na evolucijskoj historiji. Svi organizmi u gornjoj tabeli ortologa, osim kljunara (kojem nedostaje domen hromosom_Seg) sadrže oba ova konzervirana domena unutar svoje proteinske sekvence.[7]

 
Shema FAM214A proteina Homo sapiens sa dijagramom dobrokonzerviranih regija i njihovih lokacija

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000047346 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000034858 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b c d "Gene Cards: FAM214A family with sequence similarity 214, A".
  6. ^ a b "Protein FAM214A". NCBI. Pristupljeno 2 Feb 2013.
  7. ^ a b c d "NCBI Conserved Domains".
  8. ^ a b c "UniProt, Q32MH5". Pristupljeno 14. 7. 2021.
  9. ^ "Gene Loc Map Region around Gene FAM214a". Gene Cards.
  10. ^ a b "FAM214A family with sequence similarity 214, A". NCBI.
  11. ^ "Homo sapiens family with sequence similarity 214, member A (FAM214A), mRNA". NCBI. 17. 4. 2013.
  12. ^ a b c d "Genomatix: El Dorado". Genomatix.[mrtav link]
  13. ^ a b "FAM214A Gene Expression from Gene Cards". Gene Cards.
  14. ^ a b "FAM214A Gene Expression from BioGPS". BioGPS.
  15. ^ "FAM214A Gene Expression From Expression Atlas". Arhivirano s originala, 16. 6. 2013.
  16. ^ "The Gene Ontology".
  17. ^ "The Gene Ontology: Term Associations".[mrtav link]
  18. ^ a b "Biology Workbench: SAPS".
  19. ^ Kozlowski, LP (2016). "IPC - Isoelectric Point Calculator". Biology Direct. 11 (1): 55. doi:10.1186/s13062-016-0159-9. PMC 5075173. PMID 27769290. Arhivirano s originala, 29. 4. 2013. Pristupljeno 16. 12. 2016.
  20. ^ "PSORT II Prediction".
  21. ^ a b c d "PSORT II NLS". PSORT.
  22. ^ a b Reinhardt A, Hubbard T (maj 1998). "Using neural networks for prediction of the subcellular location of proteins". Nucleic Acids Research. 26 (9): 2230–6. doi:10.1093/nar/26.9.2230. PMC 147531. PMID 9547285.
  23. ^ a b c "NetPhos". ExPASy.
  24. ^ "NetNGlyc". ExPASy.
  25. ^ "NetOGlyc". ExPASy.
  26. ^ Fayard E, Tintignac LA, Baudry A, Hemmings BA (decembar 2005). "Protein kinase B/Akt at a glance". Journal of Cell Science. 118 (Pt 24): 5675–8. doi:10.1242/jcs.02724. PMID 16339964.
  27. ^ a b "NetCorona". ExPASy.
  28. ^ "Gene Cards MFSD6L". Gene Cards.
  29. ^ "UniProt MFSD6L". UniProt.
  30. ^ a b c d e "PHYRE Protein Fold Recognition Server". Arhivirano s originala, 12. 8. 2022. Pristupljeno 14. 7. 2021.
  31. ^ a b c "Biology Workbench".
  32. ^ "Gene Cards-Paralogs". Gene Cards.
  33. ^ a b "NCBI BLAST". NCBI.
  34. ^ "Conserved Domains FAM214B". NCBI.
  35. ^ "Gene Cards Orthologs". Gene Cards.
  36. ^ Hedges, SB; Dudley J; Kumar S (2006). "TimeTree: a public knowledge-base of divergence times among organisms". str. 2971–2972.