FAM214A
Protein FAM214A, znan i kao porodica proteina sa sličnošći sekvence 214, A (FAM214A) je protein koji je kod ljudi kodiran genom FAM214A. FAM214A je gen nepoznate funkcije, na lokusu q21.2-q21.3 hromosoma 15.[5] Proteinski proizvod ovog gena ima dva konzervirana domena, jedan nepoznate funkcije (DUF4210) i drugu koja se zove hromosom_Seg.[6] Iako je funkcija proteina FAM214A neokarakterizirana, predviđa se da će i DUF4210 i hromosomu_Seg imati ulogu u segregaciji hromosoma za vrijeme mejoza.[7]
FAM214A | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | FAM214A | ||||||||||||||||||||||||
Vanjski ID-jevi | MGI: 2387648 HomoloGene: 35065 GeneCards: FAM214A | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 15: 52.58 – 52.71 Mb | Chr 9: 74.86 – 74.94 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Aminokiselinska sekvenca
urediDužina polipeptidnog lanca je 1.076 aminokiselina, a molekulska težina 121.670 Da.[8]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MKPDRDTLDE | YFEYDAEEFL | VSLALLITEG | RTPECSVKGR | TESFHCPPAQ | ||||
SCYPVTTKHE | CSDKLAQCRQ | ARRTRSEVTL | LWKNNLPIMV | EMMLLPDCCY | ||||
SDDGPTTEGI | DLNDPAIKQD | ALLLERWILE | PVPRQNGDRF | IEEKTLLLAV | ||||
RSFVFFSQLS | AWLSVSHGAI | PRNILYRISA | ADVDLQWNFS | QTPIEHVFPV | ||||
PNVSHNVALK | VSVQSLPRQS | NYPVLTCSIH | TNIGLYEKRI | QQHKLKTHQH | ||||
HNPNEAEQCG | TNSSQRLCSK | QTWTMAPESV | LHAKSGPSPE | YTAAVKNIKL | ||||
YPGTGSKSDH | GTSQANILGF | SGIGDIKSQE | TSVRTLKSFS | MVDSSISNRQ | ||||
SFWQSAGETN | PLIGSLIQER | QEIIARIAQH | LIHCDPSTSH | VSGRPFNTQE | ||||
SSSLHSKLFR | VSQENENVGK | GKEAFSMTFG | SPEFSSPEDT | NEGKIRLKPE | ||||
TPRSETCISN | DFYSHMPVGE | TNPLIGSLLQ | ERQDVIARIA | QHLEHIDPTA | ||||
SHIPRQSFNM | HDSSSVASKV | FRSSYEDKNL | LKKNKDESSV | SISHTKCSLL | ||||
GDISDGKNLV | PNKCFTSFKN | NSKEKCSLKH | QTRNQCQNNP | SEIIQSTYQE | ||||
TQNKSSSLST | SSILSQHKEN | NLDLTSRFKE | QEMSNGIDKQ | YSNCTTIDKQ | ||||
ICTNKYKEKI | INENYNPKFF | GNLQSDDSKK | NDSKIKVTVL | EMSEYLNKYE | ||||
SMSSNKDSKR | PKTCEQNTQL | NSIENYLNKD | NEGFKCKKSD | QLKNEQDKQE | ||||
DPTNEKSQNY | SQRRSIKDCL | STCEQPKNTE | VLRTTLKHSN | VWRKHNFHSL | ||||
DGTSTRAFHP | QTGLPLLSSP | VPQRKTQSGC | FDLDSSLLHL | KSFSSRSPRP | ||||
CLNIEDDPDI | HEKPFLSSSA | PPITSLSLLG | NFEESVLNYR | FDPLGIVDGF | ||||
TAEVGASGAF | CPTHLTLPVE | VSFYSVSDDN | APSPYMGVIT | LESLGKRGYR | ||||
VPPSGTIQVT | LFNPNKTVVK | MFVVIYDLRD | MPANHQTFLR | QRTFSVPVKQ | ||||
EVKRSVNKEN | IRHTEERLLR | YLIHLRFQSS | KSGKIYLHRD | VRLLFSRKSM | ||||
EVDSGAAYEL | KSYTESPTNP | QFSPRC |
- Simboli
Gen
urediPregled
urediGen FAM214A nalazi se na negativnom lancu DNK (vidi Smislenost) hromosoma 15 između položaja 52,873,514 i 53,002,014; tako je gen dug 97.303 baznih parova (bp).[5][9][10] FAM214A je prethodno označen sa još dva pseudonima, poznata kao KIAA1370 i FLJ10980.[5] Predviđa se da sadrži 12 egzona koji sadrže konačni transkript iRNK od 4.231 bp, nakon transkripcije.[11] Upravo je ovaj iRNK proizvod preveden u konačni protein FAM214A uz pomoć promotorske sekvence i transkripcijskih faktora. Promotor za sekvencu iRNK FAM214A predvidio je i analizirao program El Dorado na Genomatixu.[12] Ovaj promotor dug je 601 bazni par i obuhvata dio 5 'UTR.[12]
Ekspresija gena
urediSmatra se da je FAM214A sveprisutan (ili vrlo blizu tom) eksprimiran u niskim nivoima, prema brojnim izvorima kao što su BioGPS i Expression Atlas.[13][14][15] Kao što se može videti na donjoj BioGPS slici, postoji značajno viši nivo ekspresije u imuno-povezanim ćelijama i tkivima, što sugerira imunsku ulogu; međutim, nije bilo konkretnih dokaza in situ koji podupiru ovu tvrdnju. Podaci o ekspresiji prikupljeni su iz brojnih studija izvedenih na širokom spektru gena, pa su neki podaci kontradiktorne prirode.
Protein
urediPregled
urediFunkcija proteina FAM214A kod ljudi još uvijek nije poznata; međutim, postoje tri funkcionalna udružena pojma, uključujući biološki proces, ćelijsku komponentu i molekulsku funkciju, koji opisuju funkciju ovog proteina u bazi Gene Ontology koja predviđaju implikacije njegove primarne funkcije in vivo.[16][17] Proteinski proizvod FAM214A sastoji se od 1.076 aminokiselina (aa), a predviđa se da ima molekulsku masu od 121.700 Da i ima izoelektričnu tačku oko pH 7,7.[6][18][19] Predviđa se da će ovaj protein ostati u jedru i nakon transkripcije na osnovu nedostatka sekvence signalnog peptida i predviđenog programa PSORTII. Zbog alternativne prerade, dvije druge izoforme ( Q32MH5-2 i Q32MH5-3) neznatno se razlikuju od primarnog proizvoda.[8] Izoforma 2 ima četiri različite aminokiseline iz baza 960-960 i nedostaje joj kraj sekvence baza 964-1076. Izoforma 3 ima sedam dodatnih aminokiselina na početju sekvence, nakon metionina .[8]
Nakon translacije, predviđa se da će protein FAM214A ostati u jedru, pomoću više tipova potprograma na PSORT II.[20] Ovaj protein ima pat4 signal, jedan od dva "klasična" signala jedarne lokalizacije (NLS), počevši od ostatka 709.[21] Iako nema drugu "klasičnu" NLS, pat7, kao ni "neklasičnu" dvodijelnu NLS, i dalje se predviđa da će biti usmjerena na jedeu, prema rezultatu NCNN-a.[21][22] Ovaj rezultat, na osnovu aminokiselinske sekvence, predviđa da li je protein usmjeren na jedro ili citoplazmu. Za protein FAM214A, NCNN rezultat predviđa jedarnu lokalizaciju sa 94,1% sigurnosti. Na osnovu ovih informacija, PSORT generira sveukupno predviđanje subčelijsje lokalizacije proteina. Za FAM214A, predviđene vrijednosti bile su 69,6% za jedro, u odnosu na 13,0% za mitohondrije, 8,7% za citoplazmu i 4,3% za sekretorne vezikule i endoplazmatski retikulum.
Ovaj protein najvjerojatnije ne podliježe značajnom broju posttranslacijskih modifikacija zbog nedostatka signalnih peptidnih sekvenci, predviđenih prema NetNGlyc i NetOGlyc na ExPASy web serveru.[24][25] To je zato što velik dio unutarćelijskih mehanizama za posttranslacijske modifikacije zahtijeva da se protein kreće kroz organele kao što su endoplazmatski retikulum i Golgijev aparat. Bez signalne peptidne sekvence, protein uglavnom ne napušta jedro, što je predvidio PSORT II, kako je gore opisano.
SAPS analiza ovog proteina izvedena je prema bazi podataka swp23s.q, koja je ukazala na prisustvo abnormalno velikog broja serinskih aminokiselina i abnormalno malog broja aminokiseline alanina u ovom proteinu.[18] Prema preglednom članku Fayarda et al., fosfoinozitid-ovisna kinaza 2 (PDK2) je serin/treonin kinaza koja je važna za regulaciju ćelijskog ciklusa. Budući da protein FAM214A ima veći broj serinskih skupina nego što se smatra normalnim, postoji mogućnost da PDK2 ima važan učinak na ovaj protein.[26] Da bi se utvrdilo da li se pretjeranom broju serina zapravo predviđa fosforilacija, sekvenca proteina pokrenuta je kroz program NetPhos sa web servera ExPASy.[23] This program predicted the phosphorylation of 69 serines, 14 threonines, and 9 tyrosines.[23] Prema SAPS analizi, ima ukupno ili 134 serina, što ukazuje da se predviđa da će ih približno polovina biti fosforilirana in vivo. Dijagram predviđanja fosforilacije prikazan je desno.
Još jedan tip posttranslacijske modifikacije za protein FAM214A predvidio je program NetCorona na ExPASy.[27] Program je predvidio jedno mjesto cijepanja, između položaja 214 i 215 u sekvenci proteina FAM214A, nakon translacije.
Proteinske interakcije
urediBrojna su mjesta vezanja faktora transkripcije predviđeni za promotivnu sekvencu FAM214A.[12] Nekoliko od onih sa najvećim predviđenim pouzdanjem dato je u donjoj tabeli.[12]
Mogući faktori transkripcije sa predviđanjem da će se vezati za promotivnu sekvencu FAM214A
Predviđeni transkripcijski faktor | Start | Kraj | Lanac | Povjerljivost |
Prepoznavajući element transcripcijskog faktora II B (TFIIB) | 97 | 103 | Negativni | 1,0 |
Mijeloidni protein cinkovog prsta MZF1 | 151 | 161 | Negativni | 1,0 |
Mijelinski transkripcijski 1-liki faktor, nervni C2HC faktor 1 cinkovog prsta | 388 | 400 | Negativni | 0,945 |
Vezujuće mjesto androgenog receptora, mjesto IR3 | 495 | 513 | Negativni | 0,923 |
Suprsor Wilmsovog tumora | 1 | 17 | Pozitivni | 0,968 |
Vezno mjesto nepalindromskog jedarnog faktora I | 27 | 47 | Pozitivni | 0,988 |
Varijanta alternativne prerade FOXP1, aktivirab+ne ESC-ima | 383 | 383 | Pozitivni | 1,0 |
Gen 1 pleomorfnog adenoma | 488 | 510 | Pozitivni | 1,0 |
ETS-liki gen 1 (ELK-1) | 569 | 589 | Pozitivni | 0,961 |
Jedini protein za koji je predviđeno da STRING stupa u interakciju s proteinom FAM214A naziva se MFSD6L. Ovaj protein pripada glavnom facilitatoru za superporodicu za koju se predviđa da je transmembranski protein. Kao i FAM214A, funkcija ovog proteina još nije okarakterizirana eksperimentima ili istraživanjima.[28][29] Budući da je ovaj protein MFSD6L jedina interakcija proteina FAM214A koja se predviđa sa sigurnošću, sekvenca za njega pokrenuta je preko programa PSORT II. Podaci iz NLS potprograma predviđali su prisustvo jednog niza pat4 i dva pat7 NLS, što ukazuje na moguću jedarnu lokalizaciju. Rezultat NCNN-a, s druge strane, predviđao je lokalizaciju u citoplazmi, sa sigurnošću od 94,1%, ostavljajući tako ukupni rezultat PSORT II na 39,1% plazmamembrane, 39,1% endoplazmatskog retikuluma, 4,3% vakuolskog, 4,3% vezikulskog sekretornog sistema, 4,3% Golgijevog aparata, 4,3% mitohondrija i 4,3% jedarnih.[21][22] To je kontradiktorno, zato što postoje tri ukupna signala jedarne lokalizacije, ali to može biti zbog činjenice da je značajna transmembranska priroda proteina MFSD6L možda uzrokuje probleme s ovim predviđanjima.[21]
Sekundarna i tercijarna struktura
urediSekundarna struktura proteina FAM214A sastoji se od velikog broja alfa-heliks ai beta-listova kako su predviđali Biology Workbench i PHYRE (P rotein H omology / analog Y Recognition E ngine).[30][31] Program PHYRE predviđa da je 66% sekundarne strukture FAM214A poremećeno i stoga ne može biti analizirano i pretvoreno u predviđanje tercijarne strukture.[30] Bilo je; međutim, sposoban predvidjeti približno 10 posto strukture proteina sa 95 posto značajnosti.[30] Dijagram za to prikazan je slijeva.[30]
Konzervacija
urediParalog
urediJedini paralogni gen pronađen je na ljudskom hromozomu 9 u i nazvan je FAM214B (porodica sa sličnošću sekvenci,B).[32] Iako se smatra paralogom, FAM214B ima značajno drugačiju sekvencu proteina od one u FAM214A. Kada su njih dvije međusobno upoređene u bazama NCBI BLAST-a, jedina značajna uočena sličnost bila je unutar posljednjih 200 aminokiselina (gdje se nalaze domeni DUF4210 i hromosom_Seg).[33] Iako je sličnost između FAM214 A i B mala, oba su u istoj porodici proteina i sadrže ista dva konzervirana domena.[7][34]
Ortolozi
urediProtein FAM214A ima značajan broj ortologa u velikom broju taksonomskih grupa, uključujući Mammalia, Aves, Reptilia, Amphibia, Actinopterygii, Echinoidea, Insecta, Trematoda, Crustacea, Tricoplacia, Anthozoa i Eurotiomycetes.[35] To ukazuje na to da je protein FAM214A dobro konzerviran u eukariotima, ali čini se da nije konzerviran u Bacteria ili Archaea. U svim ortolozima, najkonzerviranija regija bila je pri kraju proteina, na kojoj su konzervirani domeni (vidi dolje). Ortolozi za ljudski protein FAM214A pronađeni su još prije u Tuber melanosporum, Talaromyces stipitatus i Aspergillus nidulans, koji su se svi razišli prije otprilike 1.215 miliona godina.
Ortolozi proteina FAM214A
Rod i vrsta | Uobičajeno ime | Datirana divergencija od ljudske loze (milioni godina) [36] | Pristupni broj bazi NCBI]] | Dužina sekvnce | Identitet sa ljudskom sekvencom (%) [33] | Naziv gena |
Homo sapiens | Čovjek | - | NP_062546.2 | 1076 | 100 | FAM214A |
Pan troglodytes | Obični čimpanza | 6,3 | XP_003314724 | 1083 | 99 | FAM214A |
Pan paniscus | Bonobo | 6,3 | XP_003827895.1 | 1076 | 100 | FAM214A |
Rattus norvegicus | Pacov | 92,3 | NP_001100308 | 1074 | 100 | LOC300836 |
Bos taurus | Govedo | 94,2 | XP_601152 | 1087 | 100 | KIAA1370 |
Canis lupus familiaris | Pas | 94,2 | XP_544682 | 1081 | 100 | KIAA1370 |
Ornithorhynchus anatinus | Kljunar | 167.4 | XP_001515207 | 1169 | 95 | KIAA1370 |
Gallus gallus | Kokoš | 296.0 | NP_001005811 | 1093 | 99 | FAM214A |
Taeniopygia guttata | Zebrasta zeba | 296.0 | XP_002196177 | 1112 | 99 | FAM214A |
Anolis carolinensis | Karolinska anola | 296.0 | XP_003227400 | 1086 | 99 | KIAA1370 |
Xenopus tropicalis | Tropska kandžasta žaba | 371,2 | NP_001015702 | 946 | 98 | FAM214A |
Danio rerio | Zebrica | 400,1 | NP_001189349 | 1021 | 75 | FAM214A |
Apis mellifera | Medonosna pčela | 782,7 | XP_393903 | 1339 | 45 | LOC410423 |
Strongylocentrotus purpuratus | Morski rež | 742.9 | XP_799179 | 297 | 27 | FAM214A-liki |
Drosophila melanogaster | Vinska mušica | 782,7 | NP_610688 | 1297 | 27 | CG9005 |
Schistosoma mansoni | Shistosoma parazit | 792.4 | XP_002579285 | 766 | 26 | Hypothetical Protein |
Daphnia pulex | Obična vodena buha | 782,7 | EFX87516 | 200 | 18 | Hipothetski protein DAPPUDRAFT_207300 |
Nematostella vectensis | Morska sasa | 855,3 mya | XP_001633540 | 191 | 18 | Hipotetski protein |
Tuber melanosporum | Tartuf | 1215,8 | XP_002841833 | 622 | 15 | Hipotetski protein |
Talaromyces stipitatus | – | 1215,8 | XP_002478567 | 797 | 25 | Konservirani hipotetski protein |
Aspergillus nidulans | Nitasta gljivica | 1215,8 | XP_658605 | 728 | 15 | Hipotetski protein AN1001.2 |
Filogenija
urediNekorijenjeno filogenetsko stablo od 20 ortologa generirano je programom CLUSTALW na Biology Workbenchu kako bi se pokazao evolucijski odnos između FAM214A i njegovih ortologa.[31]
Konzervirani domeni
urediUnutar proteina FAM214A postoje tri dobro konzervirane regije. To uključuje dobro konzerviranu regiju u blizini N-kraja proteina i dva konzervirana domena, uključujući domenu nepoznate funkcije 4210 (DUF4210) i domen hromosom_Seg u blizini C-krajs .[7] Shematski dijagram ove tri regije prikazan je u nastavku. Nije predviđeno da dobro konzervirano područje u blizini N-kraja proteina sadrži bilo kakve poznate domene ili motive; međutim, mjesto cijepanja koje je predviđao NetCorona gore nalazi se unutar ove regije i dobro je konzervirano u većini proteina ortologa FAM214A.[27] Dva konzervirana domena na kraju ovog proteina su najvažniji dio peptida, zasnovano na evolucijskoj historiji. Svi organizmi u gornjoj tabeli ortologa, osim kljunara (kojem nedostaje domen hromosom_Seg) sadrže oba ova konzervirana domena unutar svoje proteinske sekvence.[7]
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000047346 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000034858 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ a b c d "Gene Cards: FAM214A family with sequence similarity 214, A".
- ^ a b "Protein FAM214A". NCBI. Pristupljeno 2 Feb 2013.
- ^ a b c d "NCBI Conserved Domains".
- ^ a b c "UniProt, Q32MH5". Pristupljeno 14. 7. 2021.
- ^ "Gene Loc Map Region around Gene FAM214a". Gene Cards.
- ^ a b "FAM214A family with sequence similarity 214, A". NCBI.
- ^ "Homo sapiens family with sequence similarity 214, member A (FAM214A), mRNA". NCBI. 17. 4. 2013.
- ^ a b c d "Genomatix: El Dorado". Genomatix.[mrtav link]
- ^ a b "FAM214A Gene Expression from Gene Cards". Gene Cards.
- ^ a b "FAM214A Gene Expression from BioGPS". BioGPS.
- ^ "FAM214A Gene Expression From Expression Atlas". Arhivirano s originala, 16. 6. 2013.
- ^ "The Gene Ontology".
- ^ "The Gene Ontology: Term Associations".[mrtav link]
- ^ a b "Biology Workbench: SAPS".
- ^ Kozlowski, LP (2016). "IPC - Isoelectric Point Calculator". Biology Direct. 11 (1): 55. doi:10.1186/s13062-016-0159-9. PMC 5075173. PMID 27769290. Arhivirano s originala, 29. 4. 2013. Pristupljeno 16. 12. 2016.
- ^ "PSORT II Prediction".
- ^ a b c d "PSORT II NLS". PSORT.
- ^ a b Reinhardt A, Hubbard T (maj 1998). "Using neural networks for prediction of the subcellular location of proteins". Nucleic Acids Research. 26 (9): 2230–6. doi:10.1093/nar/26.9.2230. PMC 147531. PMID 9547285.
- ^ a b c "NetPhos". ExPASy.
- ^ "NetNGlyc". ExPASy.
- ^ "NetOGlyc". ExPASy.
- ^ Fayard E, Tintignac LA, Baudry A, Hemmings BA (decembar 2005). "Protein kinase B/Akt at a glance". Journal of Cell Science. 118 (Pt 24): 5675–8. doi:10.1242/jcs.02724. PMID 16339964.
- ^ a b "NetCorona". ExPASy.
- ^ "Gene Cards MFSD6L". Gene Cards.
- ^ "UniProt MFSD6L". UniProt.
- ^ a b c d e "PHYRE Protein Fold Recognition Server". Arhivirano s originala, 12. 8. 2022. Pristupljeno 14. 7. 2021.
- ^ a b c "Biology Workbench".
- ^ "Gene Cards-Paralogs". Gene Cards.
- ^ a b "NCBI BLAST". NCBI.
- ^ "Conserved Domains FAM214B". NCBI.
- ^ "Gene Cards Orthologs". Gene Cards.
- ^ Hedges, SB; Dudley J; Kumar S (2006). "TimeTree: a public knowledge-base of divergence times among organisms". str. 2971–2972.