UPF0172 protein FAM158A, znan i kao c14orf122 ili CGI112, je protein koji je kod ljudi kodiran genom FAM158A lociranom na hromosomu 14, sekvenca q11.2.[5][6]

Fam158a
Identifikatori
AliasiEMC9
Vanjski ID-jeviMGI: 1934682 HomoloGene: 41095 GeneCards: EMC9
Lokacija gena (čovjek)
Hromosom 14 (čovjek)
Hrom.Hromosom 14 (čovjek)[1]
Hromosom 14 (čovjek)
Genomska lokacija za Fam158a
Genomska lokacija za Fam158a
Bend14q12Početak24,138,959 bp[1]
Kraj24,141,591 bp[1]
Lokacija gena (miš)
Hromosom 14 (miš)
Hrom.Hromosom 14 (miš)[2]
Hromosom 14 (miš)
Genomska lokacija za Fam158a
Genomska lokacija za Fam158a
Bend14|14 C3Početak55,818,973 bp[2]
Kraj55,822,759 bp[2]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_001346874
NM_001346875
NM_001346876
NM_001346877
NM_016049

NM_033146

RefSeq (bjelančevina)

NP_001333803
NP_001333804
NP_001333805
NP_001333806
NP_057133

NP_149158

Lokacija (UCSC)Chr 14: 24.14 – 24.14 MbChr 14: 55.82 – 55.82 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Ljudski FAM158A i njegovi paralozi u drugim vrstama dio su noekarakterizirane porodice proteina UPF0172, koja je podskup JAB1/Mov34/MPN/PAD-1, porodica proteina ubikvitin-proteaza. MPN superporodica doprinosi ubikvitinaciji i deubikvitinacijskoj aktivnosti unutar ćelije. Podskup UPF0172 više nema funkcionalni domen sveprisutnosti i neokarakterizirane funkcije.[7]

Aminokiselinska sekvenca

uredi

Dužina polipeptidnog lanca je 208 aminokiselina, a molekulska težina 23.061 Da.[8].

1020304050
MGEVEISALAYVKMCLHAARYPHAAVNGLFLAPAPRSGECLCLTDCVPLF
HSHLALSVMLEVALNQVDVWGAQAGLVVAGYYHANAAVNDQSPGPLALKI
AGRIAEFFPDAVLIMLDNQKLVPQPRVPPVIVLENQGLRWVPKDKNLVMW
RDWEESRQMVGALLEDRAHQHLVDFDCHLDDIRQDWTNQRLNTQITQWVG
PTNGNGNA
Simboli

Fam158a nalazi se između PSME1 (antisens) i smislenog PSME2.RNF31 je uzvodno i antisense do Fam158a. DCAF11 i FITM1 su oba uzvodno od PSME1 antisens do Fam158a. PSME1 je podjedinica regulatora 11S, koji je dio imunoproteasoma odgovornog za cijepanje peptida MHC klase I. PSME2 je još jedna podjedinica 11S regulatora. RNF31 kodira protein koji sadrži motiv RING cinkovog prsta, koji se nalazi u nekoliko proteina koji posreduju u interakcijama protein-DNK i protein-proteina. FITM1 je protein uključen u skladištenje masti. DCAF11 je protein za koji je poznato da stupa u interakciju sa COP9 i ima nekoliko alternativnih transkriptata.

Promotor

uredi

Promotor je konzerviran još od Danio rerio. Softberry FGenesH predviđa dva uzvodna promotora, TATA-boksa 461bp uzvodno od početnog mjesta i još jednog neokarakteriziranog uzvodnog promotora od 83bp. Genomatix ElDorado predviđa nekoliko faktora transkrpcije mjesta vezanja u promoterskoj regiji.[9] utvrdio je da se ekspresija Fam158a povećava kod mutanata GATA3, a kao što se vidi u tabeli, promotorska regija Fam158a sadrži mjesto vezanja Gata. Druga studija pokazuje da FAM158A reaguje na iscrpljivanje Beta-katenina.[10] Iako u promotoru nisu poznata mjesta vezivanja beta-katenina, postoji NeuroD mjesto i NeuroD reagira na beta-katenin.

Funkcija

uredi

Fam158a gotovo je sveprisutan u čitavom ljudskom tijelu.[11] Homolog kod miševa također ima ekspresiju u cijelom tijelu.[12] Nekoliko mikro-nizova pokazuje varijabilnu ekspresiju Fam158a, kao odgovor na druge faktore i kod različitih tipova karcinoma. Nijedna od ovih informacija ne daje naznake specifične funkcije, ali široka ekspresija gena i njegova visoka konzerviranost ukazuju da Fam158a ima važnu ulogu u ćelijskoj funkciji.

Homologija

uredi

Paralozi

uredi
Naziv Vrsta Uobičajeno ime Broj pristupa NCBI-u Dužina Identitet proteina
Fam158a Homo sapiens Čovjek NP_057133.2 208aa 100%
Cox4NB Homo sapiens Čovjek O43402.1 210aa 41.6%

Paralog FAM158A-a poznat je kao Cox4NB i nalazi se na poziciji 16q24.[13] Također se naziva i Cox4AL, Noc4 i Fam158b. Paralog se djelimično preklapa COX4I1 i ima dvije izoforme. Izoforma 1 je potpuna izoforma sa 210 aminokiselina, dok je izoforma 2.126-aminokiselinska.[14] Poput Fam158a, Cox4NB je visoko konzerviran u eukariota, od sisara pa sve do riba. Još nije poznata funkcija Cox4NB. U većine riba i dalje unatrag postoji jedan homolog, prekursor Cox4NB i Fam158a.

Homolozi

uredi
Vrsta Uobičajeno ime Pristupni broj u bazu NCBI (iRNK/Protein) Dužina (broj aminokiselina) Identitet proteina Identitet iRNK Napomena
Homo sapiens Čovjek NM_16049.3 / NP_057133.2 896bp/208aa 100% 100%
Pan troglodytes Čimpanza XM_001167788.2 / XP_001167788.1 842bp/208aa 99.5% 98.7% Identity based on SDSC alignment [15]
Mus musculus Miš NM_033146.1[mrtav link] / NP_149158.1 805bp/206aa 90,4% 77,7%
Xenopus (Silurona) tropicalis Zapadna kandžasta žaba XM_002939019.1 / XP_002939065.1 1182bp/205aa 49,8% 40,4%
Xenopus laevis Afrička kandžasta žab NM_001096278.1/ NP_001089747.1 750bp/206aa 49,8% 51,9% U iRNK nedostaje 5' UTR
Danio rerio Zebrica NM_200126.1 / NP_956420.1 962bp/205aa 51,4% 46,3%
Bombus impatiens Istočna pčela zunzara XM_003489887.1 / XP_003489935.1 846bp/207aa 35,8% 41,1% U uRNK nedostaje 5' UTR
Volvox carteri f. nagariensis Zelena alga XM_002953071.1 / XP_002953117.1 1677bp/222aa 29,3% 34,8%
Salicornia bigelovii Patuljasta slanica DQ444286.1 / ABD97881.1 870bp/198aa 31,3% 47,5%
Arabidopsis thaliana Grbaštica NM_124976.3 / NP_568832.1 1039bp/208aa 29,1% 44,7%
Physcomitrella patens patens Mahovina XM_001763974 / XP_001764026.1 609bp/202aa 30,9% 49,2% mRNA missing 5' UTR
Serpula lacrymans S7.3 Tip kvasca Basidiomycetes, bez uobičajenog imena GL945481.1 / EGN98368.1 203aa 30,3% Redoslijed iRNK slučajnih pogodaka, nema podataka o iRNK
Capsaspora owczarzaki Protist bez uobičajenog imena GG697244.1 / EFW44366.1 202aa 31,2% Redoslijed iRNK slučajnih pogodaka, nema podataka o iRNK
Plasmodium knowlesi soj H Plazmodij koji izaziva malariju, bez uobičajenog imena XM_002259366.1 / XP_002259402.1 609bp/202aa 24,7% 45,9% U iRNK nedostaje 5' UTR

Kao što je prikazano u poravnavanju, protein je hemijski vrlo konzerviran, iako tačna sekvenca varira. Postoji nekoliko regija visoke konzerviranosti (istaknuti crvenim okvirima). Stepen konzerviranosti slijedi očekivani evolucijski obrazac. Grafikon to pokazuje prikupljanjem sličnosti proteina svake vrste s ljudskim proteinima, u odnosu na vrijeme otkad vrsta dijeli zajedničkog pretka. Neukorijenjeno filogenetsko stablo takođe pokazuje ovu vezu.

Protein

uredi

Fam158a ima izoelektričnu tačku 5,5[16] i molekulsku težinu od 23 kilodaltona.[17] Fam158a nema nijedan predviđeni signalni peptid ili transmembransku regiju. Postoji nekoliko predviđenih mjesta fosforilacije.[18][19] označenih u konceptnoj translaciji, kao i predviđena sekundarna struktura.[20] Ne postoje regije koje se bitno razlikuju od ostalih ljudskih proteina s obzirom na sastav, područja polarnosti ili regije hidrofobnosti. iPsortII ne predviđa signalne peptide i lokalizira Fam158a na citoplazmi-[21] I-Tassera[22] predviđa nekoliko struktura za Fam158a i prikazano je najbolje predviđanje. Swiss Model[23] predviđa dvije potencijalne proteinske strukture. Prva struktura predviđa da protein stvara proteinski dimer, druga kao monomer. Rual et al.[24] otkrili su da Fam158a stupa u interakciju s proteinom zvanim TTC35. Funkcija TTC35 je nepoznata, ali je također poznato da komunicira s Cox4NB i ubikvitinom C.

Klinički značaj

uredi

Postoji nekoliko bolesti povezanih s delecijom 14q11.2, ali nijedna nije posebno povezana s Fam158a. T-limfocitna leukemija sa ili bez ataxia telangiectasia povezana je s inverzijama i tandemskim translokacijama 14q11 i 14q32 i drugih hromosoma.[25] Također, sindaktilija tip 2 izolirana je do 14q11.2-12.[26] Ovaj oblik sindaktilije karakterizira fuzija treće i četvrtog prsta šake i četvrtog i petog stopala, uz druge fuzije i malformacije.

Reference

uredi
  1. ^ a b c ENSG00000285377 GRCh38: Ensembl release 89: ENSG00000100908, ENSG00000285377 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000022217 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ GeneCard za fam158a
  6. ^ HomoloGene41095
  7. ^ "NCBI CDD cd08060". Conserved Domain Database. National Center for Biotechnology Information.Marchler-Bauer A, Anderson JB, Chitsaz F, Derbyshire MK, DeWeese-Scott C, Fong JH, Geer LY, Geer RC, Gonzales NR, Gwadz M, He S, Hurwitz DI, Jackson JD, Ke Z, Lanczycki CJ, Liebert CA, Liu C, Lu F, Lu S, Marchler GH, Mullokandov M, Song JS, Tasneem A, Thanki N, Yamashita RA, Zhang D, Zhang N, Bryant SH (januar 2009). "CDD: specific functional annotation with the Conserved Domain Database". Nucleic Acids Res. 37 (Database issue): D205–10. doi:10.1093/nar/gkn845. PMC 2686570. PMID 18984618.
  8. ^ "UniProt, Q9Y3B6". Pristupljeno 24. 7. 2021.
  9. ^ Usary J, Llaca V, Karaca G, Presswala S, Karaca M, He X, Langerød A, Kåresen R, Oh DS, Dressler LG, Lønning PE, Strausberg RL, Chanock S, Børresen-Dale AL, Perou CM (oktobar 2004). "Mutation of GATA3 in human breast tumors". Oncogene. 23 (46): 7669–78. doi:10.1038/sj.onc.1207966. PMID 15361840.
  10. ^ Dutta-Simmons J, Zhang Y, Gorgun G, Gatt M, Mani M, Hideshima T, Takada K, Carlson NE, Carrasco DE, Tai YT, Raje N, Letai AG, Anderson KC, Carrasco DR (septembar 2009). "Aurora kinase A is a target of Wnt/beta-catenin involved in multiple myeloma disease progression". Blood. 114 (13): 2699–708. doi:10.1182/blood-2008-12-194290. PMID 19652203.
  11. ^ "EST Profile - Hs.271614". EST Profile Viewer. National Center for Biotechnology Information (NCBI).
  12. ^ "GENEPAINT Set ID: EH1992". GenePaint.org. digital atlas of gene expression patterns in the mouse[mrtav link]
  13. ^ Bachman NJ, Wu W, Schmidt TR, Grossman LI, Lomax MI (maj 1999). "The 5' region of the COX4 gene contains a novel overlapping gene, NOC4" (PDF). Mamm. Genome. 10 (5): 506–12. doi:10.1007/s003359901031. hdl:2027.42/42117. PMID 10337626.
  14. ^ NCBI. "Homo sapiens COX4 neighbor (COX4NB), transcript variant 1, mRNA - Nucleotide". NCBI Reference Sequence: NM_006067.4. National Center for Biotechnology Information.
  15. ^ Thompson JD, Higgins DG, Gibson TJ (novembar 1994). "CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice". Nucleic Acids Res. 22 (22): 4673–80. doi:10.1093/nar/22.22.4673. PMC 308517. PMID 7984417.
  16. ^ Toldo L, Kindler B. "EMBL WWW Gateway to Isoelectric Point Service". EMBL Heidelberg. Arhivirano s originala, 12. 2. 2012. Pristupljeno 24. 7. 2021.
  17. ^ Brendel V, Bucher P, Nourbakhsh IR, Blaisdell BE, Karlin S (mart 1992). "Methods and algorithms for statistical analysis of protein sequences". Proc. Natl. Acad. Sci. U.S.A. 89 (6): 2002–6. doi:10.1073/pnas.89.6.2002. PMC 48584. PMID 1549558.
  18. ^ Blom N, Gammeltoft S, Brunak S (decembar 1999). "Sequence and structure-based prediction of eukaryotic protein phosphorylation sites". J. Mol. Biol. 294 (5): 1351–62. doi:10.1006/jmbi.1999.3310. PMID 10600390.
  19. ^ Blom N, Sicheritz-Pontén T, Gupta R, Gammeltoft S, Brunak S (juni 2004). "Prediction of post-translational glycosylation and phosphorylation of proteins from the amino acid sequence". Proteomics. 4 (6): 1633–49. doi:10.1002/pmic.200300771. PMID 15174133.
  20. ^ Qian N, Sejnowski TJ (august 1988). "Predicting the secondary structure of globular proteins using neural network models". J. Mol. Biol. 202 (4): 865–84. doi:10.1016/0022-2836(88)90564-5. PMID 3172241. Joint prediction - Prediction made by the program that assigns the structure using a "winner takes all" procedure for each amino acid prediction using the other methods
  21. ^ Bannai H, Tamada Y, Maruyama O, Nakai K, Miyano S (februar 2002). "Extensive feature detection of N-terminal protein sorting signals". Bioinformatics. 18 (2): 298–305. doi:10.1093/bioinformatics/18.2.298. PMID 11847077.
  22. ^ Ambrish Roy, Alper Kucukural, Yang Zhang. I-TASSER: a unified platform for automated protein structure and function prediction. Nature Protocols, vol 5, 725-738 (2010)
  23. ^ Arnold K, Bordoli L, Kopp J, Schwede T (januar 2006). "The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling". Bioinformatics. 22 (2): 195–201. doi:10.1093/bioinformatics/bti770. PMID 16301204.
  24. ^ Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, Berriz GF, Gibbons FD, Dreze M, Ayivi-Guedehoussou N, Klitgord N, Simon C, Boxem M, Milstein S, Rosenberg J, Goldberg DS, Zhang LV, Wong SL, Franklin G, Li S, Albala JS, Lim J, Fraughton C, Llamosas E, Cevik S, Bex C, Lamesch P, Sikorski RS, Vandenhaute J, Zoghbi HY, Smolyar A, Bosak S, Sequerra R, Doucette-Stamm L, Cusick ME, Hill DE, Roth FP, Vidal M (oktobar 2005). "Towards a proteome-scale map of the human protein-protein interaction network". Nature. 437 (7062): 1173–8. doi:10.1038/nature04209. PMID 16189514.
  25. ^ Brito-Babapulle V, Catovsky D (august 1991). "Inversions and tandem translocations involving chromosome 14q11 and 14q32 in T-prolymphocytic leukemia and T-cell leukemias in patients with ataxia telangiectasia". Cancer Genet. Cytogenet. 55 (1): 1–9. doi:10.1016/0165-4608(91)90228-M. PMID 1913594.
  26. ^ Malik S, Abbasi AA, Ansar M, Ahmad W, Koch MC, Grzeschik KH (juni 2006). "Genetic heterogeneity of synpolydactyly: a novel locus SPD3 maps to chromosome 14q11.2-q12". Clin. Genet. 69 (6): 518–24. doi:10.1111/j.1399-0004.2006.00620.x. PMID 16712704.