Protein FAM46B
Protein FAM46B, znan i kao član B porodice sa sličnošću sekvence 46 jest protein koji je kod ljudi kodiran genom FAM46B sa hromosoma 1.[5] FAM46B sadrži jedan proteinski domen nepoznate funkcije, DUF1693.[6] Dvohibridnim pregledom kvasca identificirana su tri proteina koji su u fizičkoj interakciji sa FAM46B. To su ATX1, PEPP2 (kodirano RHOXF2) i DAZAP2.[7][8]
Protein FAM46B | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | TENT5B | ||||||||||||||||||||||||
Vanjski ID-jevi | MGI: 2140500 HomoloGene: 24928 GeneCards: TENT5B | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 1: 27.01 – 27.01 Mb | Chr 4: 133.21 – 133.22 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Amiokiselininska sekvenca
urediDužina polipeptidnog lanca je 425 aminokiselina, a molekulska težina 46.688 Da.[9]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MMPSESGAER | RDRAAAQVGT | AAATAVATAA | PAGGGPDPEA | LSAFPGRHLS | ||||
GLSWPQVKRL | DALLSEPIPI | HGRGNFPTLS | VQPRQIVQVV | RSTLEEQGLH | ||||
VHSVRLHGSA | ASHVLHPESG | LGYKDLDLVF | RVDLRSEASF | QLTKAVVLAC | ||||
LLDFLPAGVS | RAKITPLTLK | EAYVQKLVKV | CTDSDRWSLI | SLSNKSGKNV | ||||
ELKFVDSVRR | QFEFSIDSFQ | IILDSLLLFG | QCSSTPMSEA | FHPTVTGESL | ||||
YGDFTEALEH | LRHRVIATRS | PEEIRGGGLL | KYCHLLVRGF | RPRPSTDVRA | ||||
LQRYMCSRFF | IDFPDLVEQR | RTLERYLEAH | FGGADAARRY | ACLVTLHRVV | ||||
NESTVCLMNH | ERRQTLDLIA | ALALQALAEQ | GPAATAALAW | RPPGTDGVVP | ||||
ATVNYYVTPV | QPLLAHAYPT | WLPCN |
Gen
urediPregled
urediFAM46B je najčešće ime koje se koristi za gen koji kodira FAM46B. Za opisivanje istog gena također korišteni su i alijasi MGC16491 i RP11-344H11.[7] FAM46B je gen od 7.283 baznih parova koji se nalazi na antisens lancu DNK na kratkom kraku hromosoma 1 na specifičnom lokusu 1p36.11. Budući da se nalazi na antisens lancu, pravac u kojem se transkribuje FAM46B je suprotan standardnom numerisanju nukleotida duž hromosoma. FAM46B počinje na bazi 27,339.333 i završava na 27,331.522.
Program El Dorado preko Genomatixa predviđa da je region promotora dugačak 1.028 baza, obuhvatajući baze od 27,339.962 do 27,338. 935.[10]
Egzonska struktura i varijante prerade
urediGen FAM46B sadrži dva egzona, od kojih se oba nalaze u proteinu FAM46B. Postoji jedna glavna izoforma proteina koja ukazuje da nema alternativne prerade FAM46B iRNK.[11]
Protein
urediFunkcija FAM46B još nije određena. Informacije u nastavku su zasnovane na bioinformatičkim analizama i predviđanjima.
Svojstva
urediLjudski oblik FAM46B sadrži 425 aminokiselinskih ostataka, ima izoelektričnu tačku od 8,093,[12] i molekulsku masu od 46.888 D.[7] FAM46B je topivi protein za koji se predviđa da se nalazi u citosolu.[13][14]
Domeni i motivi
urediFAM46B sadrži samo jedan identificirani domen: domen nepoznate funkcije 1693 (DUF1693). DUF1693 je identificiran kao dio natporodice nukleotidiltransferaza i sadrži četiri proteina slična nematodnom prionu, ali tačna funkcija ostaje nepoznata.[15] SAPS analiza proteina ne predviđa nikakve neobične karakteristike proteina na osnovu sastava aminokiselina, unutrašnjih ponavljanja, klastera naboja ili periodičnosti.[16]
Posttranslacijske modifikacije
urediNije predviđeno da FAM46B sadrži signalnopeptidno mjesto cijepanja,[17] glikofosfatidilinozitolskog (GPI) sidra ili transmembranske regije. Odsustvo signalnog peptida podržava predviđanje da se FAM46B nalazi u citosolu.
Alati u ExPASy korišćeni su za predviđanje mjesta fosforilacija, O-vezane glikozilacije i N-vezane glikozilacije. Iako su dva mjesta u FAM46B predviđena kao potencijalna mjesta N-vezane glikozilacije, FAM46B nema signalni peptid i stoga ne ulazi u lumen endoplazmatskog retikuluma, gdje dolazi do N-vezan glikozilacije. Pet mjesta je identificirano kao moguća O-vezana glikozilacijska mjesta.[18] Označene su u odeljku Konceptna translacija ispod.
Najčešća posttranslacijska modifikacija predviđena u FAM46B je fosforilacija. Program, NetPhos 2.0, predviđa 23 fosforilacijske lokacije. Većina predviđenih fosforilacija je predviđena na serinskim ostacima (14), ali postoji i šest predviđenih na treoninu i tri na tirozinima.[19] Imaju tendenciju da se grupišu zajedno unutar proteinske sekvence. Poređenje predviđenih mjesta fosforilacije kod ljudi, miša i zebrica pokazuje da sve tri vrste imaju približno isti broj i distribuciju mjesta fosforilacije (na serinima naspram treonina naspram trirozina).
Tačna struktura FAM46B nije okarakterizirana. Prediktivni programi dostupni preko Biology Workbench-a[20] kao što su GOR4, PELE, CHOFAS korišteni su za predviđanje sekundarne strukture. Rezultati dobijeni kroz programe na Biology Workbench upoređeni su sa rezultatima dobijenim pomoću Phyre2.[21] Pošto su ovi programi prediktivni i oslanjaju se na različite algoritme, svaki daje malo drugačiji izlaz. Konsenzus između programa sugerira da FAM46B sadrži uglavnom alfa-helikse i nasumične zavojnice. Iako je prisutan, čini se da FAM46B sadrži samo nekoliko malih sekcija za koje se predviđa da će formirati beta-listove. Anotirani rezultati predviđanja sekundarne strukture prema PELE i PHYRE2 prikazani su na donjoj slici.
Konceptna translacija
urediEkspresija
urediEkspresija se može procijeniti na različite načine. I eksprimirane oznake sekvence i GEO profili pokazuju broj transkripata gena prisutnih u određenom tipu tkiva i u odnosu na ukupne transkripte gena. Mikronizoviovi su također korisni u kvantificiranju ekspresije gena. Proteinska in-situ hibridizacija je preciznija mjera ekspresije od metoda zasnovanih na iRNK ili cDNK, jer se sonde mogu spojiti direktno na protein.
Prema nekim dostupnim podacima mikromreža, FAM46B je visoko eksprimiran na jeziku (nivoi 10x iznad prosječne ekspresije gena za tkivo).[22] Izvan jezika, čini se da je FAM46B ujednačeno eksprimiran u većini tkiva. Osim ekspresije gena u zdravim tkivima, EST podaci također naglašavaju ekspresiju gena prema zdravstvenom stanju. Čini se da je ekspresija FAM46B povišena u slučajevima raka kože i glioma.[23]
Homologija
urediParalozi
urediFAM46B ima tri paraloga u Homo sapiens: FAM46A, FAM46C i FAM46D.[7] Višestruka poravnanja sekvenci četiri člana FAM46 pokazuju visoke nivoe konzerviranosti, posebno prema C-terminalu. Konzervirane aminokiseline u sva četiri paraloga ukazuju na ostatke koji čine jezgro porodice FAM46.
Ortolozi
uredi„FAM46B“ je prisutan u zajedničkom pretku životinja i nalazi se samo kod eukariota. Iako se strogi ortolozi "FAM46B" nalaze samo u relativno malom rasponu životinja kao što su insekti i kičmenjaci, ortolozi paraloga FAM46 su identificirani u širem rasponu vrsta. U kičmenjacima, „FAM46B“ je visoko konzervira kod riba, vodozemaca i sisara. Uobičajeni modelni organizmi u kojima je identificiran FAM46B su Danio rerio, Xenopus tropicalis i Mus musculus. Strogi ortolog FAM46B nije pronađen kod gmizavaca ili ptica; međutim i FAM46A i FAM46C paralog nalazi se u ribici Anolis carolinensis, a FAM46C paralog se nalazi kod ptica kao što je Gallus gallus.[6]
Udaljeni homolozi
urediUdaljeni homolozi FAM46B prisutni su u Drosophila i nematodama, kao što je Caenorhabditis elegans. Nema ortologa FAM46B u biljkama, protistima ili gljivama.[24]
Filogenija
urediFilogenetsko stablo FAM46B odražava standardno filogenetsko stablo. Kao što se i očekivalo, sisari su grupirani zajedno s primatima koji su najčvršće grupirani. Udaljeniji homolozi kao što su Drosophila i Caenorhabditis elegans su na lijevoj strani, što predstavlja veću divergenciju između sekvenci gena.
Interakcioni proteini
urediTranskripcijski faktori koji se vezuju za regulatorne sekvence
urediProgram El Dorado preko Genomatixa korišten je za predviđanje ove liste transkripcijskih faktora koji će se vjerovatno vezati za promotorsku regiju FAM46B. Predviđena su brojna E2F mjesta, pored brojnih mjesta faktora transkripcije cinkovog prsta, nekoliko E-kutijskih faktora vezivanja i TWIST homologa. Mjesta vezanja nisu ravnomerno raspoređena unutar regiona promotora. Najveće grupisanje mjesta vezanja nalazi se oko baze 177 promotora, što je oko 600 baznih parova uzvodno od početka transkripcije za FAM46B.[10] Slika ispod prikazuje odabrana mjesta vezivanja faktora transkripcije za dvadeset najboljih poklapanja koje je identificirao El Dorado, a koja se nalaze na antisens lancu.
Potvrđene interakcije protein-protein i mogući klinički značaj
uredidvohibridni skrining kvasaca ukazuje da FAM46B fizički interraguje sa proteinom ataksin-1, koji je kodiran sa lokusa ATXN1.[8] Tačna funkcija ATXN1 nije poznata, ali se smatra da je uključen u regulaciju aspekata proizvodnje proteina, posebno transkripcije. Budući da FAM46B fizički komunicira s ATXN1, moguće je da FAM46B također ima ulogu u regulaciji proizvodnje proteina i regulaciji transkripcije.[25]
Drugi protein koji pokazuje fizičku interakciju sa FAM46B je DAZAP2, protein eksprimiran u mozgu je bogat prolinom.[8] U kombinaciji sa informacijama o ATXN1 iznad, čini se da FAM46B stupa u interakciju sa proteinima specifičnim za mozak. Treći protein identificiran dvohibridnim skriningom kvasca kao fizički interaktant FAM46B je PEPP2,[8] upareni homeoboksni protein. Ako je ova interakcija značajna, interakcija između FAM46B i PEPP2 može imati ulogu u razvoju i morfogenezi.
Međutim, proteinski interaktom još nije dobro shvaćen. Nije svaki program identifikovao proteine u interakciji na isti način. Naprimjer, STRING je identificirao ATXN-1 kao snažnog partnera u interakciji sa FAM46B, ali nije identificirao PEPP2 niti DAZAP2. Mreža predviđanja iz STRING prikazana je na susjednoj slici.
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000158246 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000046694 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "NCBI Gene: FAM46B family with sequence similarity 46, member B". Pristupljeno 23. 4. 2013.
- ^ a b "NCBI BLAST". National Library of Medicine. National Center for Biotechnology Information. Pristupljeno 11. 5. 2013.
- ^ a b c d "family with sequence similarity 46, member B". Pristupljeno 23. 4. 2013.
- ^ a b c d "FAM46B Interaction Summary". BioGRID. Tyers Lab. Pristupljeno 11. 5. 2013.
- ^ "UniProt, Q96A09" (jezik: eng.). Pristupljeno 26. 11. 2021.CS1 održavanje: nepoznati jezik (link)
- ^ a b "Annotation and Analysis". El Dorado. Genomatix. Arhivirano s originala, 2. 12. 2021. Pristupljeno 4. 5. 2013.
- ^ "Homo sapiens family with sequence similarity 46, member B (FAM46B), mRNA". Pristupljeno 23. 4. 2013.
- ^ "Big-PI". IMP Bioinformatics. Arhivirano s originala, 21. 7. 2020. Pristupljeno 11. 5. 2013.
- ^ "SOSUI Prediction". Arhivirano s originala, 20. 3. 2004. Pristupljeno 4. 5. 2013.
- ^ "PSORT II". Pristupljeno 4. 5. 2013.
- ^ "NCB Conserved Domains: DUF1693 Superfamily". Pristupljeno 23. 4. 2013.
- ^ Brendel V, Bucher P, Nourbakhsh IR, Blaisdell BE, Karlin S (mart 1992). "Methods and algorithms for statistical analysis of protein sequences". Proc. Natl. Acad. Sci. U.S.A. 89 (6): 2002–6. Bibcode:1992PNAS...89.2002B. doi:10.1073/pnas.89.6.2002. PMC 48584. PMID 1549558.
- ^ Petersen TN, Brunak S, von Heijne G, Nielsen H (2011). "SignalP 4.0: discriminating signal peptides from transmembrane regions". Nat. Methods. 8 (10): 785–6. doi:10.1038/nmeth.1701. PMID 21959131.
- ^ "NetOGlyc". CBS Prediction Servers. Pristupljeno 11. 5. 2013.
- ^ "NetPhos". CBS Prediction Servers. Pristupljeno 11. 5. 2013.
- ^ "GOR4, CHOFAS, PELE". Protein Tools. San Diego Supercomputer Center. Arhivirano s originala, 11. 8. 2003. Pristupljeno 12. 5. 2013.
- ^ Kelley LA, Sternberg MJ (2009). "Protein structure prediction on the Web: a case study using the Phyre server" (PDF). Nat Protoc. 4 (3): 363–71. doi:10.1038/nprot.2009.2. hdl:10044/1/18157. PMID 19247286. S2CID 12497300.
- ^ "SymAtlas Expression FAM46B". BioGPS. The Scripps Research Institute. Pristupljeno 12. 5. 2013.
- ^ "UniGene Data, FAM46B". EST Profile. National Center for Biotechnology Information. Pristupljeno 12. 5. 2013.
- ^ "family with sequence similarity 46, member B". Pristupljeno 23. 4. 2013.
- ^ "ATXN1 - ataxin 1". Genetic Home Reference, National Library of Medicine. Pristupljeno 11. 5. 2013.