FAM149A
Član A proteina sa sličnošću sekvence 149, znan i kao MSTP119, MST119 i DKFZP564J102, jest protein koji je kod ljudi kodiran genom FAM149A sa hromosoma 4.[5] Dobro je konzerviran u primata, pasa, goveda, miševa, pacova i kokošiju. Ima jedan paralog, FAM149B.
FAM149A | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | FAM149A | ||||||||||||||||||||||||
Vanjski ID-jevi | MGI: 2387177 HomoloGene: 27540 GeneCards: FAM149A | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) |
| ||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 4: 186.1 – 186.18 Mb | Chr 8: 45.79 – 45.84 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Pregled
urediFAM149A se nalazi u normalnom srčanom tkivu ]]Homo sapiens]] i dostavljen je Centru za molekularnu medicinu za kardiovaskularne bolesti 1999. Dakle, ovo ukazuje da mora imati važnu ulogu u normalnoj regulaciji funkcija srca. Međutim, prema Nacionalnom centru za informacije u biotehnologiji (NCBI) nije pronađen nikakav izvještaj o varijacijama ili informacije od kliničkog značaja za ovaj gen. Prema osnovnom alatu za pretraživanje lokalnog poravnanja (BLAST), FAM149A je sličan cDNK-u FLJ32604 (98% pokrivanja upita), koji se nalazi u tkivu želuca i nema poznatu funkciju. FAM149A je također sličan cDNK FLJ58677-a (86% pokrivenosti upita), koji se nalazi u tkivu fetusnog bubrega bez poznate funkcije (informacija prema:
https://www.ncbi.nlm.nih.gov/
Aminokiselinska sekvenca
urediDužina polipeptidnog lanca je 773 aminokiseline, а molekulska težina 82.698 Da.[6]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MKAAVLDLGS | LLAKLFETST | APPAGPSSRP | SGGAAAAGSG | GSRAGTPLGT | ||||
APTLLRALAP | DSPSASRRSP | APLLSSPYSR | GSAASRAAGA | VGTLLSWPSS | ||||
PRAGKAPPQP | PTPSGGGCSP | ARLVVPARPP | SGPGGVWAAL | PRNPLQPGPG | ||||
ERELGACVAP | GAGPRTLFLT | LPDIGEEGAS | DGDSGDGEAR | GLSEGRRRHG | ||||
FTVRSKDSLP | THFTRNVQKA | IDKYTCKSLS | SFSSSGSHTP | TGAHTSWSGS | ||||
ATQSSTTGSS | TERGSVYSWR | DDEFDEASSQ | SVQRLLWEVE | EMLFEGKVNP | ||||
QTQSLLAECG | EWTRRSLHLR | VLGRQLILPT | DKGVQHFQGS | TPASAVHRPP | ||||
LSACGHSSNI | RELCISGSQI | VPAALSASAL | PGPDDTGVAD | LTARSSLEEE | ||||
VYHVDGKIEE | YFAFDRKEDD | DECLEQKPAQ | PGRKWRKLGL | PPVSPRDCVK | ||||
DAVAAEVFDH | VWTNMVELLE | ELIRKHWETT | LTEGKKQRET | LKVAGNRFPH | ||||
VLVPHAHADG | ASGPPSGHAE | AHGISLASRL | NPPQIHHFSS | SFYSDMNGVM | ||||
TIQAKPLQRR | PAYFADRTQN | EKEDKASGGG | AGALSSAPHR | LGRASDTHGL | ||||
SPSAKKTPVP | WRLPSLASDS | QRLKTPNIYS | DEVLRGTKLP | TGVDHMASPL | ||||
VQTSRSRFPP | LVTETRGQNT | AVPGCRLVSY | RGRHLQNRVL | SAMPDGTERS | ||||
RLRERTATLE | RLSRPSTTHT | FRQSDTPRKS | SLTQMEFAAH | TWTGQSILTG | ||||
SQYVPKSFQR | TTLTFKRRFQ | VTS |
Gen
urediFAM149A sastoji se od 2.721 baznog para i 482 aminokiseline i nalazi se na hromosomskoj regiji 4q35.1. Pokreće se na pozitivnom lancu hromosoma 4. Na istom hromosomu, u blizini nalaze se i drugi geni, uključujući TLR3, CYP4V2, FLJ38576, ORAOV1P1 i SORBS2.[7]
Protein
urediPrimarne sekvenca
urediKao što je ranije rečeno, FAM149A se sastoji od 482 aminokiseline. Aminokiseline koje imaju ulogu u translaciji gena FAM149A u protein FAM149A prikazane su ispod, zajedno sa odgovarajućim parovima baza. Protein se nalazi između bp 534. i 1982. bp.
Postoje programi koji se koriste za određivanje posttranslacionih modifikacija u FAM149A.[8] U nastavku, navedeni su testovi i rezultati za svaki.
NetPhos: Određuje predviđena mjesta fosforilacija unutar datog proteina, koja se javljaju na serinima, tirozinima i treoninima. Date su ocjene koje ukazuju na kvalitet predviđene lokacije. „Dobar“ rezultat je bliži 1,0, dok je nizak bliži nuli. Rezultati: Predviđena mesta fosforilacije: Ser: 20 Thr: 16 Tyr: 2 Sve ove predviđene lokacije imale su rezultate iznad 0,514, većina između 0,8 – 0,9. Generirana slika:
Sulfinator: Koristi se za predviđanje mjesta sulfacije tirozina nastalih dok proteini prolaze kroz sekretorni put. Nema rezultata za FAM149A. Stoga ne postoje mjesta za sulfaciju tirozina.
NetAcet: Predviđa mjesta acetilacija N-terminala.
Evo rezultata:
Prema NetAcetu, ne postoje N-terminalne acetilacijske lokacije za FAM149A.
SUMOplot/SUMOsp: Koristi se za predviđanje potencijalnih sumoilacijskih mjesta. Ovo može objasniti veće molekulne težine od očekivanih na SDS gelovima zbog vezivanja SUMO-proteina.
Rezultate je u nastavku:
Sekundarna struktura
urediSekundarna struktura proteina FAM149A temelji se na lokalnoj trodimenzijskoj strukturi. Analizirane strukture uključuju α-heliks, β-lanac, β-list i uprtedenu zavojnicu. Rezultati su dobijeni korištenjem GOR4 i PELE-a[9] iz Biology WorkBench. GOR4 je pojednostavljena verzija, a PELE upoređuje predviđene strukture iz ostalih programa.
Ekspresija
urediNa osnovu grafikona na desnoj strani, najviši nivoi ekspresije javljaju se u trigeminusnoj gangliji, gornjoj vratnoj gangliji, prtetkomorskokomorskom čvoru (srcu) i bubrezima. Međutim, čini se da je barem mala količina izražena u gotovo svim tkivima u ljudskom tijelu. Koristeći iste mikročipove koje pruža Bio GPS,[10] utvrđeno je da ekspresija FAM149A varira kroz opadanje endometrija tokom menstruacije. Ovo otvara novi put za moguće istraživanje funkcije gena.
Pretraga je izvršena na Allenovom Atlasu mozga pomoću FAM149A. Prema nivoima ekspresije koje obezbeđuje Atlas, FAM149A nije eksprimiran u značajnim nivoima u mozgu miša. Međutim, uz vizuelno posmatranje figure, FAM149A može se naći u ventralnom zadnjem kompleksu talamusa. Ovo se može vidjeti kao tamna okomita linija u centru sagitalnog dijela mozga na slici ispod. Kao poređenje, ekspresija proteina, aktina, koristi se da pokaže kako izgleda mišji mozak s visokim nivoom ekspresije.[11]
EST profil
urediPodaci sa donje slike pokazuju da je FAM149A visoko eksprimiran u mozgu, živcima, gušterači, nadbubrežnim žlijezdama i bubrezima. Nema ga u srcu. Prema informacijama u drugoj tabeli, uobičajene komplikacije koje uključuju ekspresiju FAM149A odnose se na tumore nadbubrežne žlijezde, pankreasa, kolorektumske tumore i tumore jajnika.[12]
Varijante transkripcije
urediFAM149A ima dvije varijante transkripcije, varijantu transkripta 1 i varijantu transkripta 2. Obje kodiraju isti protein FAM149A. Razlike uključuju dodatne parove baza u 5' UTR-neprevedenom području, kao i 3' UTR netranslatiranoj regiji. Jedna od dvije razlike u stvarnom translatiranom području proteina je G umjesto A na bp 1.590 u varijanti 1 i bp 1.337. u varijanti 2. Druga razlika se sastoji od C umjesto A na bp 2214. u TV1 i bp 1961. u TV2.
Kompozicija
urediKao što je gore navedeno, FAM149A se sastoji od 482 aminokiseline. Najčešća aminokiselina je serin koja čini 9,8% gena. Najrjeđe aminokiseline su triptofan i cistein, od kojih svaka čini samo 1,2% gena. Jedina ponavljajuća kombinacija aminokiselina u proteinu je SLAS koja se javlja od aminokiselina 234–237 i od 324–327. Osim toga, Izoelektrična tačka FAM149A je 9,891999.[13]
Promotor
urediSlijede promotori gena FAM149A koje je obezbijedio ElDorado [14] and the sequence extracted from the information.
Segment | Startna lokacija | Stop-lokacija | Lanac | Dužina | Broj reference | Informacija |
---|---|---|---|---|---|---|
Promotorska regija | 187065495 | 187066181 | + | 687 bp | GXP_210035 | Promotor za GXT_23739713, GXT_23739714, GXT_2803949
Locus: FAM149A/GXL_175098 |
Primarni transkript | 187065995 | 187093817 | + | 27283 bp | GXT_2803949, GXL_175098 | FAM149A
Homo sapiens, član A porodicw proteina sa sličnošću sekvence 149 (FAM149A), transkriptna varijanta 1, iRNK GeneID:25854/NM_015398 |
Slijedi formatirana verzija FAM149A promotora FASTA.
Homologija/evolucija
urediParalozi i ortolozi
urediFAM149A ima jedan glavni paralog, FAM149B. Još se ne zna mnogo o FAM149B, osim njegovog članstva u cjelokupnoj porodici gena FAM149.
Ortolozi FAM149A uključuju BRTD i njegove četiri izoforme, ECCHC11 i ALMS1. Svi ovi geni se nalaze kod ljudi i imaju konzervirana područja sa FAM149A.
Vrsta | Uobičajenio ime | Pristupni broj | Dužina | Identitet proteina | Sličnost proteina | Datiranje divergencije (milioni godina) | |
---|---|---|---|---|---|---|---|
Homo sapiens | Čovjek | NP_001073963.1 | 482aa | 100% | 100% | 0 | |
Pongo abelii | Orangutan | XP_002815398.2 | 481aa | 93,2% | 95,0% | 15,7 | |
Nomascus leucogenys | Sjeverni bjeloobrazni gibon | XP_004093218.1 | 482aa | 92,7% | 95,0% | 20,4 | |
Equus ferus caballus | Konj | XP_001490414.3 | 480aa | 72,0% | 81,0% | 94,2 | |
Taeniopygia guttata | Zebrasta zeba | XP_002193183 | 485aa | 46,0% | 62,0% | 296 | |
Monodelphis domestica | Oposum | XP_001368447.2 | 1133aa | 19.5% | 61.0% | 162.6 | |
Xenopus tropicalis | Zapadna kandžasta žaba | XP_002934449 | 427aa | 22,0% | 65,0% | 371,2 |
Konzervirani domen
urediFAM149A ima konzervirani domen nepoznate funkcije (DUF) 3719. O DUF 3719 ima vrlo malo informacija. Nalazi se samo u eukariotskim organizmima i sastoji se od 70 aminokiselina. Postoji konzerviani motiv HLR sekvence pronađen u DUF 3719. Ispod je slika koja prikazuje DUF3719 na FAM149A.
Iz Instituta Sanger, sljedeća slika prikazuje vrste u kojoj ova porodica postoji. Ljubičasta boja ukazuje da DUF3719 postoji samo u eukariotskim organizmima. Boje, poput zelene, ukazuju na to da DUF3719 postoji i u bakterijama. Kada se ovaj dijagram interaktivno koristi na web stranici, navodi da 23 vrste u eukariota imaju ovaj domen.[15]
Filogenija
urediFAM149A se odvojio u periodu vladavine vodozemaca, prije oko 400 miliona godina, ptica prije 300 miliona godina i sisara, ne uključujući primate, prije 94 miliona godina. Divergiranje od primata posljednji put se dogodilo prije oko 5 miliona godina.[16]
Konzervacija strukture gena među vrstama
urediPreko NCBI web stranice, dodatnih 1.000 baznih parova je dodano odabranoj regiji na hromosomu 4 koji sadrži FAM149A. Nakon što su početna i krajnja pozicija uspostavljene, prebačene su u ECR pretraživač kako bi se stvorilo poravnanje među drugim vrstama.
Prema raspoloživim rezultatima, unutar FAM149A postoji 14 egzona koji su konzervirani kod majmuna, pasa, miševa i oposuma. Kokoš, žaba i riba pokazuju malo ili nimalo konzerviranja. Unutar prvih 1.000 parova baza prije početka transkripcije, čini se da nema značajne konzervacije među vrstama. Samo pas sadrži ono što se smatra evolucijski konzerviranim regionom (ECR).[17]
Interaktivni proteini
urediVezna mjesta faktora transkripcije
urediSlijedi analiza promotorske regije za FAM149A. Pokazuje niz transkripcija mjesta vezanja faktora koja mogu imati snažan doprinos regulaciji ekspresije gena. Na slici ispod prikazane su lokacije mjesta vezanja. Ta mjesta analizirana su kako bi se pronašle sve moguće jedinstvene funkcije.
Bilo je mnogo rezultata, ali su odabrani oni sa najvećom sličnošću i najvećom zastupljenošću, jer je najvjerovatnije da će biti prisutni na stvarnom genu. Porodice matriksa od interesa uključuju regulatornu regiju gena za Huntingtonovu bolest, nervni faktor rasta, jedarni respiratorni faktor, gen pleomorfnog adenoma, faktore transkripcije cinkovog prsta i E2F-myc aktivator/regulator ćelijskog ciklusa. Mnogi od njih su imali interakcije okretanja kompleksa cinkovih prstiju, što sugerira da bi to moglo biti važno za FAM149A.[18]
Interaktivni proteini
urediFAM149A has potential interactions with ZNF385D, C10orf10, PNMAL1, CPN2, C10orf72, VPS13D, and RBMS3.[19] Na osnovu prethodnih istraživanja o mjestima vezivanja, mnogi su često sugerirali da su uključeni u proteine cinkovih prstiju. Prema rezultatima STRING, drugi najjači asocirajući protein je protein cinkovog prsta 385D. Međutim, ne može se zaključiti da su to jedini proteini koji djeluju u interakciji, jer se čini da postoji malo istraživanja koja uključuju interakcije FAM149A-a. Baza podataka o molekulnoj interakciji (MINT) korištena je kao dodatni izvor za proteinske interakcije. Međutim, FAM149A nije bio u bazi podataka. Na osnovu liste funkcionalnih partnera prema STRING-u, prvih pet također nema u bazi podataka MINT. Druga baza podataka interakcija, I2D Protein-Protein Interaction[20] pokazala moguću interakciju sa proteinom PRKAG1, ali interakcija je bila slaba.
Ispod je lista proteina koji potencijalno stupaju u interakciju sa FAM149A.
Klinički značaj
urediPridružene bolesti
urediIako nije u potpunosti povezan, FAM149A je jedan od 15 gena kandidata za doprinos razvoju raka i displazijskih lezija.[21] Isti rad je takođe zabilježio smanjenje regulacije gena tokom oralnog karcinoma, pružajući mogući put istraživanja.
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000109794 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000070044 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ Xu X, Tsumagari K, Sowden J, Tawil R, Boyle AP, Song L, Furey TS, Crawford GE, Ehrlich M (decembar 2009). "DNaseI hypersensitivity at gene-poor, FSH dystrophy-linked 4q35.2". Nucleic Acids Res. 37 (22): 7381–93. doi:10.1093/nar/gkp833. PMC 2794184. PMID 19820107.
- ^ "UniProt, A5PLN7" (jezik: engleski). Pristupljeno 26. 10. 2021.
- ^ "FAM149A, family with sequence similarity 149, member A [Homo sapiens (Human)]". Gene - NCBI.
- ^ "ExPASy: SIB Bioinformatics Resource Portal - Categories". SIB Swiss Institute of Bioinformatics.
- ^ "FAM149A Secondary Structure". GOR4 and PELE - Biology WorkBench. Arhivirano s originala, 11. 8. 2003. Pristupljeno 26. 10. 2021.
- ^ "BioGPS". Pristupljeno 14. 5. 2013.
- ^ "FAM149A Expression". Allen Brain Atlas.
- ^ "FAM149A EST Profile". EST Profile from UniGene via NCBI.
- ^ "PI". Biology Workbench. San Diego Supercomputer Center. Arhivirano s originala, 11. 8. 2003. Pristupljeno 26. 10. 2021.
- ^ "ElDorado". Genomatix. Arhivirano s originala, 2. 12. 2021. Pristupljeno 30. 4. 2013.
- ^ "DUF3719". Species Distribution from Sanger Institute. Arhivirano s originala, 6. 5. 2011.
- ^ "Clustal W". San Diego Super Computer Center. Arhivirano s originala, 11. 8. 2003. Pristupljeno 5. 3. 2013.
- ^ Ovcharenko I, Nobrega MA, Loots GG, Stubbs L (juli 2004). "ECR Browser: a tool for visualizing and accessing data from comparisons of multiple vertebrate genomes". Nucleic Acids Res. 32 (Web Server issue): W280–6. doi:10.1093/nar/gkh355. PMC 441493. PMID 15215395.
- ^ "GEMS Launcher: MatInspector: Search for transcription factor binding sites via Genomatix Software". Genomatix Software. Arhivirano s originala, 2. 12. 2021. Pristupljeno 26. 10. 2021.
- ^ "FAM149A protein (Homo sapiens) – STRING network view".
- ^ "I2D Protein Interactions". Arhivirano s originala, 4. 5. 2013. Pristupljeno 30. 4. 2013.
- ^ Sumino J, Uzawa N, Okada N, Miyaguchi K, Mogushi K, Takahashi K, Sato H, Michikawa C, Nakata Y, Tanaka H, Amagasa T (februar 2013). "Gene expression changes in initiation and progression of oral squamous cell carcinomas revealed by laser microdissection and oligonucleotide microarray analysis". Int. J. Cancer. 132 (3): 540–8. doi:10.1002/ijc.27702. PMID 22740306. S2CID 8895382.