Član A proteina sa sličnošću sekvence 149, znan i kao MSTP119, MST119 i DKFZP564J102, jest protein koji je kod ljudi kodiran genom FAM149A sa hromosoma 4.[5] Dobro je konzerviran u primata, pasa, goveda, miševa, pacova i kokošiju. Ima jedan paralog, FAM149B.

FAM149A
Identifikatori
AliasiFAM149A
Vanjski ID-jeviMGI: 2387177 HomoloGene: 27540 GeneCards: FAM149A
Lokacija gena (čovjek)
Hromosom 4 (čovjek)
Hrom.Hromosom 4 (čovjek)[1]
Hromosom 4 (čovjek)
Genomska lokacija za FAM149A
Genomska lokacija za FAM149A
Bend4q35.1Početak186,104,419 bp[1]
Kraj186,175,337 bp[1]
Lokacija gena (miš)
Hromosom 8 (miš)
Hrom.Hromosom 8 (miš)[2]
Hromosom 8 (miš)
Genomska lokacija za FAM149A
Genomska lokacija za FAM149A
Bend8|8 B1.1Početak45,789,754 bp[2]
Kraj45,835,328 bp[2]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)
NM_001006655
NM_015398
NM_001350178
NM_001350179
NM_001367768

NM_001395294

NM_153535

RefSeq (bjelančevina)

NP_001006656
NP_056213
NP_001337107
NP_001337108
NP_001354697

NP_705763

Lokacija (UCSC)Chr 4: 186.1 – 186.18 MbChr 8: 45.79 – 45.84 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Pregled

uredi

FAM149A se nalazi u normalnom srčanom tkivu ]]Homo sapiens]] i dostavljen je Centru za molekularnu medicinu za kardiovaskularne bolesti 1999. Dakle, ovo ukazuje da mora imati važnu ulogu u normalnoj regulaciji funkcija srca. Međutim, prema Nacionalnom centru za informacije u biotehnologiji (NCBI) nije pronađen nikakav izvještaj o varijacijama ili informacije od kliničkog značaja za ovaj gen. Prema osnovnom alatu za pretraživanje lokalnog poravnanja (BLAST), FAM149A je sličan cDNK-u FLJ32604 (98% pokrivanja upita), koji se nalazi u tkivu želuca i nema poznatu funkciju. FAM149A je također sličan cDNK FLJ58677-a (86% pokrivenosti upita), koji se nalazi u tkivu fetusnog bubrega bez poznate funkcije (informacija prema:
https://www.ncbi.nlm.nih.gov/

Aminokiselinska sekvenca

uredi

Dužina polipeptidnog lanca je 773 aminokiseline, а molekulska težina 82.698 Da.[6]

1020304050
MKAAVLDLGSLLAKLFETSTAPPAGPSSRPSGGAAAAGSGGSRAGTPLGT
APTLLRALAPDSPSASRRSPAPLLSSPYSRGSAASRAAGAVGTLLSWPSS
PRAGKAPPQPPTPSGGGCSPARLVVPARPPSGPGGVWAALPRNPLQPGPG
ERELGACVAPGAGPRTLFLTLPDIGEEGASDGDSGDGEARGLSEGRRRHG
FTVRSKDSLPTHFTRNVQKAIDKYTCKSLSSFSSSGSHTPTGAHTSWSGS
ATQSSTTGSSTERGSVYSWRDDEFDEASSQSVQRLLWEVEEMLFEGKVNP
QTQSLLAECGEWTRRSLHLRVLGRQLILPTDKGVQHFQGSTPASAVHRPP
LSACGHSSNIRELCISGSQIVPAALSASALPGPDDTGVADLTARSSLEEE
VYHVDGKIEEYFAFDRKEDDDECLEQKPAQPGRKWRKLGLPPVSPRDCVK
DAVAAEVFDHVWTNMVELLEELIRKHWETTLTEGKKQRETLKVAGNRFPH
VLVPHAHADGASGPPSGHAEAHGISLASRLNPPQIHHFSSSFYSDMNGVM
TIQAKPLQRRPAYFADRTQNEKEDKASGGGAGALSSAPHRLGRASDTHGL
SPSAKKTPVPWRLPSLASDSQRLKTPNIYSDEVLRGTKLPTGVDHMASPL
VQTSRSRFPPLVTETRGQNTAVPGCRLVSYRGRHLQNRVLSAMPDGTERS
RLRERTATLERLSRPSTTHTFRQSDTPRKSSLTQMEFAAHTWTGQSILTG
SQYVPKSFQRTTLTFKRRFQVTS

FAM149A sastoji se od 2.721 baznog para i 482 aminokiseline i nalazi se na hromosomskoj regiji 4q35.1. Pokreće se na pozitivnom lancu hromosoma 4. Na istom hromosomu, u blizini nalaze se i drugi geni, uključujući TLR3, CYP4V2, FLJ38576, ORAOV1P1 i SORBS2.[7]  

Protein

uredi

Primarne sekvenca

uredi

Kao što je ranije rečeno, FAM149A se sastoji od 482 aminokiseline. Aminokiseline koje imaju ulogu u translaciji gena FAM149A u protein FAM149A prikazane su ispod, zajedno sa odgovarajućim parovima baza. Protein se nalazi između bp 534. i 1982. bp.

Datoteka:Protein Structure without comments.jpg
Aminokiseline koje grade protein kojeg proizvodi gen FAM149A.

Postoje programi koji se koriste za određivanje posttranslacionih modifikacija u FAM149A.[8] U nastavku, navedeni su testovi i rezultati za svaki.

NetPhos: Određuje predviđena mjesta fosforilacija unutar datog proteina, koja se javljaju na serinima, tirozinima i treoninima. Date su ocjene koje ukazuju na kvalitet predviđene lokacije. „Dobar“ rezultat je bliži 1,0, dok je nizak bliži nuli. Rezultati: Predviđena mesta fosforilacije: Ser: 20 Thr: 16 Tyr: 2 Sve ove predviđene lokacije imale su rezultate iznad 0,514, većina između 0,8 – 0,9. Generirana slika:

 
Rezultati FAM149A iz NetPhos

Sulfinator: Koristi se za predviđanje mjesta sulfacije tirozina nastalih dok proteini prolaze kroz sekretorni put. Nema rezultata za FAM149A. Stoga ne postoje mjesta za sulfaciju tirozina.

NetAcet: Predviđa mjesta acetilacija N-terminala.
Evo rezultata:

 
Rezultati FAM149A iz NetAcet

Prema NetAcetu, ne postoje N-terminalne acetilacijske lokacije za FAM149A.

SUMOplot/SUMOsp: Koristi se za predviđanje potencijalnih sumoilacijskih mjesta. Ovo može objasniti veće molekulne težine od očekivanih na SDS gelovima zbog vezivanja SUMO-proteina.

Rezultate je u nastavku:

 
Rezultati FAM149A-a u SUMOplot

Sekundarna struktura

uredi

Sekundarna struktura proteina FAM149A temelji se na lokalnoj trodimenzijskoj strukturi. Analizirane strukture uključuju α-heliks, β-lanac, β-list i uprtedenu zavojnicu. Rezultati su dobijeni korištenjem GOR4 i PELE-a[9] iz Biology WorkBench. GOR4 je pojednostavljena verzija, a PELE upoređuje predviđene strukture iz ostalih programa.

 
 
Sekundarna struktura FAM149A od GOR4-a, preko Biology WorkBench 1.
 
Sekundarna struktura FAM149A od GOR4-a, preko Biology WorkBench 2.

Ekspresija

uredi

Na osnovu grafikona na desnoj strani, najviši nivoi ekspresije javljaju se u trigeminusnoj gangliji, gornjoj vratnoj gangliji, prtetkomorskokomorskom čvoru (srcu) i bubrezima. Međutim, čini se da je barem mala količina izražena u gotovo svim tkivima u ljudskom tijelu. Koristeći iste mikročipove koje pruža Bio GPS,[10] utvrđeno je da ekspresija FAM149A varira kroz opadanje endometrija tokom menstruacije. Ovo otvara novi put za moguće istraživanje funkcije gena.

 
FAM149A-ekspresija 1
 
FAM149A-ekspresija 2
 
FAM149A-ekspresija 3

Pretraga je izvršena na Allenovom Atlasu mozga pomoću FAM149A. Prema nivoima ekspresije koje obezbeđuje Atlas, FAM149A nije eksprimiran u značajnim nivoima u mozgu miša. Međutim, uz vizuelno posmatranje figure, FAM149A može se naći u ventralnom zadnjem kompleksu talamusa. Ovo se može vidjeti kao tamna okomita linija u centru sagitalnog dijela mozga na slici ispod. Kao poređenje, ekspresija proteina, aktina, koristi se da pokaže kako izgleda mišji mozak s visokim nivoom ekspresije.[11]

 
Ekspresija proteina FAM149A u mišjem mozgu
 
Primjer ekspresije proteina aktin-beta u mozgu miša
 
Nivoi ekspresije proteina FAM149A u mozgu miša
 
Primjer ekspresije proteina aktin-beta u mozgu miša

EST profil

uredi

Podaci sa donje slike pokazuju da je FAM149A visoko eksprimiran u mozgu, živcima, gušterači, nadbubrežnim žlijezdama i bubrezima. Nema ga u srcu. Prema informacijama u drugoj tabeli, uobičajene komplikacije koje uključuju ekspresiju FAM149A odnose se na tumore nadbubrežne žlijezde, pankreasa, kolorektumske tumore i tumore jajnika.[12]

 
EST profil za FAM149A

Varijante transkripcije

uredi

FAM149A ima dvije varijante transkripcije, varijantu transkripta 1 i varijantu transkripta 2. Obje kodiraju isti protein FAM149A. Razlike uključuju dodatne parove baza u 5' UTR-neprevedenom području, kao i 3' UTR netranslatiranoj regiji. Jedna od dvije razlike u stvarnom translatiranom području proteina je G umjesto A na bp 1.590 u varijanti 1 i bp 1.337. u varijanti 2. Druga razlika se sastoji od C umjesto A na bp 2214. u TV1 i bp 1961. u TV2.

Kompozicija

uredi

Kao što je gore navedeno, FAM149A se sastoji od 482 aminokiseline. Najčešća aminokiselina je serin koja čini 9,8% gena. Najrjeđe aminokiseline su triptofan i cistein, od kojih svaka čini samo 1,2% gena. Jedina ponavljajuća kombinacija aminokiselina u proteinu je SLAS koja se javlja od aminokiselina 234–237 i od 324–327. Osim toga, Izoelektrična tačka FAM149A je 9,891999.[13]

Promotor

uredi

Slijede promotori gena FAM149A koje je obezbijedio ElDorado [14] and the sequence extracted from the information.

Segment Startna lokacija Stop-lokacija Lanac Dužina Broj reference Informacija
Promotorska regija 187065495 187066181 + 687 bp GXP_210035 Promotor za GXT_23739713, GXT_23739714, GXT_2803949

Locus: FAM149A/GXL_175098

Primarni transkript 187065995 187093817 + 27283 bp GXT_2803949, GXL_175098 FAM149A

Homo sapiens, član A porodicw proteina sa sličnošću sekvence 149 (FAM149A), transkriptna varijanta 1, iRNK GeneID:25854/NM_015398

Slijedi formatirana verzija FAM149A promotora FASTA.

 
Promotorska regija FAM149A (FASTA format)

Homologija/evolucija

uredi

Paralozi i ortolozi

uredi

FAM149A ima jedan glavni paralog, FAM149B. Još se ne zna mnogo o FAM149B, osim njegovog članstva u cjelokupnoj porodici gena FAM149.

Ortolozi FAM149A uključuju BRTD i njegove četiri izoforme, ECCHC11 i ALMS1. Svi ovi geni se nalaze kod ljudi i imaju konzervirana područja sa FAM149A.

Vrsta Uobičajenio ime Pristupni broj Dužina Identitet proteina Sličnost proteina Datiranje divergencije (milioni godina)
Homo sapiens Čovjek NP_001073963.1 482aa 100% 100% 0
Pongo abelii Orangutan XP_002815398.2 481aa 93,2% 95,0% 15,7
Nomascus leucogenys Sjeverni bjeloobrazni gibon XP_004093218.1 482aa 92,7% 95,0% 20,4
Equus ferus caballus Konj XP_001490414.3 480aa 72,0% 81,0% 94,2
Taeniopygia guttata Zebrasta zeba XP_002193183 485aa 46,0% 62,0% 296
Monodelphis domestica Oposum XP_001368447.2 1133aa 19.5% 61.0% 162.6
Xenopus tropicalis Zapadna kandžasta žaba XP_002934449 427aa 22,0% 65,0% 371,2

Konzervirani domen

uredi

FAM149A ima konzervirani domen nepoznate funkcije (DUF) 3719. O DUF 3719 ima vrlo malo informacija. Nalazi se samo u eukariotskim organizmima i sastoji se od 70 aminokiselina. Postoji konzerviani motiv HLR sekvence pronađen u DUF 3719. Ispod je slika koja prikazuje DUF3719 na FAM149A.

 
Struktura proteina FAM149A sa DUF3719
 
Distribucija DUF3719 po vrstama

Iz Instituta Sanger, sljedeća slika prikazuje vrste u kojoj ova porodica postoji. Ljubičasta boja ukazuje da DUF3719 postoji samo u eukariotskim organizmima. Boje, poput zelene, ukazuju na to da DUF3719 postoji i u bakterijama. Kada se ovaj dijagram interaktivno koristi na web stranici, navodi da 23 vrste u eukariota imaju ovaj domen.[15]

Filogenija

uredi

FAM149A se odvojio u periodu vladavine vodozemaca, prije oko 400 miliona godina, ptica prije 300 miliona godina i sisara, ne uključujući primate, prije 94 miliona godina. Divergiranje od primata posljednji put se dogodilo prije oko 5 miliona godina.[16]

Konzervacija strukture gena među vrstama

uredi
 
ECR pretraživač pokazuje konzerviranje strukture gena FAM149A kod različitih vrsta.

Preko NCBI web stranice, dodatnih 1.000 baznih parova je dodano odabranoj regiji na hromosomu 4 koji sadrži FAM149A. Nakon što su početna i krajnja pozicija uspostavljene, prebačene su u ECR pretraživač kako bi se stvorilo poravnanje među drugim vrstama.

Prema raspoloživim rezultatima, unutar FAM149A postoji 14 egzona koji su konzervirani kod majmuna, pasa, miševa i oposuma. Kokoš, žaba i riba pokazuju malo ili nimalo konzerviranja. Unutar prvih 1.000 parova baza prije početka transkripcije, čini se da nema značajne konzervacije među vrstama. Samo pas sadrži ono što se smatra evolucijski konzerviranim regionom (ECR).[17]

Interaktivni proteini

uredi

Vezna mjesta faktora transkripcije

uredi

Slijedi analiza promotorske regije za FAM149A. Pokazuje niz transkripcija mjesta vezanja faktora koja mogu imati snažan doprinos regulaciji ekspresije gena. Na slici ispod prikazane su lokacije mjesta vezanja. Ta mjesta analizirana su kako bi se pronašle sve moguće jedinstvene funkcije.

 
Mjesta vezanja transkripcijskih faktora FAM149A

Bilo je mnogo rezultata, ali su odabrani oni sa najvećom sličnošću i najvećom zastupljenošću, jer je najvjerovatnije da će biti prisutni na stvarnom genu. Porodice matriksa od interesa uključuju regulatornu regiju gena za Huntingtonovu bolest, nervni faktor rasta, jedarni respiratorni faktor, gen pleomorfnog adenoma, faktore transkripcije cinkovog prsta i E2F-myc aktivator/regulator ćelijskog ciklusa. Mnogi od njih su imali interakcije okretanja kompleksa cinkovih prstiju, što sugerira da bi to moglo biti važno za FAM149A.[18]

Interaktivni proteini

uredi
 
Proteini koji su u interakciji sa FAM149A.

FAM149A has potential interactions with ZNF385D, C10orf10, PNMAL1, CPN2, C10orf72, VPS13D, and RBMS3.[19] Na osnovu prethodnih istraživanja o mjestima vezivanja, mnogi su često sugerirali da su uključeni u proteine cinkovih prstiju. Prema rezultatima STRING, drugi najjači asocirajući protein je protein cinkovog prsta 385D. Međutim, ne može se zaključiti da su to jedini proteini koji djeluju u interakciji, jer se čini da postoji malo istraživanja koja uključuju interakcije FAM149A-a. Baza podataka o molekulnoj interakciji (MINT) korištena je kao dodatni izvor za proteinske interakcije. Međutim, FAM149A nije bio u bazi podataka. Na osnovu liste funkcionalnih partnera prema STRING-u, prvih pet također nema u bazi podataka MINT. Druga baza podataka interakcija, I2D Protein-Protein Interaction[20] pokazala moguću interakciju sa proteinom PRKAG1, ali interakcija je bila slaba.

Ispod je lista proteina koji potencijalno stupaju u interakciju sa FAM149A.  

Klinički značaj

uredi

Pridružene bolesti

uredi

Iako nije u potpunosti povezan, FAM149A je jedan od 15 gena kandidata za doprinos razvoju raka i displazijskih lezija.[21] Isti rad je takođe zabilježio smanjenje regulacije gena tokom oralnog karcinoma, pružajući mogući put istraživanja.

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000109794 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000070044 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ Xu X, Tsumagari K, Sowden J, Tawil R, Boyle AP, Song L, Furey TS, Crawford GE, Ehrlich M (decembar 2009). "DNaseI hypersensitivity at gene-poor, FSH dystrophy-linked 4q35.2". Nucleic Acids Res. 37 (22): 7381–93. doi:10.1093/nar/gkp833. PMC 2794184. PMID 19820107.
  6. ^ "UniProt, A5PLN7" (jezik: engleski). Pristupljeno 26. 10. 2021.
  7. ^ "FAM149A, family with sequence similarity 149, member A [Homo sapiens (Human)]". Gene - NCBI.
  8. ^ "ExPASy: SIB Bioinformatics Resource Portal - Categories". SIB Swiss Institute of Bioinformatics.
  9. ^ "FAM149A Secondary Structure". GOR4 and PELE - Biology WorkBench. Arhivirano s originala, 11. 8. 2003. Pristupljeno 26. 10. 2021.
  10. ^ "BioGPS". Pristupljeno 14. 5. 2013.
  11. ^ "FAM149A Expression". Allen Brain Atlas.
  12. ^ "FAM149A EST Profile". EST Profile from UniGene via NCBI.
  13. ^ "PI". Biology Workbench. San Diego Supercomputer Center. Arhivirano s originala, 11. 8. 2003. Pristupljeno 26. 10. 2021.
  14. ^ "ElDorado". Genomatix. Arhivirano s originala, 2. 12. 2021. Pristupljeno 30. 4. 2013.
  15. ^ "DUF3719". Species Distribution from Sanger Institute. Arhivirano s originala, 6. 5. 2011.
  16. ^ "Clustal W". San Diego Super Computer Center. Arhivirano s originala, 11. 8. 2003. Pristupljeno 5. 3. 2013.
  17. ^ Ovcharenko I, Nobrega MA, Loots GG, Stubbs L (juli 2004). "ECR Browser: a tool for visualizing and accessing data from comparisons of multiple vertebrate genomes". Nucleic Acids Res. 32 (Web Server issue): W280–6. doi:10.1093/nar/gkh355. PMC 441493. PMID 15215395.
  18. ^ "GEMS Launcher: MatInspector: Search for transcription factor binding sites via Genomatix Software". Genomatix Software. Arhivirano s originala, 2. 12. 2021. Pristupljeno 26. 10. 2021.
  19. ^ "FAM149A protein (Homo sapiens) – STRING network view".
  20. ^ "I2D Protein Interactions". Arhivirano s originala, 4. 5. 2013. Pristupljeno 30. 4. 2013.
  21. ^ Sumino J, Uzawa N, Okada N, Miyaguchi K, Mogushi K, Takahashi K, Sato H, Michikawa C, Nakata Y, Tanaka H, Amagasa T (februar 2013). "Gene expression changes in initiation and progression of oral squamous cell carcinomas revealed by laser microdissection and oligonucleotide microarray analysis". Int. J. Cancer. 132 (3): 540–8. doi:10.1002/ijc.27702. PMID 22740306. S2CID 8895382.