FAM200A
C7orf38 je gen na homosomu 7 ljdskog genoma.[3] Eksprimira u gotovo svim tipovima tkiva na vrlo niskim nivoima.[4] Evolucijski se može naći u cijelom carstvu Animalia. Naučna zajednica ne razumije u potpunosti funkciju proteina, ali su bioinformatički alati pokazali da protein ima mnogo sličnosti sa proteinima cinkovih prstiju ili transpozaza. Pokazalo se da mnogi od njegovih ortologa, paraloga i susjednih gena imaju domene cinkovih prstiju.[5] Protein sadrži domen dimerizacije hAT blizu C-kraja.[6] Ovaj domen je visokokonzerviran u transpozaznim enzimima.[7]
FAM200A | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | FAM200A | ||||||||||||||||||||||||
Vanjski ID-jevi | HomoloGene: 89159 GeneCards: FAM200A | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez |
| ||||||||||||||||||||||||
Ensembl |
| ||||||||||||||||||||||||
UniProt |
| ||||||||||||||||||||||||
RefSeq (mRNK) |
| ||||||||||||||||||||||||
RefSeq (bjelančevina) |
| ||||||||||||||||||||||||
Lokacija (UCSC) | Chr 7: 99.55 – 99.56 Mb | n/a | |||||||||||||||||||||||
PubMed pretraga | [2] | n/a | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Aminokiselinska sekvenca kodiranog proteina
urediDužina polipeptidnog lanca je 573 aminokiseline, а molekulska težina 66.276 Da.[8]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MTPESRDTTD | LSPGGTQEME | GIVIVKVEEE | DEEDHFQKER | NKVESSPQVL | ||||
SRSTTMNERA | LLSSYLVAYR | VAKEKMAHTA | AEKIILPACM | DMVRTIFDDK | ||||
SADKLRTIPL | SDNTISRRIC | TIAKHLEAML | ITRLQSGIDF | AIQLDESTDI | ||||
ASCPTLLVYV | RYVWQDDFVE | DLLCCLNLNS | HITGLDLFTE | LENCLLGQYK | ||||
LNWKHCKGIS | SDGTANMTGK | HSRLTEKLLE | ATHNNAVWNH | CFIHREALVS | ||||
KEISPSLMDV | LKNAVKTVNF | IKGSSLNSRL | LEIFCSEIGV | NHTHLLFHTE | ||||
VRWLSQGKVL | SRVYELRNEI | YIFLVEKQSH | LANIFEDDIW | VTKLAYLSDI | ||||
FGILNELSLK | MQGKNNDIFQ | YLEHILGFQK | TLLLWQARLK | SNRPSYYMFP | ||||
TLLQHIEENI | INEDCLKEIK | LEILLHLTSL | SQTFNYYFPE | EKFESLKENI | ||||
WMKDPFAFQN | PESIIELNLE | PEEENELLQL | SSSFTLKNYY | KILSLSAFWI | ||||
KIKDDFPLLS | RKSILLLLPF | TTTYLCELGF | SILTRLKTKK | RNRLNSAPDM | ||||
RVALSSCVPD | WKELMNRQAH | PSH |
Struktura
urediProtein
urediZa određivanje strukturno povezanog proteina s eksperimentalno određenom strukturom, korišten je CBLAST. Pokazalo se da je proteinska hermes DNK-transpozaza iz hermes DBD natporodice strukturno slična (E-vrijednost: 1E-6).[9]
hAT-domen dimerizacije | |
---|---|
Identifikatori | |
Simbol | hAT |
Domen dimerizacije hAT nalazi se na C-terminalu transpozaznih elemenata koji pripadaju natporodici aktivatora (natporodici hAT elemenata). Izolirana domena dimerizacije in vitro tvori izuzetno stabilne dimere.[7]
Program MFOLD dostupan na Rensselaer BioInformatics serveru korišten je za predviđanje sekundarne strukture sekvence zrele iRNK.[10] Primarna sekvenca sekundarnih struktura iRNK pokazala je visok nivo konzerviranosti u ortolozima, što ukazuje na strukturnu važnost.
Gen
urediC7orf38 nalazi se na hromosomu 7, regija q22.1. Njegova genomska sekvenca sadrži 5.612 bp. Prevladavajući transkript sadrži dva egzona i dužine je 2.507 bp.[11] Translatirani protein sadrži 573 aminokiselina.[12]
Sastav proteina
urediMolekulska masa proteina od 573 aminokiseline je 66,280.05.[13] Utvrđeno je da se izoelektrična tačka javlja pri pH od 5.775, otprilike 1,6 pH nižem od pH prosječne ljudske.[14] Očigledna su dva odstupanja od prototipinih ljudkih proteina. Protein sadrži manji broj glicinskih ostataka od očekivanog i bogat je ostacima leucina.[15] Ne postoje dijelovi jake hidrofobnosti ili hidrofilnosti. Stoga se ne predviđa da je transmembranski protein.
Gensko susjedstvo
urediČetiri gena u neposrednoj blizini C7orf38 na hromosomu 7 pokazuju sličnu funkciju, od kojih su mnogi transkripcijski faktori.[16]
Ime | Orijentacija | Funkcija |
---|---|---|
ZNF789 | Start: 98,908,451 bp od pter
Kraj: 98,923,153 bp od pter Veličina: 14,703 baznih parova Orijentacija: Lanac plus |
Gen kodira protein cinkovog prsta 789. Funkcionalno, predloženo je da gen učestvuje u regulaciji transkripcije. Očekuje se da će se koristiti vezanje cinkovih iona. |
ZNF394 | Start: 98,928.790 bp od pter
Kraj: 98,935,813 bp od pter Veličina: 7.024 bp Orijentacija: lanac minus |
Gen kodira protein cinkovog prsta 394. Prekomjerna ekspresija preko ZNF394 inhibira transkripciju c-juna i Ap-1. Sugerirano je da se radi o transkripcijskom represoru. |
ZKSCAN5 | Start: 98,940.209 bp od pter
Kraj: 98,969.381 bp od pter Veličina: 29.173 baza Orijentacija: lanac plus |
Gen kodira cinkov prst s KRAB i SCAN domenima 5. Ovaj gen kodira protein cinkovog prsta iz porodice kruppel. Protein sadrži SCAN-kutiju i KRAB A-domen. |
ZNF655 | Start: 98,993.981 bp od pter
Kraj: 99,012.012 bp od pter Veličina: 18.032 baza Orijentacija: lanac plus |
Gen kodira protein cinkovog prsta 655. Otkriveni su brojni alternativno prerađeni transkripti koji kodiraju različite izoforme. |
Mihuya | Start: 99,149.738 bp od pter
Kraj: 99,149.626 bp od pter Veličina : 112 bazA Orijentacija: lanac plus |
Gen Mihuya ne kodira veliki ili poznati funkcionalni protein. Antisens odnos prema C7orf38 otvara mogućnost regulacije eksprimiranja. |
Tkivna distribucija
urediOvaj gen eksprimiran je u većini tipova tkiva.[17] Procjenom profila, primijećeni su veoma niski nivoi ekspresije , a nije uočeno odstupanje između zdravstvenih ili razvojnih stanja.
Paralozi
urediu ljudskom proteomu pronađeno je osam paraloga.[5] Slično susjednim genima, mnogi paralozi funkcioniraju kao cinkovi prsti ili transkripcijski faktori.
Naziv | Pristupni broj bazi NCBI Accession Number | Dužina (AA) | Identitet sa C7orf38 ( %) | Sličnost sa C7orf38 (%) |
---|---|---|---|---|
Hipotetski protein LOC285550 | NP_001138663.1 | 657 | 79 | 91 |
Protein 6 cinkovog prsta MYM-tipa | NP_009098.3 | 1.325 | 38 | 60 |
SCAN-protein 3 sa domenom | NP_443155.1 | 1.325 | 39 | 60 |
Protein 5 cinkovog prsta sa BED-domenom | NP_067034.2 | 692 | 35 | 57 |
Transpozon-izvadena Buster3 slična transposaza | NP_071373.2 | 594 | 32 | 53 |
Opći transkripcijski faktor II-I ponavljajući protein 2B sa domenom | NP_001003795.1 | 949 | 25 | 46 |
GTF2I-ponavljanje sa domenom 2 | NP_775808.2 | 949 | 24 | 45 |
EPM2A-interaaktivni protein 1 | NP_055620.1 | 607 | 22 | 42 |
Ortolozi
urediOrtolozi za C7orf38 mogu se evolucijski pratiti unazad do biljaka.[5] Slijedi opsežan popis ortologa. Namjera mu je pružiti evolucijski pregled konzerviranosti C7orf38.
Uobičajeno ime | Rod i vrsta | Pristupni broj bazi NCBI | Dužina (AA) | Identitet sa C7orf38 (%) | Sličnost sa C7orf38 (%) |
---|---|---|---|---|---|
Čimpanza | Pan troglodytes | XP_001139775.1 | 573 | 99 | 99 |
Makak-majmun | Macaca fascicularis | BAE01234.1 | 573 | 96 | 98 |
Konj | Equus caballus | XP_001915370.1 | 573 | 81 | 84 |
Svinja | Sus scrofa | XP_001929194 | 1323 | 39 | 61 |
Govedo | Bos taurus | XP_875656.2 | 1320 | 38 | 61 |
Miš | Mus musculus | CAM15594.1 | 1157 | 37 | 60 |
Domaći pas | Canis lupus familiaris | ABF22701.1 | 609 | 37 | 60 |
Pacov | Rattus rattus | NP_001102151.1 | 1249 | 37 | 59 |
Oposum | Monodelphis domestica | XP_001372983.1 | 608 | 37 | 59 |
Kokoš | Gallus gallus | XP_424913.2 | 641 | 37 | 58 |
Žaba | Xenopus (Silurana) tropicalis | ABF20551.1 | 656 | 37 | 56 |
Zebrica | Danio rerio | XP_001340213.1 | 609 | 37 | 56 |
Graškova uš | Acyrthosiphon pisum | XP_001943527.1 | 659 | 36 | 54 |
Tvrdokrilac | Tribolium castaneum | ABF20545.1 | 599 | 35 | 55 |
Morski mlaz | Ciona intestinalis | XP_002119512.1 | 524 | 34 | 52 |
Hidra | Hydra magnipapillata | XP_002165429.1 | 572 | 29 | 52 |
Pufer-riba | Tetraodon nigroviridis | CAF95678.1 | 539 | 28 | 47 |
Komarac | Anopheles gambiae | XP_558399.5 | 591 | 28 | 47 |
Morski jež | Strongylocentrotus purpuratus | ABF20546.1 | 625 | 27 | 47 |
Trava | Sorghum bicolor | XP_002439156.1 | 524 | 25 | 40 |
Širokolisna topola | Populus trichocarpa | XP_002319808.1 | 788 | 21 | 39 |
Reference
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000221909 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "University of California Santa Cruz". Pristupljeno 10. 5. 2010.
- ^ "NCBI UniGene". Pristupljeno 10. 5. 2010.
- ^ a b c "NCBI BLAST". Pristupljeno 10. 5. 2010.
- ^ "KEGG". Pristupljeno 10. 5. 2010.
- ^ a b Essers L, Adolphs RH, Kunze R (2000). "A highly conserved domain of the maize activator transposase is involved in dimerization". Plant Cell. 12 (2): 211–224. doi:10.2307/3870923. JSTOR 3870923. PMC 139759. PMID 10662858.
- ^ "UniProt, Q8TCP9" (jezik: engleski). Pristupljeno 25. 9. 2021.
- ^ "Hermes DNA Transposase". Pristupljeno 10. 5. 2010.
- ^ "Fam200A". Arhivirano s originala, 22. 5. 2010. Pristupljeno 10. 5. 2010.
- ^ "Fam200A". Pristupljeno 10. 5. 2010.
- ^ "NCBI Protein Accession Number". Pristupljeno 10. 5. 2010.
- ^ "AAStats. SDSC Biology WorkBench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 10. 5. 2010.
- ^ "IP. SDSC Biology WorkBench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 10. 5. 2010.
- ^ "SAPS. SDSC Biology WorkBench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 10. 5. 2010.
- ^ "AceView". Pristupljeno 10. 5. 2010.
- ^ "NCBI UniGene". Pristupljeno 22. 4. 2010.