C7orf38 je gen na homosomu 7 ljdskog genoma.[3] Eksprimira u gotovo svim tipovima tkiva na vrlo niskim nivoima.[4] Evolucijski se može naći u cijelom carstvu Animalia. Naučna zajednica ne razumije u potpunosti funkciju proteina, ali su bioinformatički alati pokazali da protein ima mnogo sličnosti sa proteinima cinkovih prstiju ili transpozaza. Pokazalo se da mnogi od njegovih ortologa, paraloga i susjednih gena imaju domene cinkovih prstiju.[5] Protein sadrži domen dimerizacije hAT blizu C-kraja.[6] Ovaj domen je visokokonzerviran u transpozaznim enzimima.[7]

FAM200A
Identifikatori
AliasiFAM200A
Vanjski ID-jeviHomoloGene: 89159 GeneCards: FAM200A
Lokacija gena (čovjek)
Hromosom 7 (čovjek)
Hrom.Hromosom 7 (čovjek)[1]
Hromosom 7 (čovjek)
Genomska lokacija za FAM200A
Genomska lokacija za FAM200A
Bend7q22.1Početak99,546,300 bp[1]
Kraj99,558,536 bp[1]
Ontologija gena
Molekularna funkcija GO:0001948, GO:0016582 vezivanje za proteine
GO:0001200, GO:0001133, GO:0001201 DNA-binding transcription factor activity, RNA polymerase II-specific
vezivanje sa DNK
Ćelijska komponenta integral component of membrane
membrana
citoplazma
nukleoplazma
Biološki proces GO:0044324, GO:0003256, GO:1901213, GO:0046019, GO:0046020, GO:1900094, GO:0061216, GO:0060994, GO:1902064, GO:0003258, GO:0072212 regulation of transcription by RNA polymerase II
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_145111

n/a

RefSeq (bjelančevina)

NP_659802

n/a

Lokacija (UCSC)Chr 7: 99.55 – 99.56 Mbn/a
PubMed pretraga[2]n/a
Wikipodaci
Pogledaj/uredi – čovjek

Aminokiselinska sekvenca kodiranog proteina

uredi

Dužina polipeptidnog lanca je 573 aminokiseline, а molekulska težina 66.276 Da.[8]

1020304050
MTPESRDTTDLSPGGTQEMEGIVIVKVEEEDEEDHFQKERNKVESSPQVL
SRSTTMNERALLSSYLVAYRVAKEKMAHTAAEKIILPACMDMVRTIFDDK
SADKLRTIPLSDNTISRRICTIAKHLEAMLITRLQSGIDFAIQLDESTDI
ASCPTLLVYVRYVWQDDFVEDLLCCLNLNSHITGLDLFTELENCLLGQYK
LNWKHCKGISSDGTANMTGKHSRLTEKLLEATHNNAVWNHCFIHREALVS
KEISPSLMDVLKNAVKTVNFIKGSSLNSRLLEIFCSEIGVNHTHLLFHTE
VRWLSQGKVLSRVYELRNEIYIFLVEKQSHLANIFEDDIWVTKLAYLSDI
FGILNELSLKMQGKNNDIFQYLEHILGFQKTLLLWQARLKSNRPSYYMFP
TLLQHIEENIINEDCLKEIKLEILLHLTSLSQTFNYYFPEEKFESLKENI
WMKDPFAFQNPESIIELNLEPEEENELLQLSSSFTLKNYYKILSLSAFWI
KIKDDFPLLSRKSILLLLPFTTTYLCELGFSILTRLKTKKRNRLNSAPDM
RVALSSCVPDWKELMNRQAHPSH

Struktura

uredi

Protein

uredi

Za određivanje strukturno povezanog proteina s eksperimentalno određenom strukturom, korišten je CBLAST. Pokazalo se da je proteinska hermes DNK-transpozaza iz hermes DBD natporodice strukturno slična (E-vrijednost: 1E-6).[9]

hAT-domen dimerizacije
Identifikatori
SimbolhAT

Domen dimerizacije hAT nalazi se na C-terminalu transpozaznih elemenata koji pripadaju natporodici aktivatora (natporodici hAT elemenata). Izolirana domena dimerizacije in vitro tvori izuzetno stabilne dimere.[7]

 
Hermes DNK-transpozaza

Program MFOLD dostupan na Rensselaer BioInformatics serveru korišten je za predviđanje sekundarne strukture sekvence zrele iRNK.[10] Primarna sekvenca sekundarnih struktura iRNK pokazala je visok nivo konzerviranosti u ortolozima, što ukazuje na strukturnu važnost.

 
Predviđena sekundarna struktura MFOLD-a

C7orf38 nalazi se na hromosomu 7, regija q22.1. Njegova genomska sekvenca sadrži 5.612 bp. Prevladavajući transkript sadrži dva egzona i dužine je 2.507 bp.[11] Translatirani protein sadrži 573 aminokiselina.[12]

 
Lokusi gena C7orf38

Sastav proteina

uredi

Molekulska masa proteina od 573 aminokiseline je 66,280.05.[13] Utvrđeno je da se izoelektrična tačka javlja pri pH od 5.775, otprilike 1,6 pH nižem od pH prosječne ljudske.[14] Očigledna su dva odstupanja od prototipinih ljudkih proteina. Protein sadrži manji broj glicinskih ostataka od očekivanog i bogat je ostacima leucina.[15] Ne postoje dijelovi jake hidrofobnosti ili hidrofilnosti. Stoga se ne predviđa da je transmembranski protein.

 
Analiza hidrofilnosti

Gensko susjedstvo

uredi

Četiri gena u neposrednoj blizini C7orf38 na hromosomu 7 pokazuju sličnu funkciju, od kojih su mnogi transkripcijski faktori.[16]

 
Gensko susjedstvo
Ime Orijentacija Funkcija
ZNF789 Start: 98,908,451 bp od pter

Kraj: 98,923,153 bp od pter Veličina: 14,703 baznih parova Orijentacija: Lanac plus

Gen kodira protein cinkovog prsta 789. Funkcionalno, predloženo je da gen učestvuje u regulaciji transkripcije. Očekuje se da će se koristiti vezanje cinkovih iona.
ZNF394 Start: 98,928.790 bp od pter

Kraj: 98,935,813 bp od pter Veličina: 7.024 bp Orijentacija: lanac minus

Gen kodira protein cinkovog prsta 394. Prekomjerna ekspresija preko ZNF394 inhibira transkripciju c-juna i Ap-1. Sugerirano je da se radi o transkripcijskom represoru.
ZKSCAN5 Start: 98,940.209 bp od pter

Kraj: 98,969.381 bp od pter Veličina: 29.173 baza Orijentacija: lanac plus

Gen kodira cinkov prst s KRAB i SCAN domenima 5. Ovaj gen kodira protein cinkovog prsta iz porodice kruppel. Protein sadrži SCAN-kutiju i KRAB A-domen.
ZNF655 Start: 98,993.981 bp od pter

Kraj: 99,012.012 bp od pter Veličina: 18.032 baza Orijentacija: lanac plus

Gen kodira protein cinkovog prsta 655. Otkriveni su brojni alternativno prerađeni transkripti koji kodiraju različite izoforme.
Mihuya Start: 99,149.738 bp od pter

Kraj: 99,149.626 bp od pter Veličina : 112 bazA Orijentacija: lanac plus

Gen Mihuya ne kodira veliki ili poznati funkcionalni protein. Antisens odnos prema C7orf38 otvara mogućnost regulacije eksprimiranja.

Tkivna distribucija

uredi

Ovaj gen eksprimiran je u većini tipova tkiva.[17] Procjenom profila, primijećeni su veoma niski nivoi ekspresije , a nije uočeno odstupanje između zdravstvenih ili razvojnih stanja.

 
Est profil na osnovu tipa tkiva
 
Est profil na osnovu zdravstvenog stanja
 
Est profil na osnovu rasvojnog stadija

Paralozi

uredi

u ljudskom proteomu pronađeno je osam paraloga.[5] Slično susjednim genima, mnogi paralozi funkcioniraju kao cinkovi prsti ili transkripcijski faktori.

Naziv Pristupni broj bazi NCBI Accession Number Dužina (AA) Identitet sa C7orf38 ( %) Sličnost sa C7orf38 (%)
Hipotetski protein LOC285550 NP_001138663.1 657 79 91
Protein 6 cinkovog prsta MYM-tipa NP_009098.3 1.325 38 60
SCAN-protein 3 sa domenom NP_443155.1 1.325 39 60
Protein 5 cinkovog prsta sa BED-domenom NP_067034.2 692 35 57
Transpozon-izvadena Buster3 slična transposaza NP_071373.2 594 32 53
Opći transkripcijski faktor II-I ponavljajući protein 2B sa domenom NP_001003795.1 949 25 46
GTF2I-ponavljanje sa domenom 2 NP_775808.2 949 24 45
EPM2A-interaaktivni protein 1 NP_055620.1 607 22 42

Ortolozi

uredi

Ortolozi za C7orf38 mogu se evolucijski pratiti unazad do biljaka.[5] Slijedi opsežan popis ortologa. Namjera mu je pružiti evolucijski pregled konzerviranosti C7orf38.

Uobičajeno ime Rod i vrsta Pristupni broj bazi NCBI Dužina (AA) Identitet sa C7orf38 (%) Sličnost sa C7orf38 (%)
Čimpanza Pan troglodytes XP_001139775.1 573 99 99
Makak-majmun Macaca fascicularis BAE01234.1 573 96 98
Konj Equus caballus XP_001915370.1 573 81 84
Svinja Sus scrofa XP_001929194 1323 39 61
Govedo Bos taurus XP_875656.2 1320 38 61
Miš Mus musculus CAM15594.1 1157 37 60
Domaći pas Canis lupus familiaris ABF22701.1 609 37 60
Pacov Rattus rattus NP_001102151.1 1249 37 59
Oposum Monodelphis domestica XP_001372983.1 608 37 59
Kokoš Gallus gallus XP_424913.2 641 37 58
Žaba Xenopus (Silurana) tropicalis ABF20551.1 656 37 56
Zebrica Danio rerio XP_001340213.1 609 37 56
Graškova uš Acyrthosiphon pisum XP_001943527.1 659 36 54
Tvrdokrilac Tribolium castaneum ABF20545.1 599 35 55
Morski mlaz Ciona intestinalis XP_002119512.1 524 34 52
Hidra Hydra magnipapillata XP_002165429.1 572 29 52
Pufer-riba Tetraodon nigroviridis CAF95678.1 539 28 47
Komarac Anopheles gambiae XP_558399.5 591 28 47
Morski jež Strongylocentrotus purpuratus ABF20546.1 625 27 47
Trava Sorghum bicolor XP_002439156.1 524 25 40
Širokolisna topola Populus trichocarpa XP_002319808.1 788 21 39

Reference

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000221909 - Ensembl, maj 2017
  2. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  3. ^ "University of California Santa Cruz". Pristupljeno 10. 5. 2010.
  4. ^ "NCBI UniGene". Pristupljeno 10. 5. 2010.
  5. ^ a b c "NCBI BLAST". Pristupljeno 10. 5. 2010.
  6. ^ "KEGG". Pristupljeno 10. 5. 2010.
  7. ^ a b Essers L, Adolphs RH, Kunze R (2000). "A highly conserved domain of the maize activator transposase is involved in dimerization". Plant Cell. 12 (2): 211–224. doi:10.2307/3870923. JSTOR 3870923. PMC 139759. PMID 10662858.
  8. ^ "UniProt, Q8TCP9" (jezik: engleski). Pristupljeno 25. 9. 2021.
  9. ^ "Hermes DNA Transposase". Pristupljeno 10. 5. 2010.
  10. ^ "Fam200A". Arhivirano s originala, 22. 5. 2010. Pristupljeno 10. 5. 2010.
  11. ^ "Fam200A". Pristupljeno 10. 5. 2010.
  12. ^ "NCBI Protein Accession Number". Pristupljeno 10. 5. 2010.
  13. ^ "AAStats. SDSC Biology WorkBench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 10. 5. 2010.
  14. ^ "IP. SDSC Biology WorkBench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 10. 5. 2010.
  15. ^ "SAPS. SDSC Biology WorkBench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 10. 5. 2010.
  16. ^ "AceView". Pristupljeno 10. 5. 2010.
  17. ^ "NCBI UniGene". Pristupljeno 22. 4. 2010.