HIKESHI je protein koji je važan za razvoj pluća i višećelijskih organizama[5] koji je kod ljudi kodiran genom HIKESHI.[6] Kod ljudi, HIKESHI se nalazi na kromosomu 11 i hromosomu 7 kod miševa. Slične sekvence (ortolozi) nalaze se u većini životinjskih i gljivičnih vrsta. Homolog miša, letalni gen na proteinu Rinchik 6 hromosoma 7 kodiran je genom l7Rn6.[7]

HIKESHI
Dostupne strukture
PDBPretraga ortologa: PDBe RCSB
Spisak PDB ID kodova

3WVZ, 3WW0

Identifikatori
AliasiHIKESHI
Vanjski ID-jeviOMIM: 614908 MGI: 96738 HomoloGene: 6908 GeneCards: HIKESHI
Lokacija gena (čovjek)
Hromosom 11 (čovjek)
Hrom.Hromosom 11 (čovjek)[1]
Hromosom 11 (čovjek)
Genomska lokacija za HIKESHI
Genomska lokacija za HIKESHI
Bend11q14.2Početak86,302,211 bp[1]
Kraj86,345,943 bp[1]
Lokacija gena (miš)
Hromosom 7 (miš)
Hrom.Hromosom 7 (miš)[2]
Hromosom 7 (miš)
Genomska lokacija za HIKESHI
Genomska lokacija za HIKESHI
Bend7 D3|7 50.4 cMPočetak89,566,737 bp[2]
Kraj89,590,412 bp[2]
Ontologija gena
Molekularna funkcija Hsp70 protein binding
nuclear import signal receptor activity
Ćelijska komponenta citoplazma
citosol
intracellular anatomical structure
jedro
nukleoplazma
Biološki proces protein transport
regulation of cellular response to heat
protein import into nucleus
cellular response to heat
Golgi organization
lung development
Izvori:Amigo / QuickGO
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_016401
NM_001322404
NM_001322407
NM_001322409

NM_001291286
NM_001291287
NM_001291288
NM_001291289
NM_026304

RefSeq (bjelančevina)

NP_001309333
NP_001309336
NP_001309338
NP_057485

NP_001278215
NP_001278216
NP_001278217
NP_001278218
NP_080580

Lokacija (UCSC)Chr 11: 86.3 – 86.35 MbChr 7: 89.57 – 89.59 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Aminokiselinska sekvenca

uredi

Dužina polipeptidnog lanca je 197 aminokiselina, a molekulska težina 21.628 Da.[8]

1020304050
MFGCLVAGRLVQTAAQQVAEDKFVFDLPDYESINHVVVFMLGTIPFPEGM
GGSVYFSYPDSNGMPVWQLLGFVTNGKPSAIFKISGLKSGEGSQHPFGAM
NIVRTPSVAQIGISVELLDSMAQQTPVGNAAVSSVDSFTQFTQKMLDNFY
NFASSFAVSQAQMTPSPSEMFIPANVVLKWYENFQRRLAQNPLFWKT

HIKESHI je gen koji kodira ljudske proteine. Alternativni nazivi za gen su FLJ43020, HSPC138, HSPC179 i L7RN6. Smješten na dugom kraku hromosoma 11, na području q14.2, a cijeli gen uključujući introne i egzone ima 42,698 parova baza na plus lancu. iRNK HIKESHI varijante 1 uključuje egzone 1, 3, 4, 5 i 7 u iznosu od 1.183 parova baza, pri čemu parovi baza 239 do 832 predstavljaju kodirajuće regije.

Alternativna prerada

uredi

Varijanta 1 je najduža i najčešća varijanta kodiranja proteina. Tri druge glavne varijante imaju zamjensku reguju egzona koja izbacuje otvoreni okvir čitanja, uzrokujući rano prekidanje sekvence iRNK i podvrgavajući se raspadu proteina. Donja tabela prikazuje različite varijante i upotrebu egzona.

Varijanta Egzon 1 Egzon 2 Egzon 3 Egzon 4 Egzon 5 Egzon 6 Egzon 7 Protein kodirajući
1 x x x x x Da
2 x x x x x x Ne
3 x x x x x Ne
4 x x x x Ne

Četiri varijante prikazane u gornjoj tabeli su najčešće izoforme koje se nalaze u ljudskim ćelijama. Postoji ukupno 13 alternativno prerađenih sekvenci i tri nepretađena oblika koji koriste dva alternativna promotora. Varijante iRNK razlikuju se po kombinaciji osam različitih egzona, zamjenskih, preklapajućih egzona i zadržavanju introna. Osim alternativnog prerađivanja, iRNK se razlikuju po skraćivanju na 3’ kraju. Varijanta 1 je jedna od deset iRNK za koje je pokazano da kodiraju protein, dok se ostale čini vezanim za nonsens raspadanje iRNK. AceView[9] reprezentacija C11orf73 izoformi:  

Promotor

uredi

Regija promotora, GXP 47146, pronađena je pomoću ElDoradoa[10] Genomatix-ovog alata. Sekvenca od 840 bp nalazi se ispred HIKESHI gena na DNK tačkama 86012753 do 86013592. Promotor je konzerviran u 12 od 12 ortologa i kodira šest relevantnih transkripata.

Konzervirana mjesta vezanja faktora transkripcije Genomatix ElDorado alata:

Detaljna informacija o porodici Od Do Sidro Orijentacija Konzervacija u Mus musculus Matriksni sim Sekvenca Pojava
Regulatori ćelijskog ciklusa: element homologije ćelijskog ciklusa 137 149 143 + Lanac Konzerviran 0,943 ggacTTGAattca 1
GATA-vezujuči faktori 172 184 178 + Lanac Konzerviran 0,946 taaAGATttgagg 1
Kičmenjački TATA-vezujući proteinski faktor 193 209 201 + Lanac Konzerviran 0,983 tcctaTAAAatttggat 1
Faktori toplotnog šoka 291 315 303 + Lanac Konzerviran 0,992 cacagaaacgttAGAAgcatctctt 4
Ljudski i mišji ETS1 faktori 512 532 522 +Lanac Konzerviran 0,984 taagccccGGAAgtacttgtt 3
Transkripcijski faktor cinkovog prsta RU49, Zipro1 522 528 525 + Lanac Konzerviran 0,989 aAGTAct 2
Krueppeloliki transkripcijski faktori 618 634 626 + Lanac Konzerviran 0.925 tggaGGGGcagacaccc 1
SOX/SRY-spolno/testis determinirajući HMG-boksni faktori 636 658 647 + Lanac Konzerviran 0,925 cccgcaAATTctggaaggttctt 1
 
Predviđena promotorska regija C11orf73

Terminacija

uredi

Terminacija proizvoda iRNK kodirana je unutar cDNK gena. Terminacija iRNK proizvoda općenito ima tri glavne karakteristike: poli A signal, poli A rep i područje sekvence koje može formirati strukturu matične petlje. Poli A signal je visoko konzervirano mjesto sa šest nukleotidnih sekvenci. Kod eukariota sekvenca je AATAAA sa oko 10-30 nukleotida sa poli A mjesta. AATAAA sekvenca je visoko konzerviran, eukariotski polyA signal koji signalizira poliadenilaciju proizvoda iRNK od 10-30 parova baza nakon signalne sekvence. PolyA mjesto za C11orf73 je GTA.

Utvrđeno je da je HIKESHI sveprisutno eksprimiran na visokom nivou od 2,3 puta iznad prosjeka. C11orf73 se eksprimira u velikom broju ljudskih tkiva.[11][12] Između profila ekspresije i EST profila na UniGene-u, pokazalo se da samo 11 tkiva ne eksprimira C11orf73, najvjerojatnije zbog male veličine uzorka u tkivu.

Protein

uredi

Ljudski gen HIKESHI kodira protein zvani neokarakterizirsni protein C11orf73.[6] Homologni gen miša L7rn6 kodira protein zvani letalni gen na hromozomu 7 Rinchik 6.[7]

1 mfgclvagrl vqtaaqqvae dkfvfdlpdy esinhvvvfm lgtipfpegm ggsvyfsypd
61 sngmpvwqll gfvtngkpsa ifkisglksg egsqhpfgam nivrtpsvaq igisvellds
121 maqqtpvgna avssvdsftq ftqkmldnfy nfassfavsq aqmtpspsem fipanvvlkw
181 yenfqrrlaq nplfwkt

Kodirani ljudski protein dug je 197 aminokiselina i težak 21.628 daltona. Po analogiji s mišjim proteinom, hipotetska funkcija ljudskog proteina HIKESHI je organizacija i funkcija sekretornog aparata u plućnim ćelijama.[5]

Protein nepoznate funkcije (DUF775)
Identifikatori
SimbolDUF775

Proteinski domen poznat kao DUF775 (domen nepoznate funkcije 775) nalazi se unutar ljudskih HIKESHI i mišjih L7rn6 proteina. Domen DUF775 dug je 197 aminokiselina, iste dužine kao i protein. Ostali proteini koji čine superporodicu DUF 775, po definiciji uključuju sve ortologe C11orf73.

Analiza hidropatije pokazuje da u proteinu nema opsežnih hidrofobnih regija, pa se zaključuje da je HIKESHI citoplazmatski protein. Izoelektrična tačka za C11orf73 je 5,108, što ukazuje na to da optimalno funkcionira u kiselijoj sredini.

 
Hidropatijski plot C11orf73

[13]

Jennonukleotidni polimorfizam

uredi

Jedini SNP,[14] ili jednonukleotidni polimorfizam, sekvence C11orf73 rezultira promjenom aminokiselina unutar proteina. Nedostatak drugih SNP-a najvjerojatnije je posljedica visokog stupnja konzervacija HIKESHI-a i smrtonosnog učinka koji mutacija proteina daje organizmu. Fenotip SNP-a je nepoznat.

Funkcija Alel dbSNP Proteinski ostatak Položaj kodona Položaj aminokiseline
Reference C Prolin [P] 1 47
Misens G Alanin [A] 1 47

Gensko susjedstvo

uredi

Okolni geni HIKESHI-a su CCDC81, ME3 i EED. Gleda se gensko susjedstvo kako bi se bolje razumjelo moguće djelovanje gena posmatrajući funkciju okolnih gena.

 
Susjedni geni hromosoma 11, regija 11q14.2

[15]

CCDC81 gen kodira za neokarakterizirani proteinski proizvod i orijentiran je na plus lanac. CCDC81-sekvence za domen sa zavojnicom sadrže 81 izoformu 1.

Gen ME3 označava prekursor mitohondrijskog jđmalatnog enzima 3. Malatni enzim katalizira oksidativnu dekarboksilaciju malata u piruvat, koristeći ili NAD+ ili NADP+ kao kofaktor. Tkiva sisara sadrže tri različite izoforme malatnog enzima: citosolnu NADP (+)-ovisnu izoformu, mitohondrijsku NADP (+) ovisnu izoformu i mitohondrijsku NAD (+)-ovisnu izoformu. Ovaj gen kodira izoformu ovisnu o mitohondrijskom NADP (+). Za ovaj gen je pronađeno više alternativno prerađenih varijanti transkripta, ali biološka valjanost nekih varijanti nije utvrđena.[16]

Gen EED označava razvojnu izoformu embrijskog ektoderma b i član je porodice polikomb grupe (PcG). Članovi porodice PcG tvore multimerne proteinske komplekse koji su uključeni u održavanje transkripcijskog represivnog stanja gena tokom uzastopnih ćelijskih generacija. Ovaj protein stupa u interakciju s pojačivačem zeste 2, citoplazmatskim repom integrina beta7, virusom imunodeficijencije tipa 1 (HIV-1) MA proteinom i proteinima histon-deacetilaze. Ovaj protein posreduje u represiji aktivnosti gena, deacetilacijom histona i može djelovati kao specifičan regulator funkcije integrina. Za ovaj gen su identificirane dvije varijante transkripta koje kodiraju različite izoforme.[17]

Interakcije

uredi

Programi STRING [18] i Sigma-Aldrich-ov favorit gen [19] sugeriraju moguće interakcije proteina sa C11orf73. ARGUL1, CRHBP i EED, izvedenih iz značenja teksta, a HNF4A iz Sigma-Aldricha.

Protein Opis Metod Rezultat
ARGUL1 Nepoznat Značenje teksta 0,712
CRHBP Vezujući protein koji oslobađa kortikotropin Značenje teksta 0,653
EED Razvoj embrionskog ektoderma Značenje tekta 0,420
HNF4A Transkripcijski regulator Sigma-Aldrich N/A

ARGUL1 je nepoznati protein s nepoznatom funkcijom. CRHBP je protein koji vezuje hormon koji oslobađa kortikotrofin i koji bi mogao imati ulogu u signalnoj kaskadi koja uključuje ili aktivira HIKESHI. EED, a susjedni protein C11orf73, je embrionski razvojni protein ektoderma i član je porodice Polycomb-grupe (PcG). Članovi porodice PcG tvore multimerne proteinske komplekse koji su uključeni u održavanje transkripcijskog represivnog stanja gena tokom uzastopnih ćelijskih generacija. HNF4A je regulator transkripcije i nije poznato regulira li HNF4A ekspresiju C11orf73 ili jednostavno stupa u interakciju s njim.[12

Evolucijska historija

uredi
 
Filogenetsko stablo C11orf73-a.

Evolucijska povijest organizama može se odrediti pomoću sekvenci ortologa kao vremenskih referenci za stvaranje filogenetskog stabla. CLUSTALW [20] poredi više sekvenci, a program se takođe može koristiti za kreiranje takvog filogenetskog stabla zasnovanog na ortolozima C11orf73. S desne strane prikazano je generirano filogenetsko stablo s vremenskom linijom zasnovanom na vremenu divergencije. Napravljeno od HIKESHI ortologa, identično je filogenetskom stablu u literaturi, čak grupira slične organizme poput riba, ptica i gljiva.

Ortolozi

uredi

Homologne sekvence su ortologne ako su razdvojene događajem specijacije: kada se vrsta raziđe u dvije zasebne vrste, za divergentne kopije jednog gena u rezultirajućoj vrsti kaže se da su ortologne. Ortolozi ili ortologni geni su geni različitih vrsta koji su međusobno slični jer potiču od zajedničkog pretka. Ortologne sekvence pružaju korisne informacije u taksonomskoj klasifikaciji i filogenetskim studijama organizama. Obrazac genetičke divergencije može se koristiti za praćenje srodnosti organizama. Dva vrlo bliska organizma vjerojatno će pokazati vrlo slične sekvence DNK između dva ortologa. Nasuprot tome, organizam koji se evolucijski ukloni iz drugog organizma vjerojatno će pokazati veće odstupanje u sekvencj ortologa koji se proučavaju.

Tabela otvorenog okvira čitanja hromosoma 11 73: Ortolozi

Vrsta Uobičajeno ime Protein Pristuoni broj Dužina NT Identitet NT Dužina AA Identitet AA E-Vrijednost
Homo sapiens Čovjek C11orf73 NM_016401 1187 bp 100% 197 aa 100% 0
Bon taurus Govedo LOC504867 NP_001029398 996 bp 73,60% 197 aa 98% 5,30E-84
Mus musculus Miš l7Rn6 NP_080580 1045 bp 72,90% 197 aa 97% 4,80E-83
Gallus gallus Kokoš LOC427034 N/A 851 bp 56,20% 197 aa 88,3% 5,60E-76
Taeniopygia guttata Zebrasta zeba LOC100190155 ACH44077 997 bp 61,60% 997 aa 87,80% 1,20E-75
Xenopus laevis Žaba MGC80709 NP_001087012 2037 bp 36,50% 197 aa 86,80% 1,70E-75
Oncorhynchus mykiss Dužičasta pastrmka CK073 NP_001158574 940 bp 52,20% 197 aa 75,10% 2,70E-66
Tetradon nigroviridis Tetradon Neimenovani proteinski proizvod CAF89643 N/A N/A 197 aa 70,90% 1,40E-61
Trichoplax adhaerens Trihoplaks TRIADDRAFT_19969 XP_002108733 600 bp 33,10% 199 aa 52,30% 2,00E-47
Culex quinquefasciatus Komarac Konzervirani hipotetski protein XP_001843282 594 bp 30,70% 197 aa 49,30% 2,50E-41
Drosophilia melanogaster Vinska mušica CG13926 NP_647633 594 bp 31,50% 197 aa 48,50% 4,50E-39
Laccaria bicolor Pečurka Predviđeni protein XP_001878996 696 bp 36,40% 202 aa 35,20% 8,30E-24
Candida albicans Gliva CaO19.13758 XP_716157 666 bp 36,10% 221 aa 24% 5,70E-11

Tabela prikazuje 13 sekvenci (12 ortologa, jedna originalna sekvenca) zajedno sa imenom proteina, pristupnim brojevima, identitetom nukleotida, identitetom proteina i E-vrijednostima. Pristupni brojevi su identifikacijski brojevi iz baze podataka NCBI Protein. Nukleotidnoj sekvenci se može pristupiti sa stranice sekvence proteina iz DBSOURCE-a, koja daje pristupni broj i predstavlja vezu do stranice sekvence nukleotida. Dužina nukleotidne i proteinske sekvence za svakog ortologa i njegov odgovarajući organizam također je navedena u tabeli. Pored dužine sekvence nalaze se identiteti ortologa originalnom HIKESHI genu. Identiteti i E-vrijednosti stečeni su pomoću globalnog programa usklađivanja, ALIGN, iz SDSC Biology Workbench-a i BLAST-a iz NCBI-a.

Grafikon prikazuje postotak identiteta ortologa u odnosu na vrijeme divergencije organizma za stvaranje uglavnom linearne krivulje. Dva glavna zgloba unutar krivulje ukazuju na vrijeme duplikacije gena, prije otprilike 450 i 1.150 miliona godina. Paralozi iz dupliciranja gena vjerojatno su toliko različiti od visoko konzerviranih ortologa HIKESHI-ja da nisu pronađeni pomoću alata Blink ili BLAST.

 
CLUSTALW srodnih ortologa
 
Postotak identiteta C11orf73 ortologa u odnosu na vrijeme divergencije organizma.

Vrijednost m (ukupan broj promjena aminokiselina koje su se dogodile u segmentu od 100 aminokiselina), koja je ispravljena vrijednost n (broj razlika aminokiselina iz šablona sekvence), također se koristi za izračunavanje λ (prosječna amino kiselina) kisele promjene godišnje, obično predstavljene u vrijednostima λE9).

m/100 = –ln(1-n/100)
λ = (m/100)/(2*T)
 
CLUSTALW udaljenih ortologa
 
Broj promjena aminokiselina u odnosu na vrijeme evolutivne divergencije.

References

uredi
  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000149196 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000062797 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b Fernández-Valdivia R, Zhang Y, Pai S, Metzker ML, Schumacher A (januar 2006). "l7Rn6 Encodes a Novel Protein Required for Clara Cell Function in Mouse Lung Development". Genetics. 172 (1): 389–99. doi:10.1534/genetics.105.048736. PMC 1456166. PMID 16157679.
  6. ^ a b Zhang QH, Ye M, Wu XY, Ren SX, Zhao M, Zhao CJ, Fu G, Shen Y, Fan HY, Lu G, Zhong M, Xu XR, Han ZG, Zhang JW, Tao J, Huang QH, Zhou J, Hu GX, Gu J, Chen SJ, Chen Z (oktobar 2000). "Cloning and Functional Analysis of cDNAs with Open Reading Frames for 300 Previously Undefined Genes Expressed in CD34+ Hematopoietic Stem/Progenitor Cells". Genome Res. 10 (10): 1546–60. doi:10.1101/gr.140200. PMC 310934. PMID 11042152.
  7. ^ a b Rinchik EM, Carpenter DA (1993). "N-ethyl-N-nitrosourea-induced prenatally lethal mutations define at least two complementation groups within the embryonic ectoderm development (eed) locus in mouse chromosome 7". Mamm. Genome. 4 (7): 349–53. doi:10.1007/BF00360583. PMID 8358168. S2CID 24689449.
  8. ^ "UniProt, Q53FT3". Pristupljeno 23. 8. 2021.
  9. ^ AceView NCBI Gene Information AceView Arhivirano 12. 12. 2001. na Wayback Machine
  10. ^ Genomatix ElDorade tool for promoter analysis ElDorado Product Page Arhivirano 6. 10. 2008. na Wayback Machine
  11. ^ "Expression profile for C11orf73". GeneNote version 2.4. Weizmann Institute of Science. septembar 2009. Arhivirano s originala, 5. 3. 2012. Pristupljeno 23. 8. 2021.
  12. ^ "EST Profile - Hs.283322". National Center for Biotechnology Information, United States National Library of Medicine.
  13. ^ Saier Lab Bioinformatics Group http://www.tcdb.org/progs/hydro.php
  14. ^ NCBI SNP Database https://www.ncbi.nlm.nih.gov/snp/ Arhivirano 4. 2. 2006. na Wayback Machine
  15. ^ NCBI Entrez https://www.ncbi.nlm.nih.gov/nuccore/NC_000011.9?from=86011067&to=86059171&report=graph
  16. ^ RefSeq NCBI Database https://www.ncbi.nlm.nih.gov/RefSeq/ Arhivirano 11. 4. 2006. na Wayback Machine
  17. ^ "RefSeq: NCBI Reference Sequence Database".
  18. ^ STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) http://string-db.org/ Arhivirano 26. 7. 2010. na Wayback Machine
  19. ^ Sigma-Aldrich's Favorite Gene http://www.sigmaaldrich.com/life-science/your-favorite-gene-search.html
  20. ^ CLUSTALW Program Julie D. Thompson, Desmond G. Higgins and Toby J. Gibson http://workbench.sdsc.edu/ Arhivirano 8. 4. 2006. na Wayback Machine

Vanjski linkovi

uredi