HIKESHI
HIKESHI je protein koji je važan za razvoj pluća i višećelijskih organizama[5] koji je kod ljudi kodiran genom HIKESHI.[6] Kod ljudi, HIKESHI se nalazi na kromosomu 11 i hromosomu 7 kod miševa. Slične sekvence (ortolozi) nalaze se u većini životinjskih i gljivičnih vrsta. Homolog miša, letalni gen na proteinu Rinchik 6 hromosoma 7 kodiran je genom l7Rn6.[7]
HIKESHI | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||
Identifikatori | |||||||||||||||||||||||||
Aliasi | HIKESHI | ||||||||||||||||||||||||
Vanjski ID-jevi | OMIM: 614908 MGI: 96738 HomoloGene: 6908 GeneCards: HIKESHI | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 11: 86.3 – 86.35 Mb | Chr 7: 89.57 – 89.59 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Aminokiselinska sekvenca
urediDužina polipeptidnog lanca je 197 aminokiselina, a molekulska težina 21.628 Da.[8]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MFGCLVAGRL | VQTAAQQVAE | DKFVFDLPDY | ESINHVVVFM | LGTIPFPEGM | ||||
GGSVYFSYPD | SNGMPVWQLL | GFVTNGKPSA | IFKISGLKSG | EGSQHPFGAM | ||||
NIVRTPSVAQ | IGISVELLDS | MAQQTPVGNA | AVSSVDSFTQ | FTQKMLDNFY | ||||
NFASSFAVSQ | AQMTPSPSEM | FIPANVVLKW | YENFQRRLAQ | NPLFWKT |
Gen
urediHIKESHI je gen koji kodira ljudske proteine. Alternativni nazivi za gen su FLJ43020, HSPC138, HSPC179 i L7RN6. Smješten na dugom kraku hromosoma 11, na području q14.2, a cijeli gen uključujući introne i egzone ima 42,698 parova baza na plus lancu. iRNK HIKESHI varijante 1 uključuje egzone 1, 3, 4, 5 i 7 u iznosu od 1.183 parova baza, pri čemu parovi baza 239 do 832 predstavljaju kodirajuće regije.
Alternativna prerada
urediVarijanta 1 je najduža i najčešća varijanta kodiranja proteina. Tri druge glavne varijante imaju zamjensku reguju egzona koja izbacuje otvoreni okvir čitanja, uzrokujući rano prekidanje sekvence iRNK i podvrgavajući se raspadu proteina. Donja tabela prikazuje različite varijante i upotrebu egzona.
Varijanta | Egzon 1 | Egzon 2 | Egzon 3 | Egzon 4 | Egzon 5 | Egzon 6 | Egzon 7 | Protein kodirajući |
---|---|---|---|---|---|---|---|---|
1 | x | x | x | x | x | Da | ||
2 | x | x | x | x | x | x | Ne | |
3 | x | x | x | x | x | Ne | ||
4 | x | x | x | x | Ne |
Četiri varijante prikazane u gornjoj tabeli su najčešće izoforme koje se nalaze u ljudskim ćelijama. Postoji ukupno 13 alternativno prerađenih sekvenci i tri nepretađena oblika koji koriste dva alternativna promotora. Varijante iRNK razlikuju se po kombinaciji osam različitih egzona, zamjenskih, preklapajućih egzona i zadržavanju introna. Osim alternativnog prerađivanja, iRNK se razlikuju po skraćivanju na 3’ kraju. Varijanta 1 je jedna od deset iRNK za koje je pokazano da kodiraju protein, dok se ostale čini vezanim za nonsens raspadanje iRNK. AceView[9] reprezentacija C11orf73 izoformi:
Promotor
urediRegija promotora, GXP 47146, pronađena je pomoću ElDoradoa[10] Genomatix-ovog alata. Sekvenca od 840 bp nalazi se ispred HIKESHI gena na DNK tačkama 86012753 do 86013592. Promotor je konzerviran u 12 od 12 ortologa i kodira šest relevantnih transkripata.
Konzervirana mjesta vezanja faktora transkripcije Genomatix ElDorado alata:
Detaljna informacija o porodici | Od | Do | Sidro | Orijentacija | Konzervacija u Mus musculus | Matriksni sim | Sekvenca | Pojava |
---|---|---|---|---|---|---|---|---|
Regulatori ćelijskog ciklusa: element homologije ćelijskog ciklusa | 137 | 149 | 143 | + Lanac | Konzerviran | 0,943 | ggacTTGAattca | 1 |
GATA-vezujuči faktori | 172 | 184 | 178 | + Lanac | Konzerviran | 0,946 | taaAGATttgagg | 1 |
Kičmenjački TATA-vezujući proteinski faktor | 193 | 209 | 201 | + Lanac | Konzerviran | 0,983 | tcctaTAAAatttggat | 1 |
Faktori toplotnog šoka | 291 | 315 | 303 | + Lanac | Konzerviran | 0,992 | cacagaaacgttAGAAgcatctctt | 4 |
Ljudski i mišji ETS1 faktori | 512 | 532 | 522 | +Lanac | Konzerviran | 0,984 | taagccccGGAAgtacttgtt | 3 |
Transkripcijski faktor cinkovog prsta RU49, Zipro1 | 522 | 528 | 525 | + Lanac | Konzerviran | 0,989 | aAGTAct | 2 |
Krueppeloliki transkripcijski faktori | 618 | 634 | 626 | + Lanac | Konzerviran | 0.925 | tggaGGGGcagacaccc | 1 |
SOX/SRY-spolno/testis determinirajući HMG-boksni faktori | 636 | 658 | 647 | + Lanac | Konzerviran | 0,925 | cccgcaAATTctggaaggttctt | 1 |
Terminacija
urediTerminacija proizvoda iRNK kodirana je unutar cDNK gena. Terminacija iRNK proizvoda općenito ima tri glavne karakteristike: poli A signal, poli A rep i područje sekvence koje može formirati strukturu matične petlje. Poli A signal je visoko konzervirano mjesto sa šest nukleotidnih sekvenci. Kod eukariota sekvenca je AATAAA sa oko 10-30 nukleotida sa poli A mjesta. AATAAA sekvenca je visoko konzerviran, eukariotski polyA signal koji signalizira poliadenilaciju proizvoda iRNK od 10-30 parova baza nakon signalne sekvence. PolyA mjesto za C11orf73 je GTA.
Utvrđeno je da je HIKESHI sveprisutno eksprimiran na visokom nivou od 2,3 puta iznad prosjeka. C11orf73 se eksprimira u velikom broju ljudskih tkiva.[11][12] Između profila ekspresije i EST profila na UniGene-u, pokazalo se da samo 11 tkiva ne eksprimira C11orf73, najvjerojatnije zbog male veličine uzorka u tkivu.
Protein
urediLjudski gen HIKESHI kodira protein zvani neokarakterizirsni protein C11orf73.[6] Homologni gen miša L7rn6 kodira protein zvani letalni gen na hromozomu 7 Rinchik 6.[7]
1 mfgclvagrl vqtaaqqvae dkfvfdlpdy esinhvvvfm lgtipfpegm ggsvyfsypd 61 sngmpvwqll gfvtngkpsa ifkisglksg egsqhpfgam nivrtpsvaq igisvellds 121 maqqtpvgna avssvdsftq ftqkmldnfy nfassfavsq aqmtpspsem fipanvvlkw 181 yenfqrrlaq nplfwkt
Kodirani ljudski protein dug je 197 aminokiselina i težak 21.628 daltona. Po analogiji s mišjim proteinom, hipotetska funkcija ljudskog proteina HIKESHI je organizacija i funkcija sekretornog aparata u plućnim ćelijama.[5]
Protein nepoznate funkcije (DUF775) | |
---|---|
Identifikatori | |
Simbol | DUF775 |
Proteinski domen poznat kao DUF775 (domen nepoznate funkcije 775) nalazi se unutar ljudskih HIKESHI i mišjih L7rn6 proteina. Domen DUF775 dug je 197 aminokiselina, iste dužine kao i protein. Ostali proteini koji čine superporodicu DUF 775, po definiciji uključuju sve ortologe C11orf73.
Analiza hidropatije pokazuje da u proteinu nema opsežnih hidrofobnih regija, pa se zaključuje da je HIKESHI citoplazmatski protein. Izoelektrična tačka za C11orf73 je 5,108, što ukazuje na to da optimalno funkcionira u kiselijoj sredini.
Jennonukleotidni polimorfizam
urediJedini SNP,[14] ili jednonukleotidni polimorfizam, sekvence C11orf73 rezultira promjenom aminokiselina unutar proteina. Nedostatak drugih SNP-a najvjerojatnije je posljedica visokog stupnja konzervacija HIKESHI-a i smrtonosnog učinka koji mutacija proteina daje organizmu. Fenotip SNP-a je nepoznat.
Funkcija | Alel dbSNP | Proteinski ostatak | Položaj kodona | Položaj aminokiseline |
---|---|---|---|---|
Reference | C | Prolin [P] | 1 | 47 |
Misens | G | Alanin [A] | 1 | 47 |
Gensko susjedstvo
urediOkolni geni HIKESHI-a su CCDC81, ME3 i EED. Gleda se gensko susjedstvo kako bi se bolje razumjelo moguće djelovanje gena posmatrajući funkciju okolnih gena.
CCDC81 gen kodira za neokarakterizirani proteinski proizvod i orijentiran je na plus lanac. CCDC81-sekvence za domen sa zavojnicom sadrže 81 izoformu 1.
Gen ME3 označava prekursor mitohondrijskog jđmalatnog enzima 3. Malatni enzim katalizira oksidativnu dekarboksilaciju malata u piruvat, koristeći ili NAD+ ili NADP+ kao kofaktor. Tkiva sisara sadrže tri različite izoforme malatnog enzima: citosolnu NADP (+)-ovisnu izoformu, mitohondrijsku NADP (+) ovisnu izoformu i mitohondrijsku NAD (+)-ovisnu izoformu. Ovaj gen kodira izoformu ovisnu o mitohondrijskom NADP (+). Za ovaj gen je pronađeno više alternativno prerađenih varijanti transkripta, ali biološka valjanost nekih varijanti nije utvrđena.[16]
Gen EED označava razvojnu izoformu embrijskog ektoderma b i član je porodice polikomb grupe (PcG). Članovi porodice PcG tvore multimerne proteinske komplekse koji su uključeni u održavanje transkripcijskog represivnog stanja gena tokom uzastopnih ćelijskih generacija. Ovaj protein stupa u interakciju s pojačivačem zeste 2, citoplazmatskim repom integrina beta7, virusom imunodeficijencije tipa 1 (HIV-1) MA proteinom i proteinima histon-deacetilaze. Ovaj protein posreduje u represiji aktivnosti gena, deacetilacijom histona i može djelovati kao specifičan regulator funkcije integrina. Za ovaj gen su identificirane dvije varijante transkripta koje kodiraju različite izoforme.[17]
Interakcije
urediProgrami STRING [18] i Sigma-Aldrich-ov favorit gen [19] sugeriraju moguće interakcije proteina sa C11orf73. ARGUL1, CRHBP i EED, izvedenih iz značenja teksta, a HNF4A iz Sigma-Aldricha.
Protein | Opis | Metod | Rezultat |
---|---|---|---|
ARGUL1 | Nepoznat | Značenje teksta | 0,712 |
CRHBP | Vezujući protein koji oslobađa kortikotropin | Značenje teksta | 0,653 |
EED | Razvoj embrionskog ektoderma | Značenje tekta | 0,420 |
HNF4A | Transkripcijski regulator | Sigma-Aldrich | N/A |
ARGUL1 je nepoznati protein s nepoznatom funkcijom. CRHBP je protein koji vezuje hormon koji oslobađa kortikotrofin i koji bi mogao imati ulogu u signalnoj kaskadi koja uključuje ili aktivira HIKESHI. EED, a susjedni protein C11orf73, je embrionski razvojni protein ektoderma i član je porodice Polycomb-grupe (PcG). Članovi porodice PcG tvore multimerne proteinske komplekse koji su uključeni u održavanje transkripcijskog represivnog stanja gena tokom uzastopnih ćelijskih generacija. HNF4A je regulator transkripcije i nije poznato regulira li HNF4A ekspresiju C11orf73 ili jednostavno stupa u interakciju s njim.[12
Evolucijska historija
urediEvolucijska povijest organizama može se odrediti pomoću sekvenci ortologa kao vremenskih referenci za stvaranje filogenetskog stabla. CLUSTALW [20] poredi više sekvenci, a program se takođe može koristiti za kreiranje takvog filogenetskog stabla zasnovanog na ortolozima C11orf73. S desne strane prikazano je generirano filogenetsko stablo s vremenskom linijom zasnovanom na vremenu divergencije. Napravljeno od HIKESHI ortologa, identično je filogenetskom stablu u literaturi, čak grupira slične organizme poput riba, ptica i gljiva.
Ortolozi
urediHomologne sekvence su ortologne ako su razdvojene događajem specijacije: kada se vrsta raziđe u dvije zasebne vrste, za divergentne kopije jednog gena u rezultirajućoj vrsti kaže se da su ortologne. Ortolozi ili ortologni geni su geni različitih vrsta koji su međusobno slični jer potiču od zajedničkog pretka. Ortologne sekvence pružaju korisne informacije u taksonomskoj klasifikaciji i filogenetskim studijama organizama. Obrazac genetičke divergencije može se koristiti za praćenje srodnosti organizama. Dva vrlo bliska organizma vjerojatno će pokazati vrlo slične sekvence DNK između dva ortologa. Nasuprot tome, organizam koji se evolucijski ukloni iz drugog organizma vjerojatno će pokazati veće odstupanje u sekvencj ortologa koji se proučavaju.
Tabela otvorenog okvira čitanja hromosoma 11 73: Ortolozi
Vrsta | Uobičajeno ime | Protein | Pristuoni broj | Dužina NT | Identitet NT | Dužina AA | Identitet AA | E-Vrijednost |
---|---|---|---|---|---|---|---|---|
Homo sapiens | Čovjek | C11orf73 | NM_016401 | 1187 bp | 100% | 197 aa | 100% | 0 |
Bon taurus | Govedo | LOC504867 | NP_001029398 | 996 bp | 73,60% | 197 aa | 98% | 5,30E-84 |
Mus musculus | Miš | l7Rn6 | NP_080580 | 1045 bp | 72,90% | 197 aa | 97% | 4,80E-83 |
Gallus gallus | Kokoš | LOC427034 | N/A | 851 bp | 56,20% | 197 aa | 88,3% | 5,60E-76 |
Taeniopygia guttata | Zebrasta zeba | LOC100190155 | ACH44077 | 997 bp | 61,60% | 997 aa | 87,80% | 1,20E-75 |
Xenopus laevis | Žaba | MGC80709 | NP_001087012 | 2037 bp | 36,50% | 197 aa | 86,80% | 1,70E-75 |
Oncorhynchus mykiss | Dužičasta pastrmka | CK073 | NP_001158574 | 940 bp | 52,20% | 197 aa | 75,10% | 2,70E-66 |
Tetradon nigroviridis | Tetradon | Neimenovani proteinski proizvod | CAF89643 | N/A | N/A | 197 aa | 70,90% | 1,40E-61 |
Trichoplax adhaerens | Trihoplaks | TRIADDRAFT_19969 | XP_002108733 | 600 bp | 33,10% | 199 aa | 52,30% | 2,00E-47 |
Culex quinquefasciatus | Komarac | Konzervirani hipotetski protein | XP_001843282 | 594 bp | 30,70% | 197 aa | 49,30% | 2,50E-41 |
Drosophilia melanogaster | Vinska mušica | CG13926 | NP_647633 | 594 bp | 31,50% | 197 aa | 48,50% | 4,50E-39 |
Laccaria bicolor | Pečurka | Predviđeni protein | XP_001878996 | 696 bp | 36,40% | 202 aa | 35,20% | 8,30E-24 |
Candida albicans | Gliva | CaO19.13758 | XP_716157 | 666 bp | 36,10% | 221 aa | 24% | 5,70E-11 |
Tabela prikazuje 13 sekvenci (12 ortologa, jedna originalna sekvenca) zajedno sa imenom proteina, pristupnim brojevima, identitetom nukleotida, identitetom proteina i E-vrijednostima. Pristupni brojevi su identifikacijski brojevi iz baze podataka NCBI Protein. Nukleotidnoj sekvenci se može pristupiti sa stranice sekvence proteina iz DBSOURCE-a, koja daje pristupni broj i predstavlja vezu do stranice sekvence nukleotida. Dužina nukleotidne i proteinske sekvence za svakog ortologa i njegov odgovarajući organizam također je navedena u tabeli. Pored dužine sekvence nalaze se identiteti ortologa originalnom HIKESHI genu. Identiteti i E-vrijednosti stečeni su pomoću globalnog programa usklađivanja, ALIGN, iz SDSC Biology Workbench-a i BLAST-a iz NCBI-a.
Grafikon prikazuje postotak identiteta ortologa u odnosu na vrijeme divergencije organizma za stvaranje uglavnom linearne krivulje. Dva glavna zgloba unutar krivulje ukazuju na vrijeme duplikacije gena, prije otprilike 450 i 1.150 miliona godina. Paralozi iz dupliciranja gena vjerojatno su toliko različiti od visoko konzerviranih ortologa HIKESHI-ja da nisu pronađeni pomoću alata Blink ili BLAST.
Vrijednost m (ukupan broj promjena aminokiselina koje su se dogodile u segmentu od 100 aminokiselina), koja je ispravljena vrijednost n (broj razlika aminokiselina iz šablona sekvence), također se koristi za izračunavanje λ (prosječna amino kiselina) kisele promjene godišnje, obično predstavljene u vrijednostima λE9).
m/100 = –ln(1-n/100) λ = (m/100)/(2*T)
References
uredi- ^ a b c GRCh38: Ensembl release 89: ENSG00000149196 - Ensembl, maj 2017
- ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000062797 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ a b Fernández-Valdivia R, Zhang Y, Pai S, Metzker ML, Schumacher A (januar 2006). "l7Rn6 Encodes a Novel Protein Required for Clara Cell Function in Mouse Lung Development". Genetics. 172 (1): 389–99. doi:10.1534/genetics.105.048736. PMC 1456166. PMID 16157679.
- ^ a b Zhang QH, Ye M, Wu XY, Ren SX, Zhao M, Zhao CJ, Fu G, Shen Y, Fan HY, Lu G, Zhong M, Xu XR, Han ZG, Zhang JW, Tao J, Huang QH, Zhou J, Hu GX, Gu J, Chen SJ, Chen Z (oktobar 2000). "Cloning and Functional Analysis of cDNAs with Open Reading Frames for 300 Previously Undefined Genes Expressed in CD34+ Hematopoietic Stem/Progenitor Cells". Genome Res. 10 (10): 1546–60. doi:10.1101/gr.140200. PMC 310934. PMID 11042152.
- ^ a b Rinchik EM, Carpenter DA (1993). "N-ethyl-N-nitrosourea-induced prenatally lethal mutations define at least two complementation groups within the embryonic ectoderm development (eed) locus in mouse chromosome 7". Mamm. Genome. 4 (7): 349–53. doi:10.1007/BF00360583. PMID 8358168. S2CID 24689449.
- ^ "UniProt, Q53FT3". Pristupljeno 23. 8. 2021.
- ^ AceView NCBI Gene Information AceView Arhivirano 12. 12. 2001. na Wayback Machine
- ^ Genomatix ElDorade tool for promoter analysis ElDorado Product Page Arhivirano 6. 10. 2008. na Wayback Machine
- ^ "Expression profile for C11orf73". GeneNote version 2.4. Weizmann Institute of Science. septembar 2009. Arhivirano s originala, 5. 3. 2012. Pristupljeno 23. 8. 2021.
- ^ "EST Profile - Hs.283322". National Center for Biotechnology Information, United States National Library of Medicine.
- ^ Saier Lab Bioinformatics Group http://www.tcdb.org/progs/hydro.php
- ^ NCBI SNP Database https://www.ncbi.nlm.nih.gov/snp/ Arhivirano 4. 2. 2006. na Wayback Machine
- ^ NCBI Entrez https://www.ncbi.nlm.nih.gov/nuccore/NC_000011.9?from=86011067&to=86059171&report=graph
- ^ RefSeq NCBI Database https://www.ncbi.nlm.nih.gov/RefSeq/ Arhivirano 11. 4. 2006. na Wayback Machine
- ^ "RefSeq: NCBI Reference Sequence Database".
- ^ STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) http://string-db.org/ Arhivirano 26. 7. 2010. na Wayback Machine
- ^ Sigma-Aldrich's Favorite Gene http://www.sigmaaldrich.com/life-science/your-favorite-gene-search.html
- ^ CLUSTALW Program Julie D. Thompson, Desmond G. Higgins and Toby J. Gibson http://workbench.sdsc.edu/ Arhivirano 8. 4. 2006. na Wayback Machine
Vanjski linkovi
uredi- Lokacija ljudskog genoma C11orf73 i stranica sa detaljima o genu C11orf73 u UCSC Genome Browseru.