ARMH3 ili armadiloliki protein sa domenom3, znan i kao UPF0668 i c10orf76, je protein koji je kod ljudi kodiran genom ARMH3.[5] Njegova funkcija trenutno nije poznata, ali eksperimentalni dokazi sugeriraju da bi mogao biti uključen u regulaciju transkripcije. Protein sadrži konzervirani prolinom bogati motiv,[5][6] sugerirajući da može sudjelovati u interakcijama protein-protein, putem SH3-vezujućeg domena,[7] iako takve interakcije nisu eksperimentalno potvrđene. Čini se da je dobro konzervirani gen nastao u gljivama prije otprilike 1,2 milijarde godina.[6][8] Lokus je alternativno prerađen i predviđeno je da će dati pet proteinskih varijanti, od kojih tri sadrže proteinski domen nepoznate funkcije, DUF1741.[5][9]

ARMH3
Identifikatori
AliasiARMH3
Vanjski ID-jeviMGI: 1918867 HomoloGene: 15843 GeneCards: ARMH3
Lokacija gena (čovjek)
Hromosom 10 (čovjek)
Hrom.Hromosom 10 (čovjek)[1]
Hromosom 10 (čovjek)
Genomska lokacija za ARMH3
Genomska lokacija za ARMH3
Bend10q24.32Početak101,845,599 bp[1]
Kraj102,056,193 bp[1]
Lokacija gena (miš)
Hromosom 19 (miš)
Hrom.Hromosom 19 (miš)[2]
Hromosom 19 (miš)
Genomska lokacija za ARMH3
Genomska lokacija za ARMH3
Bend19|19 C3Početak45,805,803 bp[2]
Kraj45,986,927 bp[2]
Ortolozi
VrsteČovjekMiš
Entrez
Ensembl
UniProt
RefSeq (mRNK)

NM_024541

NM_198296

RefSeq (bjelančevina)

NP_078817

NP_938038

Lokacija (UCSC)Chr 10: 101.85 – 102.06 MbChr 19: 45.81 – 45.99 Mb
PubMed pretraga[3][4]
Wikipodaci
Pogledaj/uredi – čovjekPogledaj/uredi – miš

Aminokiselinska sekvenca uredi

Dužina polipeptidnog lanca je 689 aminokiselina, а molekulska težina 78.710 Da.[10]

1020304050
MAQVEKRGGLLRKSSASKKPLKEKVVLMYDEIFMTEDPSKCSPRFWEELF
LMKVNLEYLEGKLESLDGEELMKIKDNINCLFQHCIQALGEEHPIRVVNA
LQTLCALIRGVHQKNKSTSGFDIINMLMGFDKAELCMKNLMESLDSLLCA
EGSESLKSLCLKLLLCLVTVTDNISQNTILEYVMINSIFEAILQILSHPP
SRREHGYDAVVLLALLVNYRKYESVNPYIVKLSIVDDEATLNGMGLVIAQ
ALSEYNRQYKDKEEEHQSGFFSALTNMVGSMFIADAHEKISVQTNEAILL
ALYEAVHLNRNFITVLAQSHPEMGLVTTPVSPAPTTPVTPLGTTPPSSDV
ISSVELPLDADVQTSNLLITFLKYSSIVMQDTKDEHRLHSGKLCLIILTC
IAEDQYANAFLHDDNMNFRVNLHRMPMRHRKKAADKNLPCRPLVCAVLDL
MVEFIVTHMMKEFPMDLYIRCIQVVHKLLCYQKKCRVRLHYTWRELWSAL
INLLKFLMSNETVLLAKHNIFTLALMIVNLFNMFITYGDTFLPTPSSYDE
LYYEIIRMHQSFDNLYSMVLRLSTNAGQWKEAASKVTHALVNIRAIINHF
NPKIESYAAVNHISQLSEEQVLEVVRANYDTLTLKLQDGLDQYERYSEQH
KEAAFFKELVRSISTNVRRNLAFHTLSQEVLLKEFSTIS

Funkcija uredi

Utvrđeno je da sadrži potencijalni SH3 vezujući domen,[5][7] za koje je poznato da učestvuju u interakciji vezivanja proteina-protein; međutim, s c10orf76 eksperimentalno nisu potvrđene nikakve interakcije proteina. Studija ekspresije gena iz 2007. pokazala je da ekspresija c10orf76 varira obrnuto s ekspresijom nekoliko drugih gena, uključujući NFYB, CCR5 i NSBP1, što ukazuje na to da protein može funkcionirati kao regulator transkripcije.[11]

Gen uredi

Karakteristike uredi

Kod ljudi, gen ARMH3, poznat i pod pseudonimom FLJ13114, proteže se na 210.577 baznih parova na zadnjoj strani dugog kraka hromosoma 10.[9] Sa 26 alternativno prerađenih egzona kodiraju pet potencijalnih Vrijanti transkripata, od kojih je najveća duga 4.101 parova baza.[9]

 
Mapa ljudskog hromosoma 10 sa c10orf76 označenim crvenom linijom.

Ljudski ARMH3 lokus bočno je s lijeve i desne strane okružen HPS6, odnosno KCNIP2.[5] HPS6 je protein koji može imati ulogu u biogenezi organela,[12] i KCNIP2 je protein s interakcijom kalijevog kanala s naponom.[13] Isti obrazac primjećen je i u ortolognom lokusu kod miševa,[14] kao i većine ostalih kičmenjaka.

Ekspresija uredi

Profil gena NCBI (GenBank) za c10orf76 označava početak prvog transkribiranog egzona, kao početkom gena.[5] Primarni promotor predviđen alatom El Dorado iz Genomatixa počinje sa 519 parova baza uzvodno od ovog početnog mjesta za transkripciju.[15] Predviđa se da će ovaj promotor imati dužinu od 658 parova baza i stoga uključuje prvi transkribovani egzon na svom 3' kraju.[5]

Smatra se da je c10orf76 lokus alternativno prerađen na najmanje pet jedinstvenih izoformi, iako je nejasno kako je ta prerada regulirana.[5] Drugi potencijalni promotor, koji je također predvidio El Dorado, vjerovatno podstiče ekspresiju jedne od kraćih dokumentiranih varijanti (pozicioniranih prije egzona 23).[9][15]

Protein uredi

Svojstva uredi

Najveća proteinska varijanta dugačka je 689 aminokiselina.[5] Ima molekulsku masu od približno 78,7 kDa i izoelektričnu tačku na pH 6,13.[16] Može se izlučiti neklasičnim putem.[17] NCBI identifikuje proteinski domen nepoznate funkcije između aminokiselina Asp 435 i Leu 671, poznat kao DUF1741 (domen nepoznate funkcije 1741).[5] Nije poznato da ovaj domen postoji ni u jednom drugom proteinu.[6]

Ekspresija proteina uredi

Dotletov program iz ExPASy-a predvidio je potencijalnu regiju matične petlje na tri primarna kraja prvog egzona (a time i kraj promotora).[18] Ovo bi moglo poslužiti za regulaciju translaciju proteina.[19] Također, Alu segment u tri primarne neprevedene regije zrele iRNK mogao bi poslužiti kao potencijalni translacijski regulatorni mehanizam.[20]

Utvrđeno je da se protein različito eksprimira u nekim medicinskim stanjima i kao odgovor na određene ćelijske signale. Naprimjer, smanjena ekspresija c10orf76 primijećena je kod pacijenata s hroničnom limfocitnom leukemijom B-ćelija.[21] Smanjena ekspresija se također primjećuje u ćelijama liječenim vaskularnim endotelnim faktorom rasta.[22]

Smatra se da je protein lokaliziran u citoplazmi,[23] iako je to neizvesno. Predviđeno je i da je to 3-prolazni transmembranski protein.[16] Također, signal za sortiranje mitohondrija je identificiran na početku jedne od izoformi proteina, koristeći MitoProt II (nalazi se na Met 416 najveće proteinske varijante).[24]

Struktura uredi

 
Strukturno predviđanje proteina c10orf76, prema softvwru PHYRE2 za savijanje proteina. Ova struktura je slična ljudskom simplekinu, proteinu za koji se smatra da regrutira regulatorne faktore u mehanizmu za poliadenilaciju.[25]

Struktura proteina c10orf76 nije eksperimentalno istražena. Predviđa se da će sekundarna struktura biti potpuno alfa heliksna u prirodi, sa interventnim područjima poremećaja proteina.[26][27] Potencijalni domen koji se veže za SH3 nalazi se na predviđenom području poremećaja, dodatno podržavajući funkciju vezanja proteina-protein za c10orf76. Predviđeno je da je spiralno područje između aminokiselina 610-655 motiv upredene zavojnice.[28]

Serversko PHYRE2[29] predviđanje strukture proteina sugeriralo je da prvih 200 ostataka c10orf76 može imati jake strukturne sličnosti sa simplekinom,[26] jedarno lokalizirani protein za koji se smatra da je komponenta skele kompleksa poliadenilacije.[25]

Predviđene interakcije proteina uredi

Utvrđeno je da je ekspresija c10orf76 iRNK obrnuto povezana s ekspresijom raznih drugih iRNK, uključujući NFYB, CCR5 i NSBP1. Iako ova studija i predviđeni domeni vezanja SH3 sugeriraju da c10orf76 sudjeluje u interakcijama vezanja proteina-protein, nijedna nije eksperimentalno potvrđena. Kratko pretraživanje pomoću IntAct -a,[30] MINT-a,[31] i STRING-a[32] također je dalo nultu predviđenu interakciju protein-protein.

Predviđene posttranslacijske modifikacije uredi

Postoji potencijal da se protein izlučuje neklasičnim putem,[17] što može biti temelj funkcionalnosti nekih posttranslacijskih modifikacija. U sekvenci proteina postoji deset konzerviranih potencijalnih mjesta fosforilacije.[33] Također, postoji devet ostataka za koje NetOGlyc pouzdano (> 90%) predviđa da će proći O-vezanu glikozilaciju, a svi oni ostaju unutar regije niske složenosti između Leu 325 i Ser 359

Donja tabela sažima najbolje predviđene posttranslacijske modifikacije za c10orf76.

Alat Predviđena modifikacija Homo sapiens Mus musculus Danio rerio
NetPhos[33] Fosforilacija S233, T319, S376, S547, S647, T103, T536, Y225, Y406, Y468 S233, T319, S376, S547, S647, T103, T536, Y225, Y406, Y468 S233, S319, S376, S547, S647, T103, T536, Y225, Y406, Y468
SumoPlot[34] Sumoilacija K62, K603 K62, K603 K35, K62, K603
Sulfinator[35] Sulfacija Y255, Y259, Y548, Y553 Y255, Y259, Y548, Y553 Y255, Y259, Y548, Y553
NetOGlyc[36] O-GalNAc T327, T328, S331, T335, T336, T339, T343, T344, S347 T327, S331, T333, T336, T339, T343, T344, S347 T39, T328, T331, S336, T338, T339, T343, T344
YinOYang[37] O-β-GlcNAc T171, T327, S331, T335, T336, T339, T343, T344, S347, T587 T171, T327, S331, T335, T336, T339, T343, T344, S347, T587 T171, S200, T331, T587, S687

Regije od potencijalnog istraživačkog interesa uredi

Protein kodiran najvećom iRNK varijantom c10orf76 kodira prolinom bogati motiv koji sadrži dva domena PxxP, gdje "P" predstavlja ostatak prolina, a "x" bilo koju drugu aminokiselinu [5] (ispod označeno plavom bojom). Pokazalo se da ovi domeni sudjeluju u interakcijama vezanja proteina-proteina, posebno putem SH3 domena vezanja proteina. Regija s neobično velikim brojem aminokiselina sa bočnim grupama koje sadrže kisik (dolje označeno zelenom bojom). NetOGlyc analiza [36] regije sugerira da će ti ostaci vjerovatno proći glikozilaciju vezanu s O, pa stoga mogu poslužiti za regulaciju vezivanja za potencijalni domen vezanja SH3.[38]

325 L V T T P V S P A P T T P V T P L G T T P P S S 359

 
Poravnavanje sekvenci pokazuje sličnosti između dijela 3`-UTR c10orf76 i ALU elementa iz porodice Alu-Sc. Poravnati su pomoću NCBI-jevog BLAST alata.[6]

Alu element je identificiran u 3'-UTR najduže varijante transkripta iRNK [5] Nije jasno da li ova sekvenca služi bilo kojoj funkcionalnoj ili regulatornoj svrsi, ali postoje dokazi za Alu-posredovana regulacija translacije proteina, pa se to ne može isključiti u c10orf76.[20]

Predviđeno je da N-terminalne varijante kratkog transkripta (egzoni 17-26) imaju signal za sortiranje mitohondrija sa 96% pouzdanosti pomoću alata MitoProt II.[24] Nije jasno je li ovo je jedinstveno transkribirana varijanta ili je posljedica cijepanja proteina-proteina pune veličine. Ne postoje predviđeni alternativni promotori uzvodno od prvog egzona ove varijante.[15]

Homologija uredi

ARMH3 je dobro konzerviran širom Eumetazoa.[5][6] Neki slabo slični ortolozi (približno 35% identiteta sekvence) identificirano je u Parazoa (tj. Amphimedon queenslandica) i u Fungi, konkretno Ascomycetes (tj. Aspergillus oryzae).[6]

Sljedeća tabela ilustrira sličnost sekvenci između ljudskog proteina c10orf76 i različitih ortologa. Slične sekvence su identificirane BLAST-om [6] i BLAT[39] alatima.

Vrsta Uobičajeno ime organizma Pristup bazi NCBI Identitet sekvence Sličnost sekvence Dužina (AA) Uobičajena oznaka gena
Homo sapiens Čovjek NP_078817.2 100% 100% 689 UPF0668 protein C10orf76
Mus musculus Miš NP_938038.2 99% 99% 689 UPF0668 protein C10orf76 homolog
Danio rerio Zebrica NP_956913.2 85% 93% 689 UPF0668 protein C10orf76 homolog
Apis florea Medonosna pčela XP_003695991.1 51% 70% 641 PREDVIĐANJE: UPF0668 homolog proteina C10orf76
Amphimedon queenslandica Spužva XP_003383350.1 46% 67% 667 PREDVIĐANJE: UPF0668 C10orf76-liki protein
Acyrthosiphon pisum Grašak XP_001952575.2 40% 61% 684 PREDVIĐANJE: Homologna izoforma 1UPF0668 proteina C10orf76
Aspergillus oryzae Gljiva XP_001820240 23% 42% 653 Hipotetski protein AOR_1_2042154

Modelni organizmi uredi

U proučavanju PNPO funkcije, korišteni su modelni organizmi. Uvjetna linija 9130011E15Rik nokaut-miševa [40][41] generirana je kao dio programa Međunarosnog konzorcija za miševe – visokopropusnog projekta mutageneze za generiranje i distribuciju životinjskih modela bolesti zainteresiranim naučnicima.[42][43][44]

Muške i ženske životinje prolazile su standardizirani fenotipski skrining, kako bi se utvrdili efekti delecije.[45][46] Od 24 izvedena testa ina mutantnim miševima, uočene su dvije značajne abnormalnosti.[45] Tokom gestacije, nije utvrđen homozigotni mutantni embrion, pa tako nijedan nije preživio do odvikavanja. Preostali testovi su izvedeni na mutiranim heterozigotnim odraslim miševima; opažene dvije dodatne značajne abnormalnosti kod ovih životinja.[45]

Fenotip nokaut-miša 9130011E15Rik
Svojstvo Fenotip
Svi podaci raspoloživi na linku:[47][48]
Leukociti periferne krvi nakon šesr sedmica 6 Normalan
Hematologija šest sedmica Normalan
Insulin Normalnal
Vijabilnost homozigota na P14 Nenormalan
Studija recesivne letalnosti Nenormalan
Tjelesna težina Normalan
Neurološka procjena Normalan
Snaga stiska Normalan
Dismorfologija Normalan
Indirektna kalorimetrija Normalan
Test tolerancije glukoze Normalan
Slušni odgovor moždanog stabla Normalan
DEXA Normalan
Radiografija Normalan
Morfologija oka Normalan
Klinička hemija Normalan
Hematologija 16 Weeks Normal
Leukociti periferne krvi 16 sedmica Normalan
Težina srca Normalan
Salmonella infekcia Normalan
Funkcija citotoksičnih T-ćelija Normalan
Imunofenotizacija slezene Normalan
Imunofenotipizacija mezenternih limfnih čvorova Normalan
Imunophenotipizacija koštane srži Normalan
Esej antijedarnih antitijela Normalan
Kompozicija epidermne imunosti Normalan
Izazov grupe Normalan

Reference uredi

  1. ^ a b c GRCh38: Ensembl release 89: ENSG00000120029 - Ensembl, maj 2017
  2. ^ a b c GRCm38: Ensembl release 89: ENSMUSG00000039901 - Ensembl, maj 2017
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b c d e f g h i j k l m "Entrez Gene: Chromosome 10 open reading frame 76 (Human)". Pristupljeno 28. 4. 2013.
  6. ^ a b c d e f g "NCBI BLAST Tool". Pristupljeno 2. 4. 2013.
  7. ^ a b Jia CY, Nie J, Wu C, Li C, Li SS (Aug 2005). "Novel Src homology 3 domain-binding motifs identified from proteomic screen of a Pro-rich region". Molecular & Cellular Proteomics. 4 (8): 1155–66. doi:10.1074/mcp.M500108-MCP200. PMID 15929943.
  8. ^ "TimeTree: The Timescale of Life". Pristupljeno 23. 5. 2013.
  9. ^ a b c d "AceView: c10orf76". Pristupljeno 28. 4. 2013.
  10. ^ "UniProt, Q5T2E6". Pristupljeno 30. 8. 2021.
  11. ^ Weinberg MS, Barichievy S, Schaffer L, Han J, Morris KV (2007). "An RNA targeted to the HIV-1 LTR promoter modulates indiscriminate off-target gene activation". Nucleic Acids Research. 35 (21): 7303–12. doi:10.1093/nar/gkm847. PMC 2175361. PMID 17959645.
  12. ^ "Entrez Gene: HPS6 Hermansky-Pudlak syndrome 6". Pristupljeno 5. 5. 2013.
  13. ^ Burgoyne RD (Mar 2007). "Neuronal calcium sensor proteins: generating diversity in neuronal Ca2+ signalling". Nature Reviews. Neuroscience. 8 (3): 182–93. doi:10.1038/nrn2093. PMC 1887812. PMID 17311005.
  14. ^ "Entrez Gene: 9130011E15Rik cDNA (Mus musculus)". Pristupljeno 13. 5. 2013.
  15. ^ a b c "El Dorado Gene Promoter Analysis". Arhivirano s originala, 22. 5. 2021. Pristupljeno 21. 4. 2013.
  16. ^ a b SDSC Biology Workbench. "Biology WorkBench 3.2". Pristupljeno 1. 5. 2013.
  17. ^ a b "SecretomeP". Pristupljeno 18. 4. 2013.
  18. ^ "Sib Dotlet Sequence Alignment". Pristupljeno 13. 5. 2013.
  19. ^ Pandey NB, Marzluff WF (Dec 1987). "The stem-loop structure at the 3' end of histone mRNA is necessary and sufficient for regulation of histone mRNA stability". Molecular and Cellular Biology. 7 (12): 4557–9. doi:10.1128/MCB.7.12.4557. PMC 368142. PMID 3437896.
  20. ^ a b Häsler J, Strub K (2006). "Alu elements as regulators of gene expression". Nucleic Acids Research. 34 (19): 5491–7. doi:10.1093/nar/gkl706. PMC 1636486. PMID 17020921.
  21. ^ "Geo Profile: Differential Expression of c10orf76 in B-cell leukemia". Pristupljeno 13. 5. 2013.
  22. ^ "Geo Profile: Differential Expression of c10orf76 under VEGF-A conditions". Pristupljeno 13. 5. 2013.
  23. ^ "SOSUI Localization Prediction". Arhivirano s originala, 15. 5. 2012. Pristupljeno 24. 4. 2013. Arhivirano 15. 5. 2012. na Wayback Machine
  24. ^ a b "MitoProt II - v1.101". Arhivirano s originala, 30. 8. 2021. Pristupljeno 13. 5. 2013.
  25. ^ a b Takagaki Y, Manley JL (Mar 2000). "Complex protein interactions within the human polyadenylation machinery identify a novel component". Molecular and Cellular Biology. 20 (5): 1515–25. doi:10.1128/MCB.20.5.1515-1525.2000. PMC 85326. PMID 10669729.
  26. ^ a b "PHYRE2 results for c10orf76". Pristupljeno 18. 4. 2013.[trajno mrtav link]
  27. ^ "PredictProtein - Sequence Analysis, Structure and Function Prediction". Arhivirano s originala, 27. 11. 2020. Pristupljeno 18. 4. 2013.
  28. ^ Lupas A, Van Dyke M, Stock J (maj 1991). "Predicting coiled coils from protein sequences". Science. 252 (5009): 1162–4. doi:10.1126/science.252.5009.1162. PMID 2031185. S2CID 2442386.
  29. ^ "PHYRE2 Protein Fold Recognition Server". Pristupljeno 18. 4. 2013.
  30. ^ "IntAct Interaction Database". Pristupljeno 3. 5. 2013.
  31. ^ Chatr-aryamontri A, Ceol A, Palazzi LM, Nardelli G, Schneider MV, Castagnoli L, Cesareni G (Jan 2007). "MINT: the Molecular INTeraction database". Nucleic Acids Research. 35 (Database issue): D572–4. doi:10.1093/nar/gkl950. PMC 1751541. PMID 17135203.
  32. ^ "STRING functional and predicted protein interactions". Pristupljeno 10. 5. 2013.
  33. ^ a b "NetPhos". Pristupljeno 24 Apr 2013.
  34. ^ "SumoPlot". Arhivirano s originala, 20. 4. 2009. Pristupljeno 24 Apr 2013.
  35. ^ "Sulfinator". Pristupljeno 24 Apr 2013.
  36. ^ a b "NetOGlyc". Pristupljeno 23. 4. 2013.
  37. ^ "YinOYang". Pristupljeno 24 Apr 2013.
  38. ^ Wells L, Vosseller K, Hart GW (Mar 2001). "Glycosylation of nucleocytoplasmic proteins: signal transduction and O-GlcNAc". Science. 291 (5512): 2376–8. doi:10.1126/science.1058714. PMID 11269319. S2CID 9397432.
  39. ^ UCSC Genome Bioinformatics. "Human BLAT Search Tool". Pristupljeno 18. 3. 2013.
  40. ^ "International Knockout Mouse Consortium". Arhivirano s originala, 3. 4. 2012. Pristupljeno 30. 8. 2021.
  41. ^ "Mouse Genome Informatics".
  42. ^ Skarnes, W. C.; Rosen, B.; West, A. P.; Koutsourakis, M.; Bushell, W.; Iyer, V.; Mujica, A. O.; Thomas, M.; Harrow, J.; Cox, T.; Jackson, D.; Severin, J.; Biggs, P.; Fu, J.; Nefedov, M.; De Jong, P. J.; Stewart, A. F.; Bradley, A. (2011). "A conditional knockout resource for the genome-wide study of mouse gene function". Nature. 474 (7351): 337–342. doi:10.1038/nature10163. PMC 3572410. PMID 21677750.
  43. ^ Dolgin E (2011). "Mouse library set to be knockout". Nature. 474 (7351): 262–3. doi:10.1038/474262a. PMID 21677718.
  44. ^ Collins FS, Rossant J, Wurst W (2007). "A Mouse for All Reasons". Cell. 128 (1): 9–13. doi:10.1016/j.cell.2006.12.018. PMID 17218247. S2CID 18872015.
  45. ^ a b c Greška kod citiranja: Nevaljana oznaka <ref>; nije naveden tekst za reference s imenom mgp_reference
  46. ^ van der Weyden L, White JK, Adams DJ, Logan DW (2011). "The mouse genetics toolkit: revealing function and mechanism". Genome Biol. 12 (6): 224. doi:10.1186/gb-2011-12-6-224. PMC 3218837. PMID 21722353.
  47. ^ Greška kod citiranja: Nevaljana oznaka <ref>; nije naveden tekst za reference s imenom IMPCsearch_ref
  48. ^ Greška kod citiranja: Nevaljana oznaka <ref>; nije naveden tekst za reference s imenom iii_ref

Vanjski linkovi uredi