GRCh38
Referentni genom (također poznat kao referentni sklop), eng. skr. GRCh38, je digitalna baza podataka sekvenci nukleinskih kiselina, koju su naučnici sastavili kao reprezentativan primjer skupa gena u jednom idealiziranom individualnom organizmu date vrste. Budući da su sastavljeni od sekvenciranja DNK od brojnih pojedinačnih donora, referentni genom ne predstavljaju tačan skup gena bilo kojeg pojedinačnog organizma. Umjesto toga, referenca pruža haploidni mozaik različitih sekvenci DNK svakog donora. Postoje referentni genomi za više vrsta virusa, bakterija, gljiva, biljki i životinja.
Naprimjer, ljudski referentni genom, GRCh38, iz Genome Reference Consortium izveden je od trinaest anonimnih volontera.[1]
Kako cijena sekvenciranja DNK pada, a pojavljuju se nove tehnologije sekvenciranja potpunog genoma, nastavlja se generirati više sekvenci genoma. Referentni genomi se obično koriste kao vodič na osnovu kojeg se grade novi genomi, što im omogućava da se sastave mnogo brže i jeftinije od početnog Projekta ljudskog genoma. Većina osoba sa celim sekvenciranim genomom, kao što je James D. Watson, imala je svoj genom sastavljen na ovaj način.[2][3] Za veći dio genoma, referenca pruža dobru aproksimaciju DNK bilo kojeg pojedinca. Ali u regijama sa velikom alelnom raznolikošću, kao što je glavni kompleks histokompatibilnosti kod ljudi i glavni urinarni proteini miševa, referentni genom može se značajno razlikovati od drugih jedinki.[4][5][6] Poređenje između referentnog (build 36) i Watsonovog genoma otkrilo je razlike u 3,3 miliona jednonukleotidnih polimorfizama, dok se oko 1,4 posto njegove DNK uopće nije moglo uporediti s referentnim genomom.[2][7] Za regije za koje je poznato da postoje velike varijacije, uz referentni lokus sklapaju se i skupovi alternativnih lokusa.
Referentnim genomima može se pristupiti onlajn na nekoliko lokacija, koristeći namenske pretraživače kao što su Ensembl ili UCSC Genome Browser.[8]
Svojstva referentnih genoma
urediMjere dužine
urediDužina genoma može se mjeriti na više različitih načina.
Jednostavan način mjerenja dužine genoma je prebrojavanje broja parova baza u sklopu.[9]
Zlatni put je alternativna mjera dužine koja izostavlja suvišne regije kao što su haplotipovi i pseudoautosomne regije.[10][11] Obično se konstruira unošenjem informacija sekvenciranja slojeva preko fizičke mape, kako bi se kombinirale informacije o skeli. To je 'najbolja procjena' kako će genom izgledati i obično uključuje praznine, što ga čini dužim od tipskog sklopa baznog para.[12]
Genomi sisara
urediReferentne genome ljudi i miša održava i poboljšava Konzorcij referentnog genoma (GRC), grupa od manje od 20 naučnika iz brojnih instituta za istraživanje genoma, uključujući Evropski institut za bioinformatiku, Nacionalni centar za biotehnološke informacije, Institut Sanger i McDonnell genomski institut na ‘’Washington University’’ u St. Louisu. GRC nastavlja da poboljšava referentne genome, izgradnjom novih poravnavnja koja sadrže manje praznina i ispravljanjem pogrešnih prikaza u sekvenci.
Ljudski referentni genom
urediLjudski referentni genom GRCh38 objavljen je iz Konzorcija referentnog genoma 17. decembra 2013..[13] Ova verzija je sadržavala oko 250 praznina, dok je prva imala otprilike 150.000 praznina.[1] GRCh38 sklop je zatvorio ili smanjio više od 100 praznina. Nanoporno sekvenciranje je donijelo zatvaranje 12 praznina u referentnom sklopu GRCh38, korištenjem ultra dugih očitavanja.[14]
Ljudski referentni genom izveden je od trinaest anonimnih dobrovoljaca iz Buffalo, New York. Donatori su regrutovani putem oglasa u The Buffalo News, u nedjelju, 23. marta 1997. Prvih deset volontera i deset volonterki pozvani su da zakažu sastanak sa genetičkim savjetnicima i donirati krv iz koje je izvučena DNK. Kao rezultat obrade uzoraka DNK, oko 80 % referentnog genoma dolazi od osam ljudi, a jedan muškarac, označen kao RP11, čini 66 posto od ukupnog broja. ABO sistem krvnih grupa razlikuje se među ljudima, ali ljudski referentni genom sadrži samo O alel, iako su ostali označeni).[1][7][15][16][17]
Ljudski referentni genom ima ograničenja zbog činjenice da se radi o "jednoj" različitoj sekvenci. Zbog toga je posebno nazvan kao "referenca". Glavna svrha kojoj je stavljen je kao indeks, ili lokator, za genetike karakteristike. Projekat 1000 genoma kreira bazu podataka koja će pružiti informacije o varijacijama u genomima u ljudskim populacijama.[18]
Nedavni sklopovi genoma su sljedeći:[19]
Naziv objave | Datum objave | Ekvivalent verziji UCSC-a |
---|---|---|
GRCh38 | Decembar 2013. | hg38 |
GRCh37 | Februar 2009. | hg19 |
NCBI Build 36.1 | Mart 2006. | hg18 |
NCBI Build 35 | Maj 2004. | hg17 |
NCBI Build 34 | Juli 2003. | hg16 |
Referentni mišji genom
urediNedavni sklopovi mišjeg genoma sljedeći:[19]
Naziv objave | Datum objave | Ekvivalent verziji UCSC-a |
---|---|---|
GRCm38 | Decembar 2011. | mm10 |
NCBI Build 37 | Juli 2007. | mm9 |
NCBI Build 36 | Februar 2006. | mm8 |
NCBI Build 35 | Avgust 2005. | mm7 |
NCBI Build 34 | Mart 2005. | mm6 |
Reference
uredi- ^ a b c Editorial (oktobar 2010). "E pluribus unum". Nature Methods. 7 (5): 910–918. doi:10.1038/nmeth0510-331. PMID 20440876.
- ^ a b Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT, Gomes X, Tartaro K, Niazi F, Turcotte CL, Irzyk GP, Lupski JR, Chinault C, Song XZ, Liu Y, Yuan Y, Nazareth L, Qin X, Muzny DM, Margulies M, Weinstock GM, Gibbs RA, Rothberg JM (2008). "The complete genome of an individual by massively parallel DNA sequencing". Nature. 452 (7189): 872–6. Bibcode:2008Natur.452..872W. doi:10.1038/nature06884. PMID 18421352.
- ^ Izuzetak je J. Craig Venter čija je DNK sekvencionirana i sastavljena pomoću metoda nasumičnog sekvenciranja tzv. metoda sačmarice.
- ^ MHC Sequencing Consortium (1999). "Complete sequence and gene map of a human major histocompatibility complex". Nature. 401 (6756): 921–923. Bibcode:1999Natur.401..921T. doi:10.1038/44853. PMID 10553908. S2CID 186243515.
- ^ Logan DW, Marton TF, Stowers L (2008). Vosshall LB (ured.). "Species specificity in major urinary proteins by parallel evolution". PLOS ONE. 3 (9): e3280. Bibcode:2008PLoSO...3.3280L. doi:10.1371/journal.pone.0003280. PMC 2533699. PMID 18815613.
- ^ Hurst J, Beynon RJ, Roberts SC, Wyatt TD (oktobar 2007). Urinary Lipocalins in Rodenta:is there a Generic Model?. Chemical Signals in Vertebrates 11. Springer New York. ISBN 978-0-387-73944-1.
- ^ a b Wade, Nicholas (31. 5. 2007). "Genome of DNA Pioneer Is Deciphered". New York Times. Pristupljeno 21. 2. 2009.
- ^ Flicek P, Aken BL, Beal K, et al. (januar 2008). "Ensembl 2008". Nucleic Acids Res. 36 (Database issue): D707–14. doi:10.1093/nar/gkm988. PMC 2238821. PMID 18000006.
- ^ "Help - Glossary - Homo sapiens - Ensembl genome browser 87". www.ensembl.org.
- ^ "Golden path length | VectorBase". www.vectorbase.org. Arhivirano s originala, 7. 8. 2020. Pristupljeno 12. 12. 2016.
- ^ "Help - Glossary - Homo sapiens - Ensembl genome browser 87". www.ensembl.org.
- ^ "Whole assembly vs Golden path length in Ensembl? - SEQanswers". seqanswers.com. Pristupljeno 12. 12. 2016.
- ^ NCBI. "GRCh38 - hg38 - Genome - Assembly - NCBI". ncbi.nlm.nih.gov. Pristupljeno 15. 3. 2019.
- ^ Jain, Miten; Koren, Sergey; Miga, Karen H; Rand, Arthur C; Sasani, Thomas A; Tyson, John R; Beggs, Andrew D; Dilthey, Alexander T (29. 1. 2018). "Nanopore sequencing and assembly of a human genome with ultra-long reads". Nature Biotechnology (jezik: engleski). 36 (4): 338–345. doi:10.1038/nbt.4060. ISSN 1546-1696. PMC 5889714. PMID 29431738.
|first4=
nedostaje|last4=
(pomoć) - ^ Scherer, Stewart (2008). A short guide to the human genome. CSHL Press. str. 135. ISBN 978-0-87969-791-4.
- ^ Ballouz, Sara; Dobin, Alexander; Gillis, Jesse A. (9. 8. 2019). "Is it time to change the reference genome?". Genome Biology. 20 (1): 159. doi:10.1186/s13059-019-1774-4. PMC 6688217. PMID 31399121.
- ^ Rosenfeld, Jeffrey A.; Mason, Christopher E.; Smith, Todd M.; Seo, Jeong-Sun (11. 7. 2012). "Limitations of the Human Reference Genome for Personalized Genomics". PLOS ONE. 7 (7): e40294. Bibcode:2012PLoSO...740294R. doi:10.1371/journal.pone.0040294. PMC 3394790. PMID 22811759.
- ^ https://www.internationalgenome.org/home
- ^ a b "UCSC Genome Bioinformatics: FAQ". genome.ucsc.edu. Pristupljeno 18. 8. 2016.