Sekvenciranje cijelog genoma

Sekvenciranje cijelog genoma (WGS), također poznato kao puno sekvenciranje genoma, kompletno sekvenciranje genoma ili sekvenca cijelog genoma, je proces određivanja cjeline, ili skoro cjeline, DNK genomske sekvence organizma u datom trenutku.[2] Ovo podrazumijeva sekvenciranje celokupne hromosomske DNK organizma kao i DNK sadržane u mitohondrijama, za biljke, u hloroplastima.

Elektroferogrami se obično koriste za sekvenciranje dijelova genoma.[1]
Shematski kariogram čovjeka, koji prikazuje pregled ljudskog genoma, sa 22 homologna hromosoma, i ženske (XX) i muške (XY) verzije polnih hromosoma (dolje desno), kao i mitohondrijski genom (po mjeri dolje lijevo).

Sekvenciranje cijelog genoma se uglavnom koristilo kao istraživački alat, ali je uvedeno u klinike 2014. godine.[3][4][5] U budućnosti personalizirane medicine podaci o sekvencama cijelog genoma mogu biti važan alat za usmjeravanje terapijske intervencije.[6] Alat sekvenciranje gena na SNP-ovima se također koristi za preciziranje funkcionalnih varijanti iz studija asocijacija i poboljšanje znanja dostupnog istraživačima zainteresiranim za evolucijsku biologiju, i stoga može postaviti temelje za predviđanje podložnosti bolesti i odgovora na lijekove.

Sekvenciranje cijelog genoma ne treba brkati sa DNK profiliranjem, koje samo određuje vjerovatnoću da genetički materijal potiče od određene osobe ili grupe, a ne sadrži dodatne informacije o genetičkim odnosima, porijeklu ili podložnosti određenim bolestima.[7] Osim toga, sekvenciranje cijelog genoma ne treba miješati sa metodima koji sekvenciraju specifične podskupove genoma – takvi metodi uključuju sekvenciranje cijelog egzoma (1–2% genoma) ili SNP-genotipizaciju (< 0,1% genoma).

Eksperimentalni detalji

uredi

Ćelije za sekvenciranje

uredi

Gotovo svaki biološki uzorak koji sadrži potpunu kopiju DNK – čak i vrlo malu količinu DNK ili drevnu DNK – može pružiti genetički materijal neophodan za potpuno sekvenciranje genoma. Takvi uzorci mogu uključivati pljuvačku, epitelne ćelije, koštanu srž, dlake (sve dok sadrže dlakin folikul), sjeme, lišće biljaka ili bilo šta drugo što ima ćelije koje sadrže DNK.

Jednoćelijsko sekvenciranje genoma

uredi

Sekvanca genoma jedne ćelije odabrane iz mješovite populacije ćelija može se odrediti korištenjem tehnika „sekvenciranja genoma jedne ćelije“. Ovo ima važne prednosti u mikrobiologiji životne sredine u slučajevima kada se jedna ćelija određene vrste mikroorganizama možemikroskopski izolovati iz mešovite populacije, na osnovu njenih morfoloških ili drugih karakteristika. U takvim slučajevima se normalno neophodni koraci izolacije i rasta organizma u kulturi mogu izostaviti, čime se omogućava sekvenciranje mnogo većeg spektra genoma organizma.[8]

Sekvenciranje jednoćelijskog genoma se testira kao i metodom zvanim preimplantacijska genetička dijagnoza, pri čemu se ćelija iz embriona stvorena oplodnjom in vitro uzima i analizira prije transfera embrija u maternicu.[9] After implantation, cell-free fetal DNA can be taken by simple venipuncture from the mother and used for whole genome sequencing of the fetus.[10]

Rane tehnike

uredi
 
ABI PRISM 3100 genetički analizator. Takvi kapilarni sekvenceri automatizirali su rane napore sekvenciranja genoma.

Sekvenciranje gotovo čitavog ljudskog genoma prvi put je postignuto 2000. godine, dijelom upotrebom tehnologije nasumično sekvenciranje. Dok je potpuna sekvenca genoma za male (4000–7000 baznih parova) genoma već bila u upotrebi 1979.,[11] šira primjena imala je koristi od sekvenciranja krajnjeg dijela u paru, kolokvijalno poznatog kao „sekvenciranje dvocijevne sačmarice“. Kako su projekti sekvenciranja počeli uzimati duže i složenije genome, više grupa je počelo shvatati da se korisne informacije mogu dobiti sekvenciranjem oba kraja fragmenta DNK. Iako je sekvenciranje oba kraja istog fragmenta i praćenje uparenih podataka bilo glomaznije od sekvenciranja jednog kraja dva različita fragmenta, saznanje da su dvije sekvence orijentirane u suprotnim smjerovima i da su otprilike dužine fragmenta odvojene od svakog drugog je bio vrijedan u rekonstrukciji sekvence originalnog ciljnog fragmenta.

Prvi objavljeni opis upotrebe uparenih krajeva bio je 1990. godine kao dio sekvenciranja ljudskog lokusa HPRT,[12] iako je upotreba uparenih krajeva bila ograničena na zatvaranje praznina nakon primjene tradicijskog pristupa Nasumičnog sekvencioniranja. Prvi teorijski opis čiste strategije sekvenciranja krajeva u paru, uz pretpostavku da su fragmenti konstantne dužine, bio je u 1991.[13] U 1995. uvedena je inovacija korištenja fragmenata različitih veličina,[14] i pokazao da bi čista strategija krajnjeg sekvenciranja u paru bila moguća na velikim ciljevima. Strategiju je naknadno usvojio Institut za genomska istraživanja (TIGR) za sekvenciranje cjelokupnog genoma bakterije Haemophilus influenzae 1995.,[15] i Celera Genomics da sekvencionira cio genom vinske mušice 2000,[16] a potom i čitav ljudski genom. Applied Biosystems, koji se sada zove Life Technologies, proizveo je automatske kapilarne sekvencere koje koriste i Celera Genomics i Projekt ljudskog genoma.

Sadašnje tehnike

uredi

Dok je kapilarno sekvenciranje bilo prvi pristup uspješnom sekvenciranju gotovo punog ljudskog genoma, još uvijek je preskupo i traje predugo za komercijalne svrhe. Od 2005. godine kapilarno sekvenciranje je progresivno zamijenjeno visokopropusnim (ranije "sljedeća generacija") tehnologijama sekvenciranja kao što su Illumina dye sequencing, pirosekvenciranje i SMRT sekvenciranje.[17] Sve ove tehnologije nastavljaju da koriste osnovnu strategiju sačmarice; naime nasumičnu paralelizaciju i generisanje šablona putem fragmentacije genoma.

Pojavile su se i druge tehnologije, uključujući nanopornu tehnologiju. Iako je tačnost sekvenciranja nanoporne tehnologije niža od one gore, njena dužina čitanja je u prosjeku mnogo duža.[18] Ova generacija dugog čitanja je vrijedna posebno u "de novo" aplikacijama sekvenciranja cijelog genoma.[19]

Baze podataka

uredi

Prema Scienceu glavne baze podataka cijelih genoma su:

Biobanka Završeni cijeli genomi Informacije o izdanju/pristupu
UK Biobank 200.000 Dostupno putem web platforme u novembru 2021., to je najveći javni skup podataka čitavih genoma. Genomi su povezani sa anonimiziranim medicinskim informacijama i dostupniji su za biomedicinska istraživanja od prethodnih, manje sveobuhvatnih skupova podataka. Očekuje se da će još 300.000 genoma biti objavljeno početkom 2023.[20][21]
Trans-Omics for Precision Medicine 161.000 Nacionalni instituti za zdravlje (NIH) zahtijevaju saglasnost za određeni projekt
Million Veteran Program 125.000 Istraživači za ne-boračka pitanja imaju pristup 2022
Genomics England 100.000 genoma 120.000 Istraživači se moraju pridružiti saradnji
Svi od nas 90.000 NIH očekuje da će biti objavljen početkom 2022.

Pokrivenost genoma

uredi

U smislu genomske pokrivenosti i tačnosti, sekvenciranje cijelog genoma može se općenito klasificirati u bilo koju od sljedećih:[22]

  • „Draft sekvence“, koja pokriva približno 90% genoma sa približno 99,9% tačnosti
  • „Završena sekvenca“, koja pokriva više od 95% genoma sa približno 99,99% tačnosti

Izrada zaista kvalitetne "gotove" sekvence prema ovoj definiciji je vrlo skupa. Dakle, većina rezultata "sekvenciranja cijelog genoma" ljudi su "nacrti sekvenci" (ponekad iznad, a ponekad ispod preciznosti definirane gore).

Također pogledajte

uredi

Sekvencirani genomi

uredi

Šablon:Lista sekvenciranih genoma

Reference

uredi
  1. ^ Alberts, Bruce; Johnson, Alexander; Lewis, Julian; Raff, Martin; Roberts, Keith; Walter, Peter (2008). "Chapter 8". Molecular biology of the cell (5th izd.). New York: Garland Science. str. 550. ISBN 978-0-8153-4106-2.
  2. ^ "Definition of whole-genome sequencing – NCI Dictionary of Cancer Terms". National Cancer Institute (jezik: engleski). 20. 7. 2012. Pristupljeno 13. 10. 2018.
  3. ^ Gilissen (juli 2014). "Genome sequencing identifies major causes of severe intellectual disability". Nature. 511 (7509): 344–7. Bibcode:2014Natur.511..344G. doi:10.1038/nature13394. PMID 24896178. S2CID 205238886.
  4. ^ Nones, K; Waddell, N; Wayte, N; Patch, AM; Bailey, P; Newell, F; Holmes, O; Fink, JL; Quinn, MC; Tang, YH; Lampe, G; Quek, K; Loffler, KA; Manning, S; Idrisoglu, S; Miller, D; Xu, Q; Waddell, N; Wilson, PJ; Bruxner, TJ; Christ, AN; Harliwong, I; Nourse, C; Nourbakhsh, E; Anderson, M; Kazakoff, S; Leonard, C; Wood, S; Simpson, PT; Reid, LE; Krause, L; Hussey, DJ; Watson, DI; Lord, RV; Nancarrow, D; Phillips, WA; Gotley, D; Smithers, BM; Whiteman, DC; Hayward, NK; Campbell, PJ; Pearson, JV; Grimmond, SM; Barbour, AP (29. 10. 2014). "Genomic catastrophes frequently arise in esophageal adenocarcinoma and drive tumorigenesis". Nature Communications. 5: 5224. Bibcode:2014NatCo...5.5224N. doi:10.1038/ncomms6224. PMC 4596003. PMID 25351503.
  5. ^ van El, CG; Cornel, MC; Borry, P; Hastings, RJ; Fellmann, F; Hodgson, SV; Howard, HC; Cambon-Thomsen, A; Knoppers, BM; Meijers-Heijboer, H; Scheffer, H; Tranebjaerg, L; Dondorp, W; de Wert, GM (juni 2013). "Whole-genome sequencing in health care. Recommendations of the European Society of Human Genetics". European Journal of Human Genetics. 21 Suppl 1 (Suppl 1): S1–5. doi:10.1038/ejhg.2013.46. PMC 3660957. PMID 23819146.
  6. ^ Mooney, Sean (Sep 2014). "Progress towards the integration of pharmacogenomics in practice". Human Genetics. 134 (5): 459–65. doi:10.1007/s00439-014-1484-7. PMC 4362928. PMID 25238897.
  7. ^ Journal Kijk, January 1, 2009.
  8. ^ Braslavsky, Ido; et al. (2003). "Sequence information can be obtained from single DNA molecules". Proc Natl Acad Sci USA. 100 (7): 3960–3984. Bibcode:2003PNAS..100.3960B. doi:10.1073/pnas.0230489100. PMC 153030. PMID 12651960.
  9. ^ Heger, Monica (2. 10. 2013). "Single-cell Sequencing Makes Strides in the Clinic with Cancer and PGD First Applications". Clinical Sequencing News.
  10. ^ Yurkiewicz, I. R.; Korf, B. R.; Lehmann, L. S. (2014). "Prenatal whole-genome sequencing--is the quest to know a fetus's future ethical?". New England Journal of Medicine. 370 (3): 195–7. doi:10.1056/NEJMp1215536. PMID 24428465.
  11. ^ Staden R (juni 1979). "A strategy of DNA sequencing employing computer programs". Nucleic Acids Res. 6 (7): 2601–10. doi:10.1093/nar/6.7.2601. PMC 327874. PMID 461197.
  12. ^ Edwards, A; Caskey, T (1991). "Closure strategies for random DNA sequencing". Methods: A Companion to Methods in Enzymology. 3 (1): 41–47. doi:10.1016/S1046-2023(05)80162-8.
  13. ^ Edwards A; Voss H; Rice P; Civitello A; Stegemann J; Schwager C; Zimmermann J; Erfle H; Caskey CT; Ansorge W (april 1990). "Automated DNA sequencing of the human HPRT locus". Genomics. 6 (4): 593–608. doi:10.1016/0888-7543(90)90493-E. PMID 2341149.
  14. ^ Roach JC; Boysen C; Wang K; Hood L (mart 1995). "Pairwise end sequencing: a unified approach to genomic mapping and sequencing". Genomics. 26 (2): 345–53. doi:10.1016/0888-7543(95)80219-C. PMID 7601461.
  15. ^ Fleischmann RD; Adams MD; White O; Clayton RA; Kirkness EF; Kerlavage AR; Bult CJ; Tomb JF; Dougherty BA; Merrick JM; McKenney; Sutton; Fitzhugh; Fields; Gocyne; Scott; Shirley; Liu; Glodek; Kelley; Weidman; Phillips; Spriggs; Hedblom; Cotton; Utterback; Hanna; Nguyen; Saudek; et al. (juli 1995). "Whole-genome random sequencing and assembly of Haemophilus influenzae Rd". Science. 269 (5223): 496–512. Bibcode:1995Sci...269..496F. doi:10.1126/science.7542800. PMID 7542800.
  16. ^ Adams, MD; et al. (2000). "The genome sequence of Drosophila melanogaster". Science. 287 (5461): 2185–95. Bibcode:2000Sci...287.2185.. CiteSeerX 10.1.1.549.8639. doi:10.1126/science.287.5461.2185. PMID 10731132.
  17. ^ Mukhopadhyay R (februar 2009). "DNA sequencers: the next generation". Anal. Chem. 81 (5): 1736–40. doi:10.1021/ac802712u. PMID 19193124.
  18. ^ Sevim, Volkan; Lee, Juna; Egan, Robert; Clum, Alicia; Hundley, Hope; Lee, Janey; Everroad, R. Craig; Detweiler, Angela M.; Bebout, Brad M.; Pett-Ridge, Jennifer; Göker, Markus; Murray, Alison E.; Lindemann, Stephen R.; Klenk, Hans-Peter; O’Malley, Ronan (26. 11. 2019). "Shotgun metagenome data of a defined mock community using Oxford Nanopore, PacBio and Illumina technologies". Scientific Data (jezik: engleski). 6 (1): 285. Bibcode:2019NatSD...6..285S. doi:10.1038/s41597-019-0287-z. ISSN 2052-4463. PMC 6879543. PMID 31772173.
  19. ^ Wang, Yunhao; Zhao, Yue; Bollas, Audrey; Wang, Yuru; Au, Kin Fai (novembar 2021). "Nanopore sequencing technology, bioinformatics and applications". Nature Biotechnology (jezik: engleski). 39 (11): 1348–1365. doi:10.1038/s41587-021-01108-x. ISSN 1546-1696. PMC 8988251 Provjerite vrijednost parametra |pmc= (pomoć). PMID 34750572 Provjerite vrijednost parametra |pmid= (pomoć).
  20. ^ "200,000 whole genomes made available for biomedical studies by U.K. effort". www.science.org (jezik: engleski). Pristupljeno 11. 12. 2021.
  21. ^ "Whole Genome Sequencing data on 200,000 UK Biobank participants available now". www.ukbiobank.ac.uk. Pristupljeno 11. 12. 2021.
  22. ^ Kris A. Wetterstrand, M.S. "The Cost of Sequencing a Human Genome". National Human Genome Research Institute. Last updated: November 1, 2021

Vanjski linkovi

uredi

Šablon:Personalna genomika

Šablon:Genetics-footer