Ontologija gena

ontologija za opis funkcije gena i genskih proizvoda

Ontologija gena (eng. Gene Ontology: GO) glavna je bioinformatička inicijativa za objedinjavanje zastupljenosti atributa gena i genskih proizvoda u svim vrstama.[1] Preciznije, cilj projekta je

  1. održavanje i razvoj svog kontroliranog rječnika gena i svojstava genskih proizvoda;
  2. označavanje gena i genskih proizvoda, te asimilacija i širenje podatke o bilješkama;
  3. pružanje alata za lahak pristup svim aspektima podataka predviđenih projektom i omogućavanje funkcionalne interpretacije eksperimentalnih podataka koristeći GO, naprimjer putem analize obogaćenja.[2][3] GO je dio većeg napora u klasifikaciji, Otvorene biomedicinske ontologije, jedan od prvih članova kandidata za OBO livnicu.[4]
Ontologija gena/Genska ontologija
SkraćenicaGO
Datum osnivanja1998.
VrstaBiološka baza ontoloških podataka
StatusAktivna
Glavno sjedišteSlobodni pristup
ČlanstvoGlobalno
JezikEngleski
Glavni organKonzorcij za ontologiju gena
Br. volonteraNeograničen
Veb-sajthttp://geneontology.org/

Dok se označavanje gena fokusira na gene i genske proizvode, ontologija gena usredotočuje se na funkciju gena i genskih proizvoda. GO također proširuje napore koristeći jezik markiranja za izradu podataka (ne samo gena i njihovih proizvoda već i kuriranih atributa) mašinski čitljivih, i to na način koji je objedinjen u svim vrstama (dok se konvencije genske nomenklature razlikuju u zavisnosti od biološkog taksona).

Pojmovi i ontologija

uredi

S praktičnog gledišta, ontologija je prikaz nečega o čemu znamo. "Ontologije" se sastoje od prikaza stvari koje se mogu otkriti ili direktno uočiti, kao i odnosa između tih stvari.

U biologiji i srodnim domenama ne postoji univerzalna standardna terminologija, a upotreba izraza može biti specifična za vrstu, područje istraživanja ili čak određenu istraživačku skupinu. To otežava komunikaciju i razmjenu podataka. Projekt genske ontologije pruža ontologiju definiranih pojmova koji predstavljaju svojstva genskog proizvoda. Ontologija pokriva tri domena:

Svaki GO pojam u ontologiji ima svoj naziv, koji može biti:

  • riječ ili niz riječi;
  • jedinstveni alfanumerički identifikator;
  • definicija sa navedenim izvorima, i
  • ontologija koja ukazuje na domen kojem pripada.

Termini mogu imati i sinonime, koji se klasificiraju kao tačno ekvivalentni nazivu, širi, uži ili povezani; reference na ekvivalentne koncepte u drugim bazama podataka i komentari o značenju ili upotrebi izraza. GO ontologija je strukturirana kao usmjereni aciklični grafikon, a svaki pojam je definirao odnose sa jednim ili više drugih pojmova u istm domenu, a ponekad i na drugim domenima. GO rječnik je dizajniran da bude neutralan prema vrstama i uključuje termine koji se primjenjuju na prokariote i eukariote, pojedinačne i višećelijse organizme.

GO nije statična, a dopune, ispravke i izmjene predlažu i traže od njih članovi istraživačkih i anotacijskih zajednica, kao i oni koji su direktno uključeni u GO projekt.[5] Naprimjer, komentator može zatražiti određeni termin koji predstavlja metabolički put ili se dio ontologije može revidirati uz pomoć stručnjaka iz zajednice (npr.[6]). Predložene izmjene pregledaju urednici ontologije i primjenjuju se prema potrebi.

Datoteke GO ontologije i napomena su besplatno dostupne na web stranici GO[7] in a number of formats, or can be accessed online using the GO browser AmiGO. Projekt Ontologija gena također nudi mapiranje svojih pojmova za preuzimanje u druge sisteme klasifikacije.

Primjeri termina

uredi
id: GO:0000016
ime: laktazna aktivnost
ontologija: molekulska_funkcija
def: "Kataliza reakcije: laktoza + H2O=D-glukoza + D-galaktoza". [EC:3.2.1.108]
sinonim: "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
sinonim: "aktivnost laktoza-galaktohidrolazew" EXACT [EC:3.2.1.108]
xref: EC:3.2.1.108
xref: MetaCyc:LACTASE-RXN
xref: Reaktom:20536
is_a: GO:0004553 ! hidrolazma aktivnost, hidroliziranje spojeva O-glikozila

Podatak o izvoru:[8]

Označavanje

uredi

Označavanje genoma obuhvata praksu pribavljanja podataka o genskom proizvodu, a GO oznake za to koriste termine iz GO. Bilješke kustosa GO integrirane su i distribuirane na web stranici GO, gdje se mogu direktno preuzeti ili pregledati na mreži pomoću AmiGO.[9] Pored identifikatora genskog proizvoda i relevantnog izraza GO, GO oznake imaju najmanje sljedeće podatke:

  • Referenca korištena za izradu napomena (npr. članak u časopisu);
  • Šifra dokaza koja označava tip dokaza na kojima se zasniva napomena;
  • Datum i kreator napomene

Dodatne informacije, ovisno o rerminu GO i korištenim dokazima, kao i posebne informacije, poput uvjeta pod kojima se funkcija poštuje, također se mogu uključiti u napomenu GO.

Kodiranje dokaza dolazi iz kontroliranog rječnika kodova Ontologije koda dokaza, koji pokriva i ručne i automatizirane metode označavanje.[10] Naperimjer, Traceable Author Statement (TAS) znači da je kustos (kurator) pročitao objavljeni naučni rad i da metapodaci za tu napomenu navode taj rad; Izvučeno iz sličnosti sekvence (ISS) znači da je ljudski kustos pregledao rezultate pretraživanja sličnosti sekvenci i potvrdio da je biološki značajan. Oznake iz automatiziranih procesa (naprimjer, preslikavanje bilješki kreiranih korištenjem drugog rječnika označavanje) dobivaju kod Izvučeno iz elektronske bilješke (IEA). U 2010. godini preko 98% svih GO oznaka izvedeno je računarski, ne od strane kustosa, ali od 2. jula 2019. računarski je izvedeno samo oko 30% svih GO oznaka.[11][12]

Budući da ove oznake ne provjerava čovjek, GO konzorcij smatra da su marginalno manje pouzdane i da su obično na višem nivou, manje detaljni pojmovi. Cjeloviti skupovi podataka o označavanjima mogu se preuzeti s web stranice GO. Da bi podržao razvoj anotacija, GO konzorcij pruža radionice i mentore novim grupama kustosa i programera.

Mnogi algoritmi mašinskog učenja dizajnirani su i implementirani za predviđanje napomena o genetičkoj ontologiji.[13][14]

Primjeri označavanja

uredi
Genski proizvod : Aktin, srčani mišić alfa 1, UniProtKB:P68032
GO termin: heart contraction ; GO:0060047 (biološki proces)
Kod dokaza: Inferencija mutantnog fenotipa (IMP)
Referenca: PubMed
Označio: UniProtKB, 6. jun, 2008

Podatak o izvoru:[15]

Alati

uredi

Dostupan je veliki broj alata,[16] kako na mreži, tako i za preuzimanja koja koriste podatke koje pruža projekt GO. Velika većina njih dolazi od trećih strana; konzorcij GO razvija i podržava dva alata, AmiGO i OBO-Edit.

AmiGO[9][17] je internetska aplikacija koja omogućava korisnicima da pretražuju, pregledavaju i vizualiziraju ontologije i podatke o oznakama genskog proizvoda. Također ima alat BLAST-a,[18] tools allowing analysis of larger data sets,[19][20] and an interface to query the GO database directly.[21]

AmiGO može se koristiti na mreži na web stranici GO za pristup podacima koje pruža GO konzorcij ili se može preuzeti i instalirati za lokalnu upotrebu, u bilo kojoj bazi podataka koja koristi shemu baze podataka GO (npr.[22]). Besplatni softver otvorenog koda dostupan je kao dio distribucije go-dev softvera.[23]

OBO-Edit[24] je uređivač ontologije otvorenog koda, neovisan o platformi, koji je razvio i održava Konzorcij za genetičku ontologiju. Implementiran je u [[Java (programski jezik] | Java]] i koristi pristup orijentiran na grafove za prikaz i uređivanje ontologija. OBO-Edit uključuje sveobuhvatni interfejs (sučelje) za pretraživanje i filtriranje, s opcijom prikazivanja podskupina pojmova, kako bi ih vizualno razlikovali; korisnički interfejs se takođe može prilagoditi prema korisničkim željama. OBO-Edit također ima rezoner koji može zaključiti veze koje nisu izričito navedene, na osnovu postojećih odnosa i njihovih svojstava. Iako je razvijen za biomedicinske ontologije, OBO-Edit može se koristiti za pregled, pretraživanje i uređivanje bilo koje ontologije. Slobodno je dostupan za preuzimanje.[23]

Konzorcij

uredi

Konzorcij za gensku ontologiju je skup bioloških baza podataka i istraživačkih grupa koje su aktivno uključene u projekt genske ontologije.[12] To uključuje niz baza podataka o model organizama i baze podataka o više vrsta, grupe za razvoj softvera i namjensku redakciju.

Historija

uredi

Ontologija gena je prvobitno konstruirana 1998., u organizaciji Konzorcija istraživača koji su proučavali genome tri modelnih organizma: Drosophila melanogaster (voćna mušica), Mus musculus (miš) i Saccharomyces cerevisiae (pivski ili pekarski kvasac).[25] Mnoge druge baze podataka o model-organizmima pridružile su se Konzorciju ontologoje gena, doprinoseći ne samo anotacijskim podacima, već i razvoju ontologija i alata za pregled i primjenu podataka. Mnoge velike baze podataka o biljkama, životinjama i mikroorganizmima daju svoj doprinos ovom projektu.[7] As of July 2019, the GO contains 44,945 terms; there are 6,408,283 annotations to 4,467 different biological organisms.[7] Postoji značajna literatura o razvoju i upotrebi GO-a, a ona je postala standardni alat u bioinformatičkom arsenalu. Njihovi ciljevi imaju tri aspekta: izgradnja ontologije gena, dodjeljivanje ontologije genima/genskim proizvodima i razvoj softvera i baza podataka za prva dva objekta.

Počinje se pojavljivati i nekoliko analiza genske ontologije, koristeći formalna svojstva razreda (metasvojstva), koja su nezavisna od domena. Naprimjer, vidi ontološka analiza bioloških ontologija.[26]

Također pogledajte

uredi

Reference

uredi
  1. ^ The Gene Ontology Consortium (januar 2008). "The Gene Ontology project in 2008". Nucleic Acids Research. 36 (Database issue): D440–4. doi:10.1093/nar/gkm883. PMC 2238979. PMID 17984083.
  2. ^ Dessimoz, Christophe; Škunca, Nives, ured. (2017). The Gene Ontology Handbook. Methods in Molecular Biology. 1446. doi:10.1007/978-1-4939-3743-1. ISBN 9781493937431. ISSN 1064-3745. S2CID 3708801.  
  3. ^ Gaudet, Pascale; Škunca, Nives; Hu, James C.; Dessimoz, Christophe (2017). "Primer on the Gene Ontology". The Gene Ontology Handbook. Methods in Molecular Biology. 1446. str. 25–37. doi:10.1007/978-1-4939-3743-1_3. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMC 6377150. PMID 27812933.
  4. ^ Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Ireland A, Mungall CJ, Leontis N, Rocca-Serra P, Ruttenberg A, Sansone SA, Scheuermann RH, Shah N, Whetzel PL, Lewis S (novembar 2007). "The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration". Nature Biotechnology. 25 (11): 1251–5. doi:10.1038/nbt1346. PMC 2814061. PMID 17989687.
  5. ^ Lovering, Ruth C. (2017). "How Does the Scientific Community Contribute to Gene Ontology?". u Dessimoz, C; Skunca, N (ured.). The Gene Ontology Handbook. Methods in Molecular Biology (jezik: engleski). 1446. Springer (New York). str. 85–93. doi:10.1007/978-1-4939-3743-1_7. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812937.
  6. ^ Diehl AD, Lee JA, Scheuermann RH, Judith Blake (april 2007). "Ontology development for biological systems: immunology". Bioinformatics. 23 (7): 913–5. doi:10.1093/bioinformatics/btm029. PMID 17267433. Greška u vankuverskom stilu: name u nazivu 4 (pomoć)
  7. ^ a b c "The Gene Ontology Resource". Gene Ontology Consortium.
  8. ^ Sjcarbon,Gene Ontology Consortium Wiki (10. 7. 2013). "AmiGO_2_Manual:term_Page" (html).
  9. ^ a b AmiGO--the current official web-based set of tools for searching and browsing the Gene Ontology database
  10. ^ "Evidence Code Ontology". Evidence Code Ontology.
  11. ^ du Plessis L, Skunca N, Dessimoz C (novembar 2011). "The what, where, how and why of gene ontology--a primer for bioinformaticians". Briefings in Bioinformatics. 12 (6): 723–35. doi:10.1093/bib/bbr002. PMC 3220872. PMID 21330331.
  12. ^ a b "The GO Consortium". Arhivirano s originala, 2. 7. 2014. Pristupljeno 16. 3. 2009.
  13. ^ Pinoli P, Chicco D, Masseroli M (juni 2013). "Computational algorithms to predict Gene Ontology annotation". BMC Bioinformatics. 16 (6): S4. doi:10.1186/1471-2105-16-S6-S4. PMC 4416163. PMID 25916950.
  14. ^ Cozzetto, Domenico; Jones, David T. (2017). "Computational Methods for Annotation Transfers from Sequence". u Dessimoz, C; Skunca, N (ured.). The Gene Ontology Handbook. Methods in Molecular Biology (jezik: engleski). 1446. Springer (New York). str. 55–67. doi:10.1007/978-1-4939-3743-1_5. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812935.
  15. ^ The GO Consortium (16. 3. 2009). "AmiGO: P68032 Associations".
  16. ^ Mosquera JL, Sánchez-Pla A (juli 2008). "SerbGO: searching for the best GO tool". Nucleic Acids Research. 36 (Web Server issue): W368–71. doi:10.1093/nar/gkn256. PMC 2447766. PMID 18480123.
  17. ^ Carbon S, Ireland A, Mungall CJ, Shu S, Marshall B, Lewis S (januar 2009). AmiGO Hub; Web Presence Working Group. "AmiGO: online access to ontology and annotation data". Bioinformatics. 25 (2): 288–9. doi:10.1093/bioinformatics/btn615. PMC 2639003. PMID 19033274.
  18. ^ "AmiGO BLAST tool". Arhivirano s originala, 20. 8. 2011. Pristupljeno 13. 3. 2009.
  19. ^ AmiGO Term Enrichment tool Arhivirano 7. 4. 2008. na Wayback Machine; finds significant shared GO terms in an annotation set
  20. ^ AmiGO Slimmer Arhivirano 29. 9. 2011. na Wayback Machine; maps granular annotations up to high-level terms
  21. ^ GOOSE Arhivirano 1. 3. 2009. na Wayback Machine, GO Online SQL Environment; allows direct SQL querying of the GO database
  22. ^ The Plant Ontology Consortium (16. 3. 2009). "Plant Ontology Consortium". Pristupljeno 16. 3. 2009.
  23. ^ a b "Gene Ontology downloads at SourceForge". Pristupljeno 16. 3. 2009.
  24. ^ Day-Richter J, Harris MA, Haendel M, Lewis S (august 2007). "OBO-Edit--an ontology editor for biologists". Bioinformatics. 23 (16): 2198–200. doi:10.1093/bioinformatics/btm112. PMID 17545183.
  25. ^ Ashburner M, Ball CA, Judith Blake, Botstein DB, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, Sherlock G (maj 2000). "Gene ontology: tool for the unification of biology. The Gene Ontology Consortium". Nature Genetics. 25 (1): 25–9. doi:10.1038/75556. PMC 3037419. PMID 10802651. Greška u vankuverskom stilu: name u nazivu 3 (pomoć)
  26. ^ Deb, B. (2012). "An ontological analysis of some biological ontologies". Frontiers in Genetics. 3: 269. doi:10.3389/fgene.2012.00269. PMC 3509948. PMID 23226158.
  27. ^ Götz S, García-Gómez JM, Terol J, Williams TD, Nagaraj SH, Nueda MJ, Robles M, Talón M, Dopazo J, Conesa A (juni 2008). "High-throughput functional annotation and data mining with the Blast2GO suite". Nucleic Acids Research. 36 (10): 3420–35. doi:10.1093/nar/gkn176. PMC 2425479. PMID 18445632.

Vanjski linkovi

uredi