BioCyc kolekcija baza podataka

Kolekcija baze podataka BioCyc je asortiman baza podataka o putevima/genomima specifičnih za organizam (PGDB) koje pružaju referencu na informacije o genomu i metaboličkom putu za hiljade organizama.[1] Od juna 2021. godine, u BioCyc-u je bilo preko 17.800 baza podataka. SRI International,[2] sa sjedištem u Menlo Parku, Kalifornija, održava porodicu podataka BioCyc.

Kategorije baza podataka

uredi

Na osnovu urađenog ručnog kuriranja, porodica BioCyc baza podataka podijeljena je na 3 nivoa:

Nivo 1: Baze podataka koje su primile najmanje godinu dana ručnog kuriranja zasnovanog na literaturi. Trenutno postoji sedam baza podataka u Tier 1. Od sedam, MetaCyc je glavna baza podataka koja sadrži skoro 2500 metaboličkih puteva iz mnogih organizama.[1][3] Druga važna baza podataka Tier 1 je HumanCyc koja sadrži oko 300 metaboličkih puteva pronađenih kod ljudi.[4] Preostalih pet baza podataka uključuje EcoCyc (E. coli),[5] AraCyc (Arabidopsis thaliana), YeastCyc ( Saccharomyces cerevisiae ), LeishCyc (Leishmania major Friedlin) i TrypanoCyc (Trypanosoma brucei).

Nivo 2: Baze podataka koje su kompjuterski predviđene, ali su primile umjereno ručno kuriranje (većina s kuracijom od 1-4 mjeseca). Baze podataka Tier 2 dostupne su za ručno vođenje od strane naučnika koji su zainteresovani za bilo koji određeni organizam. Tier 2 baze podataka trenutno sadrže 43 različite baze podataka o organizmima.

Nivo 3: Baze podataka koje je PathoLogic predvidio računarski i koje nisu dobile ručno kuriranje. Kao i kod Tier 2, baze podataka Tier 3 su takođe dostupne za kuriranje zainteresovanim naučnicima.

Softverski alati

uredi

BioCyc web stranica sadrži niz softverskih alata za pretraživanje, vizualizaciju, poređenje i analizu informacija o genomu i putevima. Uključuje pretraživač genoma i pretraživače za metaboličke i regulatorne mreže . Web stranica također uključuje alate za slikanje velikih ("omics") skupova podataka na metaboličke i regulatorne mreže, te na genom.

Upotreba u istraživanju

uredi

Budući da porodica BioCyc Database sadrži dugačku listu baza podataka specifičnih za organizam, kao i podatke na različitim sistemskim nivoima u živom sistemu, upotreba u istraživanju je bila u širokom spektru konteksta. Ovdje su istaknute dvije studije koje pokazuju dvije različite varijante upotrebe, jednu na skali genoma i drugu za identifikaciju specifičnih SNP-a ( single Nucleotide Polymorphisms) unutar genoma.

AlgaGEM

AlgaGEM je model metaboličke mreže na nivou genoma za kompartmentalnu ćeliju algi koju su razvili Gomes de Oliveira Dal'Molin et al.[6] baziran na genomu Chlamydomonas reinhardtii. Ima 866 jedinstvenih ORF-a, 1862 metabolita, 2499 unosa gen-enzim-reakcija-asocijacija i 1725 jedinstvenih reakcija. Jedna od Pathway baza podataka koja se koristi za rekonstrukciju je MetaCyc.

SNP-ovi

Studija Shimul Chowdhury i drugi.[7] pokazala je razliku između majčinih SNP-ova i metabolita uključenih u puteve homocisteina, folata i transsulfuracije u slučajevima s kongenitalnim srčanim defektima (CHDs) za razliku od kontrola. Studija je koristila HumanCyc za odabir gena kandidata i SNP-ova.

Reference

uredi

 

  1. ^ a b Caspi, R.; Altman, T.; Dreher, K.; Fulcher, C. A.; Subhraveti, P.; Keseler, I. M.; Kothari, A.; Krummenacker, M.; Latendresse, M. (2011). "The Meta Cyc database of metabolic pathways and enzymes and the Bio Cyc collection of pathway/genome databases". Nucleic Acids Research. 40 (Database issue): D742–53. doi:10.1093/nar/gkr1014. PMC 3245006. PMID 22102576. Greška kod citiranja: Neispravna oznaka <ref>; naziv "BioCyc1" definiran je nekoliko puta s različitim sadržajem
  2. ^ Home page of the SRI International
  3. ^ Karp, Peter D.; Caspi, Ron (2011). "A survey of metabolic databases emphasizing the Meta Cyc family". Archives of Toxicology. 85 (9): 1015–33. doi:10.1007/s00204-011-0705-2. PMC 3352032. PMID 21523460.
  4. ^ Romero, Pedro; Wagg, Jonathan; Green, Michelle L; Kaiser, Dale; Krummenacker, Markus; Karp, Peter D (2004). "Computational prediction of human metabolic pathways from the complete human genome". Genome Biology. 6 (1): R2. doi:10.1186/gb-2004-6-1-r2. PMC 549063. PMID 15642094.
  5. ^ Keseler, I. M.; Collado-Vides, J.; Santos-Zavaleta, A.; Peralta-Gil, M.; Gama-Castro, S.; Muniz-Rascado, L.; Bonavides-Martinez, C.; Paley, S.; Krummenacker, M. (2010). "Eco Cyc: A comprehensive database of Escherichia coli biology". Nucleic Acids Research. 39 (Database issue): D583–90. doi:10.1093/nar/gkq1143. PMC 3013716. PMID 21097882.
  6. ^ Dal'Molin, C. G.; Quek, L. E.; Palfreyman, R. W.; Nielsen, L. K. (2011). "AlgaGEM--a genome-scale metabolic reconstruction of algae based on the Chlamydomonas reinhardtii genome". BMC Genomics. 12 Suppl 4: S5. doi:10.1186/1471-2164-12-S4-S5. PMC 3287588. PMID 22369158.
  7. ^ Chowdhury, S; Hobbs, C. A.; MacLeod, S. L.; Cleves, M. A.; Melnyk, S; James, S. J.; Hu, P; Erickson, S. W. (2012). "Associations between maternal genotypes and metabolites implicated in congenital heart defects". Molecular Genetics and Metabolism. 107 (3): 596–604. doi:10.1016/j.ymgme.2012.09.022. PMC 3523122. PMID 23059056.