GenBank baza podataka sekvenci je otvoreno pristupna, označena zbirka svih javno dostupnih nukleotidnih sekvenci i njihovih proteinskih prijevoda. Proizvodi ga i održava Nacionalni centar za informacije o biotehnologiji (NCBI; dio Nacionalnih instituta za zdravlje u Sjedinjenim Državama) kao dio Međunarodne baze podataka o nukleotidnim sekvencama Saradnja (INSDC).

GenBank
SkraćenicaGB
PrethodnikNovoosnovana
Datum osnivanja1982.
VrstaJavna baza podataka o nukleotidima
StatusAktivan
CiljPrikupljanje nolvih podataka o nukleotidima i genima
Do 2023.: Nukleotidne sekvence za više od 300.000 organizama s pratećom bibliografskom i biološkom napomenom
Glavno sjedišteNCBI
ČlanstvoNeograničeni
JezikEngleski
Ključne osobeWalter Goad
Glavni organUredništvo
Br. zaposlenih?
Veb-sajt=
NCBI

GenBank i njeni saradnici primaju sekvence proizvedene u laboratorijama širom svijeta od više od 500.000 formalno opisanih vrsta.[1] Bazu podataka pokrenuli su Walter Goad i Nacionalna laboratorija Los Alamosa, 1982. GenBank je postala važna baza podataka za istraživanja u biološkim poljima i rastao je posljednjih godina eksponencijalnom stopom udvostručavajući se otprilike svakih 18 mjeseci.[2][3]

Izdanje 250.0, objavljeno u junu 2022., sadržavalo je preko 17 triliona nukleotidnih baza u više od 2,45 milijardi sekvenci.[4] GenBank je napravljen direktnim podnošenjem iz pojedinačnih laboratorija, kao i iz masovnih predaja iz velikih centara sekvenciranje.

Prijave

uredi

GenBank se mogu poslati samo originalne sekvence. Direktno podnošenje se vrši GenBank koristeći BankIt, koji je web-bazirani obrazac, ili samostalni program za podnošenje, Sequin. Po prijemu predaje sekvence, osoblje GenBank-a ispituje originalnost podataka i dodjeljuje pristupni broj sekvenci i vrši provjere osiguranja kvaliteta. Prijave se zatim puštaju u javnu bazu podataka, gdje se unosi mogu pronaći putem Entrez ili preuzeti putem FTP. Grupno slanje eksprimirana oznaka sekvence (EST), lokacija označena sekvencom (STS), sekvenca istraživanja genoma (GSS) i sekvenca genoma visoke propusnosti (HTGS) podatke najčešće dostavljaju veliki centri za sekvenciranje. Grupa za direktno podnošenje GenBank-a također obrađuje kompletne sekvence mikrobnog genoma.[5][6]

Baza podataka GenBank uključuje dodatne skupove podataka koji su konstruisani mehanički iz prikupljanja podataka glavne sekvence, i stoga su isključeni iz ovog brojanja.

Top 20 organizama u GenBank-u (Izdanje 250)[4]
Organizam Bazni parovi
Triticum aestivum 2,15443744183×10^11
SARS-CoV-2 1,65771825746×10^11
Hordeum vulgare ssp. vulgare 1,01344340096×10^11
Mus musculus 3,0614386913×10^10
Homo sapiens 2,7834633853×10^10
Avena sativa 2,1127939362×10^10
Escherichia coli 1,5517830491×10^10
Klebsiella pneumoniae 1,1144687122×10^10
Danio rerio 1,0890148966×10^10
Bos taurus 1,0650671156×10^10
Triticum turgidum subsp. durum 9,981529154×10^9
Zea mays 7,412263902×10^9
Avena insularis 6,924307246×10^9
Secale cereale 6,749247504×10^9
Rattus norvegicus 6,548854408×10^9
Aegilops longissima 5,920483689×10^9
Canis lupus familiaris 5,776499164×10^9
Aegilops sharonensis 5,272476906×10^9
Sus scrofa 5,179074907×10^9
Rhinatrema bivittatum 5,178626132×10^9

Također pogledajte

uredi

Reference

uredi
  1. ^ Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7. 1. 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.
  2. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
  3. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.
  4. ^ a b "GenBank release notes (Release 250)". NCBI. 15. 6. 2022. Pristupljeno 20. 7. 2022.
  5. ^ "How to submit data to GenBank". NCBI. Pristupljeno 20. 7. 2022.
  6. ^ "GenBank Submission Types". NCBI. Pristupljeno 20. 7. 2022.

Vanjski linkovi

uredi