GenBank
GenBank baza podataka sekvenci je otvoreno pristupna, označena zbirka svih javno dostupnih nukleotidnih sekvenci i njihovih proteinskih prijevoda. Proizvodi ga i održava Nacionalni centar za informacije o biotehnologiji (NCBI; dio Nacionalnih instituta za zdravlje u Sjedinjenim Državama) kao dio Međunarodne baze podataka o nukleotidnim sekvencama Saradnja (INSDC).
GenBank | |
---|---|
Skraćenica | GB |
Prethodnik | Novoosnovana |
Datum osnivanja | 1982. |
Vrsta | Javna baza podataka o nukleotidima |
Status | Aktivan |
Cilj | Prikupljanje nolvih podataka o nukleotidima i genima Do 2023.: Nukleotidne sekvence za više od 300.000 organizama s pratećom bibliografskom i biološkom napomenom |
Glavno sjedište | NCBI |
Članstvo | Neograničeni |
Jezik | Engleski |
Ključne osobe | Walter Goad |
Glavni organ | Uredništvo |
Br. zaposlenih | ? |
Veb-sajt | = NCBI |
GenBank i njeni saradnici primaju sekvence proizvedene u laboratorijama širom svijeta od više od 500.000 formalno opisanih vrsta.[1] Bazu podataka pokrenuli su Walter Goad i Nacionalna laboratorija Los Alamosa, 1982. GenBank je postala važna baza podataka za istraživanja u biološkim poljima i rastao je posljednjih godina eksponencijalnom stopom udvostručavajući se otprilike svakih 18 mjeseci.[2][3]
Izdanje 250.0, objavljeno u junu 2022., sadržavalo je preko 17 triliona nukleotidnih baza u više od 2,45 milijardi sekvenci.[4] GenBank je napravljen direktnim podnošenjem iz pojedinačnih laboratorija, kao i iz masovnih predaja iz velikih centara sekvenciranje.
Prijave
urediGenBank se mogu poslati samo originalne sekvence. Direktno podnošenje se vrši GenBank koristeći BankIt, koji je web-bazirani obrazac, ili samostalni program za podnošenje, Sequin. Po prijemu predaje sekvence, osoblje GenBank-a ispituje originalnost podataka i dodjeljuje pristupni broj sekvenci i vrši provjere osiguranja kvaliteta. Prijave se zatim puštaju u javnu bazu podataka, gdje se unosi mogu pronaći putem Entrez ili preuzeti putem FTP. Grupno slanje eksprimirana oznaka sekvence (EST), lokacija označena sekvencom (STS), sekvenca istraživanja genoma (GSS) i sekvenca genoma visoke propusnosti (HTGS) podatke najčešće dostavljaju veliki centri za sekvenciranje. Grupa za direktno podnošenje GenBank-a također obrađuje kompletne sekvence mikrobnog genoma.[5][6]
Baza podataka GenBank uključuje dodatne skupove podataka koji su konstruisani mehanički iz prikupljanja podataka glavne sekvence, i stoga su isključeni iz ovog brojanja.
Organizam | Bazni parovi |
---|---|
Triticum aestivum | 2,15443744183×10 11 |
SARS-CoV-2 | 1,65771825746×10 11 |
Hordeum vulgare ssp. vulgare | 1,01344340096×10 11 |
Mus musculus | 3,0614386913×10 10 |
Homo sapiens | 2,7834633853×10 10 |
Avena sativa | 2,1127939362×10 10 |
Escherichia coli | 1,5517830491×10 10 |
Klebsiella pneumoniae | 1,1144687122×10 10 |
Danio rerio | 1,0890148966×10 10 |
Bos taurus | 1,0650671156×10 10 |
Triticum turgidum subsp. durum | 9,981529154×10 9 |
Zea mays | 7,412263902×10 9 |
Avena insularis | 6,924307246×10 9 |
Secale cereale | 6,749247504×10 9 |
Rattus norvegicus | 6,548854408×10 9 |
Aegilops longissima | 5,920483689×10 9 |
Canis lupus familiaris | 5,776499164×10 9 |
Aegilops sharonensis | 5,272476906×10 9 |
Sus scrofa | 5,179074907×10 9 |
Rhinatrema bivittatum | 5,178626132×10 9 |
Također pogledajte
uredi- Ensembl
- Referentna baza podataka o ljudskim proteinima (HPRD)
- Analiza sekvence
- UniProt
- Entrez
- Lista sekvenciranih eukariotskih genoma
- Lista sekvenciranih arhealnih genoma
- RefSeq — baza podataka referentnih sekvenci
- Geneious — uključuje GenBank alat za podnošenje
- Otvoreni naučni podaci
- Proteinska banka podataka
Reference
uredi- ^ Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7. 1. 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.
- ^ a b "GenBank release notes (Release 250)". NCBI. 15. 6. 2022. Pristupljeno 20. 7. 2022.
- ^ "How to submit data to GenBank". NCBI. Pristupljeno 20. 7. 2022.
- ^ "GenBank Submission Types". NCBI. Pristupljeno 20. 7. 2022.
Vanjski linkovi
uredi- GenBank
- Example sequence record, for hemoglobin beta
- BankIt
- Sequin — a stand-alone software tool developed by the NCBI for submitting and updating entries to the GenBank sequence database.
- EMBOSS — free, open source software for molecular biology
- GenBank, RefSeq, TPA and UniProt: What's in a Name?