Proteinska banka podataka

Proteinska banka podataka, (eng. Protein Data Bank – PDB), je kolekcija 3D podataka o strukturi velikih bioloških molekula, kao što su proteini i nukleinske kiseline. Podaci su tipski dobijeni rendgenskom strukturnom analizom ili proteinskom nuklearnom magnetnom rezonantnom spektroskopijom (NMR) . Stvaranju ove zbirke doprinose biolozi i biohemičari širom svijeta. PDB je slobodno dostupan na Internetu, pod nadzorom organizacije pod nazivom Svjetska proteinska banka podataka (eng. Worldwide Protein Data Bank - wwPDB).[1][2]

Proteinska banka podataka
Logo PBP-a
SkraćenicaPDB
Datum osnivanja1971.
VrstaBaza podataka
StatusAktivna
CiljStruktura proteina
X- kristallografija
NMR-determinacija strukture
JezikEngleski
Veb-sajt

Proteinska baza podataka je ključni resurs u oblastima strukturne biologije, kao što je strukturna genomika. Većina vodećih naučnih časopisa i pojedine agencije za finansiranje, kao što je NIH u SAD, zahtevaju od istraživača da unesu svoje podatke o strukturi proteina podatke u PDB. Njen sadržaj se smatra primarnim izvorom, a postoje stotine izvedenih baza podataka koje kategorizuju podatke na razne načine. Naprimjer, SCOP i CATH kategorizuju strukture proteina na temelju strukturnog tipa i pretpostavljenih evolucijskih odnosa, a ontologija gena (GO) klasificira strukture na osnovu gena.[3]

Historija

uredi

Proteinska banka podataka (PDB) je formirana 1971. godine. Njen utemeljitelj je Valter Hamilton sa Brukhaven nacionalne laboratorije. Nakon Hamiltonove smrti 1973., nadzor nad PDB-om je preuzeo Tom Koeztle. Januara 1994., za PDB rukovodioca bio je imenovan Joel Susman. Oktobra 1998.[4] PDB je transformiran u RCSB (eng. Research Collaboratory for Structural Bioinformatics)[5]. Tranzicija je završena u junu 1999. Novi direktor bila je Helen M. Berman, sa Univerziteta Rutgers (jednog od članica RCSB).[6] Godine 2003. sa formiranjem Svjetske baze podataka (wwPDB) , PDB je postao internacionalna organizacija. Svaki od četiri wwPDB člana djeluje kao centar za depoziciju, obradu i distribuciju PDB podataka. Obrada se odnosi na činjenicu da wwPDB osoblje pregleda i anotira svaki podnijeti upis. Nakon toga, vjerodostojnost podataka se provjerava, a izvorni kod tog softvera za validaciju javno je dostupan.[7]

Sadržaj

uredi

Proteinska baza podataka se ažurira sedmično (utorkom). U septembru 2010., PDB je imao sljedeći sadržaj[8]:

Eksperimentalni
metod
Protein Nukleinska kiselina Kompleksi protein/nukleinska kiselina
Ostalo Ukupno
Difrakcija X-zraka 55480 1231 2605 17 59333
Proteinska nuklearno magnetna rezonantna spektroskopija (NMR) 7512 925 162 7 8606
Krio-elektronska mikroskopija 214 17 77 0 308
Hibrid 24 1 1 1 27
Ostalo 126 4 4 13 147
Ukupno: 63.356 2.178 2.849 38 68.421
Strukturni faktor fajl u PDB ima 48.715 struktura.
NMR podatke ima 5.901 struktura.

Ovi podaci ukazuju da je većina struktura određena difrakcijom X-zraka, dok je oko 15% struktura određeno putem protein NMR. Kad se koristi difrakcija X-zraka, dobijaju se približne koordinate atoma u proteinu. NMR eksperimenti daju procjene rastojanja između parova atoma u proteinu, čija se konformacija dobija rješavanjem problema geometrije rastojanja. Nekoliko proteinskih struktura je određeno krio-elektronskom mikroskopijom.

U prošlosti[9] PDB je rastao približno rastu eksponencijalnom brzinom. Međutim, od 2007., brzina akumulacije novih proteina izgleda da je dostigla plato, sa 7.263 dodatnih proteina u 2007., 7.073 u 2008, i 7.448 u 2009.

Format fajla

uredi

Format fajla koji je inicijalno koristio se zove PDB fajl format. Taj originalni format je bio ograničen širinom bušenih kompjuterskih kartica na 80 slova po liniji. "Makromolekukski kristalografski informacijski fajl" format, mmCIF, počeo se primjenjivati 1996. godine,. XML verzija ovog formata, zvana PDBML, pojavila se 2005. godine.[10] Proteinske strukture se mogu preuzeti u bilo kojem od tih formata. Grafički paketi pristupaju direktno strukturama na PDB sajtu:

  • Za PDB fajlove, npr.,[1];
  • Za PDBML (XML) fajlove, npr.[2]

Također pogledajte

uredi

Reference

uredi
  1. ^ Bajrović K, Jevrić-Čaušević A., Hadžiselimović R., Ed. (2005): Uvod u genetičko inženjerstvo i biotehnologiju. Institut za genetičko inženjerstvo i biotehnologiju (INGEB), Sarajevo, ISBN 9958-9344-1-8.
  2. ^ Kapur Pojskić L., Ed. (2014): Uvod u genetičko inženjerstvo i biotehnologiju, 2. izdanje. Institut za genetičko inženjerstvo i biotehnologiju (INGEB), Sarajevo, ISBN 978-9958-9344-8-3.
  3. ^ Berman, H. M. (2008). "The Protein Data Bank: a historical perspective" (PDF). Acta Crystallographica Section A: Foundations of Crystallography. A64 (1): 88–95. doi:10.1107/S0108767307035623. PMID 18156675. Referenca sadrži prazan nepoznati parametar: |quotes= (pomoć)
  4. ^ Berman, H. M. (2000). "The Protein Data Bank". Nucleic Acids Res. 28 (1): 235–242. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235. Referenca sadrži prazan nepoznati parametar: |quotes= (pomoć)
  5. ^ "Research Collaboratory for Structural Bioinformatics (RCSB)". Arhivirano s originala, 5. 2. 2007. Pristupljeno 21. 3. 2016.
  6. ^ "RCSB PDB Newsletter Archive". RCSB Protein Data Bank. Arhivirano s originala, 13. 4. 2012. Pristupljeno 30. 12. 2020.
  7. ^ "PDB Validation Suite". Arhivirano s originala, 3. 3. 2016.
  8. ^ "RCSB Protein Data Bank - Holdings Report". Arhivirano s originala, 4. 7. 2007.
  9. ^ "Number of structures". Arhivirano s originala, 28. 4. 2007. Pristupljeno 21. 3. 2016.
  10. ^ Westbrook (2005). "PDBML: the representation of archival macromolecular structure data in XML" (PDF). Bioinformatics. 21 (7): 988–992. doi:10.1093/bioinformatics/bti082. PMID 15509603. Navedeno je više parametara |author= i |last= (pomoć)

Vanjski linkovi

uredi