Proteinske natporodice
Proteinska natporodica, uobičajeno i proteinska superporodica, je najveća grupa (kladus) proteina za koje se može zaključiti zajedničko porijeklo (vidjeti homologija i homologija sekvence). Obično se ovo zajedničko porijeklo zaključuje iz poravnavanja struktura[1] i mehaničke sličnosti, čak i ako sličnost sekvence nije evidentna.[2] Stepen homologija sekvence tada se može zaključiti čak i ako nije očigledno (zbog male sličnosti sekvenci). Superporodice obično sadrže nekoliko proteinskih porodica koje pokazuju sličnost sekvenci unutar svake porodice. Termin proteinski klan obično se koristi za natporodice proteaza i glikozil-hidrolaza zasnovane na klasifikacijskim sistemima MEROPS i CAZy.[2][3]
Identifikacija
urediNadporodice proteina identificiraju se brojnim metodima. Blisko povezani članovi mogu se identificirati različitim metodima od onih potrebnih za grupisanje evolucijskio divergentnih članova.
Sličnost sekvence
urediHistorijski gledano, sličnost različitih aminokiselinskih sekvenci, uobičajeni je metod procjene homologije.[5] Sličnost sekvenci je najbolji pokazatelj stepena srodnosti, budući da slične sekvence vjerovatnije posljedica genskih duplikcija i divergentne, nego konvergentne evolucije. Aminokiselinska sekvenca tipski je konzerviranija kada je sekvenca DNK (zbog degeneracije genetičkog koda), mnogo osjetljivija za detekciju srodnosti. Pošto neke aminokiseline imaju slična svojstva (naboj, hidrofobnost, veličinu), konzervativne mutacije u međusobnoj razmjeni često imaju neutralan efekt. Najkonzerviranije regije proteinskih sekvenci često korespondiraju sa funkcijski značajnim područjima, kao što su katalitska mjesta i mjesta vezanja, manje tolerantne za promjene sekvence.
Korištenje sličnosti sekvenci za zaključivanje homologije ima nekoliko ograničenja. Ne postoji minimalni nivo sličnosti sekvence zagarantovan za proizvodnju identičnih struktura. Tokom dugih evolucijskih perioda, srodni proteini možda neće pokazivati međusobno sličnu sekvencu. Sekvence sa mnogo insercija i delecija također ponekad mogu biti teške za poravnanje i tako identifikaciju regije homolognih sekvenci. Naprimjer, u PA-klanu proteaza, niti jedan ostatak nije konzerviran kroz natporodicu, čak ni oni u katalitskoj trijadi. Nasuprot tome, pojedinačne porodice koje čine natporodicu definirane su na osnovu njihovog poravnavanja sekvenci, naprimjer porodica proteaza C04 unutar klana PA.
Ipak, sličnost sekvenci je najčešće korišteni oblik dokaza za zaključivanje srodnosti, budući da broj poznatih sekvenci uveliko nadmašuje broj poznatih tercijarnih struktura.[6] U nedostatku informacija o strukturi, sličnost sekvence predstavlja ograničenje za procjenu po kojem proteinu se daje naziv natporodice.[6]
Strukturna sličnost
urediStruktura je mnogo više evolucijski očuvane sekvence, tako da su proteini sa vrlo sličnim strukture mogu imati potpuno različite sekvence.[7] Tokom vrlo dugih evolucijskih vremenskih okvira, vrlo mali broj ostataka pokazuje konzerviranu sekvencu aminokiselina,ali elementi sekundarne strukture i motivi tercijarne strukture su visoko konzervirani. Neke dinamike proteina[8] i promjene konformacije protrinske strukture također mogu biti konzervirane, kau i serpinskoj natporodici .[9] Shodno tome, tercijarna struktura proteina može se koristiti za otkrivanje homologije među proteinima čak i kada u njihovim sekvencama nema dokaza o srodnosti. Programi strukturnog poravnavanja, poput DALI, koriste 3D strukturu proteina od interesa za pronalaženje proteina sa sličnim savijanjima.[10] Međutim, u rijetkim slučajevima, srodni proteini mogu evoluirati tako da budu strukturno različiti,[11] a srodnost se može zaključiti samo drugim metodima.[12][13][14]
Mehanička sličnost
urediKatalitski mehanizam enzima unutar natporodice je obično konzerviran, iako specifičnost supstrata može biti značajno drugačija.[15] Katalitski ostaci također se pojavljuju istim redoslijedom u proteinskoj sekvenci.[16] Za porodice proteina unutar PA-klana proteaza, iako je došlo do divergentne evolucije ostataka katalitskih trijada korištenih za izvođenje katalize, svi članovi imaju sličan mehanizam za izvođenje kovalentne, nukleofilne katalize proteins, peptida ili aminokiselina.[17] Međutim, sam mehanizam nije dovoljan za zaključivanje srodnosti. Neki katalitski mehanizmi su konvergentno evoluirani više puta neovisno, pa formiraju zasebne natporodice,[18][19][20] a u nekim natporodicama ispoljavaju raspon različitih (iako često hemijski sličnih) mehanizama.[15][21]
Evolucijski značaj
urediProteinske natporodice predstavljaju dosadašnja ograničenja sposobnosti identifikacije zajedničkog porijekla.[22] Oni su najveća evolucijska grupacija zasnovana na izravnim dokazima koja je zasad moguća. Stoga su oni među najstarijim evolucijskim događajima koji se upravo proučavaju. Neke superporodice imaju članove prisutne u svim carstvima života, što ukazuje na to da je posljednji zajednički predak te natporodice bio u posljednji univerzalni zajednički predak života uopće (LUCA).[23]
Članovi natporodice mogu biti u različitim vrstama, s tim da je predački oblik proteina koji je postojao u predačkim vrstama (ortologija). Nasuprot tome, proteini mogu biti u istoj vrsti, ali su evoluirali iz jednog proteina čiji je gen dupliciran u genomu (paralogija).
Informatički rfesursi proteinskih natporodica
urediNekoliko bioloških baza podataka dokumentira proteinske natporodice i proteinska savijanja, naprimjer:
- Pfam - Baza poravnavanja i HMM-ova proteinskih porodica
- PROSITE - Baza proteinskih domena, porodica i funkcionalnih lokacija
- PIRSF - Sistem klasifikacije superporodica
- PASS2 - Poravnavanje proteina kao strukturne natporodice v2
- SUPERFAMILY - Biblioteka HMM -ova koja predstavlja natporodice i baza podataka (natporodica i porodica) bilješki za sve potpuno sekvencirane organizme
- SCOP i CATH - Klasifikacija proteinskih struktura u natporodice, porodice i domene
Slično tome, postoje i algoritmi koji pretražuju PDB za proteine sa strukturnom homologijom prema ciljnoj strukturi, naprimjer:
- DALI - Strukturno poravnavanje zasnovano na metodi matrice poravnavanja udaljenosti
Također pogledajte
urediReference
uredi- ^ Holm L, Rosenström P (July 2010). "Dali server: conservation mapping in 3D". Nucleic Acids Research. 38 (Web Server issue): W545–9. doi:10.1093/nar/gkq366. PMC 2896194. PMID 20457744.
- ^ a b Rawlings ND, Barrett AJ, Bateman A (January 2012). "MEROPS: the database of proteolytic enzymes, their substrates and inhibitors". Nucleic Acids Research. 40 (Database issue): D343–50. doi:10.1093/nar/gkr987. PMC 3245014. PMID 22086950.
- ^ Henrissat B, Bairoch A (June 1996). "Updating the sequence-based classification of glycosyl hydrolases". The Biochemical Journal. 316 (Pt 2): 695–6. doi:10.1042/bj3160695. PMC 1217404. PMID 8687420.
- ^ "Clustal FAQ #Symbols". Clustal. Arhivirano s originala, 24 October 2016. Pristupljeno 8 December 2014.
- ^ Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (April 2007). "The folding and evolution of multidomain proteins". Nature Reviews Molecular Cell Biology. 8 (4): 319–30. doi:10.1038/nrm2144. PMID 17356578. S2CID 13762291.
- ^ a b Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (January 2002). "SUPFAM--a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes". Nucleic Acids Research. 30 (1): 289–93. doi:10.1093/nar/30.1.289. PMC 99061. PMID 11752317.
- ^ Orengo CA, Thornton JM (2005). "Protein families and their evolution-a structural perspective". Annual Review of Biochemistry. 74 (1): 867–900. doi:10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
- ^ Liu Y, Bahar I (September 2012). "Sequence evolution correlates with structural dynamics". Molecular Biology and Evolution. 29 (9): 2253–63. doi:10.1093/molbev/mss097. PMC 3424413. PMID 22427707.
- ^ Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (September 2001). "The serpins are an expanding superfamily of structurally similar but functionally diverse proteins. Evolution, mechanism of inhibition, novel functions, and a revised nomenclature". The Journal of Biological Chemistry. 276 (36): 33293–6. doi:10.1074/jbc.R100016200. PMID 11435447.
- ^ Holm L, Laakso LM (July 2016). "Dali server update". Nucleic Acids Research. 44 (W1): W351–5. doi:10.1093/nar/gkw357. PMC 4987910. PMID 27131377.
- ^ Pascual-García A, Abia D, Ortiz ÁR, Bastolla U (2009). "Cross-Over between Discrete and Continuous Protein Structure Space: Insights into Automatic Classification and Networks of Protein Structures". PLOS Computational Biology. 5 (3): e1000331. Bibcode:2009PLSCB...5E0331P. doi:10.1371/journal.pcbi.1000331. PMC 2654728. PMID 19325884.
- ^ Li D, Zhang L, Yin H, Xu H, Satkoski Trask J, Smith DG, Li Y, Yang M, Zhu Q (June 2014). "Evolution of primate α and θ defensins revealed by analysis of genomes". Molecular Biology Reports. 41 (6): 3859–66. doi:10.1007/s11033-014-3253-z. PMID 24557891. S2CID 14936647.
- ^ Krishna SS, Grishin NV (April 2005). "Structural drift: a possible path to protein fold change". Bioinformatics. 21 (8): 1308–10. doi:10.1093/bioinformatics/bti227. PMID 15604105.
- ^ Bryan PN, Orban J (August 2010). "Proteins that switch folds". Current Opinion in Structural Biology. 20 (4): 482–8. doi:10.1016/j.sbi.2010.06.002. PMC 2928869. PMID 20591649.
- ^ a b Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), "Function Diversity Within Folds and Superfamilies", From Protein Structure to Function with Bioinformatics (jezik: engleski), Springer Netherlands, str. 295–325, doi:10.1007/978-94-024-1069-3_9, ISBN 9789402410679
- ^ Echave J, Spielman SJ, Wilke CO (February 2016). "Causes of evolutionary rate variation among protein sites". Nature Reviews. Genetics (jezik: engleski). 17 (2): 109–21. doi:10.1038/nrg.2015.18. PMC 4724262. PMID 26781812.
- ^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (September 2015). "Handicap-Recover Evolution Leads to a Chemically Versatile, Nucleophile-Permissive Protease". ChemBioChem. 16 (13): 1866–1869. doi:10.1002/cbic.201500295. PMC 4576821. PMID 26097079.
- ^ Buller AR, Townsend CA (February 2013). "Intrinsic evolutionary constraints on protease structure, enzyme acylation, and the identity of the catalytic triad". Proceedings of the National Academy of Sciences of the United States of America. 110 (8): E653–61. doi:10.1073/pnas.1221050110. PMC 3581919. PMID 23382230.
- ^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (April 2003). "An evolving hierarchical family classification for glycosyltransferases". Journal of Molecular Biology. 328 (2): 307–17. doi:10.1016/S0022-2836(03)00307-3. PMID 12691742.
- ^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (May 2015). "Independent evolution of four heme peroxidase superfamilies". Archives of Biochemistry and Biophysics. 574: 108–19. doi:10.1016/j.abb.2014.12.025. PMC 4420034. PMID 25575902.
- ^ Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E.; Barber, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrad C.; Lauck, Florian; Mashiyama, Susan T. (2013-11-23). "The Structure–Function Linkage Database". Nucleic Acids Research (jezik: engleski). 42 (D1): D521–D530. doi:10.1093/nar/gkt1130. ISSN 0305-1048. PMC 3965090. PMID 24271399.
- ^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (March 2005). "Protein structure and evolutionary history determine sequence space topology". Genome Research. 15 (3): 385–92. arXiv:q-bio/0404040. doi:10.1101/gr.3133605. PMC 551565. PMID 15741509.
- ^ Ranea JA, Sillero A, Thornton JM, Orengo CA (October 2006). "Protein superfamily evolution and the last universal common ancestor (LUCA)". Journal of Molecular Evolution. 63 (4): 513–25. Bibcode:2006JMolE..63..513R. doi:10.1007/s00239-005-0289-7. hdl:10261/78338. PMID 17021929. S2CID 25258028.