Proteinske natporodice

(Preusmjereno sa Proteinska natporodica)

Proteinska natporodica, uobičajeno i proteinska superporodica, je najveća grupa (kladus) proteina za koje se može zaključiti zajedničko porijeklo (vidjeti homologija i homologija sekvence). Obično se ovo zajedničko porijeklo zaključuje iz poravnavanja struktura[1] i mehaničke sličnosti, čak i ako sličnost sekvence nije evidentna.[2] Stepen homologija sekvence tada se može zaključiti čak i ako nije očigledno (zbog male sličnosti sekvenci). Superporodice obično sadrže nekoliko proteinskih porodica koje pokazuju sličnost sekvenci unutar svake porodice. Termin proteinski klan obično se koristi za natporodice proteaza i glikozil-hidrolaza zasnovane na klasifikacijskim sistemima MEROPS i CAZy.[2][3]

Identifikacija

uredi
 
Gore: sekundarna strukturna konzervacija 80 članova PA-proteaznog klana (natporodica). H = α-heliks, E = β-list, L = petlja. Ispod je konzerviranost sekvence za isto poravnavanje. Strelice označavaju ostatke katalitske trijade. Poravnano na osnovu strukture prema DALI.

Nadporodice proteina identificiraju se brojnim metodima. Blisko povezani članovi mogu se identificirati različitim metodima od onih potrebnih za grupisanje evolucijskio divergentnih članova.

Sličnost sekvence

uredi
 
Poravnanje sekvenci u histonima sisarskih proteina. Sličnost sekvenci implicira da su se razvijale putem genskih duplikacija. Konzervirani ostaci sekvenci označeni su sivo. Ispod proteinske sekvence je oznaka za njenu konzerviranost (*), konzervativne mutacije (:), semikonzervativne (.) i nekonzervativne mutacije ( ).[4]

Historijski gledano, sličnost različitih aminokiselinskih sekvenci, uobičajeni je metod procjene homologije.[5] Sličnost sekvenci je najbolji pokazatelj stepena srodnosti, budući da slične sekvence vjerovatnije posljedica genskih duplikcija i divergentne, nego konvergentne evolucije. Aminokiselinska sekvenca tipski je konzerviranija kada je sekvenca DNK (zbog degeneracije genetičkog koda), mnogo osjetljivija za detekciju srodnosti. Pošto neke aminokiseline imaju slična svojstva (naboj, hidrofobnost, veličinu), konzervativne mutacije u međusobnoj razmjeni često imaju neutralan efekt. Najkonzerviranije regije proteinskih sekvenci često korespondiraju sa funkcijski značajnim područjima, kao što su katalitska mjesta i mjesta vezanja, manje tolerantne za promjene sekvence.

Korištenje sličnosti sekvenci za zaključivanje homologije ima nekoliko ograničenja. Ne postoji minimalni nivo sličnosti sekvence zagarantovan za proizvodnju identičnih struktura. Tokom dugih evolucijskih perioda, srodni proteini možda neće pokazivati međusobno sličnu sekvencu. Sekvence sa mnogo insercija i delecija također ponekad mogu biti teške za poravnanje i tako identifikaciju regije homolognih sekvenci. Naprimjer, u PA-klanu proteaza, niti jedan ostatak nije konzerviran kroz natporodicu, čak ni oni u katalitskoj trijadi. Nasuprot tome, pojedinačne porodice koje čine natporodicu definirane su na osnovu njihovog poravnavanja sekvenci, naprimjer porodica proteaza C04 unutar klana PA.

Ipak, sličnost sekvenci je najčešće korišteni oblik dokaza za zaključivanje srodnosti, budući da broj poznatih sekvenci uveliko nadmašuje broj poznatih tercijarnih struktura.[6] U nedostatku informacija o strukturi, sličnost sekvence predstavlja ograničenje za procjenu po kojem proteinu se daje naziv natporodice.[6]

Strukturna sličnost

uredi
 
Strukturna homologija u natporodici PA (PA-klan). Dvostruki β-barel koji karakterizira natporodicu označen je crvenom bojom. Prikazane su reprezentativne strukture iz nekoliko porodica unutar natporodice PA.
Neki proteini pokazuju djelomično modificiranu strukturu. Himotripsin (1gg6), proteaza virusa nekroze duhana (1 lvm), kalicivirin (1 wqs), virus zapadnog Nila proteaza (1fp7), piling toksin (1exf), HtrA proteaza (1l1j), aktivator plazminogena zmijskog otrova (1bqy), hloroplast proteaza (4fln) i proteaza (1 mbm)virusa konjskog arteritisa.

Struktura je mnogo više evolucijski očuvane sekvence, tako da su proteini sa vrlo sličnim strukture mogu imati potpuno različite sekvence.[7] Tokom vrlo dugih evolucijskih vremenskih okvira, vrlo mali broj ostataka pokazuje konzerviranu sekvencu aminokiselina,ali elementi sekundarne strukture i motivi tercijarne strukture su visoko konzervirani. Neke dinamike proteina[8] i promjene konformacije protrinske strukture također mogu biti konzervirane, kau i serpinskoj natporodici .[9] Shodno tome, tercijarna struktura proteina može se koristiti za otkrivanje homologije među proteinima čak i kada u njihovim sekvencama nema dokaza o srodnosti. Programi strukturnog poravnavanja, poput DALI, koriste 3D strukturu proteina od interesa za pronalaženje proteina sa sličnim savijanjima.[10] Međutim, u rijetkim slučajevima, srodni proteini mogu evoluirati tako da budu strukturno različiti,[11] a srodnost se može zaključiti samo drugim metodima.[12][13][14]

Mehanička sličnost

uredi

Katalitski mehanizam enzima unutar natporodice je obično konzerviran, iako specifičnost supstrata može biti značajno drugačija.[15] Katalitski ostaci također se pojavljuju istim redoslijedom u proteinskoj sekvenci.[16] Za porodice proteina unutar PA-klana proteaza, iako je došlo do divergentne evolucije ostataka katalitskih trijada korištenih za izvođenje katalize, svi članovi imaju sličan mehanizam za izvođenje kovalentne, nukleofilne katalize proteins, peptida ili aminokiselina.[17] Međutim, sam mehanizam nije dovoljan za zaključivanje srodnosti. Neki katalitski mehanizmi su konvergentno evoluirani više puta neovisno, pa formiraju zasebne natporodice,[18][19][20] a u nekim natporodicama ispoljavaju raspon različitih (iako često hemijski sličnih) mehanizama.[15][21]

Evolucijski značaj

uredi

Proteinske natporodice predstavljaju dosadašnja ograničenja sposobnosti identifikacije zajedničkog porijekla.[22] Oni su najveća evolucijska grupacija zasnovana na izravnim dokazima koja je zasad moguća. Stoga su oni među najstarijim evolucijskim događajima koji se upravo proučavaju. Neke superporodice imaju članove prisutne u svim carstvima života, što ukazuje na to da je posljednji zajednički predak te natporodice bio u posljednji univerzalni zajednički predak života uopće (LUCA).[23]

Članovi natporodice mogu biti u različitim vrstama, s tim da je predački oblik proteina koji je postojao u predačkim vrstama (ortologija). Nasuprot tome, proteini mogu biti u istoj vrsti, ali su evoluirali iz jednog proteina čiji je gen dupliciran u genomu (paralogija).

Informatički rfesursi proteinskih natporodica

uredi

Nekoliko bioloških baza podataka dokumentira proteinske natporodice i proteinska savijanja, naprimjer:

  • Pfam - Baza poravnavanja i HMM-ova proteinskih porodica
  • PROSITE - Baza proteinskih domena, porodica i funkcionalnih lokacija
  • PIRSF - Sistem klasifikacije superporodica
  • PASS2 - Poravnavanje proteina kao strukturne natporodice v2
  • SUPERFAMILY - Biblioteka HMM -ova koja predstavlja natporodice i baza podataka (natporodica i porodica) bilješki za sve potpuno sekvencirane organizme
  • SCOP i CATH - Klasifikacija proteinskih struktura u natporodice, porodice i domene

Slično tome, postoje i algoritmi koji pretražuju PDB za proteine sa strukturnom homologijom prema ciljnoj strukturi, naprimjer:

  • DALI - Strukturno poravnavanje zasnovano na metodi matrice poravnavanja udaljenosti

Također pogledajte

uredi

Reference

uredi
  1. ^ Holm L, Rosenström P (July 2010). "Dali server: conservation mapping in 3D". Nucleic Acids Research. 38 (Web Server issue): W545–9. doi:10.1093/nar/gkq366. PMC 2896194. PMID 20457744.
  2. ^ a b Rawlings ND, Barrett AJ, Bateman A (January 2012). "MEROPS: the database of proteolytic enzymes, their substrates and inhibitors". Nucleic Acids Research. 40 (Database issue): D343–50. doi:10.1093/nar/gkr987. PMC 3245014. PMID 22086950.
  3. ^ Henrissat B, Bairoch A (June 1996). "Updating the sequence-based classification of glycosyl hydrolases". The Biochemical Journal. 316 (Pt 2): 695–6. doi:10.1042/bj3160695. PMC 1217404. PMID 8687420.
  4. ^ "Clustal FAQ #Symbols". Clustal. Arhivirano s originala, 24 October 2016. Pristupljeno 8 December 2014.
  5. ^ Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (April 2007). "The folding and evolution of multidomain proteins". Nature Reviews Molecular Cell Biology. 8 (4): 319–30. doi:10.1038/nrm2144. PMID 17356578. S2CID 13762291.
  6. ^ a b Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (January 2002). "SUPFAM--a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes". Nucleic Acids Research. 30 (1): 289–93. doi:10.1093/nar/30.1.289. PMC 99061. PMID 11752317.
  7. ^ Orengo CA, Thornton JM (2005). "Protein families and their evolution-a structural perspective". Annual Review of Biochemistry. 74 (1): 867–900. doi:10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
  8. ^ Liu Y, Bahar I (September 2012). "Sequence evolution correlates with structural dynamics". Molecular Biology and Evolution. 29 (9): 2253–63. doi:10.1093/molbev/mss097. PMC 3424413. PMID 22427707.
  9. ^ Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (September 2001). "The serpins are an expanding superfamily of structurally similar but functionally diverse proteins. Evolution, mechanism of inhibition, novel functions, and a revised nomenclature". The Journal of Biological Chemistry. 276 (36): 33293–6. doi:10.1074/jbc.R100016200. PMID 11435447.
  10. ^ Holm L, Laakso LM (July 2016). "Dali server update". Nucleic Acids Research. 44 (W1): W351–5. doi:10.1093/nar/gkw357. PMC 4987910. PMID 27131377.
  11. ^ Pascual-García A, Abia D, Ortiz ÁR, Bastolla U (2009). "Cross-Over between Discrete and Continuous Protein Structure Space: Insights into Automatic Classification and Networks of Protein Structures". PLOS Computational Biology. 5 (3): e1000331. Bibcode:2009PLSCB...5E0331P. doi:10.1371/journal.pcbi.1000331. PMC 2654728. PMID 19325884.
  12. ^ Li D, Zhang L, Yin H, Xu H, Satkoski Trask J, Smith DG, Li Y, Yang M, Zhu Q (June 2014). "Evolution of primate α and θ defensins revealed by analysis of genomes". Molecular Biology Reports. 41 (6): 3859–66. doi:10.1007/s11033-014-3253-z. PMID 24557891. S2CID 14936647.
  13. ^ Krishna SS, Grishin NV (April 2005). "Structural drift: a possible path to protein fold change". Bioinformatics. 21 (8): 1308–10. doi:10.1093/bioinformatics/bti227. PMID 15604105.
  14. ^ Bryan PN, Orban J (August 2010). "Proteins that switch folds". Current Opinion in Structural Biology. 20 (4): 482–8. doi:10.1016/j.sbi.2010.06.002. PMC 2928869. PMID 20591649.
  15. ^ a b Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), "Function Diversity Within Folds and Superfamilies", From Protein Structure to Function with Bioinformatics (jezik: engleski), Springer Netherlands, str. 295–325, doi:10.1007/978-94-024-1069-3_9, ISBN 9789402410679
  16. ^ Echave J, Spielman SJ, Wilke CO (February 2016). "Causes of evolutionary rate variation among protein sites". Nature Reviews. Genetics (jezik: engleski). 17 (2): 109–21. doi:10.1038/nrg.2015.18. PMC 4724262. PMID 26781812.
  17. ^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (September 2015). "Handicap-Recover Evolution Leads to a Chemically Versatile, Nucleophile-Permissive Protease". ChemBioChem. 16 (13): 1866–1869. doi:10.1002/cbic.201500295. PMC 4576821. PMID 26097079.
  18. ^ Buller AR, Townsend CA (February 2013). "Intrinsic evolutionary constraints on protease structure, enzyme acylation, and the identity of the catalytic triad". Proceedings of the National Academy of Sciences of the United States of America. 110 (8): E653–61. doi:10.1073/pnas.1221050110. PMC 3581919. PMID 23382230.
  19. ^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (April 2003). "An evolving hierarchical family classification for glycosyltransferases". Journal of Molecular Biology. 328 (2): 307–17. doi:10.1016/S0022-2836(03)00307-3. PMID 12691742.
  20. ^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (May 2015). "Independent evolution of four heme peroxidase superfamilies". Archives of Biochemistry and Biophysics. 574: 108–19. doi:10.1016/j.abb.2014.12.025. PMC 4420034. PMID 25575902.
  21. ^ Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E.; Barber, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrad C.; Lauck, Florian; Mashiyama, Susan T. (2013-11-23). "The Structure–Function Linkage Database". Nucleic Acids Research (jezik: engleski). 42 (D1): D521–D530. doi:10.1093/nar/gkt1130. ISSN 0305-1048. PMC 3965090. PMID 24271399.
  22. ^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (March 2005). "Protein structure and evolutionary history determine sequence space topology". Genome Research. 15 (3): 385–92. arXiv:q-bio/0404040. doi:10.1101/gr.3133605. PMC 551565. PMID 15741509.
  23. ^ Ranea JA, Sillero A, Thornton JM, Orengo CA (October 2006). "Protein superfamily evolution and the last universal common ancestor (LUCA)". Journal of Molecular Evolution. 63 (4): 513–25. Bibcode:2006JMolE..63..513R. doi:10.1007/s00239-005-0289-7. hdl:10261/78338. PMID 17021929. S2CID 25258028.

Vanjski linkovi

uredi