Homologija sekvence

Homologija sekvence je biološka homologija između sekvenci DNK, RNK ili sekvence proteina, definirano u smislu zajedničkog pretka u evolucijskoj historiji života. Dva segmenta DNK mogu dijeliti pretke zbog tri pojave: specijacija događanje (ortologa), ili događaj dupliranja (paralozi), ili pak pojava horizontalni (ili bočni) prenos gena (ksenolozi).[1]

Filogenetsko stablo gena kao crvene i plave grane unutar filogenije sivih vrsta. Vrh: Predačka duplikacija gena stvara dva paraloga (histon H1.1 i 1.2). Događaji specijacije proizvode ortologe u dvije kćeinskee vrste (čovjek i čimpanza).
Dno: u odvojenoj vrsti (E. coli), gen ima sličnu funkciju (histonoliki protein koji strukturira nukleoide), ali ima zasebno evolucijsko porijeklo, pa tako i analogno.

O homologiji DNK, RNK ili proteina obično se zaključuje na osnovu sličnosti sekvence nukleotida ili aminokiselina. Značajna sličnost snažan je dokaz da su dvije sekvence povezane evolucijskim promjenama iz zajedničke sekvence predaka. Kako bi se naznačilo koja su područja svake sekvence homologna koristi se poravnanja više sekvenci.

Identitet, sličnost i konzerviranje uredi

 
Poravnanje sekvence proteinskih histona sisara.
Proteinke sekvence su sredne dužine od oko 120-180 aminokiselinskih ostataka. Konzervirani ostaci koji su sačuvani u svim sekvencama označeni su sivom bojom. Ključ u nastavku označava konzervirana sekvenca (*), konzervativna mutacija (:), polukonzervativne mutacije (.) I nekonzervirane mutacije ( ).[2]

Termin "postotak homologije" često se koristi u značenju "sličnost sekvence", odnosno postotak identičnih ostataka (postotak identiteta) ili postotak ostataka konzerviranih sa sličnim fizičko-hemijskim svojstvima (postotak sličnosti), npr. za „kvantifikaciju homologije“ obično se koriste leucin i izoleucin, Na osnovu gore navedene definicije homologije ova terminologija nije tačna jer je posmatranje sličnosti sekvenci, a homologija je zaključak.[3] Sekvencei su ili homologne ili ne. To uključuje da je termin "postotna homologija" pogrešan naziv.[4]

Kao i kod morfoloških i anatomskih struktura, sličnost sekvenci može se dogoditi zbog konvergentne evolucije, ili, kao kod kraćih sekvenci, slučajno, što znači da nisu homologne. Regije homologne sekvence nazivaju se konzervirane. To se ne smije zamijeniti sa konzerviranjem u aminokiselinskim sekvencama, gdje je aminokiselina na određenom položaju zamijenjena drugom koja ima funkcionalno ekvivalentna fizičko-hemijska svojstva.

Djelimična homologija može se dogoditi tamo gdje segment upoređenih sekvenci ima zajedničko porijeklo, dok ostatak nema. Takva djelomična homologija može biti rezultat fuzija gena.

Ortologija uredi

 
Vrh: duplikacijapredačkog gena za stvaranje dva paraloga (geni A i B).
Specijacija proizvodi ortologe u dvije kćerinskwe vrste. Dno: u odvojenoj vrsti, nepovezani gen ima sličnu funkciju (gen C), ali ima odvojeno evolucijsko porijeklo, pa je tako analog.

Homologne sekvence su ortologne ako se pretpostavlja da potiču od iste predačke sekvence odvojenih specijacijom: kada se vrsta divergira u dvije zasebne vrste, kaže se da su kopije jednog gena u dva rezultirajuća tipa ortologa. Ortolozi ili ortologni geni su geni različitih vrsta koji su nastali vertikalnim nasljeđivanjem iz jednog gena najbližeg drevnog zajedničkog pretka. Termin ortolog skovao je 1970. molekulski evolucionist Walter Fitch.[5]

Naprimjer, biljni regulatorni protein gripe prisutnan je i u Arabidopsis thaliana (višećelijska viša biljka) i Chlamydomonas (jednoćelijska zelena alga). Verzija Chlamydomonas je složenija: prelazi membranu dva puta, a ne jednom, sadrži dodatne domene i podvrgava se alternativnoj preradi. Međutim, može u potpunosti zamijeniti mnogo jednostavniji protein arabidopsisa, ako se pomoću genetičkog inženjerstva prenese iz algi u biljni genom. Značajna sličnost sekvenci i zajednički funkcionalni domeni ukazuju da su ova dva gena ortologni geni,[6] nasljeđeni od zajedničkog pretka.

Ortologija je strogo definiran termin u smislu porijekla. S obzirom na to da je teško utvrditi tačno porijeklo gena u različitim organizmima zbog umnožavanja gena i preuređivanja genoma, najsnažniji dokaz da su dva slična gena ortologna obično se nalazi provođenjem filogenetske analize genetičke loze. Ortolozi često, ali ne uvijek, imaju istu funkciju.[7]

Ortologne sekvence pružaju korisne informacije u taksonomskoj klasifikaciji i filogenetskim studijama organizama. Obrazac genetsičke divergencije može se koristiti za traženje srodnosti organizama. Dva organizma koja su vrlo usko povezana vjerovatno će pokazivati vrlo slične sekvence DNK između dva ortologa. Suprotno tome, organizam koji je evolucijski udaljen od drugog organizma vjerovatno će pokazati veću divergenciju u nizu proučavanih ortologa.

Baze podataka ortolognih gena uredi

S obzirom na njihov ogroman značaj u biologiji i bioinformatici, ortologni geni su organizirani u nekoliko specijaliziranih baze podataka koji pružaju alate za identifikaciju i analizu ortoloških sekvenci gena. Ovi resursi koriste pristupe koji se općenito mogu klasificirati u one koji koriste heurističku analizu svih usporedbi uparenih nizova i onih koji koriste filogenetske metode. Metodi poređenja sekvenci prvi put predstavljeni su u bazi podataka COG, 1997.[8] Ovi metodi su prošireni i automatizirani u sljedećim bazama podataka:

Trobazni filogenetički pristupi imaju za cilj razlikovanje specijacije od događaja dupliranja gena, upoređivanjem genskih stabala sa stablima vrsta, kako je implementirano u baze podataka i softverske alate kao što su:

Treća kategorija hibridnih pristupa za konstrukciju nakupina i određivanje stabala koristi heurističke i filogenetske metode, naprimjer:

Paralogija uredi

Paralogni geni su geni koji su povezani događajima duplikacija kod posljednjeg zajedničkog pretka (LCA) vrsta koje se uspoređuju. Oni su rezultat mutacije dupliranih gena tokom odvojenih događaja specijacije. Kada potomci iz LCA dijele mutirane homologe originalnih dupliranih gena, tada se ti geni smatraju paralognima.

Naprimjer, u LCA, jedan gen (gen A) može se duplirati da bi se stvorio zaseban sličan gen (gen B), pa se ta dva gena i dalje prenose u naredne generacije. Tokom specijacije, jedno okruženje će favorizirati mutaciju gena A (gen A1), stvarajući novu vrstu sa genima A1 i B. Tada će u posebnom događaju specijacije favorizirati mutaciju gena B (gen B1) što dovodi do nova vrsta sa genima A i B1. Geni potomaka A1 i B1 paralogni su jedni drugima jer su homolozi koji su povezani događajem dupliranja kod posljednjeg zajedničkog pretka dviju vrsta.

Dodatne klasifikacije paraloga uključuju aloparaloge (aut-paraloge) i simparaloge (in-paraloge). Aloparalozi su oni koji su nastali iz duplikacija gena koje su prethodile datom događaju specijacije. Drugim riječima, aloparalozi su paralozi koji su nastali iz događaja dupliranja koji su se dogodili kod poređenih LCA organizama. Gornji primjer je primjer aloparalogije. Simparalozi su paralozi koji su nastali uslijed dupliranja paralognih gena u kasnijim događajima specijacije. Iz gornjeg primjera, ako bi potomak s genima A1 i B prošao još jedan slučaj specijaacije, gdje se gen A1 duplirao, nova vrsta imala bi gene B, A1a i A1b. U ovom primjeru, geni A1a i A1b su simparalozi.[1]

 
Kičmenjački Hox geni organizirani su u skupove paraloga. Svaka Hox grupa (HoxA, HoxB, itd.) nalazi se na različitom hromosomu. Naprimjer, ljudski HoxA skup je na hromosomu 7. Ovdje prikazan mišji HoxA klaster ima 11 paralognih gena (dva nedostaju)[36]

Paralogni geni mogu oblikovati strukturu čitavih genoma i tako u velikoj mjeri objasniti njihovu evoluciju. Primjeri uključuju homeoboks (Hox) gena kod životinja. Ovi geni nisu prošli samo duplikaciju gena unutar hromosoma, već i duplikacije cijelog genoma. Kao rezultat toga, Hox geni u većini kičmenjaka grupirani su u više hromosoma, pri čemu su najbolje proučeni HoxA-D klasteri.

Drugi primjer su globinski geni koji kodiraju mioglobin i hemoglobin i smatraju se drevnim paralozima. Slično tome, četiri poznate klase hemoglobina (hemoglobin A, hemoglobin A2, hemoglobin B i hemoglobin F) međusobno su paralogni. Iako svaki od ovih proteina služi istoj osnovnoj funkciji transporta kisika, oni su se već malo razlikovali u funkciji: fetusni hemoglobin (hemoglobin F) ima veći afinitet za kisik od hemoglobina odraslih. Međutim, funkcija nije uvijek konzervirana. Naprimjer, ljudski angiogenin se razlikovao od ribonukleaza, i dok su dva paraloga slična po tercijarnoj strukturi, njihove funkcije u ćeliji sada su prilično različite.[37][38][39]

Regulacija uredi

Paralozi se često reguliraju drugačije, npr. tako što imaju različite obrasce ekspresije, specifične za tkivo (vidi Hox gen). Međutim, mogu se i drugačije regulirati na nivou proteina. Naprimjer, Bacillus subtilis kodira dva paraloga glutamat-dehidrogenaza: GudB je konstitutivno transkribiran, dok je RocG strogo reguliran. U svojim aktivnim, oligomernim stanjima, oba enzima pokazuju slične enzimske brzine. Međutim, zamjene enzima i promotora uzrokuju ozbiljne gubitke kondicije, što ukazuje na koevoluciju promotor-enzim. Karakterizacija proteina pokazuje da je, u odnosu na RocG, enzimska aktivnost GudB-a u velikoj mjeri ovisna o glutamatu i pH.[40]

Paralogne hromosomske regije uredi

Ponekad velike hromosomske regije dijele genski sadržaj sličan ostalim hromosomskim regijama unutar istog genoma.[41] Dobro su okarakterizirane u ljudskom genomu, gdje su korišteni kao dokaz u prilog hipotezi 2R. Skupovi dupliranih, trostrukih i četvorostrukih gena, sa povezanim genima na različitim hromosomima, utvrđuju se kao ostaci od duplikacija genoma ili hromosoma. Skup paralognih regija zajedno se naziva paralogon.[42] Dobro proučeni skupovi regija paralogije uključuju dijelove ljudskih hromosoma 2, 7, 12 i 17, koji sadrže Hox genske klastere, gene za kolagen, keratin i druge duplirane gene,[43] ljudskih hromosoma 4, 5, 8 i 10, koji sadrže gene za neuropeptidne receptore, NK-klasu homeoboksni geni i još mnogih genskih poroidica,[44][45][46] i dijelova ljudskih hromosoma 13, 4, 5 i X, koji sadrže ParaHox i susjedne gene.[47] Glavni kompleks histokompatibilnosti (MHC) na ljudskom hromosomu 6 ima paralogne regije na hromosomima 1, 9 i 19.[48] Veliki dio ljudskog genoma moguće je dodijeliti regijama paralogije.[49]

Onologija uredi

Duplikacija ukupnog genoma proizvodi genom sa dvije onologne kopije svakog gena.
Speciacija proizvodi ortologne gene u dvije kćerinske vrste. Horizontalni prenos gena iz jedne vrste u drugu dodaje ksenologne gene svom genomu.
Događaj specijacije stvara ortologe gena u dvije kćerinske vrste. Naknadna hibridizacija tih vrsta generira hibridni genom sa homoeolognom kopijom svakog gena iz obje vrste.

Onologni geni su paralogni geni koji su nastali procesom 2R duplikacija cijelog genoma. Ime je prvi put dao Ken Wolfe, u čast Susumu Ohnoa.[50] Onolozi su korisni za evolucijsku analizu jer se svi se u genomu razlikuju u istom vremenskom periodu (od zajedničkog porijekla u dupliranju cijelog genoma). Takođere je poznato da onolozi pokazuju veću povezanost sa karcinomima, dominantnim genetičkim poremećajima i varijacijama broja patogenih kopija.[51][52][53][54][55]

Ksenologija uredi

Homolozi koji nastaju kao rezultat horizontalnog prijenosa gena između dva organizma nazivaju se ksenolozima. Ksenolozi mogu imati različite funkcije, ako se novo okruženje uveliko razlikuje za vodoravno preneseni gen. Općenito, međutim, ksenolozi obično imaju sličnu funkciju u oba organizma. Pojam je smislio Walter Fitch.

Homoeologija uredi

Homeologni hromosomi ili dijelovi hromosoma su oni koji su okupljeni nakon hibridizacija i alopoliploidizacije, da bi se formirao eukariotski hibridni genom , i čiji je odnos bio potpuno homologan kod predačke vrste. U alopoliploidima, homologni hromosomi unutar svakog roditeljskog genoma trebaju se vjerno upariti tokom mejoze, što dovodi do disomijskog nasljeđivanja; međutim u nekim alopoliploidima homoeologni hromosomi roditeljskih genoma mogu biti približno jednako slični jedni drugima kao homologni hromosomi, što dovodi do tetrasomijskog nasleđivanja (četiri uparena hromosoma u mejozi), intergenomske rekombinacije, i smanjena plodnost.

Gametologija uredi

Gametologija označava odnos između homolognih gena na nekombiniranim, suprotnim spolnim hromosomima. Pojam su kreirali García-Moreno i Mindell.[56] 2000. Gametolozi proizlaze iz nastanka genetičkog određivanja spola i prepreka za rekombinaciju između spolnih hromosoma. Primjeri gametologa uključuju CHDW i CHDZ kod ptica.[56]

Također pogledajte uredi

Reference uredi

  1. ^ a b Koonin EV (2005). "Orthologs, paralogs, and evolutionary genomics". Annual Review of Genetics. 39: 309–38. doi:10.1146/annurev.genet.39.073003.114725. PMID 16285863.
  2. ^ "Clustal FAQ #Symbols". Clustal. Arhivirano s originala, 24. 10. 2016. Pristupljeno 8. 12. 2014.
  3. ^ Reeck, Gerald R.; Haën, Christoph de; Teller, David C.; Doolittle, Russell F.; Fitch, Walter M.; Dickerson, Richard E.; Chambon, Pierre; McLachlan, Andrew D.; Margoliash, Emanuel; Jukes, Thomas H.; Zuckerkandl, Emile (28. 8. 1987). ""Homology" in proteins and nucleic acids: A terminology muddle and a way out of it". Cell (jezik: engleski). 50 (5): 667. doi:10.1016/0092-8674(87)90322-9. ISSN 0092-8674. PMID 3621342.
  4. ^ Holman, Christopher (1. 1. 2004). "Protein Similarity Score: A Simplified Version of the Blast Score as a Superior Alternative to Percent Identity for Claiming Genuses of Related Protein Sequences". Santa Clara High Technology Law Journal. 21 (1): 55. ISSN 0882-3383.
  5. ^ Fitch WM (juni 1970). "Distinguishing homologous from analogous proteins". Systematic Zoology. 19 (2): 99–113. doi:10.2307/2412448. JSTOR 2412448. PMID 5449325.
  6. ^ Falciatore A, Merendino L, Barneche F, Ceol M, Meskauskiene R, Apel K, Rochaix JD (januar 2005). "The FLP proteins act as regulators of chlorophyll synthesis in response to light and plastid signals in Chlamydomonas". Genes & Development. 19 (1): 176–87. doi:10.1101/gad.321305. PMC 540235. PMID 15630026.
  7. ^ Fang G, Bhardwaj N, Robilotto R, Gerstein MB (mart 2010). "Getting started in gene orthology and functional analysis". PLOS Computational Biology. 6 (3): e1000703. Bibcode:2010PLSCB...6E0703F. doi:10.1371/journal.pcbi.1000703. PMC 2845645. PMID 20361041.
  8. ^ COGs: Clusters of Orthologous Groups of proteins
    Tatusov RL, Koonin EV, Lipman DJ (oktobar 1997). "A genomic perspective on protein families". Science. 278 (5338): 631–7. Bibcode:1997Sci...278..631T. doi:10.1126/science.278.5338.631. PMID 9381173.
  9. ^ evolutionary genealogy of genes: Non-supervised Orthologous Groups Arhivirano 8. 5. 2021. na Wayback Machine
    Muller J, Szklarczyk D, Julien P, Letunic I, Roth A, Kuhn M, et al. (januar 2010). "eggNOG v2.0: extending the evolutionary genealogy of genes with enhanced non-supervised orthologous groups, species and functional annotations". Nucleic Acids Research. 38 (Database issue): D190-5. doi:10.1093/nar/gkp951. PMC 2808932. PMID 19900971.
  10. ^ Powell S, Forslund K, Szklarczyk D, Trachana K, Roth A, Huerta-Cepas J, et al. (januar 2014). "eggNOG v4.0: nested orthology inference across 3686 organisms". Nucleic Acids Research. 42 (Database issue): D231-9. doi:10.1093/nar/gkt1253. PMC 3964997. PMID 24297252.
  11. ^ GreenPhylDB
    Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (januar 2008). "GreenPhylDB: a database for plant comparative genomics". Nucleic Acids Research. 36 (Database issue): D991-8. doi:10.1093/nar/gkm934. PMC 2238940. PMID 17986457.
  12. ^ Rouard M, Guignon V, Aluome C, Laporte MA, Droc G, Walde C, et al. (januar 2011). "GreenPhylDB v2.0: comparative and functional genomics in plants". Nucleic Acids Research. 39 (Database issue): D1095-102. doi:10.1093/nar/gkq811. PMC 3013755. PMID 20864446.
  13. ^ Inparanoid: Eukaryotic Ortholog Groups Arhivirano 3. 5. 2021. na Wayback Machine
    Ostlund G, Schmitt T, Forslund K, Köstler T, Messina DN, Roopra S, et al. (januar 2010). "InParanoid 7: new algorithms and tools for eukaryotic orthology analysis". Nucleic Acids Research. 38 (Database issue): D196-203. doi:10.1093/nar/gkp931. PMC 2808972. PMID 19892828.
  14. ^ Sonnhammer EL, Östlund G (januar 2015). "InParanoid 8: orthology analysis between 273 proteomes, mostly eukaryotic". Nucleic Acids Research. 43 (Database issue): D234-9. doi:10.1093/nar/gku1203. PMC 4383983. PMID 25429972.
  15. ^ Singh PP, Arora J, Isambert H (juli 2015). "Identification of Ohnolog Genes Originating from Whole Genome Duplication in Early Vertebrates, Based on Synteny Comparison across Multiple Genomes". PLOS Computational Biology. 11 (7): e1004394. Bibcode:2015PLSCB..11E4394S. doi:10.1371/journal.pcbi.1004394. PMC 4504502. PMID 26181593.
  16. ^ "Vertebrate Ohnologs". ohnologs.curie.fr. Arhivirano s originala, 14. 9. 2018. Pristupljeno 12. 10. 2018.
  17. ^ Altenhoff AM, Glover NM, Train CM, Kaleb K, Warwick Vesztrocy A, Dylus D, et al. (januar 2018). "The OMA orthology database in 2018: retrieving evolutionary relationships among all domains of life through richer web and programmatic interfaces". Nucleic Acids Research. 46 (D1): D477–D485. doi:10.1093/nar/gkx1019. PMC 5753216. PMID 29106550.
  18. ^ Zdobnov EM, Tegenfeldt F, Kuznetsov D, Waterhouse RM, Simão FA, Ioannidis P, et al. (januar 2017). "OrthoDB v9.1: cataloging evolutionary and functional annotations for animal, fungal, plant, archaeal, bacterial and viral orthologs". Nucleic Acids Research. 45 (D1): D744–D749. doi:10.1093/nar/gkw1119. PMC 5210582. PMID 27899580.
  19. ^ Nevers Y, Kress A, Defosset A, Ripp R, Linard B, Thompson JD, et al. (januar 2019). "OrthoInspector 3.0: open portal for comparative genomics". Nucleic Acids Research. 47 (D1): D411–D418. doi:10.1093/nar/gky1068. PMC 6323921. PMID 30380106.
  20. ^ OrthologID Arhivirano 24. 2. 2014. na Wayback Machine
    Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (mart 2006). "OrthologID: automation of genome-scale ortholog identification within a parsimony framework". Bioinformatics. 22 (6): 699–707. doi:10.1093/bioinformatics/btk040. PMID 16410324.
  21. ^ Egan, Mary; Lee, Ernest K.; Chiu, Joanna C.; Coruzzi, Gloria; DeSalle, Rob (2009), Posada, David (ured.), "Gene Orthology Assessment with OrthologID", Bioinformatics for DNA Sequence Analysis, Methods in Molecular Biology (jezik: engleski), Humana Press, 537, str. 23–38, doi:10.1007/978-1-59745-251-9_2, ISBN 978-1-59745-251-9, PMID 19378138
  22. ^ OrthoMaM
    Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (novembar 2007). "OrthoMaM: a database of orthologous genomic markers for placental mammal phylogenetics". BMC Evolutionary Biology. 7: 241. doi:10.1186/1471-2148-7-241. PMC 2249597. PMID 18053139.
  23. ^ Douzery EJ, Scornavacca C, Romiguier J, Belkhir K, Galtier N, Delsuc F, Ranwez V (juli 2014). "OrthoMaM v8: a database of orthologous exons and coding sequences for comparative genomics in mammals". Molecular Biology and Evolution. 31 (7): 1923–8. doi:10.1093/molbev/msu132. PMID 24723423.
  24. ^ Scornavacca C, Belkhir K, Lopez J, Dernat R, Delsuc F, Douzery EJ, Ranwez V (april 2019). "OrthoMaM v10: Scaling-Up Orthologous Coding Sequence and Exon Alignments with More than One Hundred Mammalian Genomes". Molecular Biology and Evolution. 36 (4): 861–862. doi:10.1093/molbev/msz015. PMC 6445298. PMID 30698751.
  25. ^ OrthoMCL: Identification of Ortholog Groups for Eukaryotic Genomes
    Chen F, Mackey AJ, Stoeckert CJ, Roos DS (januar 2006). "OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups". Nucleic Acids Research. 34 (Database issue): D363-8. doi:10.1093/nar/gkj123. PMC 1347485. PMID 16381887.
  26. ^ Fischer S, Brunk BP, Chen F, Gao X, Harb OS, Iodice JB, et al. (septembar 2011). "Using OrthoMCL to assign proteins to OrthoMCL-DB groups or to cluster proteomes into new ortholog groups". Current Protocols in Bioinformatics. Chapter 6 (1): Unit 6.12.1–19. doi:10.1002/0471250953.bi0612s35. ISBN 978-0471250951. PMC 3196566. PMID 21901743.
  27. ^ Roundup Arhivirano 29. 4. 2014. na Wayback Machine
    Deluca TF, Wu IH, Pu J, Monaghan T, Peshkin L, Singh S, Wall DP (august 2006). "Roundup: a multi-genome repository of orthologs and evolutionary distances". Bioinformatics. 22 (16): 2044–6. doi:10.1093/bioinformatics/btl286. PMID 16777906.
  28. ^ TreeFam: Tree families database
    van der Heijden RT, Snel B, van Noort V, Huynen MA (mart 2007). "Orthology prediction at scalable resolution by phylogenetic tree analysis". BMC Bioinformatics. 8: 83. doi:10.1186/1471-2105-8-83. PMC 1838432. PMID 17346331.
  29. ^ TreeFam: Tree families database
    Ruan J, Li H, Chen Z, Coghlan A, Coin LJ, Guo Y, et al. (januar 2008). "TreeFam: 2008 Update". Nucleic Acids Research. 36 (Database issue): D735-40. doi:10.1093/nar/gkm1005. PMC 2238856. PMID 18056084.
  30. ^ Schreiber F, Patricio M, Muffato M, Pignatelli M, Bateman A (januar 2014). "TreeFam v9: a new website, more species and orthology-on-the-fly". Nucleic Acids Research. 42 (Database issue): D922-5. doi:10.1093/nar/gkt1055. PMC 3965059. PMID 24194607.
  31. ^ OrthoFinder: Orthologs from gene trees
    Emms DM, Kelly S (novembar 2019). "OrthoFinder: phylogenetic orthology inference for comparative genomics". Genome Biology. 20 (1): 238. doi:10.1186/s13059-019-1832-y. PMC 6857279. PMID 31727128.
  32. ^ Vilella AJ, Severin J, Ureta-Vidal A, Heng L, Durbin R, Birney E (februar 2009). "EnsemblCompara GeneTrees: Complete, duplication-aware phylogenetic trees in vertebrates". Genome Research. 19 (2): 327–35. doi:10.1101/gr.073585.107. PMC 2652215. PMID 19029536.
  33. ^ Thanki AS, Soranzo N, Haerty W, Davey RP (mart 2018). "GeneSeqToFamily: a Galaxy workflow to find gene families based on the Ensembl Compara GeneTrees pipeline". GigaScience. 7 (3): 1–10. doi:10.1093/gigascience/giy005. PMC 5863215. PMID 29425291.
  34. ^ Sayers EW, Barrett T, Benson DA, Bolton E, Bryant SH, Canese K, et al. (januar 2011). "Database resources of the National Center for Biotechnology Information". Nucleic Acids Research. 39 (Database issue): D38-51. doi:10.1093/nar/gkq1172. PMC 3013733. PMID 21097890.
  35. ^ Fulton DL, Li YY, Laird MR, Horsman BG, Roche FM, Brinkman FS (maj 2006). "Improving the specificity of high-throughput ortholog prediction". BMC Bioinformatics. 7: 270. doi:10.1186/1471-2105-7-270. PMC 1524997. PMID 16729895.
  36. ^ Zakany J, Duboule D (august 2007). "The role of Hox genes during vertebrate limb development". Current Opinion in Genetics & Development. 17 (4): 359–66. doi:10.1016/j.gde.2007.05.011. PMID 17644373.
  37. ^ Studer RA, Robinson-Rechavi M (maj 2009). "How confident can we be that orthologs are similar, but paralogs differ?". Trends in Genetics. 25 (5): 210–6. doi:10.1016/j.tig.2009.03.004. PMID 19368988.
  38. ^ Nehrt NL, Clark WT, Radivojac P, Hahn MW (juni 2011). "Testing the ortholog conjecture with comparative functional genomic data from mammals". PLOS Computational Biology. 7 (6): e1002073. Bibcode:2011PLSCB...7E2073N. doi:10.1371/journal.pcbi.1002073. PMC 3111532. PMID 21695233.
  39. ^ Eisen, Jonathan. "Special Guest Post & Discussion Invitation from Matthew Hahn on Ortholog Conjecture Paper".
  40. ^ Noda-Garcia L, Romero Romero ML, Longo LM, Kolodkin-Gal I, Tawfik DS (juli 2017). "Bacilli glutamate dehydrogenases diverged via coevolution of transcription and enzyme regulation". EMBO Reports. 18 (7): 1139–1149. doi:10.15252/embr.201743990. PMC 5494520. PMID 28468957.
  41. ^ Lundin LG (april 1993). "Evolution of the vertebrate genome as reflected in paralogous chromosomal regions in man and the house mouse". Genomics. 16 (1): 1–19. doi:10.1006/geno.1993.1133. PMID 8486346.
  42. ^ Coulier F, Popovici C, Villet R, Birnbaum D (decembar 2000). "MetaHox gene clusters". The Journal of Experimental Zoology. 288 (4): 345–51. doi:10.1002/1097-010X(20001215)288:4<345::AID-JEZ7>3.0.CO;2-Y. PMID 11144283.
  43. ^ Ruddle FH, Bentley KL, Murtha MT, Risch N (1994). "Gene loss and gain in the evolution of the vertebrates". Development: 155–61. PMID 7579516.
  44. ^ Pébusque MJ, Coulier F, Birnbaum D, Pontarotti P (septembar 1998). "Ancient large-scale genome duplications: phylogenetic and linkage analyses shed light on chordate genome evolution". Molecular Biology and Evolution. 15 (9): 1145–59. doi:10.1093/oxfordjournals.molbev.a026022. PMID 9729879.
  45. ^ Larsson TA, Olsson F, Sundstrom G, Lundin LG, Brenner S, Venkatesh B, Larhammar D (juni 2008). "Early vertebrate chromosome duplications and the evolution of the neuropeptide Y receptor gene regions". BMC Evolutionary Biology. 8: 184. doi:10.1186/1471-2148-8-184. PMC 2453138. PMID 18578868.
  46. ^ Pollard SL, Holland PW (septembar 2000). "Evidence for 14 homeobox gene clusters in human genome ancestry". Current Biology. 10 (17): 1059–62. doi:10.1016/S0960-9822(00)00676-X. PMID 10996074.
  47. ^ Mulley JF, Chiu CH, Holland PW (juli 2006). "Breakup of a homeobox cluster after genome duplication in teleosts". Proceedings of the National Academy of Sciences of the United States of America. 103 (27): 10369–10372. Bibcode:2006PNAS..10310369M. doi:10.1073/pnas.0600341103. PMC 1502464. PMID 16801555.
  48. ^ Flajnik MF, Kasahara M (septembar 2001). "Comparative genomics of the MHC: glimpses into the evolution of the adaptive immune system". Immunity. 15 (3): 351–62. doi:10.1016/S1074-7613(01)00198-4. PMID 11567626.
  49. ^ McLysaght A, Hokamp K, Wolfe KH (juni 2002). "Extensive genomic duplication during early chordate evolution". Nature Genetics. 31 (2): 200–4. doi:10.1038/ng884. PMID 12032567. S2CID 8263376.
  50. ^ Wolfe K (maj 2000). "Robustness--it's not where you think it is". Nature Genetics. 25 (1): 3–4. doi:10.1038/75560. PMID 10802639. S2CID 85257685.
  51. ^ Singh PP, Affeldt S, Cascone I, Selimoglu R, Camonis J, Isambert H (novembar 2012). "On the expansion of "dangerous" gene repertoires by whole-genome duplications in early vertebrates". Cell Reports. 2 (5): 1387–98. doi:10.1016/j.celrep.2012.09.034. PMID 23168259.
  52. ^ Malaguti G, Singh PP, Isambert H (maj 2014). "On the retention of gene duplicates prone to dominant deleterious mutations". Theoretical Population Biology. 93: 38–51. doi:10.1016/j.tpb.2014.01.004. PMID 24530892.
  53. ^ Singh PP, Affeldt S, Malaguti G, Isambert H (juli 2014). "Human dominant disease genes are enriched in paralogs originating from whole genome duplication". PLOS Computational Biology. 10 (7): e1003754. Bibcode:2014PLSCB..10E3754S. doi:10.1371/journal.pcbi.1003754. PMC 4117431. PMID 25080083.
  54. ^ McLysaght A, Makino T, Grayton HM, Tropeano M, Mitchell KJ, Vassos E, Collier DA (januar 2014). "Ohnologs are overrepresented in pathogenic copy number mutations". Proceedings of the National Academy of Sciences of the United States of America. 111 (1): 361–6. Bibcode:2014PNAS..111..361M. doi:10.1073/pnas.1309324111. PMC 3890797. PMID 24368850.
  55. ^ Makino T, McLysaght A (maj 2010). "Ohnologs in the human genome are dosage balanced and frequently associated with disease". Proceedings of the National Academy of Sciences of the United States of America. 107 (20): 9270–4. Bibcode:2010PNAS..107.9270M. doi:10.1073/pnas.0914697107. PMC 2889102. PMID 20439718.
  56. ^ a b García-Moreno J, Mindell DP (decembar 2000). "Rooting a phylogeny with homologous genes on opposite sex chromosomes (gametologs): a case study using avian CHD". Molecular Biology and Evolution. 17 (12): 1826–32. doi:10.1093/oxfordjournals.molbev.a026283. PMID 11110898.