HomoloGene, alat Nacionalnog centra za biotehnološke informacije (NCBI), Sjedinjenih Država, sistem je za automatsko otkrivanje homologa (sličnosti koja se može pripisati podrijeklu od zajedničkog pretka) među označenim genima nekoliko potpuno sekvenciranih eukariotskih genoma.[1]

HomoloGene-ska obrada sastoji se od analize proteina iz ulaznih organizama. Sekvence se upoređuju pomoću BLAST-a, zatim se podudaraju i svrstavaju u grupe, koristeći taksonomsko stablo kreirano na temelju sličnosti sekvenci, gdje se prvo poklapaju srodniji organizmi, a zatim se na dodaju drugi. Poravnanja proteina mapiraju se natrag u njihove odgovarajuće sekvence DNK, a zatim se može izračunati metrika udaljenosti kao molekulske udaljenosti po modelu supstitucije (Jukes i Cantor, 1969), odnos Ka/Ks.

Sekvence se porede pomoću heurističkih algoritama za maksimiziranje rezultata globalno, a ne lokalno, u bipartitnom podudaranju . Zatim se izračunava statistički značaj svake komparacije. Sekvence se izrađuju po položaju i postavljaju se vrijednosti Ks kako bi se spriječilo grupiranje lažnih ortologa. „Paralozi“ se identificiraju pronalaženjem sekvenci koje su bliže datim vrstama od drugih vrsta.

Uključeni organizmi uredi

Metazoa uredi

Kičmenjaci uredi

Beskičmenjaci uredi

Gljive uredi

Biljke uredi

Dikotiledone uredi

Arabidopsis thaliana

Monokotiledone uredi

Protista uredi

Uključene baze podataka uredi

Reference uredi

  1. ^ "Home - HomoloGene - NCBI". www.ncbi.nlm.nih.gov. National Center for Biotechnology Information. Pristupljeno 16. 10. 2020.

Vanjski linkovi uredi