Genetička distanca

Genetička distanca ili genetičko rastojanje ili genetička udaljenost je jedno od najatraktivnijih područja suvremene populacijske genetike u proučavanju biološke raznolikosti biljnih, životinjskih iljudskih populacija. Prvi zamah, ovakva istraživanja su imala na bazi klasičnih genetičkih markera, a pravu ekspanziju su ostvarila uvođenjem molekulskogenetičkih biljega u takva istraživanja.

Polazišta

Znanstvene analize stupnja biološke heterogenosti ljudskih populacija oduvijek su bile pod izvjesnim uticajem površnih i "podrazumijevajućih" procjena pa i predrasuda. Tako su, na osnovu promatranja samo jednog superficijelnog svojstva, još od antičkih vremena, donošeni krupni zaključci o individualnoj, populacijskoj i "rasnoj" diferencijaciji velikih ljudskih skupina. Neutemeljenost takvih generalizacija zorno ilustruje bezbroj dosadašnjih nalaza, među kojima je i to da se dvije izolovane, ali blisko susjedne bh. lokalne populacije, po pojedinim nasljednim svojstvima (krvnim grupama ABO sistema, sekreciji AB(O)H antigena i dvadesetak ostalih, npr.), međusobno značajnije razlikuju nego svaka od njih u komparaciji sa izvjesnim dijelovima skandinavskog, američkog ili afričkog stanovništva. Zato noviji metodi procjene stupnja genetičkih sličnosti i razlika među ljudskim populacijama pokušavaju da u odgovarajuću analitiku uključe što više nesumljivo nasljednih svojstava. Oba nivoa proučavanja biodiverziteta su i poželjni i potrebni, ali u svakoj prilici je neophodna svijest o tome da li je riječ o prostoj heterogenosti genskih frekvencija ili kompleksnijoj međupopulacijskoj i "rasnoj" biološkoj osobenosti.^[1]^[2]

Procjena distance prema pojedinačnim markerima

Ilustracija genetičke distance (angularne transformacije alelogenskih frekvencija) po jednom troalelnom lokusu

Wahlundova varijansa

Svako istraživanje genetičke raznolikosti u posmatranom skupu populacija – ili na drugi način definiranih (pod)uzoraka – primarno je usmjereno na procjenu ukupne unutargrupne i međugrupne varijacije posmatranih parametara. Uobičajeno je da se, u tom pravcu, proučavaju koeficijent varijabilnosti i varijansa alelogenskih frekvencija, prilagođena za populacije u genetičkoj ravnoteži. Wahlund (1928) je, naime, davno primijetio da se, nakon zbrajanja odgovarajućih podataka o nezavisnim (sub)populacijama ili njihovim spajanjem, u novonastalom skupu pojavljuje sveukupni manjak heterozigotnosti, a višak homozigota. Prema Wahlundu, to smanjenje je jednako dvostrukoj varijansi alelogenskih frekvencija individualnih populacija i direktna je mjera njihove ukupne genetičke heterogenosti. Ta mjera se, međutim, ne može raščlaniti na pojedinačne – (sub)populacijske – relativne doprinose uočenoj genetičkoj divergenciji sastavnica proučavanog skupa. Iako je to dugo zanemarivano, Wahlundova varijansa alelogenskih frekvencija još uvijek se uvažava kao jedna od najneposrednijih mjera genetičke heterogenosti neke proučavane skupine izolovanih dijelova šire populacije (sa nezavisnim genetičkim driftom). Taj pokazatelj (σ²) se procjenjuje prema slijedećem obrascu:

σ² = Σ $p$ _i² : $k$ ) - $p$ ’²

gdje je

$p$ ’ = prosječna vrijednost učestalosti alela $p$ ;
Σ $p$ _i² : $k$ = prosjčna suma kvadrata relativne frekvencije alela $p$ u proučavanom skupu ( $k$ )

populacija. Pošto Wahlundova varijansa u većini odgovarajućih analiza (posebno u proučavanju skupina genetički bliskih populacija) ima relativno male iznose, predložena je njena standardizacija:

$W$ = σ² : $pq$ ;

$p$ = prosječna relativna učestalost alela $p$ ,
$q$ = prosječna relativna učestalost alela $q$ .

Pretpostavimo populaciju $P$ , sa relativnim frekvencijama alela A i a datih kao $p$ i $q$ , odnosno: $p+q=1$ ). Ako se ova populacija podijeli u dvije jednako velike subpopulacije $P_{1}$ i $P_{2}$ i svi A aleleli ostanu u subpopulaciji $P_{1}$ , a svi a aleleli u subpopulaciji $P_{2}$ (gdje se može pojaviti genetički drift) tada nema heterozigota, iako su subpopulacije u Hardy-Weinbergovoj ravnoteži.

U generalizaciji gornjeg primjera, bilo bi $p_{1}$ i $p_{2}$ reprezenata alela A u $P_{1}$ i $P_{2}$ , odnosno $q_{1}$ i $q_{2}$ predstavljaju a. Ako je frekvenciji alela u svakoj populaciji drugačija, tj. $p_{1}\neq p_{2}$ i retpostavimo li da je svaka subpopulacija u internom Hardy–Weinbergovom ekvilibriju, tada su genotipske frekvencije: AA, Aa i aa: p², 2pq, a q² respektivno u svakoj populaciji. Tada su heterozigoti ( $H$ ) u sveukupnoj populaciji prosjek obje subpopulacije:

$H$	$={2p_{1}q_{1}+2p_{2}q_{2} \over 2}$
	$={p_{1}q_{1}+p_{2}q_{2}}$
	$={p_{1}(1-p_{1})+p_{2}(1-p_{2})}$ ,

kojih je uvijek manje od $2p(1-p)$ ( = $2pq$ ), izuzev kada je $p_{1}=p_{2}$ .^[3]^[4]

Elaborirani obrasci, naravno, predstavljaju jednu od mogućih aproksimacija kinetike genetičke različitosti proučavanih populacija pod uticajem genetičkog drifta. U ranijim fazama diversifikacije populacija sa nezavisnim driftom, Wahlundova varijansa je proporcionalna vremenu (mjerenom diskretnim generacijama) – podijeljena brojem pripadajućih gena u njihovoj genetičkoj strukturi.

Pritom se očekuje da je u genetički uravnoteženim populacijama ova varijansa veća u potomstvu nego u generaciji koja mu prethodi. Ova pojava može imati nekoliko izvornih i najčešćih uzroka. Od onih koji se mogu (i matematički) precizno definirati, treba pomenuti direktnu međuzavisnost dvaju posmatranih pokoljenja, odnosno multiplikaciju genetičkog materijala (i razlika) u proizvodnji gameta za potonju generaciju, posebno imajući u vidu diferenciranu prosječnu fertilnost pojedinih tipova braka. Takve efekte imaju i genetički drift i imigracije. U ovakvim analizama, kao što je poznato, odgovarajuće odlike roditeljske generacije, u principu, predstavljaju bliže i pouzdanije pokazatelje stvarne genetičke strukture proučavane populacije.

$F$ F-relacije i fiksacijski indeksi

Analiza $F$ –relacija je, prema dosadašnjim iskustvima, jedan od najpouzdanijih metoda u proučavanju unutargrupne i međugrupne – parcijalne (subpopulacijske) i sveukupne (totalne populacijske) genetičke heterogenosti ljudskih populacija. Pritom je potrebno imati u vidu da njeni rezultati nisu istoznačni sa ishodima standardne $F$ –statistike (variance–ratio test), koja obuhvata analizu varijanse u kojoj je totalna varijacija rezultanta koakcije nekoliko njenih – statistički nezavisnih – mogućih uzroka.

Pošto, kao što je već istaknuto, u fuzioniranim populacijama opada heterozigotnost, podjednako se smanjuju i veličine oba pokazatelja varijanse ( $F$ i σ²):

$p$ ’ $q$ ’ $F$ = σ², gdje su $p$ ’ i $q$ ’ prosječne vrijednosti učestalosti alela $p$ i $q$ .

Na osnovu toga, standardizacija Wahlundovog principa se može izraziti i u obliku F varianse alelnih frekvencija. Ako se uspostave takve relacije između

σ² i Wrightovog $F$ _ST, rezultira:
$F$ _ST = σ²:

gdje su

$pq$ ;
$p$ i
$q$ = prosjčne veličine.

Ovaj postupak je prikladan za estimaciju $F$ iz alelnih frekvencija, a njegov finalni izraz se poistovjećuje sa standardiziranom Wahlundovom varijansom alelogenskih frekvencija i pogodan je za procjenu $F$ _ST iz podataka o relativnoj frekvenciji respektivnih alela. Taj odnos, između ostalog, omogućava i nekoliko nivoa hijerarhijske statistike, koja polazi od činjenice da svaka razdijeljena opća populacija ima tri nivoa kompleksnosti: individualni ( $I$ ), subpopulacijski ( $S$ ) i sveukupni (u totalnoj populaciji ( $T$ ). Prema tome, i očekivane razine heterozigotnosti (u uvjetima panmiktičnog ekvilibrija) su:

individualna ( $H$ _I),
subpopulacijska ( $H$ _S),
ukupna populacijska ( $H$ _T).

Hijerarhijska analiza genetičke heterogenosti uključuje različite nivoe, mjere i pokazatelje strukture populacije, a osobito tzv. fiksacijske indekse.

Izvorni (Wrightovi) fiksacijski indeksi

Izvorni (Wrightovi) fiksacijski indeksisu:

koeficijent inbridinga ( $F$ '_IS),
indeks redukcije heterozigotnosti (' $F$ _ST),
ukupni koeficijent inbridinga ( $F$ _IT).

Koeficijent inbridinga ( $F$ _IS

Koeficijent inbridinga ( $F$ _IS) je mjera redukcije heterozigotnosti inidividua uzrokovane neslučajnim parenjem unutar subpopulacija. Definiran je formulom:

$F$ _IS = ( $H$ _S – $H$ _I) : $H$ _S.

Negativna $F$ _ST vrijednost indicira povećanje heterozigotnosti (usljed autbridinga), a pozitivna upućuje na deficit heterozigotnosti (i inbriding) u odnosu na očekivanja (prema Hardy–Weinbergovom modelu genetičke ravnoteže).

Fiksacijski indeks $F$ _ST

Fiksacijski indeks $F$ _ST je pokazatelj redukcije heterozigotnosti subpopulacija usljed djelovanja genetičkog drifta, a definiran je formulom:

$F$ _ST = ( $H$ _T – $H$ _S) : $H$ _T.

Ova mjera je prikladna za široku upotrebu u analizi genetičke različitosti među populacijama. $F$ _ST uvijek ima pozitivnu vrijednost – sa rasponom variranja od $f0$ do $1$ . Minimalna vrijednost ( $0$ ) je karakteristična za panmiktičnu – nerazdijeljenu populaciju unutar koje nema genetičke divergencije. Maksimalni iznos $F$ _ST se javlja pri ekstremnoj razdijeljenosti i potpunoj izolaciji (sub)populacija, pri čemu su njegove moguće vrijednosti uvijek manje od $1$ . Kvantifikacija stupnja genetičke heterogenosti zasniva se na konvencionalnom rangiranju vrijednosti F_ST:

– 0,00 do 0,05 – mala,
– > 0,05 do 0,15 – umjerena,
– > 0,15 do 0,25 – velika,
– > 0,25 – veoma velika

genetička diferencijacija.^[5]^[6]^[7]^[8]^[9]^[10]

Pritom iznos $F$ _ST od 0,20 (npr.) pokazuje da 20% registrirane ukupne varijacije alelogenskih frekvencija potiče iz međusubpopulacijskih razlika, a 80% je unutar varijanse prosječne subpopulacije.

Kada sve subpopulacije imaju iste genske frekvencije, nema međusubpopulacijske varianse pa Wahlundov efekat izostaje; tada je $F$ _ST = $0$ .

Ukupni koeficijent inbridinga

Ukupni koeficijent inbridinga ( $F$ _ST) je mjera redukcije heterozigotnosti individua u odnosu na totalnu populaciju: $F$ _ST = ( $H$ _T – $H$ _I) : $H$ _T.

Kao i subpopulacijski koeficijent inbridinga ( $F$ _IS), tako i njegov ukupni koeficijent ( $F$ _IT) može imati negativne vrijednosti.

Koeficijent genske diferencijacije ( $G$ _ST)

Koeficijent genske diferencijacije ( $G$ _ST) je Neiova modifikacija Wrightovog pokazatelja $F$ _ST – u slučajevima kada se radi o više alela istog genskog lokusa, uzimajući u obzir i veličinu populacije. Izračunava se primjenom formule:

$G$ _ST = $D$ _ST : $H$ _T;
$H$ _T = prosječna genska raznolikost u totalnoj populaciji, dok je
$D$ _ST – zvana interpopulacijska genska raznolikost – izražena obrascem:
$D$ _ST = (Σ_kΣ_l : $s$ ²

$D$ _kl = genski diverzitet između $k$ –te i $l$ –te populacije, $s$ = broj subpopulacija.

Redefinirani (Neiovi) fiksacijski indeksi

Redefinirani (Neiovi) fiksacijski indeksi su formulirani na osnovu činjenice da u stvarnim prirodnim populacijama frekvencija genotipova u njihovim pojedinim dijelovima (subpopulacijama) nije redovno suglasna Hardy–Weinbergovoj ravnoteži. Sljedstveno tome, ni $F$ u svakoj subpopulaciji ne mora biti jednak $0$ . Kao što je već elaborirano, Wright je izvorno predložio da se devijacija genotipskih frekvencija u podrazdjeljenim populacijama određuje u okvirima fiksacijskih indeksa $F$ _IS, $F$ _IT i $F$ _ST. Prema njegovoj definiciji, parametri $F$ _IS i $F$ _IT su korelacije između dva spojena gameta iz gametskog fonda subpopulacije i sveukupne populacije, dok je $F$ _ST korelacija između dva slučajno odabrana gameta iz svake subpopulacije, a mjera je stupnja genetičke diferencijacije subpopulacija. Može se konstatovati da su pokazatelji $F$ '_IS, $F$ _ST i $F$ _IT međusobno povezani relacijama po obrascu:

$1$ – $F$ _IT = ( $1$ $F$ _IS) ( $1$ – $F$ _IT),

odnosno

( $1$ – $F$ _IS) ( $1$ – $F$ _ST) = ( $1$ – $F$ _IT).

Ovakav model $F$ statistike, sa izvjesnim modifikacijama, posebno respektira univerzalnu činjenicu da je ona primjenjiva na svaku populaciju u kojoj se posmatraju bialelni genski lokusi.

Polazište ove formulacije je u pretpostavci da posmatrane populacije ili subpopulacije imaju istovjetno porijeklo, tj. zajedničku predačku populaciju, i da su sve (sub)populacije srodne, bez obzira na međusobne migracije. Populacije se, dakle, posmatraju kao slučajan uzorak iz skupa beskrajno mnogo jednakih, tj. srodnih populacija. Ova idealizirana struktura populacije je približno primjenjiva na skup vještački formiranih populacija u laboratorijskim ili terenskim eksperimentima. Međutim, pokazalo se da takav model nije primjenjiv za proučavanje genetičke strukture prirodnih populacija. Većina njih, naime, ima neke historijsko–filogenetske veze, od kojih zavisi struktura aktuelnog genskog fonda istraživane populacije. Zato one nisu slučajan uzorak iz skupa beskonačno mnogo jednakih – srodnih skupina. Pritom treba imati na umu i imanentno široku međupopulacijsku varijaciju njihove veličine i da eventualna migracijska stopa nije ista za sve parove poređenih populacija. Suglasno tim činjenicama, koncept korelacije spojenih gameta se teško aplicira na realne prirodne populacije.

Nei (1977.) je redefinirao fiksacijske indekse bez primjene koncepta korelacije spojenih gameta i pokazao je da je u tom obliku prethodna formula primjenjiva u svakoj situaciji – bez obzira na filogenetske veze, migracijske modele, broj alela i prisustvo ili odsustvo selekcije. Dokazao je da svi fiksacijski indeksi mogu biti definisani na temelju uočene i očekivane heterozigotnosti posmatranih populacija. Po ovoj hipotezi, fiksacijski indeksi $F$ _IS, $F$ _IT i $F$ _ST su preformulirani u relacijama tri heterozigotnosti, i to:

stvarne unutarpopulacijske ( $h$ _O),
očekivane unutarpopulacijske ( $h$ _S),
očekivane sveukupne ( $h$ _T).

U ovom smislu, heterozigotnost se obično označava i kao genski diverzitet. Uočena unutarpopulacijska heterozigotnost definirana je obrascem: $xk$ _ij (i ≠ j) = frekvencija A i A_j u $k$ populaciji.

Očekivanu unutarpopulacijsku heterozigotnost procjenjuje formula: Očekivana ukupna heterozigotnost iznosi: Budući da podaci o $wk$ obično nisu dostupni, pretpostavlja se je

$wk$ = $1$ : $s$ ; $s$ = broj (sub)populacija.

Respektirajući ove izraze, uz upotrebu $O$ _ST, $h$ _ST_S i $h$ _T, fiksacijski indeksi mogu biti definisani na slijedeći način:

$F$ _IS = (h_S – h_O) / $h$ _S,
$F$ _IT = (h_T – h_O) / $h$ _T,
$F$ _ST = (h_T – h_S) / $h$ _T.

Bitno je napomenuti da $F$ _IS i $F$ _IT mogu imati negativnu vrijednost – kada je $h$ _O iz nekog razloga visok. $F$ _ST nikada ne može biti negativan, s obzirom da je $h$ _T uvijek veći ili jednak $h$ _S. Wrightova formulacija fiksacijskih indeksa je razvijena za slučaj dva alela, zbog čega je $F$ _ST proširen i za analizu genetičke heterogenosti multiplih alela. Obično je označen kao $G$ _ST, a izvorno nazvan koeficijentom genske diferencijacije. Značajno je primijetiti da su prethodno definirani fiksacijski indeksi univerzalno primjenljivi, bez obzira na prisustvo ili odsustvo selekcije (budući da su definisani u relacijama postojećih alela i genotipskih frekvencija). U slučajevima bialelnih lokusa, $G$ _ST postaje identičan sa $F$ _ST u formuli i ima vrijednost između $0$ i $1$ . U svakom slučaju, kada je veliki broj alela po lokusu i $h$ _S visok, $G$ _ST može biti znatno niži od $1$ , čak i ako postoje aleli koji nisu zajednički za različite subpopulacije.

Kvantitet $dST$ (= $h$ _T – $h$ _S) može biti izražen i kao: $d$ _ST =(Σ_kΣ_l $d$ _kl) : $s$ ;

$d$ _kl= Σ_i( $x$ _ki – $x$ _li)²/2;
$x$ _ki = frekvencija $i$ –tog alela u $k$ –toj populaciji;
$x$ _li = frekvencija i–tog alela u l-toj populaciji.

Očito je $d$ _kk = $0$ , pa tako imamo da je: $d$ '_ST = ( $s$ – $1$ ) $d$ ’_ST/ $s$ ,

gdje je:

U ovo sumiranje su uključeni svi iznosi $d$ _kl, osim $d$ _kk's. Zato se prosječna međupopulacijska diferencijacija alelnih frekvencija može mjeriti preko d'_ST – prije nego putem $d$ _ST. Pa zato možemo primijeniti

$F$ ’_ST = $d$ ’_ST: $h$ ’_T = ( $h$ ’_T – $h$ _S) / $fh$ ’_T; $h$ '_T = $h$ _S + $d$ '_ST.

Ovo je dodatna mjera širine genetičke diferencijacije subpopulacija i ima prednost nad $F$ _ST–om, jer je nezavisna od $s$ . Pošto h '_T više nije pokazatelj heterozigotnosti totalne populacije, $F$ _IT je redefinisan kao:

$F$ ’_IT = ( $h$ ’_T – $h$ _O) / $h$ ’_T,

u cilju održavanja relacija iz obrasca: $1$ – $F$ _IT = ( $1$ – $F$ _IS)( $1$ – $F$ _ST), dok $F$ _ST ostaje isti. U suštini, razlika između $F$ _ST i $F$ '_ST ili $F$ _IT i $F$ _IT je vrlo mala ako je $s$ ≥ 5.

Prosječni genski diverzitet

Prosječni genski diverzitet ili prosječna heterozigotnost se procjenjuje u slučajevima kada se stupanj genetičkih varijacija analizira na bazi alelnih frekvencija sa više lokusa. Genski diverzitet po jednom lokusu je definiran kao:

$h$ = $1$ - Σ^q_i=1 $x$ ²_i,

gdje je

$x$ _i = frekvencija $i$ -tog alela u populaciji,
$q$ = broj alela posmatranog lokusa.

Rezultat primjene obrasca Σ_ix_i se često označava i kao genski identitet ili genski similaritet. Prosječni genski diverzitet populacije, logično, jednak je srednjoj vrijednosti genskog diverziteta svih promatranih lokusa (l):

$h$ ' = Σ_i $h$ : $l$

Izraz genska raznolikost se odnosi na očekivanu heterozigotnost prema Hardy–Weinberg modelu genetičkog ekvilibrija, bez obzira na stvarnu genotipsku frekvenciju u populaciji.

Prekid izolacije

Prekid izolacije (isolate breaking) se odnosi na pojavu da kada subpopulacije (bivše izoliranê populacije) ostvaruju sekundarni kontakt ili se stapaju, usljed čega se reduciraju frekvencije homozigotnih genotipova. Ovaj fenomen je suprotan Wahlundovom principu.

Kompleksna analiza genetičke distance

U drugoj polovini prošlog vijeka formulirano je nekoliko modela i obrazaca za procjenu složene genetičke distance, koji počivaju na proučavanju genskih frekvencija sa jednog ili više lokusa. Empirijsku provjeru su najuspješnije ovjerila dva modela, koji se diferenciraju u respektiranju isključivo jednog ili pak dva ključna faktora međupopulacijske diversifikacije:

(1) genetički drift,
(2) genetički drift – mutacije.

Prvi model je predložio, a kasnije sa svojim saradnicima i neznatno modificiao, Cavalli–Sforza, po čemu se često označava i kao Cavalli–Sforzina mjera vezanosti (srodnosti), odnosno Cavalli–Sforzina genetička distanca (Cavalli–Sforza, Edwards 1968). Druga varijanta procjene genetičke heterogenosti populacija označava se kao Neiova genetička distanca (Nei 1972).

Po svemu sudeći, u dosadašnjim istraživanjima širu primjenu i veću popularnost je stekla prvopomenuta mjera. Prema toj procjeni, genetička distanca ( $d$ ) se može definirati izrazom koji je određen geometrijskom proporcijom sa linijom koja određuje ugao θ:

$d$ ∞ ${\sqrt {1-cos0}}\dots \!$ , gdje je

0 = θ

Iako je izvorno prilagođena za angularnu transformaciju alelogenskih frekvencija, ovaj metod procjene genetičke distance neznatno je modificirana u dosadašnjim istraživanjima.

Ova procjena počiva na činjenici da, suglasno angularnoj transformaciji, genetička sličnost (similaritet: $cos$ θ) dviju poređenih populacija (A – B) iznosi:

cosθ = Σ_i ${\sqrt {piApiB}}\dots \!$

gdje su:

$p$ _iA, $p$ _piB = relativne frekvencije posmatranog alela u populacijama A i B.

Respektirajući takav pristup, populacije mogu (po pojedinim lokusima) biti i grafički predstavljene, kako je to prikazano na priloženoj slici. Prikazane su odgovarajuće relacije s obzirom na jedan trialelni lokus, a koordinate su kvadratni korijeni relativnih alelogenskih učestalosti. Polazeći od činjenice da suma frekvencija alela svakog lokusa iznosi $1$ (= $1$ ), svaka populacija može biti predstavljena tačkom na površini oktanta neke sfere, pri čemu dvoalelnom lokusu odgovara četvrtina kruga.

Kada se međusobno porede samo dvije populacije, varijansa između njihovih uglovnih vrijednosti (σθ²) jednaka je

θ_A i θ_B = odgovarajući uglovi između svake posmatrane i neke arbitrarno definirane populacije,
θ = ugao između dvije poređene populacije.

jednom troalelnom lokusu

Pošto je:

slijedi:

Dakle, veličina $f$ između dvije populacije jednaka je četverostrukom kvadratu genetičke distance ( $d$ ):

Ova mjera vrijedi za bialelne lokuse, dok se za multialelne gene izražava prosjek $f$ veličina za ukupni broj ( $k$ ) alela: Integriranje, odnosno sumiranje složene genetičke distance po sveukupnom kompleksu proučavanih genskih lokusa moguće je prema srodnom obrascu:

Ukupni niz ovih mjera genetičke distance u većim skupovima populacija (u mogućim relacijama “svako sa svakim”) može se iskoristiti i za grube procjene stupnja genetičke osobenosti svake populacije – u odnosu na očekivano stanje u hipotetičnoj prosječnoj populaciji. Najjednostavniji takvi pokazatelji su:

(1) raspon variranja ( $f$ _θmin – $f$ _θmax),
(2) prosječna genetička distanca ( $f$ ’_θ),
(3) indeks genetičke specifičnosti ( $f$ _θs);

ili

u dva donja izraza, djelitelj je ustvari faktor standardizacije (koja je preporučljiva zbog pretežito malih veličina djeljenika) – osobito u skupinama blisko srodnih populacija. Pritom predznak ( $+$ ili $-$ ) ovog pokazatelja indicira smjer, a njegov iznos procjenjuje intenzitet odstupanja genetičkog sastava svake konkretne populacije u odnosu na hipotetičnu prosječnu genetičku strukturu proučavanog skupa ( $k$ ). Određivanje standardne greške procjene $f$ _θ počiva na obradi $f$ vrijednosti posmatranih lokusa.

Pojednostavljene procjene odnosa između veličine $f$ i brzine (mikro)evolucije pokazale su da je za izvjesne aplikacije pouzdanije respektirati ovaj pokazatelj nego veličinu $d$ . Temporalna diversifikacija populacija se odvija u određenom periodu ( $T$ ), pri djelovanju tekućeg drifta čiju efikasnost primarno određuje efektivna veličina populacije ( $N$ ), a koja ima očekivanu $f$ vrijednost:
koja je za mali $T$ jednostavna:

Drugim riječima, to je kvadrat genetičke distance, koji je proporcionalan sa vremenom za divergenciju po jednostavnom modelu drifta. Primjena kvadrata genetičke distance ili pokazatelja f u evolucijskim analizama počiva na pretpostavci da je genetički drift glavni faktor diferencijacije. Međutim, ako je trajanje diferencijacije duže, to nije samo $f$ , već:

$log$ ( $1$ – $f$ ),
što je proporcionalno evolucijskom vremenu (preciznije: $T$ : $2N$ ).

Kada se pretpostavlja da su lokalne selekcijske specifičnosti odgovorne za diferencijaciju, genetička distanca može biti analizirana sama po sebi. U tom slučaju, genske frekvencije divergiraju (u dvije ili više nezavisno evoluirajućih populacija) saglasno veličini koeficijenta selekcije ( $s$ ), a prema jednostavnom obrascu: koji uvažava početne i krajnje genske frekvencije:

$m$ ₀ – proučavana genska frekvencija u vrijeme diversifikacije, $p$ – populacija koja je bila izložena selekciji intenziteta ' $s$ , u toku vremena $T$ .

Neiova genetička distanca je formulirana za beskonačni (neograničeni) izoalelni model mutacija, u kojem postoji stopa neutralnih mutacija, a svaki mutant je potpuno novi alel. Pritom se podrazumijeva da je:

– stopa neutralnih mutacija svih alela identična efektima genetičkog drifta, a
– efektivna veličina svih populacija konstantna.

Ova distanca je definirana formulom:

gdje je:
$m$ = suma svih lokusa,
$i$ = suma svih alela na m–tom lokusu,,
$p$ _1 mi = frekvencija $i$ –tog alela $m$ –tom lokusu populacije $1$ .

U kompleksnoj analizi genetičke distance (naročito one koja počiva na posmatranju uzoraka male veličine), koristi se i koancestralni koeficijent (Reynolds, Weir, Cockerham, 1983). Ovaj model distance se bazira na hipotezi da su efekti genetičkog drifta isključivi izvor diversifikacije, a opservirana procjena je izvorno označena kao indikator genetičke sličnosti. Međutim, u kasnijim analizama i raspravama, kompetentni autoriteti su dokazali da se i ovdje radi o angularnoj transformaciji direktnog pokazatelja genetičke heterogenosti, pa se danas ova procjena uvažava kao jedna od varijanti pojma genetičke distance. Proračun koancestralnog koeficijenta, naime, (kao i angularna distanca) počiva na $F$ _ST–u (To je proporcija ukupne genetičke varianse sadržane u subpopulacijama u odnosu na totalnu genetičku varijaciju. Njene vrijednosti se kreću u rasponu od 0 do 1. Veće vrijednost $F$ _ST implicira veći stepen diferencijacije među pripadajućim populacijama) i predstavlja pravu mjeru genetičke udaljenosti. Polazeći od te činjenice, ovaj model je poznat i kao $F$ _ST distanca:

$m$ = suma lokusa,
$i$ = suma alela,,
$p$ _1 mi = frekvencija $i$ –tog alela na $m$ –tom lokusu populacije $1$ ,,
$p$ _2 mi = frekvencija $i$ –tog alela na m–tom lokusu upopulacije 2.,

Za $D$ ₂ vrijednost je očekivano da raste linearno sa kumulacijom efekata genetičkog drifta. Ovaj model genetičke distance zanemaruje važnost mutacija, a čini se da je posebno prikladan iz tri osnovna razloga:

– podesan je za populacije male veličine (u kojma je veća vjerovatnoća djelovanja genetičkog drifta);
– drift sa "nedostajućim koracima" (missing steps – drift kreira diskontinuiranu distribuciju alela, umjesto "blago zvonaste" linije koju bismo očekivali pod striktno stepwise (kontinuiranim) dejstvom ovog faktora;
– reflektira vrijeme proteklo do divergencije posmatranih populacija (subpopulacija).

Moguća strategija i finalni rezultati analize genetičke heterogenosti u skupini od 15 bosanskohercegovačkih lokalnih populacija i u svjetskim razmjerima, ilustrirani su na priloženim tabelama. Analiza kompleksne genetičke distance počiva na angularnoj transformaciji alelogenskih frekvencija (Cavalli–Sforza, Bodmer 1999), a odgovarajući dendrogrami su konstruirani primjenom UPGMA metoda prosječne vezanosti. UPGMA = Unweighted Pair–Group Method using arithmetic Averages.

Matriks različitosti / sličnosti moguće je napraviti i na osnovu mjera kvantitativnih svojstava operativnih taksonomskih jedinica i na osnovu tog matriksa izvšiti (npr.) i UPGMA klasterizaciju i dendrogramski je prikazati.

Prosječna "taksonomska" distanca i prosječna distanca su najčešće korištene mjere različitosti u numeričkoj taksonomiji (Sneath, Sokal 1973).

Pregled modela procjene genetičke distance

Analize genetičkake udaljenosti su osobito korisne i za rekonstrukciju historije populacija. Njihovi rezultati, na primjer, ukazujiu na evolucujsku prošlost ljudskih populacija i dokazuju činjenicu da su se afričke i evroazijske međusobno udaljile prije oko 100.000 godina.^[11]

Genetička distanca se također koristi za razumijevanje porijekla biodiverziteta, njegove aktuelne strukture i dinamike. Na primjer, genetičke udaljenosti između različitih rasa domaćih životinja se često istražuju, kako bi se utvrdilo koja rasa treba da bude zaštićena u cilju održavanja genetičke raznolikosti.^[12]

Iako je jednostavno definirati genetske udaljenosti kao mjere genetičke divergencije, postoji više predloženih i različitih njenih statističkih mjera koje su bile ili su i danas u primjeni. To se dogodilo zbog toga što različiti autori polaze od različitih evolucijskih modela. Najčešće se koriste Cavalli-Sforzina i Neiova genetička udaljenost.^[13] i Reynolds – Weir–Cockerhamova genetička distanca.^[14]

U svim formulama ovog odjeljka, $X$ i $Y$ predstavljaju dvije različite populacije sa po $L$ proučavanih lokusa. Neka $X_{u}$ predstavljaju $u$ ^ti alel na $l$ ^th lokusu.

Neiova standardna genetička distanca

U 1972., Masatoshi Nei je objavio ono što je postalo poznato kao Neioa standardna genetička udaljenost. Analiza ove udaljenosti ima mogućnost da na osnovu pretpostavke da je godišnja ili generacijska stopa genetičke promjena (supstitucija aminokiselina), konstanta, a zatim Neiova standardna genetska udaljenosti (D) u ovu analizu uključuje i divergenciju vremena. Kao što naglašeno u prethodnom poglavlju, ova mjera pretpostavlja da su genetičke razlike posljedica mutacija i genetičkog drifta.

{\begin{aligned}D=-\ln {\frac {\sum \limits _{l}\sum \limits _{u}X_{u}Y_{u}}{\sqrt {(\sum \limits _{l}\sum \limits _{u}X_{u}^{2})(\sum \limits _{l}\sum \limits _{u}Y_{u}^{2})}}}\end{aligned}}

Ova distanca se također može izraziti u aritmetičkom smislu i terminima genskog identiteta. Ako $j_{X}$ je vjerovatnoća da dvije jedinke u populaciji $X$ imaju istovremeno isti alel na određenom lokusu i $j_{Y}$ i to odgovara vjerovatnoći u populaciji $Y$ . Ako, također stoji da je $j_{XY}$ vjerovatnoća za jedinku populacije $X$ da i član $Y$ ima isti alel. Sada, uzmimo da $J_{X}$ , $J_{Y}$ i $J_{XY}$ predstavlja aritmetičku sredinu $j_{X}$ , $j_{Y}$ i $j_{XY}$ datih lokusa. Drugim riječima,

{\begin{aligned}J_{X}=\sum \limits _{l}\sum \limits _{u}{\frac {{X_{u}}^{2}}{L}}\end{aligned}}

{\begin{aligned}J_{Y}=\sum \limits _{l}\sum \limits _{u}{\frac {{Y_{u}}^{2}}{L}}\end{aligned}}

{\begin{aligned}J_{XY}=\sum \limits _{l}\sum \limits _{u}{\frac {X_{u}Y_{u}}{L}}\end{aligned}}

,

gdje je $L$ ukupni broj posmatranih lokusa.^[15]

Neiova standardna distanca se tada može izraziti kao:

{\begin{aligned}D=-\ln {\frac {J_{XY}}{\sqrt {J_{X}J_{Y}}}}\end{aligned}}

Cavalli-Sforzina chord distanca

Ovu mjeru su definirali Luigi Luca Cavalli-Sforza i A. W. F. Edwards 1967., a proističe samo iz genetičkog drifta. Glavni napredak ove mjere je da su populacije predstavljene u hipersferi skale čija je jedinica supstitucija po genu:

{\begin{aligned}D_{CH}={\frac {2}{\pi }}{\sqrt {2(1-\sum \limits _{l}\sum \limits _{u}{\sqrt {X_{u}Y_{u})}}}}\end{aligned}}

Neki autori ispuštaju faktor ${\frac {2}{\pi }}$ da pojednostave formulu po cijenu gubitka zanemaruju mjere po jedinici izmjene gena.

Reynolds - Weir - Cockerhamanova genetička distanca

Godine 1983., ovu mjera je objavio trojacobjavio John Reynolds, B. S Weir i C. Clark Cockerham. Ona pretpostavlja da genetičku diferencijaciju također uzrokuje samo genetički drift,bez mutacija. Procjenjujuju koeficijent koancestralnosti (zajedničkog porijekla) $\Theta$ :

{\begin{aligned}\Theta _{w}={\sqrt {\frac {\sum \limits _{l}\sum \limits _{u}(X_{u}-Y_{u})^{2}}{2\sum \limits _{l}(1-\sum \limits _{u}X_{u}Y_{u})}}}\end{aligned}}

Ostale mjere genetičke distance

Predlagane su i mnoge druge procjene genetičke distance sa različitim uspjehom.

Neiova D_A distanca 1983

Ova udaljenost pretpostavlja da genetičke razlike nastaju zbog mutacija i genetičkog drifta, ali ta mjera udaljenosti daje mogućnost pouzdanije rekonstrukcije filogenetskih stabala populacija u odnosu na ostale udaljenosti, posebno za mikrosatelitske DNK podatake. ^[16]

{\begin{aligned}D_{A}=1-\sum \limits _{l}\sum \limits _{u}{\sqrt {X_{u}Y_{u}}}/{L}\end{aligned}}

Euklidovska distanca

{\begin{aligned}D_{EU}={\sqrt {\sum \limits _{u}(X_{u}-Y_{u})^{2}}}\end{aligned}}

Goldsteinova distanca 1995

Ova mjera je posebno razvijena za mikrosatelitske markere i zasniva se na modelu stepenastih mutacija (SMM). $\mu _{X}$ and $\mu _{Y}$ su prosjeci alelnih frekvencija u populacijama X i Y.^[17]

{\begin{aligned}(\delta \mu )^{2}=\sum \limits _{l}(\mu _{X}-\mu _{Y})^{2}/{L}\end{aligned}}

Neiova minimalna genetička distanca 1973

I ova mjera počiva na pretpostavci da su mutacije i genetički drift glavni faktori genetičke diferencijacije populacija:

{\begin{aligned}D_{m}={\frac {(J_{X}+J_{Y})}{2}}-J_{XY}\end{aligned}}

Rogerova distanca 1972

{\begin{aligned}D_{R}={\frac {1}{L}}{\sqrt {\frac {\sum \limits _{u}(X_{u}-Y_{u})^{2}}{2}}}\end{aligned}}

^[18]

Fiksacijski indeks

Najčešće korištena mjera genetičke udaljenosti je fiksacijski indeks koji varira između 0 i 1. Vrijednost 0 ukazuje da su dvije populacije genetički identične, dok j vrijednost od 1 ukazuje na to da su dvije populacije različite vrste. Mutacije se ne pretpostavljaju.

Softver

Poptree

GENDIST
- Nei's standard genetic distance 1972
- Cavalli-Sforza and Edwards 1967
- Reynolds, Weir, and Cockerham's 1983
TFPGA
- Nei's standard genetic distance (original and unbiased)
- Nei's minimum genetic distance (original and unbiased)
- Wright's (1978) modification of Roger's (1972) distance
- Reynolds, Weir, and Cockerham's 1983
GDA
POPGENE
POPTREE2 Takezaki, Nei, and Tamura (2010, 2014)
- Commonly used genetic distances and gene diversity analysis
DISPAN Arhivirano 27. 4. 2017. na Wayback Machine
- Nei's standard genetic distance 1972
- Nei's D_A distance between populations 1983

Vanjski linkovi

Reference

^ Nei M. (1987): Molecular evolutionary genetics. Columbia University Press, New York
^ Hadžiselimović R. (1977): Genetika sekrecije ABH antigena u stanovništvu SR Bosne i Hercegovine. God. Biol. inst. Univ. u Sarajevu, 30: 29-104.
^ Cavali-Sforza L. L., Bodmer W. F. (1999): The genetics of human populations. Dover Publictions, Inc., Mineola, New York, ISBN 0-486-40693-8.
^ Cavalli-Sforza L. L., Menozzi P., Piazza A. (1994): The history and geography of human genes. Princeton University Press, Princeton,ISBN 0-691-02905-9.
^ Hedrick P. (2011): Genetics of populations. Jones & Bartlett Learning, ISBN 978-0-7637-5737-3.
^ [1]
^ Griffiths, A. J. F. (1999). An Introduction to genetic analysis. W. H. Freeman, San Francisco, ISBN 0-7167-3520-2.
^ Dobzhansky T. (1970): Mankind envolving: The evolution of the human species. Bantam Books, New York, ISBN 05526-539-0X; ISBN 978-05526-5390-9.
^ Hadžiselimović R. (2005): Bioantropologija – Biodiverzitet recentnog čovjeka. Institut za genetičko inženjerstvo i biotehnologiju (INGEB), Sarajevo, ISBN 9958-9344-2-6.
^ Cavali-Sforza L. L., Bodmer W. F. (1999): The genetics of human populations. Dover Publications, Inc., Mineola, New York, ISBN 0-486-40693-8.
^ Nei M., Roychoudhury A. K. (1974): Genetic variation within and between the three major races of man, Caucasoids, Negroids, and Mongoloids. The American Journal of Human Genetics, 26: 421–443.
^ Ruane J. (1999): A critical review of the value of genetic distance studies in conservation of animal genetic resources. Journal of Animal Breeding and Genetics, 116 (5): 317-323.
^ Cavalli-Sforza L. L., Edwards A.W.F. (1967): Phylogenetic analysis – Models and estimation procedures. The American Journal of Human Genetics, 19 (3).
^ Reynolds J., Weir B.S., Clark Cockerham C. C. (1983): Estimation of the coancestry coefficient: Basis for a short-term genetic distance. Genetics, 105: 767–779.
^ Nei, M. (1987) Genetic distance and molecular phylogeny. In: Population Genetics and Fishery Management (N. Ryman and F. Utter, eds.), University of Washington Press, Seattle, WA.
^ Nei M.,Tajima F., Tateno Y. (1983): Accuracy of estimated phylogenetic trees from molecular data. II. Gene frequency data. J. Mol. Evol., 19: 153-170.
^ Gillian C. G. et al. ( 1999): An rmperical exploration of the $(\delta \mu )^{2}$ Genetic distance for 213 Human microsatellite markers. The American Journal of Human Genetics, 65: 1125–1133.
^ Rogers, J. S. (1972): Measures of similarity and genetic distance. In Studies in Genetics VII: 145−153. University of Texas Publication 7213. Austin, Texas.

Također pogledajte

Vanjski linkovi

The Estimation of Genetic Distance and Population Substructure from Microsatellite allele frequency data., Brent W. Murray (May 1996), McMaster University web stranica o genetičkoj distanci

[1] Nei M. (1987): Molecular evolutionary genetics. Columbia University Press, New York

[2] Hadžiselimović R. (1977): Genetika sekrecije ABH antigena u stanovništvu SR Bosne i Hercegovine. God. Biol. inst. Univ. u Sarajevu, 30: 29-104.

[3] Cavali-Sforza L. L., Bodmer W. F. (1999): The genetics of human populations. Dover Publictions, Inc., Mineola, New York, ISBN 0-486-40693-8.

[4] Cavalli-Sforza L. L., Menozzi P., Piazza A. (1994): The history and geography of human genes. Princeton University Press, Princeton,ISBN 0-691-02905-9.

[5] Hedrick P. (2011): Genetics of populations. Jones & Bartlett Learning, ISBN 978-0-7637-5737-3.

[6] [1]

[7] Griffiths, A. J. F. (1999). An Introduction to genetic analysis. W. H. Freeman, San Francisco, ISBN 0-7167-3520-2.

[8] Dobzhansky T. (1970): Mankind envolving: The evolution of the human species. Bantam Books, New York, ISBN 05526-539-0X; ISBN 978-05526-5390-9.

[9] Hadžiselimović R. (2005): Bioantropologija – Biodiverzitet recentnog čovjeka. Institut za genetičko inženjerstvo i biotehnologiju (INGEB), Sarajevo, ISBN 9958-9344-2-6.

[10] Cavali-Sforza L. L., Bodmer W. F. (1999): The genetics of human populations. Dover Publications, Inc., Mineola, New York, ISBN 0-486-40693-8.

[11] Nei M., Roychoudhury A. K. (1974): Genetic variation within and between the three major races of man, Caucasoids, Negroids, and Mongoloids. The American Journal of Human Genetics, 26: 421–443.

[12] Ruane J. (1999): A critical review of the value of genetic distance studies in conservation of animal genetic resources. Journal of Animal Breeding and Genetics, 116 (5): 317-323.

[13] Cavalli-Sforza L. L., Edwards A.W.F. (1967): Phylogenetic analysis – Models and estimation procedures. The American Journal of Human Genetics, 19 (3).

[14] Reynolds J., Weir B.S., Clark Cockerham C. C. (1983): Estimation of the coancestry coefficient: Basis for a short-term genetic distance. Genetics, 105: 767–779.

[15] Nei, M. (1987) Genetic distance and molecular phylogeny. In: Population Genetics and Fishery Management (N. Ryman and F. Utter, eds.), University of Washington Press, Seattle, WA.

[16] Nei M.,Tajima F., Tateno Y. (1983): Accuracy of estimated phylogenetic trees from molecular data. II. Gene frequency data. J. Mol. Evol., 19: 153-170.

[An_Empirical_Exploration_of_the_dmu2_Genetic_Distance_for_213_Human_Microsatellite_Markers-17] Gillian C. G. et al. ( 1999): An rmperical exploration of the $(\delta \mu )^{2}$ Genetic distance for 213 Human microsatellite markers. The American Journal of Human Genetics, 65: 1125–1133.

[18] Rogers, J. S. (1972): Measures of similarity and genetic distance. In Studies in Genetics VII: 145−153. University of Texas Publication 7213. Austin, Texas.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

Genetička distanca

Polazišta

Procjena distance prema pojedinačnim markerima

Wahlundova varijansa

Izvorni (Wrightovi) fiksacijski indeksi

Ukupni koeficijent inbridinga

Redefinirani (Neiovi) fiksacijski indeksi

Prosječni genski diverzitet

Prekid izolacije

Kompleksna analiza genetičke distance

Pregled modela procjene genetičke distance

Neiova standardna genetička distanca

Cavalli-Sforzina chord distanca

Reynolds - Weir - Cockerhamanova genetička distanca

Ostale mjere genetičke distance

Neiova DA distanca 1983

Euklidovska distanca

Goldsteinova distanca 1995

Neiova minimalna genetička distanca 1973

Rogerova distanca 1972

Fiksacijski indeks

Softver

Vanjski linkovi

Reference

Također pogledajte

Vanjski linkovi

Neiova D_A distanca 1983