Hardyho–Weinbergův princip

Statické frekvence alel v populaci napříč generacemi předpokládají: žádnou mutaci (alely se nemění), žádnou migraci nebo emigraci (žádnou výměnu alel mezi populacemi), nekonečnou velikost populace a žádný selektivní tlak pro nebo proti jakýmkoliv genotypům. Genotypové frekvence budou také statické, když je páření náhodné.

Tento koncept byl pojmenován po G.H. Hardym a Wilhelmu Weinbergovi.

Lepší, ale rovnocenný pravděpodobnostní popis pro HWP je, že alely pro další generaci pro daného jedince jsou vybrány náhodně a nezávisle na sobě. Vezměme si dvě alely, A a, s frekvencemi p a q, v populaci. Různé způsoby tvorby nových genotypů lze odvodit pomocí Punnettova čtverce, kde zlomek v každé je roven součinu pravděpodobnosti řádků a sloupců.

Vzorec je někdy psán jako (p2) + (2pq) + (q2) = 1, což reprezentuje fakt, že pravděpodobnosti (normalizované frekvence pro teoreticky nekonečnou velikost populace) se musí sčítat do jedné.

Poslední tři možné genotypové frekvence v potomstvu se stávají:

Tyto frekvence se nazývají Hardyho-Weinbergovy frekvence (nebo Hardyho-Weinbergovy proporce). Toho se dosáhne za jednu generaci a vyžaduje to pouze předpoklad náhodného páření s nekonečnou velikostí populace.

Někdy je populace vytvořena spojením samců a samic s různou četností alel. V tomto případě je předpoklad jedné populace porušen až po první generaci, takže první generace nebude mít Hardyho-Weinbergovu rovnováhu. Následující generace budou mít Hardyho-Weinbergovu rovnováhu.

Odchylky od Hardyho–Weinbergovy rovnováhy

Porušení Hardyho–Weinbergových předpokladů může způsobit odchylky od očekávání. Jak to ovlivní populaci, závisí na porušených předpokladech.

Pokud populace poruší jeden z následujících čtyř předpokladů, může mít populace i nadále Hardyho-Weinbergovy proporce v každé generaci, ale frekvence alel se bude s touto silou měnit.

Jak tyto prohřešky ovlivňují formální statistické testy pro HWE je rozebráno později.

Porušení předpokladů v Hardyho-Weinbergově principu bohužel neznamená, že populace poruší HWE. Například vyvažování selekce vede k rovnovážné populaci s Hardyho-Weinbergovými proporcemi. Tato vlastnost s selekcí vs. mutací je základem pro mnoho odhadů míry mutace (tzv. mutace-selekce balance).

Tam, kde je gen A spojen s pohlavím, heterogametické pohlaví (např. savčí samci; ptačí samice) má pouze jednu kopii genu (a označuje se jako hemizygózní), zatímco homogametické pohlaví (např. lidské samice) má dvě kopie. Frekvence genotypu v rovnováze jsou p a q pro heterogametické pohlaví, ale p2, 2pq a q2 pro homogametické pohlaví.

Například u lidí je červeno-zelená barvoslepost recesivní znak vázaný na X. U západoevropských mužů tento znak postihuje asi 1 z 12, (q = 0,083), zatímco postihuje asi 1 z 200 žen (0,005, v porovnání s q2 = 0,007), velmi blízko Hardyho-Weinbergových proporcí.

Pokud se populace spojí s muži a ženami s různou četností alel, četnost alel mužské populace následuje četnost alel ženské populace, protože každá dostává svůj chromozom X od své matky. Populace se velmi rychle sbližuje v rovnováze.

Výše uvedené jednoduché odvození lze zobecnit pro více než dvě alely a polyploidii.

Generalizace pro více než dvě alely

Vezměme si navíc frekvenci alel, r. Dvoulalelový případ je binomická expanze (p + q)2, a tedy trojalelový případ je trinomiální expanze (p + q+ r)2.

Obecněji uvažujme alely A1, …, Ai dané frekvencemi alel p1 až pi;

Zobecnění pro polyploidii

Hardyho-Weinbergův princip lze zobecnit i na polyploidní systémy, tedy na organismy, které mají více než dvě kopie každého chromozomu. Vezměme si opět pouze dvě alely. Diploidní případ je binomická expanze:

a proto polyploidní případ je polynomiální expanze:

kde c je ploidie, například u tetraploidu (c = 4):

Podle toho, zda je organismus „pravý“ tetraploid nebo amfidriloid, se určí, jak dlouho bude trvat, než populace dosáhne Hardyho-Weinbergovy rovnováhy.

Pro odlišné alely u -ploidů jsou frekvence genotypu v Hardyho-Weinbergově rovnováze dány individuálními termíny v multinomiální expanzi :

Hardyho-Weinbergův princip lze aplikovat dvěma způsoby, buď se předpokládá, že populace je v Hardyho-Weinbergově poměru, ve kterém lze vypočítat genotypové frekvence, nebo pokud jsou známy genotypové frekvence všech tří genotypů, mohou být testovány na odchylky, které jsou statisticky významné.

Použití na případy úplné dominance

Předpokládejme, že fenotypy AA a Aa jsou nerozlišitelné, tj. existuje úplná dominance. Za předpokladu, že Hardyho-Weinbergův princip platí pro populaci, pak může být ještě vypočten z f(aa):

a lze vypočítat z . A tedy odhad f(AA) a f(Aa) odvozený z a resp. Všimněte si však, že taková populace nemůže být testována na rovnováhu pomocí níže uvedených testů významnosti, protože se předpokládá a priori.

Zkoušky významnosti odchylky

Testování odchylek od HWP se zpravidla provádí pomocí Pearsonova chi-kvadrátového testu s využitím pozorovaných frekvencí genotypů získaných z dat a očekávaných frekvencí genotypů získaných pomocí HWP. U systémů, kde je velké množství alel, to může vést k údajům s mnoha prázdnými možnými genotypy a nízkými počty genotypů, protože ve vzorku často není dostatek jedinců, kteří by adekvátně reprezentovali všechny třídy genotypů. Pokud tomu tak je, pak již nebude platit asymptotický předpoklad rozdělení chí-kvadrát a může být nutné použít formu Fisherova přesného testu, který vyžaduje k vyřešení počítač. V poslední době byla navržena řada MCMC metod testování odchylek od HWP (Guo & Thompson, 1992; Wigginton et al. 2005)

Příklad χ2 test na odchylku

Tyto údaje jsou z E.B. Forda (1971) o molu tygra šarlatového, u kterého byly zaznamenány fenotypy vzorku populace. Rozlišení mezi genotypem a fenotypem je považováno za zanedbatelně malé. Nulová hypotéza je, že populace je v Hardyho-Weinbergově poměru, a alternativní hypotéza je, že populace není v Hardyho-Weinbergově poměru.

Z čeho lze vypočítat četnost alel:

Takže Hardyho–Weinbergovo očekávání je:

Existuje 1 stupeň volnosti (stupně volnosti pro test Hardyho-Weinbergových proporcí jsou # genotypy − # alely). 5% hladina významnosti pro 1 stupeň volnosti je 3,84, a protože hodnota χ2 je menší než tato, nulová hypotéza, že populace je v Hardyho-Weinbergových frekvencích, není odmítnuta.

Fisherův přesný test (pravděpodobnostní test)

Fisherův přesný test lze aplikovat na testování Hardyho-Weinbergových proporcí. Protože test je podmíněn frekvencemi alel, p a q, lze na problém pohlížet jako na testování správného počtu heterozygotů. Tímto způsobem je hypotéza Hardyho-Weinbergových proporcí odmítnuta, pokud je počet heterozygotů příliš velký nebo příliš malý. Podmíněné pravděpodobnosti pro heterozygoty, dané frekvencemi alel, jsou uvedeny v Emighově (1980) jako

kde n11, n12, n22 jsou pozorované počty tří genotypů, AA, Aa a aa, a n1 je počet alel A, kde .

Příklad
Pomocí jednoho z příkladů z Emigha (1980) můžeme vzít v úvahu případ, kdy n = 100 a p = 0,34. Možné pozorované heterozygoty a jejich přesná hladina významnosti jsou uvedeny v tabulce 4.

Pomocí této tabulky si vyhledáte hladinu významnosti testu na základě pozorovaného počtu heterozygotů. Pokud jste například pozorovali 20 heterozygotů, je hladina významnosti testu 0,007. Jak je pro Fisherův přesný test u malých vzorků typické, gradace hladin významnosti je poměrně hrubá.

Bohužel musíte takovou tabulku vytvořit pro každý experiment, protože tabulky jsou závislé na n i p.

Koeficient příbuzenského křížení F (viz též F-statistika) je jeden minus pozorovaná frekvence heterozygotů oproti frekvenci očekávané od Hardyho-Weinbergovy rovnováhy.

kde očekávaná hodnota z Hardyho–Weinbergovy rovnováhy je dána

Například u výše uvedených údajů společnosti Ford;

Pro dvě alely je chi-kvadrátová dobrota fit testu pro Hardyho-Weinbergovy proporce ekvivalentní testu pro příbuzenský kříženec, F = 0.

Koeficient příbuzenského křížení je nestabilní, protože očekávaná hodnota se blíží nule, a tudíž není užitečný pro vzácné a velmi časté alely. Pro: E = 0, O > 0, F = −∞ a E = 0, O = 0, F není definováno.

Mendelova genetika byla znovu objevena v roce 1900. Nicméně zůstávala několik let poněkud kontroverzní, protože se tehdy nevědělo, jak může způsobit spojité charakteristiky. Udny Yule (1902) argumentoval proti Mendelismu, protože si myslel, že dominantní alely by se v populaci zvýšily. Američan William E. Castle (1903) ukázal, že bez selekce by genotypové frekvence zůstaly stabilní. Karl Pearson (1903) našel jednu rovnovážnou pozici s hodnotami p = q = 0,5. Reginald Punnett, neschopný čelit Yuleovu názoru, představil problém G. H. Hardymu, britskému matematikovi, se kterým hrál kriket. Hardy byl čistý matematik a zastával aplikovanou matematiku s určitým opovržením; jeho pohled na využití matematiky biology se objevuje v jeho práci z roku 1908, kde to popisuje jako „velmi jednoduché“.

Princip byl tak v anglicky mluvícím světě znám jako Hardyho zákon až do roku 1943, kdy Curt Stern poukázal na to, že byl poprvé samostatně formulován v roce 1908 německým lékařem Wilhelmem Weinbergem. Jiní se pokusili spojovat Castleovo jméno se zákonem kvůli jeho práci v roce 1903, ale jen zřídka je vnímán jako Hardyho-Weinbergův-hradní zákon.

Odvození Hardyho rovnic

Odvození Hardyho rovnic je ilustrativní. Začíná populací genotypů skládající se z čistých dominantů (AA), heterozygotů (Aa) a čistých recesiv (aa) v relativním poměru p:2q:r s výše uvedenými podmínkami, tedy,

Přepsat toto jako (p + q) + (q + r) = 1 a umocnit obě strany přináší Hardyho výsledek:

Hardyho ekvivalenční podmínka je

po generace po té první. Pro domnělou třetí generaci,

Nahrazení p1 a q1 a rozklad (výnosy p + q)2,

Množství v závorkách je rovno 1, tedy p2 = p1 a tak to zůstane i pro následující generace. Výsledek bude stejný pro další dva genotypy.

Příklad výpočtu rozdělení genotypu, který je dán Hardyho původními rovnicemi, je poučný. K výpočtu Hardyho počátečního rozdělení genotypu bude použito rozdělení fenotypu z tabulky 3 výše. Všimněte si, že hodnoty p a q použité Hardym nejsou stejné jako ty, které byly použity výše.

Jako kontrolu distribuce, výpočet

Pro další generaci, Hardy rovnice dát,

Opět jako kontroly na rozdělení, výpočet

které jsou očekávanými hodnotami. Čtečka může prokázat, že následné použití hodnot druhé generace pro třetí generaci přinese shodné výsledky.

Rozdělení frekvencí genotypu pro bialelický lokus v populaci je možné znázornit graficky pomocí de Finettiho diagramu. Ten využívá trojúhelníkový graf (také známý jako trilineární, triaxiální nebo trojúhelníkový) k znázornění rozdělení tří frekvencí genotypu ve vztahu k sobě. I když se od mnoha jiných takových grafů liší tím, že směr jedné z os byl obrácený.

Soubor:De finetti diagram.png

Zakřivená čára ve výše uvedeném diagramu je Hardyho–Weinbergova parabola a představuje stav, kdy jsou alely v Hardyho–Weinbergově rovnováze.

Na těchto grafech je možné znázornit vliv přírodního výběru a jeho vliv na četnost alel (např. Ineichen & Batschelet 1975)

De Finettiho diagram byl vyvinut a široce využit A. W. F. Edwardsem v jeho knize Základy matematické genetiky.