Normální rozdělení

Normální rozdělení, také nazývané Gaussovo rozdělení, je extrémně důležité rozdělení pravděpodobnosti v mnoha oblastech.
Je to skupina rozdělení stejné obecné formy, lišících se svým umístěním a parametry měřítka: průměr („průměr“) a směrodatná odchylka („variabilita“).
Standardní normální rozdělení je normální rozdělení s průměrem nula a směrodatnou odchylkou jedna (zelené křivky na parcelách vpravo).
Často se nazývá zvonová křivka, protože graf její hustoty pravděpodobnosti připomíná zvon.

Laplaceova použita normální rozdělení v analýze chyb experimentů. Důležitá metoda nejmenších čtverců byla zavedena Adrien Marie Legendre v roce 1805. Carl Friedrich Gauss kteří tvrdili, že použili metodu od roku 1794, zdůvodnil to důsledně v 1809 tím, že předpokládá normální rozdělení chyb.

Název „zvonová křivka“ sahá až k Jouffretovi, který poprvé použil termín „zvonová plocha“ v roce 1872 pro dvourozměrný normál s nezávislými složkami. Název „normální rozdělení“ byl vytvořen nezávisle Charlesem S. Peircem, Francisem Galtonem a Wilhelmem Lexisem kolem roku [1875]. Tato terminologie je nešťastná, protože odráží a podporuje omyl, že mnoho nebo všechna rozdělení pravděpodobnosti jsou „normální“. (Viz diskuse o „výskytu“ níže.)

Specifikace normálního rozdělení

Existují různé způsoby, jak specifikovat náhodnou proměnnou. Nejvíce vizuální je funkce hustoty pravděpodobnosti (graf nahoře), která reprezentuje, jak pravděpodobná je každá hodnota náhodné proměnné. Kumulativní distribuční funkce je koncepčně čistší způsob, jak specifikovat stejnou informaci, ale pro netrénované oko je její graf mnohem méně informativní (viz níže). Rovnocenné způsoby, jak specifikovat normální rozdělení, jsou: momenty, kumulátory, charakteristická funkce, funkce generující moment a funkce generující kumulátor. Některé z nich jsou velmi užitečné pro teoretickou práci, ale ne intuitivní. Viz rozdělení pravděpodobnosti pro diskusi.

Všechny kumulátory normálního rozdělení jsou nulové, s výjimkou prvních dvou.

Funkce hustoty pravděpodobnosti

Funkce hustoty pravděpodobnosti pro 4 různé sady parametrů (zelená čára je standardní normál)

Funkce hustoty pravděpodobnosti normálního rozdělení se střední hodnotou a rozptylem (ekvivalentně, směrodatná odchylka ) je příkladem Gaussovy funkce,

Pokud náhodná proměnná má toto rozdělení, píšeme
~ .
Pokud a , Toto rozdělení se nazývá standardní normální rozdělení a hustota pravděpodobnosti funkce redukuje na

Obrázek vpravo dává grafu funkce hustoty pravděpodobnosti normálního rozdělení různé hodnoty parametrů.

Některé pozoruhodné vlastnosti normálního rozložení:

Kumulativní distribuční funkce

Kumulativní distribuční funkce výše uvedeného pdf

Kumulativní distribuční funkce (cdf) je definována jako pravděpodobnost, že proměnná má hodnotu menší nebo rovnou , a je vyjádřena z hlediska hustoty funkce jako

Standardní normální cdf, konvenčně označené , je jen obecné cdf hodnocené s a ,

Standardní normální cdf lze vyjádřit speciální funkcí zvanou chybová funkce, jako

Inverzní distribuční funkce neboli kvantilová funkce může být vyjádřena inverzní chybovou funkcí:

Tato kvantilová funkce je někdy nazývána probitovou funkcí. Pro probitovou funkci neexistuje žádné elementární primitivum. To neznamená pouze to, že žádná není známa, ale spíše to, že neexistence takové funkce byla prokázána.

Hodnoty Φ(x) mohou být velmi přesně aproximovány různými metodami, jako je numerická integrace, Taylorova řada nebo asymptotická řada.

Funkce generování momentu

Funkce generování momentu je definována jako očekávaná hodnota
.
Pro normální rozdělení lze ukázat, že funkce generování momentu je

jak lze vidět vyplněním náměstí v exponent.

Charakteristická funkce je definována jako očekávaná hodnota
, Kde je imaginární jednotka.
Pro normální rozdělení, charakteristická funkce je

Charakteristickou funkci získáme nahrazením funkcí v momentu generování.

Některé z vlastností normálního rozdělení:

Standardizace normálních náhodných proměnných

V důsledku vlastnosti 1 je možné vztáhnout všechny normální náhodné proměnné ke standardnímu normálu.

je standardní normální náhodná proměnná: ~ .
Důležitým důsledkem je, že cdf obecného normálního rozdělení je tedy

Naopak, pokud ~ , pak

je normální náhodná veličina s průměrem a rozptylem .

Standardní normální rozdělení bylo dáno do tabulky a ostatní normální rozdělení jsou jednoduché transformace standardního.
Proto lze použít tabulkové hodnoty cdf standardního normálního rozdělení k nalezení hodnot cdf obecného normálního rozdělení.

Některé z prvních okamžiků normálního rozdělení jsou:

Všechny kumulátory normálního rozdělení za druhým kumulátorem jsou nulové.

Generování normálních náhodných proměnných

Pro počítačové simulace je často užitečné generovat hodnoty, které mají normální rozdělení.
Existuje několik metod a tou nejzákladnější je invertování standardního normálního cdf.
Známé jsou i efektivnější metody, jednou z nich je Box-Mullerova transformace.

Box-Mullerova transformace je důsledkem skutečnosti, že rozdělení chí-kvadrát se dvěma stupni volnosti (viz vlastnost 4 výše) je snadno generovatelná exponenciální náhodná proměnná.

Vykreslení pdf normálního rozdělení s μ = 12 a σ = 3, aproximace pmf binomického rozdělení s n = 48 a p = 1/4

Normální rozdělení má velmi důležitou vlastnost, že za určitých podmínek je rozdělení součtu velkého počtu nezávislých proměnných přibližně normální.
To je centrální limitní věta.

Praktický význam centrální limitní věty spočívá v tom, že normální rozdělení lze použít jako aproximaci k některým jiným distribucím.

Přibližující se normální rozdělení má průměr a rozptyl .

Přibližující se normální rozdělení má průměr a rozptyl .

Zda jsou tyto aproximace dostatečně přesné, závisí na účelu, pro který jsou potřebné, a na rychlosti konvergence k normálnímu rozdělení.
Obvykle se stává, že takové aproximace jsou méně přesné v koncích rozdělení.

Normální rozdělení jsou nekonečně dělitelná rozdělení pravděpodobnosti.

Normální rozdělení jsou přísně stabilní rozdělení pravděpodobnosti.

Tmavě modrá je menší než jedna směrodatná odchylka od průměru. Pro normální rozdělení to představuje 68 % množiny, zatímco dvě směrodatné odchylky od průměru (modrá a hnědá) představují 95 % a tři směrodatné odchylky (modrá, hnědá a zelená) představují 99,7 %.

V praxi se často předpokládá, že údaje pocházejí z přibližně normálně rozloženého souboru. Pokud je tento předpoklad oprávněný, pak asi 68% hodnot je v rozmezí 1 směrodatné odchylky od průměru, asi 95% hodnot je v rozmezí dvou směrodatných odchylek a asi 99,7% leží v rozmezí 3 směrodatných odchylek. To je známé jako „pravidlo 68-95-99,7“.

Testy normálnosti ověřují podobnost daného souboru dat s normálním rozložením. Nulová hypotéza říká, že soubor dat je podobný normálnímu rozložení, proto dostatečně malá hodnota P indikuje nenormální data.

Odhad maximální pravděpodobnosti parametrů

jsou nezávislé a identicky rozložené a jsou normálně rozložené s očekáváním μ a rozptylem σ2. V jazyce statistiků tvoří pozorované hodnoty těchto náhodných veličin „vzorek z normálně rozložené populace“. Na základě pozorovaných hodnot tohoto vzorku je žádoucí odhadnout „populační průměr“ μ a „populační směrodatnou odchylku“ σ. Společná funkce hustoty pravděpodobnosti těchto náhodných veličin je

(Nota bene: Zde symbol proporcionality znamená proporcionální jako funkce a , Není proporcionální jako funkce . To může být považováno za jeden z rozdílů mezi statistik je názor a probabilist je názor. Důvod, proč je to důležité se objeví níže.)

Jako funkce μ a σ je to funkce pravděpodobnosti

V metodě maximální pravděpodobnosti se za hodnoty μ a σ, které maximalizují funkci pravděpodobnosti, považují odhady populačních parametrů μ a σ.

Obvykle lze při maximalizaci funkce dvou proměnných uvažovat o parciálních derivacích. Zde však využijeme fakt, že hodnota μ, která maximalizuje funkci pravděpodobnosti s pevným σ, nezávisí na σ. Proto můžeme najít tuto hodnotu μ, pak ji nahradit z μ ve funkci pravděpodobnosti a nakonec najít hodnotu σ, která maximalizuje výsledný výraz.

Je zřejmé, že funkce pravděpodobnosti je klesající funkce součtu

Takže chceme hodnotu μ, která minimalizuje tento součet. Let

být „výběrový průměr“. Všimněte si, že

Na μ závisí pouze poslední člen a ten je minimalizován

To je odhad maximální pravděpodobnosti μ. Nahrazením μ v součtu výše se poslední člen vytratí. V důsledku toho, když tento odhad nahradíme μ ve funkci pravděpodobnosti, dostaneme

Je to konvenční k označení „loglikelihood funkce“, tj. logaritmus funkce pravděpodobnosti, o menší-case , A máme

Tato derivace je kladná, nulová nebo záporná podle σ2 je mezi 0 a

nebo se rovná této veličině nebo je větší než tato veličina.

V důsledku toho je tento průměr čtverců reziduí odhadem maximální pravděpodobnosti σ2 a jeho odmocnina je odhadem maximální pravděpodobnosti σ.

Odvození odhadu maximální pravděpodobnosti kovarianční matice vícerozměrného normálního rozdělení je subtilní. Zahrnuje spektrální větu a důvod, proč může být lepší pohlížet na skalár jako na stopu matice 1×1 než jako na pouhý skalár. Viz odhad kovariančních matic.

Nestranný odhad parametrů

Odhad maximální pravděpodobnosti populačního průměru ze vzorku je nezkresleným odhadem průměru, stejně jako rozptyl, je-li a priori znám průměr populace. Pokud se však setkáme se vzorkem a nemáme žádnou znalost průměru nebo rozptylu populace, ze které je odebrán, je nezkresleným odhadem rozptylu:

Přibližně normální rozdělení se vyskytují v mnoha situacích v důsledku centrální limitní věty.
Pokud existuje důvod k podezření na přítomnost velkého počtu malých efektů působících aditivně a nezávisle, je rozumné předpokládat, že pozorování budou normální.
Existují statistické metody, jak empiricky testovat tento předpoklad, například Kolmogorovův-Smirnovův test.

Efekty mohou také působit jako multiplikační (spíše než aditivní) modifikace. V takovém případě není předpoklad normálnosti odůvodněný a normálně se distribuuje logaritmus sledované proměnné. Distribuce přímo sledované proměnné se pak nazývá log-normální.

A konečně, pokud existuje jediný vnější vliv, který má velký vliv na uvažovanou proměnnou, není oprávněný ani předpoklad normálnosti. To platí i tehdy, když je externí proměnná udržována konstantní, výsledná mezní rozdělení jsou skutečně normální. Úplné rozdělení bude superpozicí normálních proměnných, která není obecně normální. To souvisí s teorií chyb (viz níže).

Pro shrnutí uvádíme seznam situací, kdy se
někdy předpokládá přibližná normalita. Pro podrobnější diskusi viz níže.

Pro biologii a ekonomii je důležitý fakt, že složité systémy mají tendenci zobrazovat mocenské zákony spíše než normalitu.

Někdy jsou však pozorovány neklasické korelace. Kvantová mechanika interpretuje měření intenzity světla jako počítání fotonů. Přirozeným předpokladem v tomto nastavení je Poissonovo rozdělení. Je-li intenzita světla integrována v čase delším, než je koherenční čas, a je-li velká, je vhodný limit Poissonova k normálu. Korelace jsou interpretovány ve smyslu „shlukování“ a „anti-shlukování“ fotonů s ohledem na očekávané Poissonovo chování. Anti-shlukování vyžaduje kvantový model světelné emise.

Intenzita laserového světla má přesně Poissonovo rozložení intenzity a dlouhé časy koherence. Díky velké intenzitě je vhodné použít normální rozložení.

Normalita je ústředním předpokladem matematické teorie chyb. Podobně ve statistickém modelování je ukazatelem správnosti uložení to, že zbytky (jak se chybám v tomto nastavení říká) jsou nezávislé a normálně rozložené. Každá odchylka od normality musí být vysvětlena. V tomto smyslu, jak v modelování, tak v teorii chyb, je normalita jediným zjištěním, které nemusí být vysvětleno, protože se očekává.

Fyzikální vlastnosti biologických vzorků

Převažujícím biologickým důkazem je, že hromadné růstové procesy živé tkáně probíhají multiplikativními, nikoli aditivními přírůstky, a že by proto měřítka velikosti těla měla nanejvýš sledovat lognormální místo normálního rozložení. Navzdory běžným tvrzením o normálnosti je velikost rostlin a živočichů přibližně lognormální. Důkazy a vysvětlení založené na modelech růstu byly poprvé publikovány v klasické knize

Rozdíly ve velikosti způsobené pohlavním dimorfismem nebo jinými polymorfismy jako dělení dělník/voják/královna u sociálního hmyzu dále způsobují, že společné rozdělení velikostí se odchyluje od lognormality.

Předpoklad, že lineární velikost biologických vzorků je normální, vede k nenormálnímu rozložení hmotnosti (protože hmotnost/objem je zhruba 3. mocnina délky a Gaussova rozložení jsou zachována pouze lineárními transformacemi) a naopak předpoklad, že hmotnost je normální, vede k nenormálním délkám. To je problém, protože neexistuje žádný apriorní důvod, proč by jedna z délek nebo tělesné hmotnosti, a ne druhá, měla být normálně rozložena. Lognormální rozložení jsou naopak zachována mocninami, takže „problém“ zmizí, pokud se předpokládá lognormalita.

Na druhou stranu existují některá biologická opatření, kde se předpokládá nebo očekává normalita:

Vzhledem k exponenciální povaze úroků a inflace jsou dobrým příkladem multiplikačního chování finanční ukazatele jako úrokové sazby, hodnoty akcií nebo ceny komodit. Jako takové by se nemělo očekávat, že budou normální, ale lognormální.

Popularizátor fraktálů Benoît Mandelbrot tvrdí, že i předpoklad lognormality je chybný, a obhajuje použití log-Levyho distribucí.

Uznává se, že finanční ukazatele se odchylují od lognormality. Je pozorováno, že rozložení cenových změn v krátkodobých měřítcích má „těžké chvosty“, takže je pravděpodobnější, že dojde k velmi malým nebo velmi velkým cenovým změnám, než by předpověděl lognormální model. Odchylka od lognormality ukazuje, že předpoklad nezávislosti multiplikačních vlivů je chybný.

Mezi další příklady proměnných, které nejsou normálně distribuovány, patří životnost lidí nebo mechanických zařízení. Příklady distribucí používaných v této souvislosti jsou exponenciální distribuce (memoryless) a Weibullovo rozdělení. Obecně není důvod, aby čekací doby byly normální, protože nejsou přímo spojeny s žádným druhem aditivního vlivu.

Velké nejasnosti panují ohledně toho, zda se výsledky IQ testů a inteligence normálně rozdělují.

Jako záměrný výsledek konstrukce testů jsou IQ skóre vždy a samozřejmě normálně rozdělena pro většinu populace. Zda je inteligence normálně rozdělena, není tak jasné. Obtížnost a počet otázek v IQ testu se rozhoduje na základě toho, které kombinace přinesou normální rozdělení. To však neznamená, že informace jsou jakýmkoli způsobem zkreslovány nebo že existuje nějaký druh „pravdivého“ rozdělení, které je uměle vnucováno do tvaru normální křivky. Inteligenční testy mohou být konstruovány tak, aby přinesly jakýkoliv druh požadovaného rozdělení skóre. Všechny pravdivé IQ testy mají normální rozdělení skóre jako výsledek konstrukce testu; jinak by IQ skóre bylo bezvýznamné, aniž by se vědělo, jaký test je přinesl. Inteligenční testy obecně však mohou přinést jakýkoliv druh rozdělení.

Na příkladu toho, jak libovolné je ve skutečnosti rozložení výsledků inteligenčních testů, si představte dvacetipoložkový test s výběrem odpovědí složený výhradně z problémů, které se skládají převážně z hledání oblastí kruhů. Takový test, pokud by byl zadán populaci středoškoláků, by pravděpodobně přinesl rozložení ve tvaru U, přičemž většina výsledků by byla velmi vysoká nebo velmi nízká, namísto normální křivky. Pokud student rozumí tomu, jak najít oblast kruhu, může tak pravděpodobně činit opakovaně a s několika chybami, a tak by v testu získal perfektní nebo vysoké skóre, zatímco student, který nikdy neměl hodiny geometrie, by pravděpodobně dostal každou otázku špatně, možná s několika správnými vzhledem k odhadu štěstí. Pokud je test složen převážně ze snadných otázek, pak většina účastníků testu bude mít vysoké skóre a jen velmi málo málo bude mít nízké skóre. Pokud je test složen výhradně z otázek tak snadné nebo tak těžké, že každý člověk dostane buď perfektní skóre nebo nulu, to se nepodaří udělat žádný druh statistické diskriminace vůbec a přináší pravoúhlé rozdělení. To je jen několik příkladů z mnoha odrůd rozdělení, které by teoreticky mohly být vyrobeny pečlivým navržením inteligenční testy.

O tom, zda je inteligence sama normálně distribuována, se občas vedou určité debaty. Někteří kritici tvrdí, že volba normálního rozdělení je zcela svévolná. Brian Simon kdysi tvrdil, že normální rozdělení bylo speciálně zvoleno psychometriky, aby falešně podporovali myšlenku, že vyšší inteligenci vlastní jen malá menšina, a tím legitimizovali vládu privilegované elity nad masami společnosti. Historicky však byly inteligenční testy navrženy bez jakéhokoli zájmu o vytvoření normálního rozdělení a skóre vyšlo přibližně normálně distribuované tak jako tak. Americký pedagogický psycholog Arthur Jensen tvrdí, že jakýkoliv test, který obsahuje „velké množství položek“, „širokou škálu obtíží s položkami“, „celou řadu obsahů nebo forem“ a „položky, které mají významnou korelaci se součtem všech ostatních skóre“, nevyhnutelně vytvoří normální rozdělení. Dále existuje řada korelací mezi skóre IQ a dalšími lidskými charakteristikami, které jsou prokazatelněji normálně rozloženy, jako je rychlost vedení nervů a rychlost metabolismu glukózy v mozku člověka, což podporuje myšlenku, že inteligence je normálně rozložena.

Někteří kritici, jako například Stephen Jay Gould ve své knize The Mismeasure of Man, zpochybňují platnost testů inteligence obecně, nejen skutečnost, že inteligence je normálně distribuována. Pro další diskusi viz článek IQ.

The Bell Curve je kontroverzní kniha na téma dědičnosti inteligence. Navzdory svému názvu se však kniha primárně nezabývá tím, zda je IQ běžně distribuováno.