Analýza rozptylu (ANOVA)

Co je analýza rozptylu (ANOVA)?

Analýza rozptylu (ANOVA) je analytický nástroj používaný ve statistice, který rozděluje pozorovanou agregovanou variabilitu nalezenou uvnitř datové sady na dvě části: systematické faktory a náhodné faktory. Systematické faktory mají statistický vliv na danou datovou sadu, zatímco náhodné faktory nikoli. Analytici používají ANOVA test k určení vlivu, který mají nezávislé proměnné na závislou proměnnou v regresní studii.

Metody t- a z-testu vyvinuté ve 20. století se používaly pro statistickou analýzu až do roku 1918, kdy Ronald Fisher vytvořil metodu analýzy rozptylu. ANOVA se také nazývá Fisherova analýza rozptylu a je rozšířením testů t- a z. Termín se stal známým v roce 1925 poté, co se objevil ve Fisherově knize „Statistické metody pro výzkumné pracovníky“. Byl použit v experimentální psychologii a později rozšířen na předměty, které byly složitější.

Klíčové způsoby

Co je analýza rozptylu (ANOVA)?

Vzorec pro ANOVA je:

Co odhaluje analýza rozptylu?

ANOVA test je úvodním krokem v analýze faktorů, které ovlivňují daný datový soubor. Jakmile je test dokončen, analytik provede dodatečné testování metodických faktorů, které měřitelně přispívají k nekonzistenci datového souboru. Analytik využívá výsledky ANOVA testu v f-testu ke generování dalších dat, která jsou v souladu s navrhovanými regresními modely.

Test ANOVA umožňuje porovnání více než dvou skupin současně, aby se zjistilo, zda mezi nimi existuje vztah. Výsledek vzorce ANOVA, statistika F (také nazývaná F-poměr), umožňuje analýzu více skupin dat, aby se určila variabilita mezi vzorky a uvnitř vzorků.

Pokud mezi testovanými skupinami neexistuje žádný reálný rozdíl, který se nazývá nulová hypotéza, výsledek ANOVA statistiky F-poměru se bude blížit 1. Rozložení všech možných hodnot F statistiky je F-rozdělení. Jedná se vlastně o skupinu distribučních funkcí se dvěma charakteristickými čísly, které se nazývají čitatelské stupně volnosti a jmenovatelské stupně volnosti.

Příklad použití přípravku ANOVA

Výzkumník může například testovat studenty z více vysokých škol, aby zjistil, zda studenti z jedné z vysokých škol soustavně překonávají studenty z ostatních vysokých škol. V podnikové aplikaci může výzkumník v oblasti výzkumu a vývoje testovat dva různé procesy vytváření produktu, aby zjistil, zda je jeden proces z hlediska nákladové efektivnosti lepší než druhý.

Typ použitého ANOVA testu závisí na řadě faktorů. Aplikuje se v případě, že je třeba údaje experimentovat. Analýza rozptylu se používá v případě, že není přístup ke statistickému softwaru, jehož výsledkem je výpočet ANOVA ručně. Používá se jednoduše a nejlépe se hodí pro malé vzorky. U mnoha experimentálních návrhů musí být velikost vzorku stejná pro různé kombinace úrovní faktorů.

Jednosměrná ANOVA versus obousměrná ANOVA

Existují dva hlavní typy ANOVA: jednosměrný (nebo jednosměrný) a obousměrný. Existují také varianty ANOVA. Například MANOVA (vícesměrný ANOVA) se liší od ANOVA jako první testy pro více závislých proměnných současně, zatímco druhý posuzuje pouze jednu závislou proměnnou najednou. Jednosměrný nebo obousměrný se týká počtu nezávislých proměnných ve vaší analýze testu rozptylu. Jednosměrný ANOVA vyhodnocuje vliv jediného faktoru na jedinou proměnnou odezvy. Určuje, zda jsou všechny vzorky stejné. Jednosměrný ANOVA se používá k určení, zda existují statisticky významné rozdíly mezi průměry tří nebo více nezávislých (nepříbuzných) skupin.

Obousměrná ANOVA je rozšířením jednosměrné ANOVA. U jednosměrné máte jednu nezávislou proměnnou ovlivňující závislou proměnnou. U obousměrné ANOVA existují dvě nezávislé. Například obousměrná ANOVA umožňuje firmě porovnat produktivitu práce na základě dvou nezávislých proměnných, jako je plat a soubor dovedností. Používá se ke sledování interakce mezi oběma faktory a testuje vliv dvou faktorů současně.