Goodness-of-Fit

Co je Goodness-of-Fit?

Termín goodness-of-fit odkazuje na statistický test, který určuje, jak dobře výběrová data odpovídají rozložení z populace s normálním rozložením. Zjednodušeně řečeno, předpokládá, zda je vzorek zkreslený nebo představuje data, která byste očekávali, že najdete ve skutečné populaci.

Goodness-of-fit určuje rozpor mezi pozorovanými hodnotami a hodnotami očekávanými od modelu v běžném distribučním případě. Existuje více metod pro určení goodness-of-fit, včetně chi-kvadrátu.

Klíčové způsoby

Pochopení dobré kondice

Testy vhodnosti jsou statistické metody, které vyvozují závěry o pozorovaných hodnotách. Můžete například určit, zda je výběrová skupina skutečně reprezentativní pro celou populaci. Jako takové určují, jak se skutečné hodnoty vztahují k predikovaným hodnotám v modelu. Při použití při rozhodování testy vhodnosti usnadňují předpovídání trendů a vzorů v budoucnosti.

Jak je uvedeno výše, existuje několik typů testů vhodnosti. Patří mezi ně test chí-kvadrát, který je nejběžnější, stejně jako Kolmogorovův-Smirnovův test a Shipiro-Wilkův test. Testy se obvykle provádějí pomocí počítačového softwaru. Statistici však mohou tyto testy provádět pomocí vzorců, které jsou šité na míru konkrétnímu typu testu.

K provedení testu potřebujete určitou proměnnou spolu s předpokladem, jak je distribuována. Potřebujete také datový soubor s jasnými a explicitními hodnotami, například:

Testy vhodnosti se běžně používají k testování normálnosti reziduí nebo k určení, zda jsou dva vzorky shromážděny z identických distribucí.

Zvláštní úvahy

Pro interpretaci testu vhodnosti je důležité, aby statistici stanovili alfa úroveň, například hodnotu p pro test chí-kvadrát. Hodnota p odkazuje na pravděpodobnost, že se výsledky přiblíží extrémům pozorovaných výsledků. To předpokládá, že nulová hypotéza je správná. Nulová hypotéza tvrdí, že neexistuje vztah mezi proměnnými a alternativní hypotéza předpokládá, že existuje vztah.

Místo toho se změří frekvence pozorovaných hodnot a následně se použije s očekávanými hodnotami a stupni volnosti pro výpočet chí-kvadrát. Pokud je výsledek nižší než alfa, je nulová hypotéza neplatná, což naznačuje, že mezi proměnnými existuje vztah.

Doporučujeme:  Tier 3 Capital

Druhy zkoušek vhodnosti

Chi-Square test

χ

2

=

i

=

1

k

(

O

i

E

i

)

2

/

E

i

\chi^2=\sum\limits^k_{i=1}(O_i-E_i)^2/E_i

χ2=i=1∑k​(Oi​−Ei​)2/Ei​

Test chí-kvadrát, známý také jako test chí-kvadrát pro nezávislost, je inferentiální statistická metoda, která testuje platnost tvrzení o populaci na základě náhodného vzorku.

Používá se výhradně pro data, která jsou rozdělena do tříd (bins), a k získání přesných výsledků vyžaduje dostatečnou velikost vzorku. Neuvádí však typ ani intenzitu vztahu. Nedochází například k závěru, zda je vztah kladný nebo záporný.

Chcete-li vypočítat chi-kvadrát goodness-of-fit, nastavte požadovanou alfa úroveň významnosti. Pokud je tedy vaše hladina spolehlivosti 95% (nebo 0,95), pak je alfa 0,05. Dále identifikujte kategorické proměnné, které chcete testovat, a pak definujte tvrzení hypotézy o vztazích mezi nimi.

Proměnné se musí vzájemně vylučovat, aby se kvalifikovaly pro test nezávislosti chí-kvadrát. A test zdatnosti chí by se neměl používat pro data, která jsou spojitá.

Kolmogorovův-Smirnovův test

Kolmogorovův-Smirnovův test (známý také jako K-S test) je statistická metoda, která určuje, zda je vzorek z určitého rozdělení v rámci populace.

Tento test, který se doporučuje pro velké vzorky (např. nad 2000), je neparametrický. To znamená, že pro platnost nespoléhá na žádné rozdělení. Cílem je dokázat nulovou hypotézu, což je vzorek normálního rozdělení.

Stejně jako chí-kvadrát používá nulovou a alternativní hypotézu a alfa úroveň významnosti. Nul znamená, že data sledují specifické rozdělení v rámci populace, a alternativa znamená, že data nesledovala specifické rozdělení v rámci populace. Alfa se používá ke stanovení kritické hodnoty použité v testu. Ale na rozdíl od chí-kvadrátového testu se Kolmogorovův-Smirnovův test vztahuje na spojité distribuce.

Vypočtená testovací statistika je často označována jako D. Určuje, zda je nulová hypotéza přijata nebo odmítnuta. Pokud je D větší než kritická hodnota při alfa, je nulová hypotéza odmítnuta. Pokud je D menší než kritická hodnota, je nulová hypotéza přijata.

Doporučujeme:  Zisk před úroky a daněmi (EBIT)

Shipiro-Wilkův test

Shipiro-Wilkův test určuje, zda se vzorek řídí normálním rozložením. Test kontroluje normálnost pouze při použití vzorku s jednou proměnnou kontinuálních dat a doporučuje se pro malé velikosti vzorku do roku 2000.

Shipiro-Wilkův test používá graf pravděpodobnosti nazvaný QQ graf, který zobrazuje dvě množiny kvantilů na ose y, které jsou uspořádány od nejmenších po největší. Pokud každý kvantil pocházel ze stejného rozdělení, jsou řady grafů lineární.

K odhadu rozptylu se používá QQ graf. Pomocí QQ grafu rozptylu spolu s odhadovaným rozptylem populace lze určit, zda vzorek patří do normálního rozdělení. Pokud se kvocient obou rozptylů rovná nebo je blízko 1, lze přijmout nulovou hypotézu. Pokud je podstatně nižší než 1, lze ji odmítnout.

Příklad Goodness-of-Fit

Zde je hypotetický příklad, který ukazuje, jak funguje test dobré kondice.

Předpokládejme, že malá komunitní tělocvična funguje za předpokladu, že nejvyšší návštěvnost je v pondělí, v úterý a v sobotu, průměrná návštěvnost ve středu a ve čtvrtek a nejnižší návštěvnost v pátek a v neděli. Na základě těchto předpokladů zaměstnává tělocvična každý den určitý počet zaměstnanců, kteří odbavují členy, čistí zázemí, nabízejí tréninkové služby a vyučují.

Ale tělocvična si finančně nevede dobře a majitel chce vědět, zda jsou tyto předpoklady o návštěvnosti a počty zaměstnanců správné. Majitel se rozhodne spočítat počet návštěvníků tělocvičny každý den po dobu šesti týdnů. Poté mohou porovnat předpokládanou návštěvnost tělocvičny s její pozorovanou návštěvností například pomocí testu zdatnosti chí-kvadrát.

Nyní, když mají nová data, mohou určit, jak nejlépe řídit tělocvičnu a zlepšit ziskovost.

Co znamená Goodness-of-Fit?

Proč je dobrá kondice důležitá?

Testy zdatnosti pomáhají určit, zda se pozorovaná data shodují s tím, co se očekává. Rozhodnutí lze učinit na základě výsledku provedeného testu hypotéz. Například maloobchodník chce vědět, jaký produkt nabízený mladým lidem vyhovuje. Maloobchodník zkoumá náhodný vzorek starých a mladých lidí, aby zjistil, který produkt je preferován. Pomocí chí-kvadrát zjistí, že s 95% jistotou existuje vztah mezi produktem A a mladými lidmi. Na základě těchto výsledků by bylo možné určit, že tento vzorek představuje populaci mladých dospělých. Maloobchodníci to mohou využít k reformě svých kampaní.

Doporučujeme:  Index zbraní (TRIN)

Co je Goodness-of-Fit v testu Chi-Square?

Jak se vám udělat Goodness-of-Fit test?

Test Goodness-of-FIt se skládá z různých testovacích metod. Cíl testu pomůže určit, kterou metodu použít. Pokud je například cílem otestovat normalitu na relativně malém vzorku, může být vhodný Shipiro-Wilkův test. Pokud chcete určit, zda vzorek pochází z určitého rozdělení v rámci populace, použije se Kolmogorovův-Smirnovův test. Každý test používá svůj vlastní jedinečný vzorec. Mají však společné rysy, jako je nulová hypotéza a úroveň významnosti.

The Bottom Line

Testy vhodnosti určují, jak dobře vyhovují výběrová data tomu, co se očekává od populace. Z výběrových dat se shromáždí pozorovaná hodnota a porovná se s vypočtenou očekávanou hodnotou pomocí měření nesrovnalostí. K dispozici jsou různé testy hypotéz vhodnosti podle toho, jaký výsledek hledáte.

Výběr správného testu vhodnosti do značné míry závisí na tom, co chcete vědět o vzorku a jak velký vzorek je. Chcete-li například vědět, zda pozorované hodnoty pro kategorická data odpovídají očekávaným hodnotám pro kategorická data, použijte chí-kvadrát. Chcete-li vědět, zda malý vzorek následuje normální rozdělení, může být výhodný Shipiro-Wilkův test. K určení vhodnosti je k dispozici mnoho testů.