Autor: Papaková Markéta
Vedoucí práce: Mgr. Tuček Pavel Ph.D.
Hlavní náplní práce bylo popsání teorie Chí kvadrát testů a následná aplikace této teorie na praktickém vypracování datového souboru. Aby bylo možno sepsat teoretickou část, bylo třeba nejprve nastudovat odbornou literaturu a projít studie, které se zabývají aplikací Chí kvadrát testu v prostředí ArcMap.
Teoretická část je rozdělena do několika částí. Vzhledem k tomu, že je Chí kvadrát test jedním z testů normality, je v úvodní kapitole vysvětlena teorie právě těchto testů normality, konkrétně jejich grafických vizualizací. Některé z těchto grafických vizualizací lze provést i pomoci nástroje Geostatistical Analyst. Pro srovnání je v textu uveden příklad vytvoření několika grafických možností testování normality pomocí softwaru ArcMap, R-project a Microsoft Excel. Stěžejní kapitola je věnována samotnému Chí kvadrát testu. Je možno zde nalézt vzorce pro výpočet testu normality i testu nezávislosti a vysvětlení, k čemu a za jakých podmínek je možno tyto testy využít. Vzhledem k tomu, že jsou testy nezávislosti počítány pro kontingenční tabulky, je teorie doplněna také o popis ukázku kontingenční tabulky. U všech zmíněných testů a grafů je popsána také možnost jejich použití či vytvoření v různých softwarech. Při možnostech softwaru je srovnáván software ArcMap, R-project, Microsoft Excel a software Idrisi ve verzi Taiga.
Popsána teorie je pak použita na získaném data setu. V průběhu práce jsou tato data blíže popsána, včetně způsobu jejich sběru. Na těchto datech byly testovány normality a různé závislosti. Nejprve bylo na datech provedeno početní testování, následně byly tyto testy graficky vyjádřený pomocí mapových výstupů. Při početních úlohách byl použit Shapiro-Wilkoxonův test pro testování normality, kdy u většiny dat bylo prokázáno nenormální rozdělení. V případě některých datových sad byla prokázána normalita. Jednalo se však pouze o minimální vzorek, a proto mohl být i na tyto sady dále použit test nezávislosti. Nezávislost byla testována pomocí Kruskalova Chí kvadrát testu. Při ověřování závislostí počtu nastupujících a vystupujících cestujících na konkrétních zastávkách případně na konkrétní denní době byla prokázána závislost. Dále bylo nutné otestovat, zda jsou tyto počty cestujících závislé také na dnech v týdnu. Jelikož bylo měření provedeno v několika dnech, bylo potřeba potvrdit nezávislost těchto dat. Pomocí Kruskalova Chí kvadrát testu se tuto nezávislost podařilo prokázat. Tento test byl jedním ze stěžejních testů, které bylo potřeba na datech provést. Posledním použitým testem byl Wilkoxonův test, který umožnil vytvořit skupiny zastávek, které jsou si podobné v rozložení nastupujících případně vystupujících cestujících v průběhu celého dne.
Grafické výstupy byly vytvořeny pouze pro některé linky městské hromadné dopravy. Data byla rozdělena vždy na tři části, odpovídající denní době - na dopoledne, odpoledne a večer. Následně byly vytvořeny tři mapové výstupy pro každou denní dobu a tři mapové výstupy, které zahrnují data za celý den. Jedním mapovým výstupem je vyjádřen podíl nastupujících a vystupujících cestujících na jednotlivých zastávkách. Trasa linky je znázorněna stuhovou metodou, která vyjadřuje počet cestujících, kteří se pohybovali ve voze mezi jednotlivými zastávkami. V dalších dvou mapových výstupech je použitá metoda kartodiagramů, které vyjadřují počest nastupujících respektive vystupujících cestujících na jednotlivých autobusových zastávkách. Pomoci různých odstínů diagramů je znázorněno, které zastávky jsou ve směru do centra města a které jsou ve směru z centra města.
Univezita Palackého v Olomouci, Přírodovědecká fakulta, Katedra Geoinformatiky