diplomová práca

Tvorba ArcGIS Notebookov pre spracovanie dát európskych miest a štátov

autor: Bc. Adam Tóth

vedúca práce: doc. Ing. Zdena Dobešová, Ph.D.

Katedra geoinformatiky PřF UP

Olomouc 2024

Výsledkami práce je 8 notebookov. Nasleduje ich stručný prehľad formou textu a obrázkov a na záver je umiestnená tabuľka notebookov s údajmi o ich rozsahu a vstupnými dátami.

Základy Jupyter Notebooku

Cieľom notebooku s názvom Základy Jupyter Notebooku je vysvetliť užívateľovi začínajúcemu pracovať s Jupyter Notebookmi, s čím sa chystá pracovať, na čo sa dá notebook používať a ako ho vytvoriť v prostredí VS Code. Tento notebook plní úlohu prezentácie použiteľnej vo výuke a tiež úlohu tutoriálu s radami na formátovanie textu v markdown bunkách, na prácu s premennými v bunkách kódu a s užitočnými príkazmi a funkciami v jazyku Python.

Python cvičenia

Notebook Python cvičenia má za cieľ precvičiť základné programovacie znalosti z jazyka Python a praktické použitie príkazov a funkcií uvedených v predchádzajúcom notebooku, ako napr. input, modulus, random.randint, split. Dôraz je kladený na správne používanie podmienok if, for cyklov a na prácu s reťazcami a zoznamami. Umiestnenie riešení na koniec notebooku do zbalenej hierarchickej štruktúry necháva priestor užívateľovi vypracovať cvičenie samostatne a správne riešenie použiť iba na kontrolu. Tento notebook je možné použiť ako cvičenie vo výuke alebo ako domácu úlohu.

ArcPy cvičenia

Cieľom notebooku ArcPy cvičenia je precvičiť používanie funkcií ArcPy. Správne riešenia sú rovnako ako v predchádzajúcom notebooku umiestnené na koniec do zbalenej štruktúry. Tento notebook je špecifický tým, že jeho prvá polovica je určená na používanie vo VS Code a druhá polovica v ArcGIS Pro. Na začiatku sa nachádza návod na naklonovanie ArcGIS Python prostredia, vďaka ktorému je možné spúšťať ArcPy funkcie mimo prostredia ArcGIS Pro. Tento notebook je tak zároveň tutoriálom aj materiálom na cvičenie vo výuke. ArcPy funkcie a metódy použité v tomto notebooku zahŕňajú Buffer, Clip, Get Count, Describe, Search Cursor, Intersect, Dissolve, Add Field, Calculate Field, Join Field, List Feature Classes.

Kolokačná analýza

Notebook Kolokačná analýza má za cieľ vysvetliť kolokačnú analýzu v ArcGIS Pro. Notebook vďaka kombinácii vysvetľujúceho textu, Python kódu a okamžitých výsledkov viditeľných v mape alebo pod spustenou bunkou interaktívne vysvetľuje komplexný pojem. Užívateľ vďaka tomu získa živšiu predstavu o tom, čo kolokačná analýza je, ako jednotlivé parametre ovplyvňujú výsledky analýzy a ako sa dajú tieto výsledky interpretovať. Notebook predstavuje „data storytelling“ kolokácie mestskej zástavby so zeleňou a športoviskami v konurbácii Katowice a tiež demonštráciu mapového modulu arcpy.mp, ktorým je možné ovládať prvky a objekty v projekte ArcGIS Pro. Ako zdrojové dáta sú použité dáta Copernicus Urban Atlas pre Európu.

Hustota dopravnej siete

Cieľom notebooku Hustota dopravnej siete je previesť užívateľa procesom výpočtu hustoty dopravnej siete na plochu a na populáciu v hexagónovej mriežke na zvolenom území. Celý proces je realizovaný pomocou Python kódu od stiahnutia dát dopravnej siete a populačného gridu, cez ich úpravu až po samotný výpočet a jednoduchú vizualizáciu. Užívateľ získa predstavu o tom, čo takýto proces zahŕňa a ako je konkrétne realizovaný v ArcGIS Pro. Tento notebook vychádza z Python skriptu, ktorý je jedným z výstupov bakalárskej práce Možnosti výpočtu charakteristik dopravní sítě států a měst (Tóth 2022). Týmto notebookom je ilustrovaný prevod kódu z Python skriptu do formy Jupyter Notebooku.

Eurostat

Notebook s názvom Eurostat má za cieľ predstaviť knižnicu Eurostat, popisnými štatistikami charakterizovať vybraný dataset o ľudských zdrojoch vo vede a technológii a pomocou máp a grafov vytiahnuť zaujímavé informácie z dát. Pomocou uvedenej knižnice je možné jednoducho pristupovať k Eurostat datasetom na základe ich ID. Týmto spôsobom je zabezpečená aktuálnosť dát pri každom spustení notebooku. Dáta sú ukladané do štruktúr (Geo)DataFrame, takže užívateľ si osvojí ich vlastnosti a metódy. „Data storytelling“ je zameraný na vývoj podielu aktívnej populácie vo vede a technológii v európskych regiónoch NUTS 2 medzi rokmi 2011 a 2022 a na vybrané skupiny regiónov. Čiastočným cieľom je ukážka získania, spracovania a vizualizácie priestorových dát iba s použitím open-source Python knižníc.

Rozloha ľadovca

Cieľom notebooku s názvom Rozloha ľadovca je predstaviť jednoduchú metódu na odhad rozlohy horského ľadovca pomocou spektrálneho indexu NDSI a demonštrovať využitie knižnice Rasterio na prácu so satelitnými snímkami. Rozloha ľadovca je odhadovaná zo Sentinel-2 snímok stiahnutých v júli v rokoch 2018- 2023. Užívateľ môže sledovať vývoj rozlohy ľadovca v tomto období na vytvorených grafoch. Čiastočným cieľom je podobne ako pri notebooku Hustota dopravnej siete konverzia zdrojového Python skriptu na Jupyter Notebook, keďže tento notebook je založený na skripte zo semestrálnej práce GeoPython: výpočet rozlohy ľadovca (Potočiar a Tóth 2023). V úvode notebooku sa nachádza návod na stiahnutie snímok z misie Sentinel-2.

Mapovacie knižnice

Notebook Mapovacie knižnice má za cieľ predstaviť štyri open-source Python knižnice, ktoré vedia vytvárať mapy, ukázať silné stránky a špeciality týchto knižníc a porovnať ich pri vizualizácii jedného spoločného datasetu. Toto sú vybrané knižnice: Cartopy, Folium, Plotly a ipyleaflet. Užívateľ tak získa prehľad o možnostiach vytvárať statické i interaktívne mapy priamo v Jupyter Notebooku pomocou Python kódu. Spoločným datasetom, ktorý vizualizujú všetky knižnice, je polygónová vrstva európskych štátov. Tento notebook je inšpirovaný článkom 6 python libraries to make beautiful maps (Rozanov 2024).

Prehľad informácií o vytvorených notebookoch

Názov notebooku Počet markdown buniek Počet buniek kódu Počet riadkov kódu Zdroj vstupných dát Získanie dát Potreba ArcGIS Pro
Základy Jupyter Notebooku 50 18 40 - - Nie
Python cvičenia 19 8 70 - - Nie
ArcPy cvičenia 38 11 59 ArcČR 500 verzia 3.3 Stiahnutie vopred Áno
Kolokačná analýza 79 50 270 Urban Atlas LULC 2018 Registrácia a stiahnutie vopred Áno
Hustota dopravnej siete 64 44 247 OSM, GEOSTAT populačný grid Stiahnutie priamo v kóde Áno
Eurostat 75 57 334 Eurostat, GISCO Stiahnutie priamo v kóde Nie
Rozloha ľadovca 34 17 142 Sentinel-2 Registrácia a stiahnutie vopred Nie
Mapovacie knižnice 41 28 248 GISCO Stiahnutie priamo v kóde Nie