Metody
Použité metody
V teoretické části diplomové práce je popisována sršeň asijská (konkrétně poddruh Vespa velutina nigrithorax, která je momentálně jediná zdokumentovaná invazivní asijská sršeň v Evropě), její charakteristika, odlišnost od sršně obecné (Vespa crabro), dopady na společnost a hospodaření. Dále jsou popisovány charakteristiky habitatu, v němž se sršeň v Evropě vyskytuje, a které byly popsány v několika výzkumech. Kapitola se též věnuje popisu několika možných řešení pro modelování distribuce druhů, přičemž největší důraz je kladen na model Maxent (obsažený v aplikaci Wallace), jenž byl vybrán jako finální nástroj pro modelování vhodnosti habitatu pro sršeň asijskou.
V rámci praktické části byly využity poznatky z rešerše – byly analyzovány dostupné datové sady a vybrány zdroje dat vhodné pro potřeby této diplomové práce. Na podkladu těchto dat byly vygenerovány rastry bioklimatických a dalších stanovištních charakteristik pro klimatický normál 1991–2020, které byly použity pro modelování výskytu sršně asijské v Evropě a následně aplikovány na prostředí České republiky, a pro klimatický normál 2041–2060, jenž byl použit pro predikci výskytu v ČR. Vzhledem k poměrně velkému množství potenciálně použitelných proměnných (19 proměnných), jejichž výběr byl stanoven na základě rešerše, byly použity různé statistické metody pro vytipování nejdůležitějších proměnných, které poskytují komplexní, ale přesto nepříliš složitý obraz o prostředí, v němž se šíří sršeň asijská. Výsledné proměnné byly vybrány statistickými metodami PCA a podobnosti jednotlivých bioklimatických proměnných byly spočítány pomocí korelační matice a následně redukovány, aby model neobsahoval příliš korelujících proměnných, které by mohly výsledný model ovlivnit.
Výzkum prováděný v této práci se od ostatních výzkumů popsaných v rešerši liší rozsahem zkoumaného území, počtem zpracovaných nálezových dat (bodů výskytu) a prostorovou podrobností rastrů bioklimatických a dalších stanovištních proměnných. Například ve Španělsku stanovovali výzkumníci míru vhodnosti habitatu v hexagonové síti o velikosti 100 km2 na buňku (Bessa et al., 2016), na Mallorce byly pro modelování použity čtvercové pixely o velikosti 1 km2 (Herrera et al., 2022). Autor v této práci používá rastry s velikostí pixelu 0,0625 km2 (pixel 250×250 m, celkem je v jednom rastru přes 36 milionů pixelů), což by mělo vést k větší přesnosti výsledného modelu a podrobnosti predikce. Vytvoření rastrů probíhá z bodových vrstev pomocí interpolace IDW (Inverse Distance Weighing). Jde o interpolační techniku, která vychází z předpokladu, že věci, které jsou si blízké, jsou si podobnější než ty, které jsou od sebe vzdálenější. K předpovědi hodnoty pro libovolné neměřené místo používá IDW naměřené hodnoty v okolí místa předpovědi. Naměřené hodnoty, které jsou nejblíže předpovídanému místu, mají na předpovídanou hodnotu větší vliv než hodnoty vzdálenější. IDW předpokládá, že každý měřený bod má lokální vliv, který se vzdáleností klesá (Esri, 2023b). Tato metoda interpolace byla použita jako nejrychlejší pro generování rastrů – vzhledem k tomu, že bodová data byla v síti 250×250 m a bylo potřeba vyexportovat rastr o stejném rozlišení, metoda IDW zjednodušeně řečeno sloužila spíše k převodu bodové vrstvy do rastrové.
Takto podrobné rastry byly vyexportovány pro poměrně velké zájmové území (viz sekce Použitá data níže), což z celého souboru rastrů dělá poměrně komplexní databázi proměnných, kterou je možné použít pro další výzkumy šíření živočišných druhů a sestavování modelů s velkou prostorovou přesností.
Vzniklo několik různých modelů, jejichž použitelnost byla vyhodnocena na základě vypočítaných statistik, a na těchto podkladech byl vybrán nejoptimálnější model. S jeho použitím byla vygenerována míra vhodnosti habitatu (ta je klíčová pro předpovídání šíření sršně asijské na další území) na území Evropy a tento model byl poté aplikován na území České republiky, a to pro normál 1991–2020 (tedy pro zjištění, zda již v současnosti jsou v České republice podmínky vhodné pro šíření sršně asijské) a dále normál 2041–2060 (tedy predikce do budoucnosti, kdy je očekávána změna teploty vzduchu, množství srážek a dalších klimatických proměnných, která pravděpodobně povede ke zvyšování vhodnosti habitatu pro tento invazivní druh hmyzu). Z povahy modelovacího přístupu modelu Maxent, jenž byl použit pro predikci v této práci, je výstupem predikční model založený na určování míry vhodnosti habitatu pro sršeň asijskou Vespa velutina.
Další část práce, tedy příprava mapových layoutů a kompletace brožury pro veřejnost, probíhala v programech desktop publishing (DTP). Zde byly z GIS vytvořené a exportované mapové výstupy upravovány, sepsán informační text a doplněna infografika. Brožura včetně map je hlavním vizualizačním výstupem celé práce.
Použitá data
Diplomová práce byla realizována za využití několika zdrojů dat. Žádná data nebyla ručně měřena, ani digitalizována, veškerá data byla stažena z volně dostupných zdrojů. Vzhledem k tomu, že model byl trénován na datech ze západní Evropy, byla pro dílčí kroky zvolena veřejně dostupná data pokrývající v co největším rozlišení celé zájmové území.
Zájmové území pro následné analýzy bylo stanoveno polygonovou vrstvou všech států Evropy, v nichž byla získána data o výskytu sršně. Jedná se o Portugalsko, Španělsko, Itálii, Švýcarsko, Velkou Británii, Nizozemsko, Belgii, Lucembursko a Německo, k těmto státům byly přidány Česká republika a Rakousko (Rakousko pro případnou vizualizaci tranzitních koridorů pro šíření sršně asijské). Vrstva zájmového území vznikla kombinací dvou vrstev – polygonové vrstvy států, která byla ve vysokém rozlišení stažena z Open Street Map pomocí doplňku QuickOSM v programu QGIS a zahrnovala i území výsostných vod přímořských států, a polygonové vrstvy EEA coastline for analysis (Evropa ořezaná pobřežní čárou), tato vrstva byla vytvořena v roce 2017 a pochází od Evropské agentury pro životní prostředí.
Stěžejním rastrovým datasetem, na jehož podkladu byla následně vygenerována veškerá klimatická data, je European Digital Elevelation Model (EU-DEM) ve verzi 1.1. Jedná se o aktualizovanou verzi EU-DEM 1.0, tuto aktualizaci koordinovala Evropská agentura pro životní prostředí (EEA) v rámci programu EU Copernicus. Data jsou poskytována po dlaždicích o velikosti 1 000×1 000 km ve formátu GeoTIFF 32-bit a v rozlišení 25×25 m. EU-DEM ve verzi 1.1 byl vydán v dubnu roku 2016. Přístup k datům je založen na zásadě úplného, otevřeného a bezplatného přístupu, jak je stanoveno v nařízení o datové a informační politice programu Copernicus (EU) č. 1159/2013 ze dne 12. července 2013.
Zdroj klimatických dat byl zvolen s ohledem na fakt, že ve výsledku bylo potřeba vygenerovat rastry o rozlišení 250×250 m, jehož většina volně dostupných dat nedosahuje.
Pro historické hodnoty klimatických charakteristik byl použit program ClimateEU, jenž pracuje s datasetem Climate Research Unit Time Series (CRU-TS) ve verzi 4.05. Jedná se o data vytvořená oddělením Climate Research Unit (CRU) pro výzkum klimatu na University of East Anglia. Data jsou poskytována ve vysokém rozlišení, a to pro období od ledna 1901 do prosince 2020. Na těchto datech proběhlo natrénování modelu. Data CRU-TS ve verzi 4.05 byly vydány v roce 2021 a jsou poskytovány pod otevřenou licencí Open Government Licence.
Pro klimatické predikce byl použit dataset European CLimate Index ProjectionS (ECLIPS) ve verzi 2.0, který obsahuje rastrová data pro 80 ročních, sezónních a měsíčních klimatických proměnných pro dva předchozí normály (1961–1990, 1991–2010) a pět budoucích normálů (2011–2020, 2021–2140, 2041–2060, 2061–2080, 2081–2100). Data jsou poskytována pod licencí Creative Commons Attribution 4.0 International. ECLIPS ve verzi 2.0 byl vydán v červenci roku 2020.
Tato data jsou sice v rozlišení 30×30 úhlových vteřin (tedy asi 1×1 km), nicméně po předchozí konzultaci s vedoucím práce byly vyhodnoceny jako přesnější (použitými algoritmy výpočtu predikovaných hodnot, nikoli rozlišením) v porovnání s daty poskytovanými programem ClimateEU. Predikovaná klimatická data z datasetu ECLIPS 2.0 byla použita pouze pro území České republiky, kde byla provedena dodatečná interpolace hodnot na požadované rozlišení 250×250 metrů (metodou co-kriging zahrnující i digitální model reliéfu). Data sloužila pouze pro aplikaci modelu na nové časové období (normál 2041–2060), nikoli jeho natrénování.
Kromě klimatických charakteristik, které výrazně ovlivňují rozšíření živočišných druhů, byla stažena podrobná data o krajinném pokryvu a využití krajiny Land Cover Map of Europe 2017 od Evropské kosmické agentury (European Space Agency, ESA). Dataset je výsledkem plně automatizované klasifikace, která byla provedena nad obrazovými daty mise Copernicus Sentinel-2 se zapojením nových cloud-computing nástrojů. Rozlišení těchto dat je 10 m na pixel pro celou Evropu a krajinný pokryv je rozdělen do 13 kategorií.
Posledním, ale zato stěžejním zdrojem informací jsou data o výskytu sršně asijské. Zatímco výzkumy, které byly rozebírány v rešerši, pracovaly s bodovými lokalitami výskytu hnízd, autor této práce k těmto datům o výskytu hnízd neměl přístup, a tak byly zvoleny zdroje dat o výskytu živočichů, které jsou postaveny na volně dostupných datech využívajících citizen science přístupu (tedy přístupu, kdy s výzkumy – např. sběrem dat – pomáhají dobrovolníci z řad nadšenců o danou problematiku). V tomto případě byly použity nálezové databáze GBIF.org a iNaturalist.org, do nichž mohou registrovaní uživatelé vkládat nálezová data různých druhů, doplněná o fotografie a další informace ohledně druhu a nálezu. Nejedná se tedy vždy o data hnízd, nýbrž i o pouhé záznamy pozorovaných jedinců. Přesnost těchto dat je ovlivněna přesností zadání dat do systému nálezcem, nicméně obě výše zmíněné organizace mají supervisory, kteří na kvalitu zadávaných dat dohlíží a záznamy kontrolují.
Citace zdrojů dat jsou uvedeny v diplomové práci.
Použité programy
Práce na řešeném problému se z programového vybavení dělila na práci s GIS a jiným softwarem na zpracování dat a práci s programy DTP. Jako hlavní program pro práci s prostorovými daty byl zvolen ArcGIS Pro ve verzi 3.1 od americké společnosti Esri, v něm probíhaly veškeré práce s rastry (jejich generování, rastrová algebra i počítání buňkových statistik) i s vektorovými daty. Byl použit jak na zpracování analytickými nástroji, tak na vytváření datových náhledů a prosté prohlížení dat.
Pro generování klimatických dat byl využit program ClimateEU ve verzi 4.63. Tento software pracuje se soubory CSV (Comma Separated Values) a existuje ve dvou variantách, z nichž každá pracuje s jiným oddělovačem položek a desetinných míst v CSV souborech – jedna varianta pojmenovaná ClimateEU v4.63 předpokládá, že desetinná místa odděluje desetinná tečka a oddělovačem položek je čárka (anglosaský svět), druhá varianta s názvem ClimateEU_v4.63 (experimental EU number format), která byla použitá v této práci, pracuje s desetinnou tečkou a oddělovačem položek je středník (např. čeština). U druhé varianty, ač nazvané jako „experimental“, autor práce nezaznamenal jediný problém se zápisem číselných hodnot, který by mohla tato experimentální verze přinést.
Pro úpravu dat (např. generování velkých CSV souborů, které byly nahrávány do programu ClimateEU), specifické rastrové operace a výpočty (např. počítání standardních odchylek za účelem počítání bioklimatických charakteristik) a pro spuštění modelu byl použit program RStudio s předinstalovaným jazykem R původně ve verzi 4.1.2, později v aktualizované verzi 4.2.3.
Na statistické analýzy a vizualizace (např. PCA, korelace) byl využit program Orange ve verzi 3.34.0.
Vzhledem k omezeným možnostem grafických úprav a nástrojů v programu ArcGIS Pro byl pro grafické dokončení map použit program Adobe Illustrator z programové sady Adobe Creative Cloud, kterou může autor práce používat v rámci své studentské licence. V Adobe Illustrator byly nejprve vytvořeny mapy spolu s legendami, které byly následně vloženy do programu Adobe InDesign (také ze sady Adobe Creative Cloud), kde byl následně dořešen grafický styl stran, vloženy texty, infografika, podtituly a další kompoziční prvky, finálně zde byla realizována předtisková příprava.