Stěžejní částí práce je implementace nástroje pro přípravu kategoriálních a dichotomických dat. Žádný z programů uvedených v kapitole 3.1 Použité programy neumožňuje přímo pracovat s prostorovými daty. Data miningové programy vyžadují specificky formátovaná data, v našem případě ve formě transakčních tabulek a textových souborů. Koncept transakčních dat je blíže představen v kapitole 2.3 Frekventované sady. Výstupem nástroje je transakční tabulka všech jedinečných kódů využití území nacházejících se do uživatelem nastavené vzdálenosti.
V rámci této kapitoly je popsán způsob, jak lze interpretovat výsledky vypočítaných frekventovaných sad. Tento krok je předstupněm k analýze podobnosti v rámci kapitoly 5.3 Případová studie – evropská města a 5.4 Porovnání s výsledky studie (Dobesova 2020). Jsou blíže popsána 2 vybraná města a to: Cheltenham (Spojené království) a Prešov (Slovensko). Pro každé město je vytvořena příloha obsahující vypočítané frekventované sady s minimální podporou 5 %. Následně jsou identifikovány potencionální specifické frekventované sady v rámci měst. Ty jsou následně popsány.
Cheltenham je lázeňské město v jihozápadní Anglii, v hrabství Gloucestershire. Město se nachází na úpatí Cotswold Hills a je známé svou architekturou a elegantními zahradami. Město má přibližně 116 000 obyvatel a díky malebnému okolí a kulturním památkám je oblíbeným cílem turistů. Vyznačuje se kombinací obytných, komerčních a průmyslových ploch. Město má dobře rozvinuté centrum s řadou obchodů, restaurací a zábavních podniků. V okolí městské části se nacházejí také rozsáhlé venkovské oblasti, včetně zemědělské půdy a volných zelených ploch. Cheltenham má dobrou dopravní síť, hlavní silnice a železniční tratě jej spojují s ostatními částmi země.
Frekventované sady byly vypočítány na základě transakčních dat sousednosti získaných aplikací nástroje SearchDistinctLanduse_SpatialJoin při nastavení vzdálenosti bufferu 100 m. Minimální podpora pro frekventované sady byla stanovena na 5 %. Bylo vypočítáno celkem 277 frekventovaných sad. Kompletní výčet frekventovaných sad do podpory 5 % je součástí přílohy PripadovaStudie2_mestaEVROPA.xlsx na listu CHELTENHAM.
Cheltenham (Spojené království) - UA 2018.
V rámci Cheltenhamu jsou nejfrekventovanější sady sousednosti obsahující průmyslové, komerční a veřejné plochy (12100) s nesouvislou hustou městskou zástavbou (11210) s podporou 60 % . Takováto místa můžeme vidět ve středu města, kde je nesouvislá hustá zástavba (tmavě červená) doplněna o pravděpodobně komerční plochy (fialová). Pro město je typická kombinace průmyslové, komerční a veřejné zástavby (12100), nesouvislé husté městské zástavby (11210) a nesouvislé středně husté městské zástavby (11220) s podporou 45 %.
Typická středně hustá zástavba (11220) v Cheltenhamu (Spojené království) – zdroj fotky.
Rovněž poměrně častou je frekventovaná sada nesouvislé středně husté zástavby (11220) s nesouvislou málo hustou městskou zástavbou (11230) s podporou 28 %. Tento druh sousedství můžeme nalézt například v části města Charlton Kings, Prestbury nebo Leckhampton.
Ukázka nesouvislé málo husté městské zástavby (12230) v části Cheltenhamu (Charlton Kings) – zdroj fotky.
Co se týče okolí města, nejfrekventovanějším sousedstvím v okolí s podporou 24 % je kombinace pastviny (23000) a orné půdy (21000). Tento druh sousedství lze vidět ve východní části vymezeného území. Malé nerovnoměrně rozmístěné oblasti orné půdy jsou obklopeny pastvinami a také malými lesy.
FS – orná půda (21000) a pastviny (23000) - při východní hranici vymezené území Cheltenhamu – zdroj mapy.cz
Prešov se nachází na východě Slovenska v Prešovském kraji. Město leží v údolí řeky Torysa, obklopené východními Karpaty. Prešov má přibližně 90 000 obyvatel a je třetím největším městem na Slovensku. Prešov se vyznačuje kombinací obytných, obchodních a průmyslových ploch. V centru města se nacházejí historické památky, obklopené komerčními částmi, jako jsou obchody, restaurace a kavárny. Průmyslové oblasti jsou soustředěny především v jižní části města, kde se nacházejí různé výrobní podniky a podniky služeb, včetně automobilového průmyslu. Prešov má dobře rozvinutou dopravní síť, včetně hlavních silnic, železnic a veřejné dopravy, která ho spojuje s ostatními částmi Slovenska a sousedními zeměmi.
Kompletní výčet frekventovaných sad do podpory 5 % je součástí příloh PripadovaStudie2_mestaEVROPA.xlsx na listu PRESOV.
Prešov (Slovensko) - UA 2018.
Pro město Prešov bylo při minimální podpoře 5 % vypočítáno 455 frekventovaných sad. Pro Prešov je nejfrekventovanější sadou sousedství průmyslových, komerčních a veřejných ploch (12100) a souvislé husté městské zástavby (11100) s podporou 51 %. Z této dvouprvkové frekventované sady vznikla také tříprvková frekventovaná sada doplněná o nesouvislou hustou městkou zástavbu (11210) s podporou 40 %.
Kombinace souvislé husté městské zástavby (11100) a průmyslové, komerční a veřejné zástavby (12100) v Prešově – zdroj mapy.cz
Poměrně časté jsou rovněž sousednosti s ornou půdou, která opklopuje město ze všech stran kromě severozápadu, kde se nachází souvislý les. S sousedství s ornou půdou se vyskytuje nesouvislá hustá městaká zástravba (11210) s podporou 40 %. Takovýto typ sousedsví lze vidět v městské části Solivar, kde nesouvislá zástavba přechází v ornou půdu. Dále se orná půda nachází v sousedství s průmyslovými, komerčními a veřejnými plochami (12100) s podporou 40%. Souvislá hustá městská zástavba (11100), která se nachází v centru města, s ornou půdou nesousedí.
Kombinace orné půdy (21000) a nesouvislé husté městské zástavby (11210) v okrajové části Prešova Solivar – zdroj fotky.
Zajímavou čtyřkombinací je sousednost průmyslových, komerčních a veřejných ploch (12100), nesouvislé husté městské zástavby (11210), souvislé husté městské zástavby (11100) a městské zeleně (14100). Jedná se o rozšíření tříprvkové sady s podporou 40 % o městskou zeleň. Sada má podporu 28 %. Městská zeleň se nachází převážně ve středu města a také v severní části města podél řeky Torysy. Městská zeleň se rovněž vyskytuje v sousedství v kombinaci se sportovišti (14200) s podporou 22 %.
Kombinace městské zeleně (14100) se souvislou hustou městskou zástavbou (11100), nesouvislou hustou městskou zástavbou a průmyslovými, komerčními a veřejnými plochami (12100) – zdroj fotky.
Cílem případové studie bylo souhrnně popsat česká města v rámci datové sady UA 2018. Tato datová sada obsahuje celkem 15 českých měst a jsou jimi: Praha, Brno, Ostrava, Plzeň, Ústí nad Labem, Olomouc, Liberec, České Budějovice, Hradec Králové, Pardubice, Zlín, Karlovy Vary, Jihlava, Most a Chomutov. Jedná se tedy o krajská města České republiky doplněná o Most a Chomutov.
Po vypočítání transakčních dat sousednosti jednotlivých měst byly vypočítány frekventované sady všech měst dohromady, čehož bylo docíleno sloučením transakčních dat jednotlivých měst do jednoho souboru, který dále vstupoval do výpočtu frekventovaných sad. Byla stanovena minimální podpora 5 %. Celkem bylo zjištěno 319 sad. Mediánová délka transakce byla 3.
1. Jednoprvkové frekventovanéh sady a dvouprvkové frekventované sady
Mezi sady s nejvyšší podporou patřily jednoprvkové frekventované sady: ostatní silnice (12220) = 97 %, nesouvislá hustá zástavba (11210) = 69 %, souvislá městská zástavba (11100) = 61 % atd. Tato frekventované sady vznikají z podstaty metody (viz kapitola 2.3 Frekventované sady) a nevypovídají o sousednosti. Takovéto sady můžeme ignorovat. Obdobně můžeme ignorovat pravidla s dvěma hodnotami využití území z nichž jedna je silnice (12220, 12210). Tyto sady z pohledu sousednosti pouze reflektují vstupní data, ve kterých silnice „krájí“ městskou mozaiku na části. Rovněž není překvapující, že se v blízkosti většiny polygonů v městech nachází silnice.
2. FS – průmyslové, komerční a veřejné plochy (12100) s nesouvislou hustou městskou zástavbou (11210)
Prvním zajímavou frekventovanou sadou je kombinace 12100 a 11210 s podporou 49 %. Jedná se o kombinaci průmyslové, komerční a veřejné zástavby (12100) a nesouvislé husté městské zástavby (11210). Hlavním problémem interpretace je příliš široké rozpětí kategorie 12100. Jedná se o průmyslovou, komerční, veřejnou či vojenskou zástavbu. Výše zmíněná frekventovaná sada tedy může poukazovat na kombinaci nesouvislé husté městské zástavby s průmyslovou zónou, nákupními zónami, školami, nemocnicemi či dokonce vojenskými objekty. Je tedy potřeba zmínit, že v rámci této sady může výše zmíněný typ zástavby sousedit se všemi zmíněnými kategoriemi najednou. Na základě vstupních dat (UA 2018) není možné jednotlivé kategorie dále odlišovat. Nelze tedy vyvozovat závěry typu: hustá zástavba sousedí s komerční plochou, protože se ve skutečnosti může jednat o plochu průmyslovou, či kombinaci více typů využití území.
Ukázka FS – průmyslové, komerční a veřejné plochy (12100) s nesouvislou hustou městskou zástavbou (11210) – Liberec část Horní Hanychov.
3. FS – průmyslové, komerční a veřejné plochy (12100) se souvislou hustou městkou zástavbou (11100)
Další frekventovanou sadou je kombinace 12100 a 11100 s podporou 48 %. Zde se jedná o kombinaci průmyslové, komerční a veřejné zástavby (12100) se souvislou hustou městskou zástavbou (11100). Takováto kombinace indikuje nahuštěné bloky budov doplněné o pravděpodobně komerční či veřejnou zástavbu. Tento druh zástavby (souvislá hustá zástavba) se vyskytuje převážně v historických centrech měst.
Ukázka FS – průmyslové, komerční a veřejné plochy (12100) s nesouvislou hustou městskou zástavbou (11210) - příklad Olomouc Holice.
4. FS – nesouvislá hustá městská zástavba (11210) se souvislou hustou městskou zástavbou (11100).
Dalším typickým rysem českých měst je přechod mezi souvislou městskou zástavbou (11100) a nesouvislou hustou městskou zástavbou (11210) s podporou 47 %. Jedná se převážně o přechody mezi hustě zastavěným historickým centrem a zástavbou, která jej obklopuje. Popřípadě se jedná o okrajové části sídlišť.
Ukázka FS – nesouvislá hustá městská zástavba (11210) se souvislou hustou městskou zástavbou (11100) - příklad Brno Židenice.
5. FS využití území – městská zeleň (14100).
Další skupinou využití území, která je v rámci vybraných český měst typická, je městská zeleň. Zeleň se nejčastěji nachází v sousedství silnic (podpora 48 %) a průmyslových, komerčních a veřejných ploch (podpora 40 %). Pokud bychom chtěli zkoumat sousednost zeleně a zástavby, nejčetnější je kombinace se souvislou hustou městskou zástavbou (11100) s podporou 37 %. Druhou nejčetnější zástavbou v kombinaci se zelení je nesouvislá hustá městská zástavba (11210) s podporou 35 %. Zajímavou sadou s pěti využitími území je kombinace silnice (12220), průmyslové, komerční a veřejné zástavby (12100), nesouvislé husté městské zástavby (11210), souvislé husté městské zástavby (11100) a městské zeleně (14100) s podporou 23 %. Městská zeleň se tedy většinou nachází v blízkosti dvou nejsytěji červených zástaveb. Tato sada poukazuje na určitou pestrost využití území v rámci českých měst.
Ukázka FS – souvislá hustá městská zástavba (11100) s městskou zelení (14100) a průmyslové, komerční a veřejné plochy (12100) s městkou zelení (14100) – příklad Komenského sady Ostrava a Smetanovy sady Olomouc.
6. FS využití území – nesouvislá středně hustá zástavba (11220).
Stále poměrně často zastoupeným typem zástavby je nesouvislá středně hustá městská zástavba (11220). Tento typ zástavby se nejčastěji nachází v sousedství v kombinaci nesouvislou hustou městskou zástavbou (11210) podporou 18 %. Dále pak v kombinaci s průmyslovými, komerčními a veřejnými plochami (13 %) a v kombinaci s pastvinami (13 %), ornou půdou (21000) s podporou 12 %.
Ukázka FS – nesouvislá středně hustá zástavba (11220) s pastvinami (23000) – příklad Liberec Ostašov a okolí.
7. FS využití území – nesouvislá městská zástavba nízké (11230) a velmi nízké hustoty (11240).
U českých měst nejsou nejfrekventovanější sady obsahující dvě nejřidší skupiny zástavby – nesouvislou městskou zástavbu nízké hustoty (11230) a nesouvislou městskou zástavbu velmi nízké hustoty (11240). Podpora pravidel obsahující tyto typy zástavby má podporu okolo 7 %. Pod těmito typy zástavby si můžeme představit čtvrtě rodinných domů s velkými zahradami a rozestupy mezi jednotlivými domy. V rámci vybraných českých měst nejsou výrazně zastoupeny. Naopak velmi typické jsou například pro britská města (kapitola 5.3).
8. FS využití území – sportoviště (14200).
V rámci měst se kromě komerční, veřejné a bytové zástavby (červené kategorie) nachází rovněž sportoviště (14200). Sportoviště se nejčastěji nacházejí v sousedství dohromady s průmyslovými, komerčními a veřejnými plochami (12100) s podporou 24 %. Dále pak v kombinaci s nejhustšími typy zástavby – se souvislou hustou městkou zástavbou (11100) s podporou 21 % a s nesouvislou hustou městskou zástavbou (11210) s podporou 23 %. Zajímavou kombinací je rovněž čtveřice využití území: souvislá hustá městská zástavba (11100), nesouvislá hustá městská zástavba (11210) a sportoviště (14200) samozřejmě v kombinaci se silnicí. Tato sada indikuje sousedství dvou typů zástavby se sportovištěm. Jedná se pravděpodobně o veřejná sportoviště mezi jednotlivými čtvrtěmi.
Ukázka FS – nesouvislá středně hustá zástavba (11220) s pastvinami (23000) – příklad Liberec Ostašov a okolí.
9. FS využití území – orná půda (21000).
Z rurálních kategorií využití území na území urbánních jader vybraných měst mají největší podporu pravidla obsahující lesy (31000), ornou půdu s jednoletými rostlinami (21000) a pastviny (23000). Naopak nejsou zastoupeny sady (25000), půda s trvalými plodinami (22000) a komplexní půda se smíšeným typem pěstování (24000). Orná půda se nachází v sousedství v kombinaci s nesouvislou hustou městkou zástavbou (11210) s podporou sady 24 %. Dále se nachází v sousedství v kombinaci s průmyslovými, komerčními a veřejnými plochami (12100) s podporou 22 % napříč vybranými městy.
Ukázka FS – využití území orná půda (21000) v kombinaci s průmyslovými, komerčními a veřejnými plochami (12100) – příklad Brněnské Ivanovice.
Celkově byly pro vybraná česká města nalezeny vypovídající frekventované sady. Celá tabulka frekventovaných sad při podpoře 5 % je součástí příloh PripadovaStudie1_mestaCR.xlsx. Výše zmíněné kombinace využití území jsou pro česká města typické. Pokud by byly provedeny obdobné studie pro jednotlivé národní státy v rámci datasetu, bylo by možné jednotlivé státy porovnat a nalézt podobnosti, popřípadě rozdílnosti. V rámci aplikované metodiky je možno změnit minimální podporu FS, velikost bufferu pro analýzu sousednosti a samotnou oblast zájmu. Namísto urbánních jader by mohlo býti použito FUA nebo administrativní jednotky.
Cílem této případové studie je nalezení skupin v rámci vybraných evropský měst (100). Metodika výběru byla přiblížena v rámci kapitoly 4.1 Výběr dat. Výběr se skládá z části z dvojic, jejichž podobnost byla zjištěna na základě obrazové podobnosti (Dobesova 2020).
Hlavní myšlenkou pro hledání podobnosti je, že podobná města budou mít podobnou procentuální podporu stejných frekventovaných sad sousednosti využití území. Abychom mohli tyto procentuální shody hledat, bylo potřeba vytvořit program, který by sumarizoval výsledky jednotlivých měst. V rámci spolupráce s Univerzitou Kyoto byla vyvinuta sumarizační funkce v rámci již existujícího Jupyter Notebooku. Tato funkce, která vytváří sumarizační matici byla blíže představena v rámci kapitoly 4.6 Příprava dat pro případovou studii – evropská města. Rovněž byla představena struktura sumarizační matice. Pro připomenutí, sloupce matice tvoří unikátní (neopakující se) frekventované sady napříč všemi 100 městy. Řádky tvoří jednotlivá města a hodnoty matice tvoří procentuální podpory jednotlivých frekventovaných sad v daných městech. Pro vybraná města studie byla vypočítána sumarizační matice. Sumarizační matice je součástí příloh PripadovaStudie2_mestaEVROPA_sumarizacni_matice.xlsx.
Nad touto maticí bylo provedeno hierarchické shlukování v programu Orange s cílem nalézt skupiny (klastry) měst s podobnými frekventovanými sadami sousednosti. Byla aplikována následující nastavení. Byla vypočítána euklidovská vzdálenost. V dendrogramu hierarchického shlukování představuje vzdálenost v horní části dendrogramu vzdálenost nebo rozdílnost mezi nejodlišnějšími shluky v souboru dat. Tato vzdálenost se obvykle měří pomocí metriky vzdálenosti. Jako mezní hodnota byla stanovena vzdálenost 175. Výška dendrogramu je grafickým znázorněním vzdálenosti mezi shluky. Čím delší je svislá čára, která spojuje dva shluky, tím větší je mezi nimi vzdálenost. Proto jsou si shluky, které jsou spojeny kratšími čarami, navzájem podobnější než shluky, které jsou spojeny delšími čarami. Dalším nastavením hierarchického shlukování v Orange je typ vázání (linkage). Bylo zvoleno Wardovo spojování (Ward linkage). Wardovo spojování je běžně používanou metodou hierarchického shlukování v Orange. Tato metoda spojování se snaží minimalizovat rozptyl v rámci každého shluku při vytváření nových shluků. Jinými slovy se snaží vytvořit shluky, které jsou co nejhomogennější, a to minimalizací součtu čtvercových rozdílů v rámci každého shluku.
Aplikací tohoto nastavení vzniklo celkem 12 shluků. 27 měst se nachází v celkem 12 skupinách po dvou nebo třech městech. Ostatních 77 měst se při tomto nastavení nenachází v žádném shluku a vystupují samostatně (vlivem nastavené prahové vzdálenosti). Při nastavení kratší vzdálenosti není každé město zařazeno do shluku, ale zároveň jsou vzniklé shluky homogennější a výstižnější. Vzniklé shluky měst byly dále zkoumány.
vlevo Plzeň (CZ) - vpravo Žilina (SK)
vlevo Nitra (SK) - vpravo České Budějovice (CZ)
Augsburg (DE)
vlevo Orleans (FR) - vpravo Hradec Králové (CZ)
Pardibice (CZ)
vlevo Oostende (BE) - vpravo Plovdiv (BG)
vlevo Lincoln (UK) - vpravo Worcester (UK)
vlevo Cambridge (UK) - vpravo Dundee City (UK)
vlevo Plauen (DE) - vpravo Gera (DE)
vlevo Odense (DK) - vpravo Celle (DE)
Osnabruck (DE)
vlevo Lubeck (DE) - vpravo Pila (PL)
vlevo Le Mans (FR) - vpravo Enschede (NL)
vlevo Toledo (ES) - vpravo Avila (ES)
vlevo Vasteras (SE) - vpravo Norrkoping (SE)
Autor práce: Bc. Pavel Novák
pavelnovak1996@email.cz
Vedoucí práce: doc. Ing. Zdena Dobešová, Ph.D.
zdena.dobesova@upol.cz