Úvod
Železniční doprava je v České republice významným druhem osobní i nákladní dopravy. Cestování vlakem je v ČR považováno za jeden z nejpopulárnějších způsobů dopravy. Díky rozsáhlé železniční síti je vlaková doprava dostupná na většině území ČR. Nákladní doprava bývá často využívána pro přepravu zboží o velkých hmotnostech na delší vzdálenosti, Při přepravě velkých objemů komodit na velké vzdálenosti jsou náklady na železniční přepravu nižší, nežli na silniční nebo leteckou.
Význam železniční dopravy se v České republice v posledních letech neustále zvyšoval, což od roku 2015 dokládají rostoucí hodnoty přepravených osob v osobní dopravě, a rostoucí hmotnost přepravených věcí u nákladní dopravy. Rostoucí trend v osobní dopravě potvrzuje i národní dopravce České dráhy, který je největším provozovatelem osobních vlaků na českých železnicích. Lidé také cestují na delší vzdálenosti než dříve, jelikož v dnešní době jsou ochotni za prací dojíždět dále, a také je vlak oblíbenou alternativou místo auta na delší trasy.
V roce 2020 však dorazila do České republiky celosvětová pandemie virového onemocnění covid-19. Proto vláda ČR zavedla sérii opatření, která měla šíření viru zamezit. Tato opatření omezila mobilitu obyvatel, a tím poptávku po osobní dopravě, a současně snížila přepravu zboží po železnici. Malý počet cestujících způsobil dopravcům veliké ztráty v tržbách. Utlumení průmyslové výroby způsobilo pokles přeprav komodit.
Cíl práce
Hlavním cílem diplomové práce je provést klasifikaci a časovou analýzu provozu osobní a nákladních dopravy na vybraných celostátních a regionálních železničních tratích (bez železničních koridorů) Olomouckého a Moravskoslezského kraje. K dosažení cílů bude využita víceletá datová sada agregovaných měsíčních údajů o vlakové dopravě na tratích České republiky. Nejprve bude provedeno předzpracování dat, zahrnující selekci údajů pouze pro definované území, vytvoření prostorových vrstev pro mapové vizualizace a očištění dat od kalendářních vlivů. Poté budou pro vybrané úseky vytvořeny časové řady, na jejichž základě bude vyhodnocován provoz osobní a nákladní dopravy od roku 2016 do roku 2021. Nakonec bude provedena klasifikace metodou shlukování, spočívající v identifikaci tratí s podobným a současně odlišným provozem, a určení tratí s podobným časovým průběhem provozu.
Dalšími cíli práce je hodnocení vlivu dopadů pandemie covidu-19 na osobní a nákladní dopravu v letech 2020 a 2021. Dále zjišťování trendů v provozu na tratích pomocí dekompozice časových řad. V případě, že to bude realizovatelné, tak bude sledována i složka sezónní. Při shlukování budou využity a porovnány přístupy hierarchické metody a metody k-means. U hierarchické metody budou testovány různé metody spojování shluků a vzdálenostních metrik, z nichž bude nakonec vybrána nejvhodnější kombinace pro konkrétní analyzovaná data. Posledním cílem je využití shlukování časových řad metodou dynamického borcení časové osy pro hledání tratí s podobným časovým průběhem.
Použitá data
Pro zpracování diplomové práce jsou stěžejní data provozu na železnici. Tato data vlastní státní organizace Správa železnic a jsou poskytnuta pouze pro účely této diplomové práce. Primárně se využívají pro výpočet poplatku za využití železniční dopravní cesty pro železniční dopravce. Data jsou poskytována ve formě tabulek ve formátu .xlsx, obsahující informace o využití dráhy v měsíčních agregacích za jednotlivý rok podle kategorie dopravy. V datech se rozlišuje lokomotivní, nákladní, osobní, služební a soupravová kategorie železniční dopravy.
Data provozu na železniční infrastruktuře jsou vztažena k monitorovacím bodům SR70. Monitorovacími body se rozumí železniční stanice, dopravně zajímavá místa jako jsou například hradla či dopravny a tarifní místa. Všechny tyto body jsou vedeny v číselníku železničních stanic SR70, který vydává Správa železnic. V datech je veden výchozí a koncový dopravní bod SR70. Díky tomu je možné na data nahlížet i jako na úseky mezi monitorovacími body. Jelikož se nejedná o data směrová, jde o úhrny provozu místa v obou směrech. Data obsahují popisné informace monitorovacího bodu, a především údaje o počtu vlaků, průměrné délce soupravy, hmotnosti souprav, průměrné hmotnosti soupravy, průměrném počtu náprav a průměrném počtu vozů, které daným bodem projely.
V rámci této práce byly použity údaje z monitorovacích bodů pouze z vybraných celostátních a regionálních železničních tratích Olomouckého a Moravskoslezského kraje pro osobní a nákladní vlakovou dopravu. Údaje z železničních tranzitních koridorů nebyly uvažovány, jelikož jejich hodnoty jsou příliš vysoké v porovnání s regionálními úseky, a tyto rozdíly by zkreslily a negativně ovlivnily výsledky analýz.
Použité metody
Data provozu na železnici byla poskytována ve formě tabulkových souborů. Proto byly dále zpracovány v tabulkovém procesoru Microsoft Excel, s využitím kontingenčních tabulek pro tvorbu agregací za jednotlivé roky a měsíce pro osobní i nákladní vlakovou dopravu. V GIS software ArcGIS Pro byly z dat vytvořeny dvě prostorové vrstvy. Bodová vrstva monitorovacích bodů na území České republiky a liniová vrstva železničních úseků České republiky.
Časová analýza
Časová analýza provozu byla založena na tvorbě časových řad měsíčních údajů počtu a hmotnosti vlaků za období 2016–2021. Časové řady byly vytvořeny v programu MS Excel. V programu Orange byla sestavena workflow, určená pro analýzu výsledných časových řad. Realizována byla dekompozice časových řad na trendovou a sezónní složku. Dále bylo sledováno meziroční tempo růstu počtu vlaků.
Klasifikace tratí
Klasifikace tratí byla realizována metodou shlukování. Při shlukové analýze železničních úseků byla využita především metoda hierarchického shlukování. Otestována byla taky k-středová metoda (k-means). Shlukování bylo realizováno v programu Orange. Železniční úseky byly shlukovány na základě ročních a měsíčních agregací počtu a hmotnosti vlakových souprav v roce 2021. Pro interpretaci výsledných shluků, byly vytvořeny kategorizační tabulky podle počtu a hmotnosti vlakových souprav. Tyto tabulky umožnily klasifikovat shluky do 6 nadefinovaných kategorií. V případě shlukování ročních agregací byly shluky kategorizovány na základě tabulek ročních agregací počtu a hmotnosti osobních a nákladních vlakových souprav. Naopak v případě shlukování měsíčních agregací byla kategorizace shluků provedena podle kategorizační tabulky měsíčních úhrnu počtu osobních a nákladních vlakových souprav. Každý shluk byl do příslušné kategorie přiřazen na základě hodnoty mediánu sledovaného atributu. Celková charakteristika shluků byla doplněna poznatky získanými z dendrogramu v programu Orange, a také z mapových výstupů, které poskytly prostorové informace.
Výsledky
Práce byla navržena a zpracována tak, že bylo docíleno několika dílčích výsledků namísto jednoho komplexního. Výsledky lze rozdělit do čtyř částí.
Příprava dat
Již ve fázi přípravy dat bylo dosaženo několika výstupů. Byly vytvořeny prostorové vrstvy, které sloužily k vizualizaci hodnot intenzity provozu a výsledků provedených analýz. Jednalo se o bodové a liniové vrstvy železniční infrastruktury Olomouckého a Moravskoslezského kraje. Bodové vrstvy obsahují lokalizované monitorovací body SR70 na celostátních a regionálních tratích za každý dílčí rok období 2016–2021, a body SR70, které mají záznamy ve všech letech současně. Dvě liniové vrstvy obsahují železniční úseky regionálních a celostátních tratí v roce 2016 a 2021. Každému úseku byl doplněn atribut čísla tratě podle jízdních řádů. Tím byla vytvořena železniční síť, složená z dílčích traťových úseků.
Struktura železniční dopravy
V této části práce byly vytvořeny mapové vizualizace, které sloužily k prvotnímu seznámení s rozložením a strukturou železniční dopravy v Olomouckém a Moravskoslezském kraji. Podle celkového počtu a hmotnosti vlakových souprav za rok 2016 a 2021 byl největší provoz zjištěn na tratích v okolí Ostravy. Největší provoz v letech 2016 a 2021 byl na trati Ostrava-Stodolní – Ostrava-Střed. Největší provoz byl v obou letech na trati Ostrava-Stodolní – Ostrava-Střed. Další tratě s vysokým provozem byly Šumperk–Zábřeh, Přerov–Nezamyslice, Olomouc–Prostějov, Opava–Ostrava, Hranice–Valašské Meziříčí. Naopak nejmenší provoz byl na regionálních tratích. Na drtivé většině všech tratí převažovala osobní doprava. Odhaleny byly také tratě, na kterých probíhala pouze osobní nebo nákladní doprava.
Porovnáním hodnot počtu vlaků v období od března do května roku 2020 a 2021 vůči průměru ze stejného období předchozích let, bylo zjištěno, na kterých tratích došlo v období pandemie covidu-19 k poklesu nebo nárůstu počtu vypravených vlaků. Největší poklesy osobních vlaků o více než 50 % zaznamenaly v roce 2020 úseky na hraničních přechodech. Důvodem bylo na určitou dobu uzavření státních hranic pro osobní dopravu. Počty vlaků klesly především na regionálních tratích. Poklesy však zaznamenal i provoz na celostátních tratích. Na některých úsecích došlo naopak k vyššímu počtu průjezdů vlaků. Propady byly zaznamenány i u nákladní dopravy. V roce 2021 se situace v osobní dopravě zlepšila především na hraničních přechodech. Celkově byl počet vypravených vlaků v březnu–květnu 2020 a 2021 nižší než v předchozích letech.
Časová analýza
Hlavními výstupy časové analýzy byly samotné časové řady. Vyhodnocením časových řad měsíčních agregací byl popsán provoz na vybraných úsecích od roku 2016 do roku 2021. Interpretován byl vývoj osobní i nákladní dopravy podle počtu a hmotnosti souprav. Pomocí časových řad byly odhaleny výkyvy v provozu a také především vliv pandemie na osobní a nákladní dopravu v letech 2020 a 2021. Na úsecích celostátních tratí byl obecně velký počet osobních vlakových souprav a provoz byl zatížen menšími výkyvy. Situace na jaře 2020 byla individuální. U některých úseků došlo k poklesu až o 500 nákladních vlaků za měsíc, na jiných nebyl provoz ovlivněn. Na úsecích celostátních tratí probíhá pravidelná nákladní doprava s velkým významem. Pandemie nejvíce postihla provoz na regionálních tratích, kdy v posledních dvou letech na těchto tratích docházelo k častým a výrazným propadům v osobní dopravě. Provoz nákladní dopravy je na těchto tratích relativně nízký.
Na úsecích v blízkosti průmyslových areálů byla nákladní doprava ovlivněna především na jaře 2020. Nejvíce byl zasažen úsek v blízkosti automobilky Hyundai Nošovice. Tyto zjištění potvrdily tezi o utlumení průmyslové výroby na počátku šíření covidu-19 v ČR. V roce 2021 již nebyly ovlivnění tak výrazné. Minimální dopady pandemie byly na tratě se specifickým provozem. Naopak výrazně byla ovlivněna doprava na hraničních přechodech. Na základě rozhodnutí o uzavření státních hranic neprojel hraničními přechody v dubnu a květnu 2020 žádný osobní vlak
Klasifikace tratí
Hlavními výsledky této části byly klasifikované železniční úseky podle měsíčních a ročních hodnot počtu a hmotnosti osobních a nákladních vlaků. Vyzkoušeny byly dva přístupy zpracování využitím hierarchického shlukování a shlukováním metodou k-means. Pro obě metody byly sestaveny modely v programu Orange. Experimentováno bylo s různými kombinacemi metod, metrik a cílových počtů shluků. U hierarchického shlukování se nejvíce osvědčila Wardova metoda s využitím Mahalanobisovy nebo Euklidovy vzdálenosti. Specificky odlišný provoz byl odhalen na úsecích Bohumín-Vrbice st. hr. – Bohumín-Vrbice S618a a Bohumín-Vrbice – Bohumín-Vrbice S618. Tyto dva úseky měly tendenci se shlukovat do samostatného shluku. Provoz zde byl specifický velmi nízkým podílem osobní dopravy, ale velmi vysokým počtem a hmotností nákladních vlaků. Úseky podobné nízkým provozem byly především na regionálních tratích. Na tratích se sezonním provozem nebo pouze nákladní dopravou byl minimální provoz. Rozdíly ve výsledcích hierarchického a k-means shlukování byly zanedbatelné.
Výsledky shlukování časových os s dlouhodobým časovým rozmezím nebyly relevantní kvůli vysokým průměrným vzdálenostem mezi objekty shluku a složité interpretaci. Klasifikovány byly tratě s podobným průběhem provozu v letech 2016–2019, tedy v době před pandemii covidu, v roce 2020 a poté 2021. Pro shlukování hodnot za jeden rok bylo jako lepší řešení vyhodnoceno použití Euklidovy metriky. Výsledky byly uspokojivé a lze v nich najít podobu s výsledky předchozích analýz.
Závěr
Hlavním cílem diplomové práce bylo na základě dat provozu na železnici provést klasifikaci a časovou analýzu provozu na regionálních a celostátních tratích Olomouckého a Moravskoslezského kraje. Práce byla rozdělena do několika částí, kdy nejdůležitější poznatky přinesla časová analýza a klasifikace tratí. Výsledky byly často rozlišovány podle druhu dopravy a roku.
Pro potřeby navržených analýz bylo nutné provést předzpracování dat. Z primárních dat byly vybrány pouze údaje o železnici v Olomouckém a Moravskoslezském kraji, a popsán postup tvorby prostorových dat, který zahrnuje kategorizaci celostátních a regionálních tratí. Dílčím úsekům tratí byl doplněn atribut čísla tratě podle jízdního řádu. Takto byla vytvořena prostorová data železniční sítě v regionu. Hodnoty vybraných atributů byly očištěny od kalendářních vlivů, aby nebyly ovlivněny křivky časových řad. Na vytvořených vrstvách železničních úseků a monitorovacích bodů SR70 byly vizualizovány naměřené hodnoty provozu a výsledky analýz.
Před zpracováním časové analýzy byly navrženy metody, kterými lze odhalit výkyvy v provozu nebo identifikovat tratě se sezónním provozem. Z časových řad byl vyhodnocen provoz osobní i nákladní železniční dopravy v letech 2016 až 2021. Na celostátních tratích došlo k hromadným propadům osobní i nákladní dopravy v roce 2020 kvůli pandemii covidu-19. Podle počtu nákladních vlaků však na těchto tratích od roku 2020 roste význam nákladní dopravy. Na regionálních tratích v průběhu let docházelo k častým výkyvům. Nejhorší situace nastala v době pandemie covidu-19, kdy v letech 2020 a 2021 byly obrovské propady počtu osobních vlaků. Počet nákladních vlaků na těchto tratích se v dlouhodobém horizontu snižuje.
Výchozí metodou klasifikace tratí podle podobného provozu bylo hierarchické shlukování. Výsledky byly porovnány s výsledky metody k-means. Tím byly klasifikovány úseky podle podobného měsíčního nebo ročního provozu. Úseky byly klasifikovány také podle podobného časového průběhu provozu pomocí shlukování podle časových řad s využitím metody dynamického borcení časové osy. Shlukování bylo realizováno pomocí naprogramovaného skriptu v jazyce R.
Summary
The main objective of the thesis was to perform a classification and time analysis of the traffic on the regional and national lines of the Olomouc and Moravian-Silesian regions on the basis of railway traffic data. The thesis was divided into several parts, with the most important findings being the time analysis and classification of the lines. The results were often differentiated by mode of transport and year.
For the purpose of the proposed analyses, it was necessary to perform data preprocessing. From the primary data, only data on railways in the Olomouc and Moravian-Silesian regions were selected, and the procedure of spatial data creation was described, which includes categorization of national and regional lines. The attribute of the line number according to the timetable was added to the line sections. In this way, spatial data of the railway network in the region was created. The values of the selected attributes were adjusted for calendar effects so as not to affect the time series curves. Measured traffic values and analysis results were visualized on the created layers of rail segments and SR70 monitoring points.
Prior to the time series analysis, methods were proposed to detect fluctuations in traffic or to identify lines with seasonal traffic. From the time series, passenger and freight rail traffic was evaluated from 2016 to 2021. There were cumulative drops in passenger and freight traffic on statewide lines in 2020 due to the covid-19 pandemic. However, based on the number of freight trains, freight traffic on these lines is increasing in importance starting in 2020. Regional lines have experienced frequent fluctuations over the years. The worst situation occurred during the covid-19 pandemic, with huge drops in passenger train numbers in 2020 and 2021. The number of freight trains on these lines has been declining over the long term.
The initial method of classifying lines by similar traffic was hierarchical clustering. The results were compared with the results of the k-means method. This classified sections according to similar monthly or annual traffic. Sections were also classified according to similar traffic timing by clustering by time series using the dynamic time axis boring method. Clustering was implemented using a script programmed in R.
Kontakt
Autor
Bc. Lukáš POSPÍŠIL
E-mail: l.pospisil01@gmail.com
Vedoucí práce
doc. Ing. Zdena DOBEŠOVÁ, Ph.D.
E-mail: zdena.dobesova@upol.cz
Ke stažení
Text práce
Poster
Přílohy
Elements
Text
This is bold and this is strong. This is italic and this is emphasized.
This is superscript text and this is subscript text.
This is underlined and this is code: for (;;) { ... }
. Finally, this is a link.
Heading Level 2
Heading Level 3
Heading Level 4
Heading Level 5
Heading Level 6
Blockquote
Fringilla nisl. Donec accumsan interdum nisi, quis tincidunt felis sagittis eget tempus euismod. Vestibulum ante ipsum primis in faucibus vestibulum. Blandit adipiscing eu felis iaculis volutpat ac adipiscing accumsan faucibus. Vestibulum ante ipsum primis in faucibus lorem ipsum dolor sit amet nullam adipiscing eu felis.
Preformatted
i = 0;
while (!deck.isInOrder()) {
print 'Iteration ' + i;
deck.shuffle();
i++;
}
print 'It took ' + i + ' iterations to sort the deck.';