Diplomová práce

Cíle práce

Hlavním cílem diplomové práce je provést pokročilou analýzu dat a následně výsledky prezentovat prostřednictvím nástrojů webové kartografie.

První část práce je zaměřena na pokročilou analýzu dat, kdy výchozí datovou sadu tvoří dotazníkové šetření Katedry geoinformatiky UP z roku 2019, které bylo realizováno v rámci bakalářské práce Marie Šabatové (2019). Je provedena rešerše dalších existujících datových sad spjatých s Katedrou geoinformatiky, a dat potenciálně přínosných v nadcházejících analýzách. Nejsou opomenuty zejména data ze Studijní agendy Univerzity Palackého v Olomouci, data z Českého statistického úřadu (demografické charakteristiky, dojížďka apod.) a data z Ministerstva školství, mládeže a tělovýchovy (např. projekt KREDO). Výstupem této fáze je seznam všech dostupných datových sad, z nichž jsou dále selektovány sady pro analýzy.

Součástí teoretické části práce je koncepční vymezení, jaké analýzy je možné díky kombinaci uvedených datových zdrojů realizovat. Jsou definována klíčová témata, jejichž analýza přináší ověření všeobecně míněných předpokladů a objevení nových překvapivých souvislostí. Důraz je kladen, mimo jiné, na uplatnitelnost zjištění v praxi, např. v oblasti popularizace a propagace katedry. Výsledkem této části práce je soubor poznatků, a to v podobě získaných údajů, interpretace souvislostí a v podobě mapových výstupů.

Druhá část práce je zaměřena na vizualizaci dat a získaných výsledků ve webovém prostředí. Autor zde prezentuje zjištěné výsledky, a to s ohledem na dále stanovenou cílovou skupinu a její zájmy. Cílová skupina je stanovena na základě charakteru zjištěných poznatků. Web má podobu funkční, interaktivní a dynamické vizualizace s důrazem na moderní kartografické přístupy, a splňuje současné standardy webové tvorby (responzivní, multiplatformní, uživatelsky přívětivý apod.).

Vedlejším cílem práce je sumarizovat poznatky nabyté při zpracovávání existujících dat a vytvořit seznam doporučení pro jejich další sběr a práci s nimi. Sestavená doporučení by měla umožnit dalším autorům na odvedenou práci snadno navázat a aplikovat poznatky do vlastní vědecké činnosti.

Práce si klade za cíl provést rešerši dostupných datových sad, sady popsat a selektovat z nich potenciálně nejpřínosnější, provést jejich analýzu a odprezentovat zjištění formou atraktivní webové vizualizace. Ta by mohla najít uplatnění mimo jiné např. v oblasti popularizace katedry, či jako demonstrace dosažitelných poznatků, a případně jako motivace pro uplatnění analytických metod ve větším měřítku (např. fakultním, univerzitním).

Metody

Online dotazník

Pro výběr témat vhodných k analýze byl v prostředí Google Sheets sestaven jednoduchý online dotazník, který byl rozeslán vybraným akademickým pracovníkům Katedry geoinformatiky pro zjištění jejich expertního názoru. Dotazník měl podobu křížové matice dostupných témat, přičemž respondenti označovali kombinace považované za potenciálně přínosné či zajímavé. Kromě vyznačení kombinace byli vyzváni i k přiložení stručného komentáře zdůvodňujícího jejich výběr. Přestože je nástroj Google Sheets tabulkový procesor a není primárně určen pro tvorbu dotazníku, byl vybrán pro svou jednoduchost a možnost cloudového sdílení. Protože se počet dotazovaných respondentů pohyboval v řádech jednotek, vyplněné dotazníky nebylo nutné sbírat s využitím sofistikovanějšího nástroje.

Delfská metoda

Témata vhodná k analýze byla stanovena pomocí metody získávání expertních výpovědí, tzv. delfskou metodou. Tu lze charakterizovat jako písemné dotazování (na základě formalizovaných dotazníků) založené na postupném zjišťování prognóz (názorů) expertů (Šulc, 1987). Spolu s respondenty byly kombinace ohodnoceny i autorem práce. Každé kombinaci témat bylo jednoduchou bodovací metodou podle počtu hlasů přiřazeno hodnocení. Hlasy všech respondentů i hlas autorův měly rovnocennou váhu. Kombinace témat s nejvyšším počtem bodů byly vybrány k analýze.

Metody tematické kartografie

Při analýze dat a tvorbě mapových výstupů byla využita celá řada konvenčních metod tematické kartografie. Nejčastěji byly při vizualizacích voleny metody bodové a areálové. Použité metody byly vybrány s ohledem na charakter analyzovaných dat, zejména přepočet kvantitativního jevu na jednotku plochy, a znázornění kvantitativních jevů v absolutních hodnotách. Cílem této práce není dopodrobna metody popsat, proto je zde uveden pouze jejich výčet. Použité metody blíže popisují Voženílek, Kaňok a kol. v publikaci Metody tematické kartografie (2011). Výčet je následující:

  • metody bodových, liniových a plošných znaků,
  • metoda kartogramu a kartodiagramu,
  • metoda gridu.

Mood board

Při tvorbě grafického návrhu webové prezentace byl vytvořen tzv. mood board, neboli koláž grafických prvků, barev a dalších designových inspirací vytvářejících celkový dojem, jenž by měl plynout z vytvořeného produktu (Trulock, 2008). Metoda umožňuje znázornit emoce a hodnoty, které lze slovy obtížně vyjádřit. Mood board nachází uplatnění v mnoha designérských oborech, v neposlední řadě v oboru grafického návrhu webových stránek a dalších digitálních produktů.

Block, Element, Modifier (BEM)

Block, Element, Modifier (zkráceně BEM) je metoda organizace HTML a CSS kódu. Jedná se o přístup webového vývoje kaskádových stylů založený na rozdělení uživatelského rozhraní do nezávislých bloků (Yandex, 2022). Metoda zavádí konvence v pojmenovávání komponent, umožňující rychlejší a snadnější vývoj webových stránek, s maximálním využitím existujících kaskádových stylů obsažených v projektu. Princip metody spočívá v rozdělení struktury rozhraní do nezávislých bloků (block), obsahujících vlastní prvky (element). Bloky se mohou v projektu vyskytovat v různých podobách a stavech, které jsou definovány jako modifikace původního bloku (modifier).

Architektura 7-1

Architektura 7-1 (nebo také vzor 7-1) je oficiálně nezdokumentovaným, avšak de facto standardním a konvenčním přístupem k organizaci a strukturování kaskádových stylů uvnitř webového projektu. Metoda je založena na principu rozdělení CSS komponent do sedmi adresářů, lišících se úrovní abstrakce obsažených komponent. Adresáře mohou být podle potřeby vynechány, nebo upraveny vzhledem k požadavkům konkrétnímu projektu. Komponenty jsou poté načítány do jednoho hlavního souboru. Takové členění umožňuje naplno využívat dědičnosti CSS komponent a současně udržovat přehlednost v psaném kódu. Výsledkem je minimální a snadno škálovatelná CSS architektura. Metoda 7-1 je blíže popsána v komunitní dokumentaci technologie SASS, SASS Guidlines (2022), a v mnohých neodborných publikacích (Timothy Robards, Denis Buchenko a další).

Závěr

Cílem diplomové práce bylo provést pokročilou analýzu dat a následně výsledky prezentovat ve webovém prostředí. První část práce byla zaměřena na rešerši existujících datových sad úzce spjatých s Katedrou geoinformatiky a jejich následnou pokročilou analýzu. Ve druhé fázi bylo cílem zjištěné poznatky atraktivní formou prezentovat, a to s ohledem na stanovenou cílovou skupinu tak, aby byl v maximální možné míře využit potenciál získaných výstupů.

Prvním krokem bylo provedení rešerše dostupných datových zdrojů potenciálně přínosných v následujících analýzách. Bylo nalezeno celkem 12 datových sad úzce souvisejících s uchazeči, studenty a absolventy KGI. Z těchto sad byly dále selektovány pouze sady relevantní k analýze. Do užšího výběru bylo vybráno sedm datových sad poskytující relevantní atributy a dostatečně kvalitní a četný vzorek. Seznámení s analyzovaným materiálem proběhlo formou základního statistického vyhodnocení a vypracováním přehledové infografiky ke každé datové sadě.

Jako postup analýzy byla zvolena konfirmační metoda definovaných předpokladů. Z obsahu datových sad bylo vymezeno 15 témat vhodných k analýze a sestavena jejich křížová matice vzájemně kombinující témata mezi sebou. Formou dotazníkového šetření mezi vybranými akademickými pracovníky Katedry geoinformatiky UP byly vybrány nejzajímavější kombinace témat. Na jejich základě bylo sestaveno 12 předpokladů k ověření. Jednotlivé předpoklady byly statistickými a prostorovými metodami analyzovány a vyhodnoceny jako potvrzené nebo vyvrácené. Výstupem analýzy každého předpokladu je přehledová infografika.

Soubor zjištěných poznatků je prezentován formou webové vizualizace. Prezentace byla implementována prostřednictvím technologií moderního vývoje webu a splňuje veškeré požadavky současného webdesignu. Účelem webu je mimo samotnou prezentaci výsledků i podpora propagační činnosti Katedry geoinformatiky UP. Web je orientován na uchazeče o studium, a koncipován jako bližší představení katedry uchazečům a demonstrace uplatnění datové a prostorové analýzy.

Summary

The aim of this thesis is an advanced analysis of data relevant to the Department of Geoinformatics of the Palacký University Olomouc and subsequent visualisation of its findings, utilizing the tools of modern web design. The initial portion of the thesis is comprised of research and compilation of already existing data sets. The result of a narrower selection of these data sets was a survey, carried out among academic staff of the Department of Geoinformatics, which yielded 12 hypotheses.

The theoretical part of the thesis contains a brief research. The first practical part of this work is concerned with advanced statistical and spatial analysis of these hypotheses and as a result of which, these hypotheses were either confirmed or debunked. Each analysis is presented in the form of an infographical overview, showing the process, results, and the evaluation of these results. Paragraphs discussing the causes and results of these hypotheses are also included.

The second part of this work is the visualisation of the findings within a website environment. A secondary goal of this effort is to support the promotion effort of the Department of Geoinformatics, with the target audience being new applicants. In light of this, the website has been built with attractive visuals, and serves to introduce the Department in greater detail to the applicants, while also demonstrating the potential applications of data analysis. A list of recommendations for further collection and analysis of data of similar nature is, among other items, also a result of this work.