Základy zpracování dat (FSI-SZD-A)

Akademický rok 2025/2026
Garant: doc. Mgr. Zuzana Hübnerová, Ph.D.  
Garantující pracoviště: ÚM všechny předměty garantované tímto pracovištěm
Jazyk výuky: angličtina
Cíle předmětu:

Základní koncepty a nástroje pro manipulaci s daty. Tato témata budou probírána i s ukázkou implementace:

  • databáze (dotazování, indexování)
  • vizualizace
  • základní statistika
  • regresní analýza a strojové učení
  • práce s geografickými daty
Výstupy studia a kompetence:
 
Prerekvizity:

Základy programování.

Základy popisné statistiky, teorie pravděpodobnosti a matematické statistiky.

Obsah předmětu (anotace):

Předmět je zaměřen na základní práci s daty: představení databází a efektivní práci s nimi; základy statistického zpracování - lineární regrese, strojové učení; vizualizace výsledků, včetně geografických výstupů. Hlavní důraz předmětu je na praktické aspekty, všechny představené koncepty jsou implementovány v programovacím jazyce python.

Metody vyučování:
 
Způsob a kritéria hodnocení:

Během semestru budou studenti pracovat na dvou vlastních projektech zaměřených na i) práci s databázemi ii) zpracování a prezentaci dat (interaktivní dashboad).
Tyto projekty jsou povinné pro udělení zápočtu. Ať už s využitím těchto dílčích projektů nebo nezávisle na nich student zpracuje individuálně finální projekt zaměřený na zpracování dat, jehož téma bude s vyučujícím dopředu zkonzultováno. Zkouška probíhá ústně formou rozpravy nad tímto projektem, jenž bude ohodnocen na stupnici 0 - 100.

Hodnocení podle bodů: výborně (90 až 100 bodů), velmi dobře (80 až 89), dobře (70 až 79 bodů), uspokojivě (60 až 69 bodů), dostatečně (50 až 59 bodů), nevyhovující (0 až 49 bodů).

Účast na cvičeních je povinná. Během semestru jsou tolerovány dvě neomluvené absence. Nahrazení zameškané výuky určí vedoucí cvičení.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky:
 
Typ (způsob) výuky:
    Přednáška  13 × 2 hod. nepovinná                  
    Cvičení s počítačovou podporou  13 × 2 hod. povinná                  
Osnova:
    Přednáška

Úvod do databází 
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)


Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody 
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python - mapové podklady - vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese - základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.

    Cvičení s počítačovou podporou

Úvod do databází
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)


Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python - mapové podklady - vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese - základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.

Literatura - základní:
1.

Sharpe, NR, Veaux, RDD, Velleman.  PF. Business statistics. Pearson, 2017.

4.

Larsen, R., Marx, M., Introduction to Mathematical Statistics and Its Applications, 6nd ed., 2017. ISBN: 978-01341142178

Zařazení předmětu ve studijních programech:
Program Forma Obor Spec. Typ ukončení   Kredity     Povinnost     St.     Roč.     Semestr  
N-LAN-A prezenční studium --- bez specializace -- zá,zk 6 Povinný 2 1 Z