Programování v Pythonu – Data Science (FSI-VPD)

Akademický rok 2021/2022
Garant: prof. Ing. Radomil Matoušek, Ph.D.  
Garantující pracoviště: ÚAI všechny předměty garantované tímto pracovištěm
Jazyk výuky: čeština
Cíle předmětu:
Porozumět využití jazyka Python a jeho knihoven (pandas, numpy, matplotlib aj.) pro oblast Data Science. Pokročilé programování v Pythonu.
Výstupy studia a kompetence:
Po úspěšné zvládnutí předmětu budou studenti schopni využít znalosti v praktických oblastech Data Science. Hlavním cílem datových specialistů je vyčistit a analyzovat velká data.
Prerekvizity:
Základy programování na úrovni kurzu VP0 (Programování v Pythonu).
Obsah předmětu (anotace):
Studenti budou s využitím programovacího jazyka Python a jeho knihoven, řešit úlohy z oblasti Data Science.
Metody vyučování:
Programování pomocí příkladů z oblasti Data Science.
Způsob a kritéria hodnocení:
Aktivní účast a zvládnutí zadaného problému v požadované kvalitě.
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky:
Výuka běží podle týdenních plánů. Účast na cvičeních je povinná. Způsob nahrazení zameškaných cvičení je plně v kompetenci vyučujícího.
Typ (způsob) výuky:
    Přednáška  13 × 1 hod. nepovinná                  
    Cvičení s počítačovou podporou  13 × 2 hod. povinná                  
Osnova:
    Přednáška P1: Přehled základních metod strojového učení a aplikované statistiky.
P2: Pokročilé metody strojového učení. Kombinace učících algoritmů. Učení v multirelačních datech. Dolování v grafech a sekvencích.
P3: Big data analytics. Teorie strojového učení Bias-varinace tradeoff. Modely učení. Vizualizace dat.
P4: Hledání častých vzorů a asociačních pravidel: algoritmus Apriori; alternativy; časté vzory v multirelačních datech. Detekce odlehlých bodů.
P5: Dobývání znalostí z vybraných typů dat: dolování v textu, dolování v temporálních a časově prostorových datech, dobývání znalostí z webu, biologické vědy a bioinformatika.
    Cvičení s počítačovou podporou Projektovou formou reflektuje cvičení obsah přednášek (4 projekty i s obhajobou, checkpointy).
Literatura - základní:
1. VANDERPLAS, Jacob T., [2017]. Python data science handbook: essential tools for working with data. Beijing: O'Reilly. ISBN 978-1-4919-1205-8.
2. BERKA, Petr, 2003. Dobývání znalostí z databází. Praha: Academia. ISBN 80-200-1062-9.
3. VANDERPLAS, Jacob T., [2017]. Python data science handbook: essential tools for working with data. Beijing: O'Reilly. ISBN 978-1-4919-1205-8.
Zařazení předmětu ve studijních programech:
Program Forma Obor Spec. Typ ukončení   Kredity     Povinnost     St.     Roč.     Semestr  
N-AIŘ-P prezenční studium --- bez specializace -- kl 4 Povinně volitelný 2 1 L