Eksploracja danych 1000-MS1-EDanych
W czasie zajęć realizowane będą następujące zagadnienia: zrozumienie danych i ich wstępna obróbka, klasyfikacja i algorytmy klasyfikacyjne (k-nn, naiwany klasyfikator bayesowski, regresja logistyczna, drzewa decyzyjne, lasy losowe, drzewa wyjątkowo losowe, sieci neuronowe, SVM), regresja i algorytmy szacowania (k-nn, regresja liniowa, drzewa CRT, sieci neuronowe), grupowanie (metodami k średnich i k medoidów, hierarchiczną, dwustopniową analizą skupień, DBSCAN), analiza koszykowa, metody redukcji wymiaru, metody selekcji zmiennych, metody oceny jakości modeli uczenia nadzorowanego i nienadzorowanego, prognozowanie z wykorzystaniem metod uczenia maszynowego.
Wszystkie zagadnienia omówione na wykładzie będą następnie ilustrowane ćwiczeniami praktycznymi na zajęciach laboratoryjnych z użyciem języka programowania Python.
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne eksponujące
Metody dydaktyczne podające
Metody dydaktyczne poszukujące
- studium przypadku
- laboratoryjna
Metody dydaktyczne w kształceniu online
- metody rozwijające refleksyjne myślenie
Koordynatorzy przedmiotu
Kryteria oceniania
Egzamin pisemny testowy lub ustny (w zależności od sytuacji pandemicznej) – W01, W02
Zaliczenie laboratorium na podstawie m.in. obecności, testów, zadań domowych oraz projektu końcowego – W03, U01-U04, K01, K02
Praktyki zawodowe
Nie dotyczy.
Literatura
Literatura podstawowa:
1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.
2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012.
3. Ch. D. Larose, D. T. Larose: ,,Data Science Using Python and R''. Wiley, 2019.
4. Aktualna dokumentacja narzędzi informatycznych wykorzystywanych na laboratoriach.
Literatura uzupełniająca:
5. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013.
6. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf).
7. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/).
8. Paweł Cichosz: ,,Data Mining Algorithms Explained Using R’’. Wiley, 2015.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: