Eksploracja danych 1000-MS1-EksDan
W czasie zajęć realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja i algorytmy klasyfikacyjne (k-nn, drzewa decyzyjne i lasy losowe, sieci neuronowe), regresja i algorytmy szacowania (k-nn, drzewa CRT, sieci neuronowe), grupowanie (metodami k średnich, hierarchiczną, dwustopniową analizą skupień, sieciami Kohonena), analiza koszykowa oraz metody redukcji wymiaru.
Wszystkie zagadnienia omówione na wykładzie będą następnie ilustrowane ćwiczeniami praktycznymi na zajęciach laboratoryjnych z użyciem środowiska R, języka programowania Python, programów KNIME i IBM SPSS Statistics.
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne
Metody dydaktyczne eksponujące
Metody dydaktyczne podające
Metody dydaktyczne poszukujące
- projektu
- studium przypadku
Metody dydaktyczne w kształceniu online
- metody rozwijające refleksyjne myślenie
Wymagania wstępne
Koordynatorzy przedmiotu
Kryteria oceniania
Egzamin pisemny testowy lub ustny (w zależności od sytuacji pandemicznej) – W01, W02
Zaliczenie laboratorium na podstawie m.in. obecności, testów, zadań domowych oraz projektu końcowego – W03, U01-U04, K01, K02
Praktyki zawodowe
Nie dotyczy
Literatura
Literatura podstawowa:
1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.
2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012.
3. Ch. D. Larose, D. T. Larose: ,,Data Science Using Python and R''. Wiley, 2019.
4. Aktualna dokumentacja narzędzi informatycznych wykorzystywanych na laboratoriach.
Literatura uzupełniająca:
5. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013.
6. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf).
7. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/).
8. Paweł Cichosz: ,,Data Mining Algorithms Explained Using R’’. Wiley, 2015.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: