Data mining dla niezaawansowanych 1000-OG-DM
W czasie kursu uczestnik zapozna się z programem PS IMAGO PRO oraz jego możliwościami. Realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja, drzewa klasyfikacyjno-regresyjne, podstawy sieci neuronowych, regresja liniowa, grupowanie i analiza koszykowa.
Każdy temat będzie zawierał krótki wstęp teoretyczny, materiał instruktażowy jak rozwiązać danych problem za pomocą PS IMAGO PRO, przykładowe zbiory danych, ćwiczenia do wykonania i zadania do rozwiązania.
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne
Metody dydaktyczne eksponujące
Metody dydaktyczne podające
Metody dydaktyczne poszukujące
- studium przypadku
Metody dydaktyczne w kształceniu online
Rodzaj przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
W cyklu 2023/24L: | W cyklu 2024/25L: | W cyklu 2022/23L: | W cyklu 2021/22L: |
Kryteria oceniania
- Krótkie testy po każdym z tematów zweryfikują efekty wiedzy W1-W3 i umiejętności U1-U4.
- Zadania zweryfikują efekt wiedzy W2, efekty umiejętności U1-U4 oraz efekty kompetencji społecznych K1-K3.
Praktyki zawodowe
Brak
Literatura
Literatura tradycyjna:
1. Bedyńska S., Książek M. (red.): Statystyczny drogowskaz 1. Praktyczne wprowadzenie do wnioskowania statystycznego. Warszawa, Wydawnictwo Akademickie Sedno, 2012.
2. Górniak J., Wachnicki J.: Pierwsze kroki w analizie danych. Kraków, SPSS Polska, 2004.
3. Daniel T. Larose: Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, Warszawa, 2013.
4. Daniel T. Larose: Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, Warszawa, 2012.
5. Tadeusz Morzy: Eksploracja danych. Metody i algorytmy. Wydawnictwo Naukowe PWN, Warszawa, 2013.
6. Bartosz Saramak: Wykorzystanie otwartych źródeł informacji w działalności wywiadowczej: historia, praktyka, perspektywy. WDiNP UW, Warszawa, 2015 (dostępne on-line: https://wnpism.uw.edu.pl/wp-content/uploads/2019/08/Wykorzystanie-otwartych-zrodel.pdf, dostęp z dn. 22.10.2020).
7. Sobczyk M.: Statystyka, Wydanie piąte uzupełnione. Warszawa, Wydawnictwo Naukowe PWN, 2020, str. 12-16.
8. Stephane Tuffery: Data Mining and Statistics for Decision Making. Wiley, 2011.
9. Xindong Wu, Vipin Kumar: The Top Ten Algorithms in Data Mining. Chapman & Holl/CRC, 2009.
Zasoby on-line:
1. Biecek P.: Odkrywać! Ujawniać! Objaśniać! Zbiór esejów o sztuce prezentowania danych.
http://www.biecek.pl/Eseje/ (dostęp z dn. 23.10.2020).
2. Polska Statystyka Publiczna https://bip.stat.gov.pl/dzialalnosc-statystyki-publicznej/polska-statystyka-publiczna/ (dostęp z dn. 21.10.2020).
3. Strona internetowa Discovering Statistics z tutorialami, filmami i zbiorami danych https://www.discoveringstatistics.com/ (dostęp z dn. 24.08.2020).
4. Strona internetowa IBM Knowledge Center z dokumentacją produktu IBM SPSS Statistics https://www.ibm.com/support/knowledgecenter/pl/SSLVMB_26.0.0/statistics_kc_ddita/spss/product_landing.html (dostęp z dn. 25.08.2020).
5. Predictive Solutions: Samouczek. http://samouczek.predictivesolutions.pl/ (dostęp z dn. 12.09.2020).
6. Predictive Solutions: Blog. https://predictivesolutions.pl/2,blog (dostęp z dn. 29.10.2020).
7. StatSoft: Internetowy Podręcznik Statystyki. https://www.statsoft.pl/textbook/stathome.html
(dostęp z dn. 25.10.2020).
8. Strona internetowa Towards Data Science: https://towardsdatascience.com/ (dostęp z dn. 30.10.2020).
9. Portal Sztuczna Inteligencja https://www.sztucznainteligencja.org.pl/ (dostęp z dn. 29.10.2020).
10. Narzędzia doboru kolorów na wykresach:
- http://paletton.com (dostęp z dn. 23.10.2020),
- https://colorbrewer2.org/ (dostęp z dn. 23.10.2020).
11. Przemysław Biecek: Przewodnik po pakiecie R 4.0 http://pbiecek.github.io/Przewodnik/ (dostęp z dn. 30.10.2020).
12. Strona domowa projektu R https://www.r-project.org/ (dostęp z dn. 27.10.2020).
Uwagi
W cyklu 2021/22L:
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
W cyklu 2022/23L:
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
W cyklu 2023/24L:
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
W cyklu 2024/25L:
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: