Narzędzia eksploracji danych 1000-MS1-NaEkDan
1. Zapoznanie z popularnymi narzędziami służącymi do analiz
i obliczeń statystycznych.
2. Tworzenie zbiorów danych, praca z przykładowymi zbiorami danych.
3. Import zbiorów danych z plików różnych formatów.
4. Transformacje zmiennych
a. przekształcanie,
b. rekodowanie.
5. Przekształcanie zbiorów danych
a. restrukturyzacja danych,
b. kategoryzacja danych,
c. agregacja danych,
d. łączenie danych,
e. wybór obserwacji, sortowanie, replikacja,
f. analiza danych w podgrupach.
6. Elementy języka poleceń (komendy) w IBM SPSS Statistics.
7. Struktury danych w R: wektory, macierze, listy, ramki danych.
8. Praca z pakietami R: instalacja, ładowanie do pamięci, praca z funkcjami i zbiorami danych dołączonych do pakietów.
9. Elementy programistyczne w R:
a. funkcje,
b. pętle,
c. instrukcje warunkowe.
Powyższe tematy będą realizowane w oparciu o co najmniej dwa narzędzia typu open source, w tym: środowisko programistyczne R (tematy nr 1-9), narzędzie z interfejsem opartym na przepływach zbudowanych z użyciem węzłów np. KNIME (tematy nr 1-5) oraz jedno narzędzie komercyjne, np. IBM SPSS Statistics (tematy nr 1-6), służące do wykonywania analiz i obliczeń statystycznych.
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne
Metody dydaktyczne podające
Metody dydaktyczne poszukujące
Wymagania wstępne
Koordynatorzy przedmiotu
Kryteria oceniania
Laboratorium kończy się zaliczeniem, które jest wystawiane na podstawie dwóch kolokwiów (w formie testów na Moodle), sprawdzających następujące efekty kształcenia: NED_W1, NED_W2, NED_U1, NED_U2, NED_K1, NED_K2.
Praktyki zawodowe
Nie dotyczy
Literatura
Przemysław Biecek, Przewodnik po pakiecie R, Oficyna Wydawnicza GiS, Wrocław, 2011.
Joseph Adler, R in a Nutshell, O’Reilly Media, 2010.
Knime Online Self-Training: https://www.knime.org/knime-online-self-training, data dostępu: 16.11.2021 r.
Learn RapidMiner: https://rapidminer.com/getting-started-central/, data dostępu: 16.11.2021 r.
Jarosław Górniak, Janusz Wachnicki, Pierwsze kroki w analizie danych. SPSS Polska Sp. z o. o., Kraków, 2010.
Uwagi
W cyklu 2022/23Z:
Oprogramowanie konieczne do pracy na zajęciach: |
W cyklu 2023/24Z:
Oprogramowanie konieczne do pracy na zajęciach: |
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: