Wprowadzenie do eksploracji danych
1000-MS1WprEks
W czasie zajęć realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, eksploracyjna analiza danych, algorytm k najbliższych sąsiadów, metody oceny jakości algorytmów uczenia nadzorowanego, prosta regresja liniowa, grupowanie metodą k średnich i ocena jakości grupowania.
W ramach laboratoriów uczestnicy zajęć zostaną zapoznani z podstawowymi pakietami języka programowania Python używanymi w analizie danych oraz będą mieli możliwość przećwiczenia teorii wprowadzonej na wykładzie na przykładzie analizy rzeczywistych zbiorów danych.
Całkowity nakład pracy studenta
Wykład – 15 godz.
Laboratorium – 30 godz.
Studiowanie literatury i materiałów zamieszczonych przez prowadzących oraz przygotowanie się do sprawdzianów – 20 godz.
Wykonanie projektów zleconych przez prowadzących zajęcia, konsultacje z prowadzącymi zajęcia – 35 godz.
Razem: 100 godz.– 4 punkty ECTS
Efekty uczenia się - wiedza
W01 - Zna najważniejsze zagadnienia eksploracji danych dotyczące klasyfikacji, grupowania i szacowania (K_W01, K_W03).
W02 - Dla każdego z podstawowych problemów eksploracji danych zna przynajmniej jeden algorytm stosowany do jego rozwiązania (K_W03, K_W06).
W03 - Orientuje się w dostępnym na rynku oprogramowaniu do eksploracji danych, zna w stopniu podstawowym przynajmniej jeden taki program (K_W04, K_W07).
Efekty uczenia się - umiejętności
U01 - Potrafi znaleźć potrzebne dane w zbiorach danych ogólnie dostępnych, umie pobrać dane i poddać je eksploracyjnej analizie danych (K_U21).
U02 - Umie przekształcić dane do formy właściwej dla dalszych analiz, umie postępować z brakami danych, potrafi zaproponować przynajmniej jeden algorytm eksploracji danych do konkretnego zagadnienia, w tym klasyfikacji, grupowania i szacowania (K_U02, K_U19).
U03 - Umie posługiwać się w stopniu podstawowym przynajmniej jednym programem do eksploracji danych (K_U03).
U04 - Potrafi przygotować raport z wynikami swoich analiz oraz zastosować zbudowany model do klasyfikacji, szacowania lub przewidywania w oparciu o nowy zbiór danych (K_U05).
Efekty uczenia się - kompetencje społeczne
K01 - Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków (K_K03).
K02 - Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych (K_K04).
Metody dydaktyczne
Pokaz, wykład informacyjny (konwencjonalny), laboratoryjna, projektu, studium przypadku, metody dydaktyczne odnoszące się do autentycznych lub fikcyjnych sytuacji, metody rozwijające refleksyjne myślenie.
Metody dydaktyczne eksponujące
- pokaz
Metody dydaktyczne podające
- wykład informacyjny (konwencjonalny)
Metody dydaktyczne poszukujące
- studium przypadku
- laboratoryjna
- projektu
Metody dydaktyczne w kształceniu online
- metody rozwijające refleksyjne myślenie
- metody odnoszące się do autentycznych lub fikcyjnych sytuacji
Wymagania wstępne
Zaliczenie przedmiotu Statystyka opisowa
Koordynatorzy przedmiotu
Kryteria oceniania
Zaliczenie wykładu na podstawie obecności lub sprawdzianu pisemnego weryfikującego osiągnięcie efektów W01-W03.
Zaliczenie laboratorium na podstawie testów pisemnych oraz projektów (W01-W03, U01-U04, K01-K02).
Literatura
1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.
2. Jake VanderPlas: ,,Python Data Science. Niezbędne narzędzia do pracy z danymi''. Wydawnie II, Wydawnictwo Helion.
3. Wes McKinney: ,,Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter.'' Wydanie III, Wydawnictwo Helion.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i
terminach zajęć) mogą być dostępne w serwisie USOSweb: