Aspekty informatyczne analizy danych 1000-AD-AspInAD
- https://plas.mat.umk.pl/moodle/course/view.php?id=2358 (w cyklu 2021/22L)
- https://moodle.mat.umk.pl/course/view.php?id=2622 (w cyklu 2022/23L)
- https://moodle.mat.umk.pl/course/view.php?id=2622 (w cyklu 2023/24L)
- https://moodle.mat.umk.pl/course/view.php?id=2622 (w cyklu 2024/25L)
Wykład
Program wykładu obejmuje wprowadzenie do systemów wielozadaniowych, przedstawienie podstawowych poleceń systemu przydatnych w przetwarzaniu plików z danymi, a także omówienie przygotowywania skryptów do wstępnego przetwarzania danych. Druga część wykładu będzie poświęcona zbieraniu danych ze stron internetowych. W trzeciej części omówione zostaną aspekty równoległego przetwarzania danych.
Laboratorium
Program zajęć laboratoryjnych obejmuje wprowadzenie do systemu operacyjnego LINUX i powłoki BASH. Treści omówione na wykładzie będą wykorzystane w praktyce do przygotowywania poleceń i skryptów pozwalających na wstępne przetworzenie pliku z danymi. Następnie omówione będzie wykorzystywanie języka Python do analizy danych z poziomu konsoli systemu LINUX. W dalszej części zajęć zostaną zaprezentowane sposoby zbierania danych z wykorzystaniem języka Python, a także zrównoleglanie obliczeń potrzebnych do analizy danych na przykładzie m.in. biblioteki Pandas.
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne podające
Metody dydaktyczne poszukujące
Rodzaj przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
Kryteria oceniania
Zaliczenie wykładu – W1, W2, W3, W4, W5, K2, K3
Sprawdziany i zadania o charakterze praktycznym – U1, U2, U3, U4, U5, U6, U7, K1, K2, K3
Aktywność na zajęciach – K2, K3
Praktyki zawodowe
Nie dotyczy
Literatura
- J. Armstrong, D. Taylor, UNIX dla każdego, Helion 2000.
- D. S. Ray, E. J. Ray, Po prostu UNIX, Helion 2000.
- Dokumentacja bibliotek języka Python: requests, scrapy. multiprocessing, pandas
- Parallel Processing in Python – A Practical Guide with Examples: https://www.machinelearningplus.com/python/parallel-processing-python/
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: