Podstawy Data Science 2401-AI-PDS-1WSI-s2
W ramach zajęć Podstaw Data Science uczestnicy zostaną zapoznani z fundamentalnymi metodami analizy danych, stosowanymi w tej interdyscyplinarnej dziedzinie łączącej aspekty statystyki, informatyki oraz analizy biznesowej. Podczas kursu studenci zapoznają się z podstawami pozyskiwania, przetwarzania, eksploracji i modelowania danych, aż po ich interpretację i przystępną prezentację wyników. Przedstawione zostaną w wyborze biblioteki programistyczne, które pozwalają na zapoznanie się z fundamentalnymi zagadnieniami nauki o danych. Prace projektowe oparte na wykorzystaniu bibliotek programistycznych są prowadzone z wykorzystaniem narzędzi sztucznej inteligencji (m.in. ChatGPT, Google Gemini).
Tematy realizowane na zajęciach:
Wykład:
1. Historia Data Science (zakresy działalności, obszary badawcze, definicje)
2. Eksploracja danych
3-4. Podstawowe narzędzia Data Science (języki programowania, biblioteki programistyczne, narzędzia)
5. Modelowanie i ewaluacja danych (EDA, wizualizacja wyników, monitoring modeli)
Laboratorium:
1. Przechwytywanie danych z WWW i PDF (z asystą sztucznej inteligencji)
2. Przechwytywanie danych z arkuszy kalkulacyjnych i podstawowa wizualizacja wyników (z asystą sztucznej inteligencji)
3. Przechwytywanie danych z dokumentów tekstowych i prezentacji multimedialnych (z asystą sztucznej inteligencji)
4. Obsługa relacyjnych baz danych (z asystą sztucznej inteligencji)
5. Odczytywanie stron WWW - tworzenie indeksów (z asystą sztucznej inteligencji)
6. Tworzenie wyszukiwarki dla domeny (z asystą sztucznej inteligencji)
7, Projekt zaliczeniowy (projekt podsumowujący poznane zagadnienia - asystą sztucznej inteligencji)
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne
Metody dydaktyczne podające
- wykład konwersatoryjny
Metody dydaktyczne poszukujące
- laboratoryjna
- projektu
Rodzaj przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
Kryteria oceniania
Wykład:
1. Egzamin testowy - W1, W2, K1, K2.
Laboratorium:
1. Aktywność i obecność na zajęciach - W1, W2, U1, U2
2. Realizacja projektów zaliczeniowych - W1, W2, U1, U2, K1, K2
Kryteria oceniania:
- test (próg zaliczenia - powyżej 50% poprawnych odpowiedzi)
- aktywność i obecność na zajęciach (laboratorium - do 20% oceny)
- ocena z realizacji projektów (laboratorium - o 80% oceny) – w tym zadań potwierdzających realizację treści wynikających z wykorzystania metod i technik kształcenia na odległość (moodle)
Ostateczna ocena z zajęć:
5 – 90% i więcej
4+ – 80% do 89%
4 – 70% do 79%
3+ – 60% do 69%
3 – 51% do 59%
2 – 50% i poniżej
Praktyki zawodowe
brak
Literatura
Literatura podstawowa:
1. W. McKinney, Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i numpy oraz środowiska ipython, Gliwice 2018.
2. R. Mitchell, Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu, Gliwice 2019.
3. J. Grus, Data science od podstaw. Analiza danych w pythonie, Gliwice 2018.
4. M. Kleppmann, Przetwarzanie danych w dużej skali. Niezawodność, skalowalność i łatwość konserwacji systemów, Gliwice 2018.
5. A. Boschetti, L. Massaron, Python. Podstawy nauki o danych, Gliwice 2017.
6. ChatGPT [online] [dostęp: 23.08.2024]. Dostępny w World Wide Web: https://chatgpt.com/.
7. Gemini [online] [dostęp: 12.03.2025]. Dostępny w World Wide Web: https://gemini.google.com/.
Literatura uzupełniająca:
1. Z. A. Shaw, Python 3. Proste wprowadzenie do fascynującego świata programowania, Gliwiice 2017.
2. P. Deitel, H. Deitel, Python dla programistów z analizami przypadków wprowadzających w tematykę sztucznej inteligencji, Gliwice 2020.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: