Text Mining 2401-AI-TM-2WSI-s2
Podstawowym zadaniem podejmowanym podczas realizacji zajęć jest zapoznanie uczestników z metodami i technikami eksploracji danych tekstowych oraz przetwarzania języka naturalnego (ang. Natural Language Processing). Zajęcia obejmują takie zagadnienia jak analiza sentymentu, wykrywanie tematów, oraz analizę dużych zbiorów danych tekstowych. Przeprowadzone ćwiczenia zakładają samodzielną pracę, z możliwością wsparcia procesu programowania o wykorzystanie rozwiązań sztucznej inteligencji (m.in. ChatGPT, Gemini Google).
Tematy realizowane na zajęciach:
1. Przygotowanie środowiska pracy (narzędzia, wymagane biblioteki programistyczne)
2. Czyszczenie danych, tokenizacja, analiza częstości (z asystą sztucznej inteligencji)
3. Analiza trendów (z asystą sztucznej inteligencji)
4. Programy analizujące dane z Internetu (z asystą sztucznej inteligencji)
5-6. Porównywanie tekstów (z asystą sztucznej inteligencji)
7. Programy do analizy tekstów (m.in. Orange Data Mining)
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne
Metody dydaktyczne podające
Metody dydaktyczne poszukujące
- ćwiczeniowa
- projektu
Rodzaj przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
W cyklu 2025/26Z: | W cyklu 2023/24Z: | W cyklu 2024/25Z: |
Kryteria oceniania
1. Obecność i aktywność w zajęciach dydaktycznych (możliwa jedna nieobecność) – U1, U2, K1, K2
2. Indywidualne zadania praktyczne (projekty) z wykorzystaniem poznanych rozwiązań – W1, W2, U1, U2
3. Prezentacja indywidualnych zadań (i/lub odpowiedź z zakresu wykorzystanych w nim rozwiązań) – W1, W2, U1, U2, K1, K2
Kryteria oceniania:
- aktywność na zajęciach (do 20% oceny)
- indywidualne zadania realizowane podczas zajęć, związane z przetwarzaniem zbiorów tekstowych (do 80% oceny)
Ostateczna ocena z zajęć:
5 – 90% i więcej
4+ – 80% do 89%
4 – 70% do 79%
3+ – 60% do 69%
3 – 51% do 59%
2 – 50% i poniżej
Praktyki zawodowe
nie dotyczy
Literatura
Literatura podstawowa:
1. George A., Python Text Mining, BPB Publications 2022.
2. Danneman N. H., Heimann R., Mishra P., Makhabel B., Mining the Social Web. Data Mining Facebook, Twitter, LinkedIn, Instagram, GitHub, and More, O'Reilly 2018.
3. Avinash P., Ashish K., Mastering Text Mining with R. Extract and recognize your text data, Packt Publishing 2016.
4. Dzieciątko M., Spinczyk D., Text Mining: metody, narzędzia i zastosowania, Warszawa 2016.
5. McKinney W., Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i numpy oraz środowiska ipython, Gliwice 2018.
6. Mitchell R., Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu, Gliwice 2019.
7. ChatGPT [online] [dostęp: 23.08.2024]. Dostępny w World Wide Web: https://chatgpt.com/.
8. Gemini [online] [dostęp: 12.03.2025]. Dostępny w World Wide Web: https://gemini.google.com/.
Literatura uzupełniająca:
1. Bird S., Klein E., Loper E., Natural Language Processing with Python
– Analyzing Text with the Natural Language Toolkit [online] [Dostęp: 20.05.2023]. Dostępny w World Wide Web: https://www.nltk.org/book/.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: