Tworzenie lingwistycznych baz danych 2518-s2LP1Z-TLBD
Problematyka spotkań obejmuje bloki tematyczne:
1. Wprowadzenie do językoznawstwa korpusowego: Definicje, historia, typy korpusów (pisane, mówione, synchroniczne, diachroniczne, jedno- i wielojęzyczne).
2. Podstawy teoretyczne i metodyczne: Reprezentatywność, zrównoważenie, wielkość korpusu. Rola językoznawstwa korpusowego w badaniach.
3. Tworzenie korpusu – gromadzenie danych: Źródła tekstów/danych, kwestie prawne (prawa autorskie), formaty danych. Przygotowanie danych tekstowych.
4. Oznaczanie korpusów (anotacja) – teoria: Poziomy anotacji (tokenizacja, lematyzacja, morfoskładnia – PoS tagging, składnia). Narzędzia i standardy anotacyjne.
5. Praktyczne aspekty oznaczania korpusów: Praca z automatycznymi taggerami morfoskładniowymi, weryfikacja i korekta anotacji. Narzędzia do anotacji.
6. Wyszukiwanie i analiza danych korpusowych: Wprowadzenie do języka zapytań korpusowych (np. CQP, CQL). Konkordancje, kolokacje, listy frekwencyjne.
7. Narodowy Korpus Języka Polskiego (NKJP): Struktura, zasoby, narzędzia (np. Poliqarp). Praktyczna praca z NKJP.
8. Inne ważne korpusy polskie i zagraniczne: Korpusy paralalne, korpusy historyczne, British National Corpus (BNC), Corpus of Contemporary American English (COCA).
9. Korpusy w badaniach leksykalnych i leksykografii: Wykorzystanie kolokacji, listy słów kluczowych (keywords) do tworzenia słowników i badań słownictwa.
10. Korpusy w badaniach gramatycznych: Badanie frekwencji konstrukcji składniowych, wariantywność językowa.
11. Metody statystyczne w analizie korpusowej. Podsumowanie.
12. Prezentacja projektów: Omówienie i konsultacje prac studenckich.
Całkowity nakład pracy studenta
Efekty uczenia się - wiedza
Efekty uczenia się - umiejętności
Efekty uczenia się - kompetencje społeczne
Metody dydaktyczne
Metody dydaktyczne podające
- wykład informacyjny (konwencjonalny)
- opis
Metody dydaktyczne poszukujące
- projektu
- studium przypadku
- laboratoryjna
Rodzaj przedmiotu
Wymagania wstępne
Koordynatorzy przedmiotu
Kryteria oceniania
Laboratoria:
1. Aktywność podczas zajęć (50%).
2. Zrealizowanie projektu (50%).
Ocena końcowa:
Na ocenę końcową składa się:
1. ocena z laboratorium (100%).
Skala ocen:
91%-100%: 5 (A)
81%-90%: 4+ (B)
71%-80%: 4 (C)
61%-70%: 3+ (D)
51%-60%: 3 (E)
<50%: 2 (F)
Literatura
Obowiązkowa
1. Barth, Danielle, Stefan Schnell. 2022. Understanding Corpus Linguistics. Routledge (Wybrane rozdziały).
2. Chlebda, Wojciech (red.). 2013. Na tropach korpusów: W poszukiwaniu optymalnych zbiorów tekstów. Rzeszów: Wydawnictwo Uniwersytetu Rzeszowskiego.
3. Przepiórkowski, Adam, Mirosław Bańko, Rafał L. Górski, and Barbara Lewandowska-Tomaszczyk (red.). 2012. Narodowy Korpus Języka Polskiego. Warszawa: PWN.
4. Zaśko-Zielińska Monika, Majewska-Tworek Anna, Śleziak Mart, Tworek Artur. 2020. Od rozmowy do korpusu. Lublin: Wydawnictwo UMCS.
Uzupełniająca
1. Paquot, Magali, Stefan Th. Gries (red.). 2020. A Practical Handbook of Corpus Linguistics. Cham: Springer.
2. Meyer, Charles F. 2002. English Corpus Linguistics: An Introduction. Cambridge: CUP.
3. Lewandowska-Tomaszczyk, Barbara (red.). 2005. Podstawy językoznawstwa korpusowego. Łódź: Wydawnictwo Uniwersytetu Łódzkiego.
4. Wybrane artykuły i materiały online (dokumentacja) dotyczące narzędzi korpusowych.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: