Eksploracja dużych zbiorów danych
0800-EDZBIOD
Program
(1h) Masywne Dane (3V), Uczenie Maszynowe,
(2h) Map/Reduce
(2h) Wyszukiwanie podobnych obiektów
(2h) Przetwarzanie strumieni Danych
(2h) Analiza sieci społecznościowych
(2h) Systemy Rekomendujące
(2h) Redukcja wymiarowości
Program (Laboratorium 30h):
(2h) Powtórzenie modeli danych, indeksów oraz funkcje skrótu
(2h) Map/Reduce - wstęp
(2h) Algorytmy Map/Reduce
(2h) Wyszukiwanie bliskiego sąsiedztwa, Lokalnie czułe funkcje skrótu dla dokumentów - implementacja na przykładzie
(2h) Strumienie danych - wstęp, próbkowanie i filtrowanie
(2h) Strumienie danych - Estymowanie momentów
(2h) Page Rank / Hub-Authority Score
(2h) Znajdowanie komponentów w grafach
(2h) Zbiory częstościowe
(2h) Masywne klastrowanie
(2h) Systemy rekomendujace -- implementacja jednego z wybranych modeli
(2h) Redukcja wymiarów - PCA, SVD
(2h) Omówienie projektów zaliczeniowych
(2h) Prezentacje projektów zaliczeniowych
Całkowity nakład pracy studenta
Uczestnictwo w wykładach- 30h
Uczestnictwo w laboratoriach- 30 h
Praca indywidulana- 60 h
Przygotowanie i udział w egzaminie- 30 h
Razem: 150 h ( 5 ECTS)
Efekty uczenia się - wiedza
K_W02- posiada rozszerzoną wiedzę w zakresie zaawansowanej konstrukcji i analizy algorytmów, metod optymalizacji, posiada rozszerzoną wiedzę w zakresie zagadnień metod numerycznych
K_W03 - posiada rozbudowaną wiedzę w zakresie zaawansowanych języków programowania i zaawansowanych konstrukcji w językach programowania, posiada wiedzę o przydatnych narzędziach czy bibliotekach narzędzi/funkcji
K_W04 - posiada wiedzę pozwalającą w ponadpodstawowy sposób pracować samodzielnie, jak i w grupie, pełniąc różnego typu role zawodowe
K_W06 - posiada szczegółową wiedzę związaną ze studiowaną specjalnością
Efekty uczenia się - umiejętności
K_U01 - efektywnie umie szukać niezbędnych informacji do rozwiązywania problemów informatycznych, posiada umiejętność samodzielnego wyszukiwania i wykorzystywania informacji z zakresu informatyki i powiązanych dziedzin
K_U02 - potrafi efektywnie wymieniać informacje związane z projektami informatycznymi, używając języka ojczystego a także angielskiego, umie korzystać z wiedzy zapisanej w języku ojczystym i języku angielskim, potrafi przygotować dokumentację, prezentację oraz omówić projekt w języku angielskim
K_U03 - posiada rozszerzone umiejętności samodzielnej pracy, potrafi określić niezbędny zakres wiedzy, jaki trzeba zdobyć, by zrealizować określony projekt informatyczny, posiada umiejętność zdobywania wiedzy/douczania się, rozwijania swojej wiedzy, wykorzystuje przy tym różnorodne techniki dostępu do informacji
K_U05 - posiada rozszerzone umiejętności pracy grupowej, potrafi efektywnie pracować w grupie i efektywnie wykorzystywać niezbędne narzędzia (programistyczne, diagnostyczne), wykorzystuje czas swój i współpracowników, potrafi rozwiązać proste problemy badawcze
K_U10 - potrafi wykorzystywać właściwe narzędzia programistyczne pozwalające na realizację projektów w zakresie studiowanej specjalnośc
K_U11 - ma przygotowanie niezbędne w środowisku przemysłowym oraz zna zasady bezpieczeństwa związane z tą pracą w zakresie studiowanej specjalności
Efekty uczenia się - kompetencje społeczne
K_K01 - rozumie potrzebę uczenia się przez całe życie, potrafi inspirować proces uczenia się innych osób
K_K04 - ma świadomość skutków wadliwie działających systemów informatycznych, które mogą doprowadzić do strat moralnych i finansowych, a nawet utraty zdrowia czy zagrożenia życia
K_K05 - rozumie potrzebę zachowań profesjonalnych i przestrzegania zasad etyki
Wymagania wstępne
Algorytmika, Programowanie w języku Python i Java. Podstawowe koncepcje relacyjnych i nie-relacyjnych baz danych. Podstawy uczenia maszynowego, analizy danych i statystycznej analizy danych
Koordynatorzy przedmiotu
Kryteria oceniania
Wykład - egzamin ustny
Laboratorium - projekt + referat
Literatura
1. Jure Leskovec, Anand Rajaraman, Jeff Ullman “Mining of Massive Datasets”
2. Chakrabarti, Soumen. Mining the Web: Discovering knowledge from hypertext data. Elsevier
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i
terminach zajęć) mogą być dostępne w serwisie USOSweb: