Strona główna

Analiza danych I


Data19.06.2016
Rozmiar94 Kb.
Wydział Zarządzania, Informatyków i Finansów

Kierunek Informatyka i Ekonometria

Koncepcja struktury zajęć 2010/2011

oprac. zmian Stanisław Heilpern i Cyprian Kozyra

na zielono wymiar dla studentów zaocznych

Struktura zajęć ze specjalności Analiza danych

I stopień – studia licencjackie

ANALIZA DANYCH I

Specjalność Analiza danych - umożliwia zdobycie wiedzy z zakresu metod i narzędzi analizy danych ilościowych i jakościowych pochodzących z obserwacji zjawisk gospodarczo-społecznych i sondaży. Przedmioty przewidziane w programie tej specjalności wykształcają umiejętności analizy i modelowania danych makro- i mikroekonomicznych. Studia na tej specjalności przygotowują do przyszłej pracy zawodowej analityków danych i doradców decydentów na każdym poziomie gospodarowania. Odbiorcami takich analiz powinny być administracja państwowa i regionalna oraz przedsiębiorstwa i instytucje finansowe.


Semestr 1,2,3.

Brak zajęć ze specjalności


Semestr 4.

30 godz. zajęć obowiązkowych – 15 godz. wykładów, 15 godz. ćwiczeń (laboratoriów)

Brak wykładów do wyboru


Wykłady obowiązkowe




W

Ć

L

Katedra




Analiza wariancji i kowariancji

zal. ocena

15

9





15

9


K. Statystyki

Jednoczynnikowa analiza wariancji; Dwuczynnikowa ANOVA bez i z replikacjami; Porównania wielokrotne; Pomiary powtarzane; Testy nieparametryczne; Układy z więcej niż dwoma czynnikami; Efekty losowe; Modele mieszane i hierarchiczne; Komponenty wariancyjne; Analiza kowariancji; Jednorodność współczynników regresji; Ogólny model liniowy, Wielowymiarowa analiza wariancji MANOVA. Zastosowania analizy wariancji i kowariancji w badaniach społeczno-ekonomicznych.
Semestr 5

60 godzin zajęć obowiązkowych – 30 godz. wykładów, 30 godz. ćwiczeń (laboratoriów)

60 godzin zajęć specjalnościowych spośród 120 proponowanych (student wybiera 2 przedmioty po 30 godzin)


Wykłady obowiązkowe




W

Ć

L

Katedra




Analiza danych wielowymiarowych

zal. ocena

15

9





15

9


K. Statystyki

Uwagi wprowadzające do analizy danych wielowymiarowych; Metody graficznej prezentacji wielowymiarowych danych; Metody wykrywania obserwacji odstających; Analiza głównych składowych; Analiza korespondencji; Analiza skupień; Metody klasyfikacji; Metody dyskryminacji; Analiza czynnikowa; Wnioskowanie o wielowymiarowym rozkładzie normalnym; Dodatkowe tematy: skalowanie wielowymiarowe, metody estymacji nieparametrycznej.


Pomiar i analiza cech jakościowych

zal. ocena

15

9





15

9


K. Statystyki

1. Źródła danych jakościowych. 2. Rodzaje cech, skale pomiaru. 3. Podstawowe rozkłady: dwumianowy, Poissona, normalny, wielomianowy. 4. Tablice kontyngencji. 5. Badanie zależności, testy. 6. Testy zgodności, jednorodności i symetrii.

7. Regresja logistyczna dla zmiennych binarnych. 8. Modele probitowe i logliniowe. 9. Cechy porządkowe, skale pomiaru. 10. Modele logliniowe i logitowe dla zmiennych porządkowych.




Wykłady do wyboru



















Pozyskiwanie i analiza danych biznesowych

zal. ocena

30

14








K. Ekonometrii

System informacji biznesowej. Geneza badań biznesowych. Przedmiot i zakres badań biznesowych. Podmioty (instytucje) badań biznesowych w Polsce i za granicą. Ogólna procedura prowadzenia badań biznesowych. Źródła danych w badaniach biznesowych. Ocena przydatności danych wtórnych. Przedmiot i struktura badań pierwotnych. Metody obserwacji. Wybór próby respondentów. Eksperyment. Metody analizy danych. Komputerowo wspomagane gromadzenie i analiza danych marketingowych. Klasyfikacja danych. Dane wtórne. Wewnętrzne źródła danych wtórnych. Zewnętrzne źródła danych wtórnych. Weryfikacja. Dane pierwotne. Techniki gromadzenia danych pierwotnych. Ankietowanie, obserwacja, eksperymentowanie. Alokacja próby. Skale pomiarowe – nominalna, porządkowa, przedziałowa, ilorazowa, ilorazowo – przedziałowa. Redukcja i wstępna analiza danych. Tabulacja, prezentacja graficzne. Zaawansowana analiza danych. Badanie zależności i współzależności. Prognozowanie. Testowanie hipotez. Pakiety ekonometryczno – statystycznej analizy danych. Raport biznesowy.Wybrane obszary badań biznesowych. Badania skuteczności i efektywności. Zagadnienia organizacji badań biznesowych.


Analiza gospodarczych szeregów czasowych

zal. ocena

15

7





15

7


K. Statystyki

Krajowe i ponadnarodowe źródła danych statystycznych. Pierwotne i wtórne źródła danych. Statystyka publiczna jako źródło danych oficjalnych; Organizacja statystyki publicznej w Polsce, w UE i w skali światowej; Dostępne banki danych; Publikacje statystyczne; Administracyjne źródła danych; Przygotowanie i realizacja badań statystycznych; Bank Danych Regionalnych; Główny Urząd Statystyczny; Eurostat; Statystyka ONZ. Niepubliczne (komercyjne) źródła danych statystycznych; Metody pozyskiwania danych.
Analiza jednowymiarowych szeregów czasowych: charakterystyki, stacjonarność, autokorelacje, autokorelacje cząstkowe, gęstości spektralne. Przekształcanie danych i filtracja. Szeregi typu ARIMA. Metody adaptacyjne - wyrównywanie wykładnicze, trend pełzający. Trend, składowe sezonowe i cykliczne. Analiza harmoniczna. Warunkowa heteroskedastyczność. Modele typu GARCH. Prognozowanie. Zastosowania w modelowaniu szeregów czasowych, zwłaszcza danych finansowych i ekonomicznych.


Projektowanie próby badawczej

zal. ocena

15

14





15

K. Statystyki

Problemy teorii i praktyki projektowania próby. Sposoby pobierania prób. Operaty losowania i ocena wielkości prób. Losowanie nieograniczone indywidualne zależne i niezależne. Losowanie warstwowe. Losowanie grupowe. Losowanie wielostopniowe. Losowanie systematyczne indywidualne. Losowanie dwufazowe. Estymatory ilorazowe i regresyjne. Zalety i wady poszczególnych projektów prób. Statystyka małych obszarów.


Modelowanie matematyczne w ubezpieczeniach i finansach

zal. ocena

30

14








K. Matematyki i Cybernetyki / K. Statystyki

Model ryzyka indywidualnego i kolektywnego. Modele ryzyka, teoria ruiny. Wyznaczanie składki ubezpieczeniowej. Porządkowanie ryzyka. Zagadnienia reasekuracji. Modele trwania życia, tablice trwania życia. Wartość pieniądza w czasie, analiza obligacji. Analiza portfelowa, modele rynku kapitałowego. Wycena opcji. Strategie inwestycyjne
Semestr 6

30 godzin zajęć obowiązkowych – 15 godz. wykładów, 15 godz. ćwiczeń (laboratoriów)

60 godzin wykładów specjalnościowych spośród 120 proponowanych (student wybiera 2 wykłady po 30 godzin)


Wykłady obowiązkowe




W

Ć

L

Katedra




Planowanie eksperymentów

zal. ocena

10

6





5

3


K. Statystyki / K. Badań Operacyjnych

Wprowadzenie do teorii planowania eksperymentów. Model liniowy i metody jego analizy.(analiza wariancji i regresji) Wybrane kryteria optymalności planów eksperymentu oraz iteracyjne metody konstrukcji planów optymalnych. Klasyczne plany eksperymentów: problem randomizacji doświadczeń, eksperymenty blokowe. Plany całkowitych eksperymentów czynnikowych typu 2k i 3k oraz plany ułamkowych eksperymentów czynnikowych typu 2k-p. Plany centralnie skomponowane oraz plany eksperymentów czynnikowych typu 3k-p. Metoda Boxa-Wilsona poszukiwania warunków optymalnych. Zastosowanie planowania eksperymentów do projektowania wyrobów wysokiej jakości. Metody Taguchiego: funkcja straty jakości, dwuetapowa procedura uzyskiwania optymalnych wartości projektowych, czynniki kontrolowane i zakłócające, tablica zewnętrzna i wewnętrzna. Metody graficzne wspomagające wybór i konstrukcje planu eksperymentu. Różnice pomiędzy klasycznymi planami eksperymentów a podejściem Taguchiego.


Metody prezentacji danych. Raporty

zal. ocena

5

3





10

6


K. Statystyki

Istota i cel tworzenia raportów oraz zalety rozmaitych technik prezentacji wyników pomiarów. Środki techniczne i programowe tworzenia prezentacji danych. Techniki prezentacji danych jednowymiarowych. Typy grafik prezentacyjnych. Prezentacja rozkładów badanych cech: wykresy kwantyl-kwantyl, dystrybuanta-dystrybuanta. Wykresy pudełkowe. Wykresy typu Stem and leaf. Techniki prezentacaji danych wielowymiarowych. Sposoby prezentacji graficznej danych wielowymiarowych a płaszczyźnie. Wykresy symboliczne. Krzywe Andrewsa. Wykresy korelacyjne. Wykresy punktowe: analiza głównych składowych. Metosy skalowania wielowymiarowego. Metoda współrzędnych dyskryminacyjnych. Wykres podwójny. Schematy blokowe. Prezentacja danych liczbowych i tworzenie raportów.


Wykłady do wyboru



















Pomiar i analiza cech ukrytych

zal. ocena

15

7





15

7


K. Statystyki

Pojęcie cechy ukrytej. Konstrukcja skali pomiaru cechy ukrytej. Skale sumacyjne, kumulacyjne i komparacyjne. Analiza czynnikowa. Analiza rzetelności sumacyjnej skali pomiaru. Konfirmacyjna analiza czynnikowa. Model wielu wskaźników i wielu przyczyn (MIMIC). Modelowanie równań strukturalnych. Analiza czynnikowa cech kategorialnych. Analiza klas ukrytych.


Modelowanie danych rynkowych

zal. ocena

15

7





15

7


K. Ekonometrii

Metody statystyczno-ekonometryczne wykorzystywane do badania rynku. Dane statystyczne i ich rodzaje; pozyskiwanie danych rynkowych - wykorzystanie metody reprezentacyjnej do doboru próby i ustalenia jej liczebności w badaniach rynku. Skale pomiaru postaw nabywców – budowa kwestionariusza i opracowywanie danych ankietowych. Analiza zależności, regresji i pomiar łącznego oddziaływania zmiennych. Modelowanie popytu konsumpcyjnego, w tym liniowe i nieliniowe modele potrzeb. Metody wielowymiarowej analizy danych w badaniu preferencji konsumentów i pozycjonowaniu produktów. Opracowywanie danych ankietowych oraz przygotowania raportów z przeprowadzonych badań ankietowych. Badanie preferencji konsumentów i pozycjonowania produktów na podstawie danych zebranych przez studentów.


Analiza i prognozowanie rozwoju gospodarczego

zal. ocena

30

14








K. Ekonometrii

Wskaźniki makroekonomiczne. Metody badania koniunktury gospodarczej: barometry koniunktury, testy koniunktury, modele ekonometryczne. Metody badania poziomu zatrudnienia i bezrobocia. Analiza i prognozowanie rozwoju sektorów gospodarki.


Statystyka w przedsiębiorstwie

zal. ocena

15

7





15

7


K. Statystyki

Rola i miejsce statystyki w zarządzaniu przedsiębiorstwem na szczeblach: operacyjnym, taktycznym i strategicznym. Wskaźniki sprawności działania, finansowania, płynności finansowej, społecznej wartosci dodanej itp. Dane statystyczne ich grupowanie i prezentacja. Statystyczna kontrola jakości. Badanie dynamiki procesów gospodarczych a także metody ich prognozowania. Autokorelogramy, analiza trendów, metody wygładzania, wskaźniki dynamiki. Sprawozdawczość statystyczna dotycząca warunków pracy, kosztów pracy, wypadków itp.
Seminaria na semestrach 4, 5, 6; po 20 godz. w każdym semestrze.

II stopień – studia magisterskie

ANALIZA DANYCH II

Semestr 1.

Brak zajęć ze specjalności


Semestr 2.

30 godz. zajęć obowiązkowych – 15 godz. wykładów, 15 godz. ćwiczeń (laboratoriów)

Brak wykładów do wyboru


Wykłady obowiązkowe




W

Ć

L

Katedra




Algorytmizacja obliczeń statystycznych

zal. ocena

15

9





15

9


K. Statystyki

Języki programowania i ich hierarchia; Korzystanie ze środowisk programistycznych i uruchomieniowych; Biblioteki procedur i funkcji statystycznych; System R; Visual Basic dla Aplikacji (VBA); Model obiektów Excela; Statistica Visual Basic; Typy danych; Działania na macierzach, wektorach i skalarach; Wizualizacja wyników na wykresach statystycznych; Tablice statyczne i dynamiczne; Pętle sterujące programem; Obiekty, właściwości i metody; Przykładowe algorytmy analityczne i obliczeniowe.
Semestr 3

60 godzin zajęć obowiązkowych – 30 godz. wykładów, 30 godz. ćwiczeń (laboratoriów)

60 godzin wykładów specjalnościowych spośród 120 proponowanych. Zajęcia – 50% wykład, 50% ćwiczenia (student wybiera 2 zajęcia po 30 godz.)


Wykłady obowiązkowe




W

Ć

L

Katedra




Metody zarządzania jakością

zal. ocena

15

9





15

9


K. Statystyki

1. Zasady Deminga i koncepcja TQM2. Idea TQM a systemy zapewniania jakości typu ISO.3. Narzędzia statystyczne doskonalenia jakości.4. Karty kontrolne.5.Miary zdolności procesów i koncepcja jakości na poziomie 6 sigma.6. Metody menedżerskie i behawioralne doskonalenia jakości.7. Metoda Taguchi'ego. 8. Modelowanie charakterystyk jakości.


Pomiar i ocena jakości życia

zal. ocena

15

9





15

9


K. Statystyki

Pojęcia dobrobytu, jakosci i standardów życia. Państwa dobrobytu. Istota pomiaru rzeczywistych cech bezpośrednio obserwowalnych i cech ukrytych obserwowalnych pośrednio za pomocą innych cech. Wskaźniki społeczne. Badania jakości życia na szczeblu europejskim i światowym. Podstawowe wskaźniki charakteryzujące jakość życia i poziom rozwoju społecznego. Statystyczne metody pomiaru poszczególnych aspektów życia.


Wykłady do wyboru



















Decyzje w warunkach niepewności i ryzyka

zal. ocena

15

14


15





K. Statystyki

Podstawowy problem decyzyjny, stany natury. Rodzaje niepewności, rozkład a priori. Wykorzystanie dodatkowych informacji, wzór Bayesa. Drzewa decyzyjne.Teoria użyteczności. Wykorzystanie opinii ekspertów. Ogólne aspekty ryzyka. Ryzyko utraty zdrowia i życia. Porządkowanie ryzyka. Modele oceny ryzyka utraty zdrowia i życia. Podstawy analizy czasu przeżycia. Funkcja przeżycia. Ryzyko ubezpieczyciela i rasekuracja. Underwriting w ubezpieczeniach. Czynniki wpływające na ryzyko zgonu ubezpieczonego. Zasady wyznaczania składki. Dywersyfikacja portfela polis. Optymalne decyzje ubezpieczeniowe.


Statystyczne metody oceny i analizy jakości usług

zal. ocena

15

7





15

7


K. Statystyki

Ogólna charakterystyka usług, definicje i klasyfikacje usług, rola sektora usług we współczesnej gospodarce, specyfika jakości usług w relacji do jakości produktów materialnych. Etapy rozwoju koncepcji jakości usług w ramach marketingu usług, amerykańska i skandynawska szkoła jakości usług, modele jakości usług. Teorie pomiaru, analiza czynnikowa i modele równań strukturalnych w pomiarze cech ukrytych, konstrukcja skal pomiaru postrzeganej jakości usług, trafność i rzetelność pomiaru. Konstrukcja skali SERVQUAL, jej krytyka i modyfikacje, inne uniwersalne narzędzia pomiaru jakości usług. Zastosowania różnych narzędzi pomiaru jakości w odniesieniu do różnych aspektów i rodzajów usług (np. finansowych, transportu i logistyki, handlu), specyfika usług publicznych w stosunku do usług rynkowych. Metody analizy i projektowania usług, jakościowe metody badania usług.


Uogólnione modele liniowe

zal. ocena

15

7





15

7


K. Ekonometrii / K. Statystyki

Wprowadzenie do klasy uogólnionych modeli liniowych. Rozkłady prawdopodobieństwa zmiennej zależnej i funkcje wiążące w klasie UML. Metody estymacji parametrów strukturalnych w klasie UML. Weryfikacja założeń uogólnionych modeli liniowych: definicja i analiza reszt modelu, wybrane typy wykresów diagnostycznych, wykrywanie obserwacji wpływowych i nietypowych, wykrywanie zjawiska nadmiernej dyspersji, testowanie poprawności funkcji wiążącej, miary dopasowanie typu R2, problem współliniowości zmiennych niezależnych, testowanie liniowych ograniczeń nakładanych na parametry strukturalne modelu, testowanie stabilności parametrów strukturalnych. Zagadnienie specyfikacji zbioru zmiennych niezależnych w klasie UML. Wybrane modele jako szczególny przypadek klasy UML: regresja liniowa, analiza wariancji, modele logit/probit, modele log-liniowe.


Modelowanie na podstawie cech jakościowych

zal. ocena

15

7





15

7


K. Ekonometrii

Podstawowe charakterystyki opisowe zmiennych dyskretnych. Analiza rozkładu jednowymiarowego - przypomnienie i uzupełnienie o miarach położenia i rozproszenia. Szacowanie wielkości frakcji, modalnej, mediany. Metody wielowymiarowej analizy danych niemetrycznych: analiza zależności i korelacji dla cech nominalnych i dla cech rangowych. Regresja dla dyskretnej zmiennej objaśniającej. Analiza regresji dla dyskretnej zmiennej objaśnianej – modele probitowe i logitowe. Analiza wariancji. Analiza danych ankietowych, uwzględniających pomiar postaw nabywców na skalach słabych i mocnych. Opracowanie projektu związanego z analizą wariancji i budową modelu ze zmiennymi jakościowymi.
Semestr 4

30 godzin zajęć obowiązkowych – 15 godz. wykładów, 15 godz. ćwiczeń (laboratoriów)

60 godzin wykładów specjalnościowych spośród 120 proponowanych. Zajęcia – 50% wykład, 50% ćwiczenia (student wybiera 2 zajęcia po 30 godz.)


Wykłady obowiązkowe




W

Ć

L

Katedra




Modele i analiza danych finansowych

zal. ocena

15

9





15

9


K. Ekonometrii / K. Statystyki

Metody badania i analizy wskaźników ekonomicznych.

Pomiar i analiza inflacji: mierniki CPI, PPI, inflacja bazowa.

Zastosowanie metod wielowymiarowej analizy statystycznej do analizy i prognozowania danych finansowych.

Ekonometryczne modelowanie rynków finansowych.

Modele zmiennych jakościowych stosowane w finansach i bankowości.


Wykłady do wyboru



















Logistyka. Prognozowanie zapasów

zal. ocena

15

7





15

7


K. Logistyki

1. Wprowadzenie – warunki zaliczenia, literatura. Logistyka – podstawowe pojęcia, przegląd procesów w przedsiębiorstwie produkcyjnym. 2. Modelowanie procesu produkcyjnego - drzewa produktów i metoda iteracyjna wyznaczania zapotrzebowania materiałowego. 3.Zstępujący model systemów planowania i kontroli produkcji - planowanie sprzedaży i operacji, planowanie nadrzędne, MRP. 4. Ustalanie planów produkcyjnych – system DRP, harmonogramy produkcji.

5. Harmonogramy produkcji – ustalanie planu produkcyjnego na podstawie przykładu. 6. Proces zaopatrzenia – zapasy na wejściu i wyjściu procesu produkcyjnego, polityki uzupełniania zapasów. 7. Prognozowanie – definicje, uwzględnienie informacji marketingowej do wyznaczania prognozy. 8. Nowe metody prognozowania – PLC, prognozowanie przez analogię

9. Klasyfikacje ABC i XYZ. 10. Zasady wyboru dostawców. 11. Planowanie przewozów – wyznaczanie tras dostaw. 12. Gra logistyczna "Logistix".


Drążenie danych (Data Mining)

zal. ocena

15

7





15

7


K. Statystyki/ K. Technologii Informacyjnych

Struktura i technologia baz danych ekonomicznych i hurtowni. Szeregi czasowe. Przygotowanie danych uczących i danych testujących. Konstrukcja drzew decyzyjnych - systemy indukcyjne. Oprogramowanie WEKA i Statistica Data Miner. Uogólnione modele addytywne. Analiza koszykowa. Miary oceny jakości klasyfikatora: precyzja i dokładność, błędy I-go i II-go rodzaju. Interpretacja macierzy konfuzji i grafu ROC. Algorytmy tworzenia reguł asocjacyjnych- APRIORI. Wyszukiwanie wzorców w szeregach sekwencyjnych -algorytm PrefixSpan. Ekstrakcja reguł z sieci neuronowych- algorytmy MofN, VIA. Reguły generowane przez algorytmy ewolucyjne. Optymalizacja bazy reguł decyzyjnych. Regresja symboliczna. Systemy hybrydowe.

Przykłady zastosowań: analiza i interpretacja danych ekonomicznych, e-commerce, generowania ekspertyz i wspomaganie decyzji giełdowych, wywiad gospodarczy, systemy wczesnego ostrzegania, wyszukiwanie w internecie i Web semantics, autentyfikacja biometryczna, systemy agentowe.




Baza wiedzy w zarządzaniu przedsiębiorstwem

zal. ocena

30

14








Katedra Systemów Sztucznej Inteligencji / Katedra Zarządzania Informacją i Wiedzą

Podstawowe pojęcia, istota i właściwości baz wiedzy (BW) w kontekście sztucznej inteligencji i zarządzania przedsiębiorstwem. Sposoby reprezentacji i organizacji wiedzy w systemach z bazą wiedzy. Mechanizmy wykorzystania wiedzy z baz wiedzy: rodzaje wnioskowania. Metody identyfikacji źródeł wiedzy oraz metody pozyskiwania wiedzy do BW (akwizycja wiedzy, odkrywanie wiedzy, nabywanie wiedzy w procesie uczenia). Podejścia i metody do rozwiązywania zadań na podstawie zgromadzonej wiedzy w BW. Architektura i specyfika działania systemów, których podstawowym elementem jest BW (systemy ekspertowe, rozmyte systemy z bazą wiedzy i systemy agentowe agentowe).


Metody wielokryterialnej analizy i wspomagania decyzji

zal. ocena

15

7





15

7


K. Badań Operacyjnych

Wprowadzenie do wykładu i motywacje: przedstawienie ogólnego problemu decyzyjnego i jego złożoność (złożony cel) jako punkt wyjścia do wykładu, wielość celów w praktycznych problemach decyzyjnych, klasyfikacja problemów wielokryterialnych, sformułowanie i składowe ogólnego problemu wielokryterialnej optymalizacji (PWO). Różne pojęcia optymalności rozwiązań. Optymalność rozwiązań w sensie Pareto (efektywność rozwiązań): dominacja wektorów ocen, wyznaczanie rozwiązań efektywnych za pomocą zbiorów dominacji oraz różnych skalaryzacji wyjściowego problemu wielokryterialnego. Rola decydenta w wyborze ostatecznego rozwiązania problemu wielokryterialnego, przegląd metod interaktywnych. Inne koncepcje optymalności: optymalizacja leksykograficzna i minimaksowa. Metody optymalizacji wielokryterialnej z celami referencyjnymi: programowanie celowe, programowanie kompromisowe, metoda punktu referencyjnego. Koncepcja rozwiązań zrównoważonych i metody ich wyznaczania. Funkcja użyteczności i jej znaczenie w optymalizacji wielokryterialnej. Metody "francuskiej szkoły" wspomagania decyzji wielokryterialnych: metoda Promethee i klasa metod typu Electre.
Seminaria na semestrach 2, 3, 4; po 25 godz. w każdym semestrze






©snauka.pl 2016
wyślij wiadomość