Strona główna

Tworzenie nowych zmiennych (wskaźników)


Pobieranie 28.93 Kb.
Data20.06.2016
Rozmiar28.93 Kb.

Tworzenie nowych zmiennych (wskaźników)

Przez obliczanie


Klikamy Przekształcenia, Oblicz wartości...

Pojawia się okno „Oblicz wartości zmiennej”

W pole w lewym, górnym rogu wpisujemy nazwę, jaką chcemy nadać nowej zmiennej




Z listy po prawej wybieramy istniejące zmienne (jedno kliknięcie myszą na nazwę zmiennej) i przyciskiem ze strzałką przenosimy je do pola „wyrażenie numeryczne”. Ten sam efekt uzyskamy podwójnie klikając na nazwę zmiennej

W polu „wyrażenie numeryczne” po prawej stronie na górze pojawiają się nazwy wybranych zmiennych

Wybieramy z listy, lub wpisujemy ręcznie działania arytmetyczne, jakie chcemy wykonać na zmiennych. Np. jeśli chcemy je zsumować, należy między nazwami zmiennych wstawić znaczek „+”. Możemy też wybrać, z listy poniżej, funkcję, która wykona określone operacje. Np. jeśli chcemy aby nowa zmienna była średnią wartością zmiennych ocena1 i ocena2 wpisujemy MEAN(ocena1,ocena2).

Zmienia się zawartość pola „wyrażenie numeryczne”.

SPSS proponuje nam kilka działań arytmetycznych oraz operatorów logicznych, których opis znajduje się w oddzielnym pliku (zanim_zaczniesz.doc). Możemy wpisać je z klawiatury lub użyć przycisków. Przycisk „usuń” usuwa zaznaczony tekst.

Zawodnikom klasy heavy-pro SPSS umożliwia warunkowe obliczanie wartości. Klikając na przycisk Jeżeli możemy sprawić, że nowa zmienna będzie utworzona tylko dla niektórych obserwacji; tj. obserwacji spełniających określony warunek. Pozostałe obserwacje w nowoutworzonej zmiennej w miejsce wartości będą miały systemowy brak danych.

Po tym, jak zdefiniujemy operacje, na podstawie których ma zostać utworzona nasza zmienna klikamy...

OK - Utworzona zostanie nowa zmienna.

Wklej - Wyświetli się syntax, nie utworzy nowej zmiennej.

Resetuj - Wyczyszczone będą wszystkie pola tego okna.

Anuluj - Okno zniknie razem z tym, co wpisaliśmy.


Przez rekodowanie


Klikamy Przekształcenia, rekoduj, na inne zmienne...

Pojawia się okno „Rekoduj na inne zmienne”

Z listy po lewej stronie wybieramy zmienną źródłową, czyli tą, którą będziemy rekodować. (Klik i przycisk ze strzałką albo podwójny klik)

Zmienia się zawartość pola „Zmienna źródłowa i wynikowa”, podświetla się pole „Zmienna wynikowa”

Wypełniamy pole „Zmienna wynikowa” nadając nazwę i etykietę nowej zmiennej a następnie klikamy zmień.

Zmienia się zawartość pola „Zmienna źródłowa i wynikowa”

Klikamy Wartości źródłowe i wynikowe.

Pojawia się okno „Rekoduj na inne zmienne: wartości...”

Mamy dwa pola: „wartość źródłowa” i „wartość wynikowa”. Z lewej decydujemy co rekodujemy, a z prawej – na co rekodujemy. Możemy więc rekodować konkretną wartość zmiennej (np. 1 na 2), albo cały zestaw (np. mniejsze niż 10 rekodujemy na 1). Po każdej takiej operacji klikamy „Dodaj”.

Zmienia się zawartość pola „Źródłowa -> wynikowa”.

Jeśli wpisując popełnimy jakiś błąd możemy usunąć określone polecenie albo zmienić je (zaznaczamy, wypełniamy od nowa i klikamy „Zmień”).

Zmienia się zawartość pola „Źródłowa -> wynikowa”.

Upewniwszy się, że wszystkie polecenia są właściwe klikamy „Dalej”.

Znika okno „Rekoduj na inne zmienne: wartości...”

Klikając „Jeżeli” możemy sprawić, że zrekodowane będą tylko te obserwacje, które spełniają określony warunek. Obserwacje niespełniające tego warunku w nowej zmiennej będą miały systemowy brak danych.

Na zakończenie klikamy jeden z przycisków...

OK - SPSS zrekoduje wybrane dane do nowej zmiennej

Wklej - Wyświetli się syntax, (i nic więcej się nie stanie)

Resetuj - Wyczyszczone będą wszystkie pola tego okna.

Anuluj - Okno zniknie razem z tym, co wpisaliśmy.

UWAGA! Rekodując od 4 do największej rekodujesz też ewentualne braki danych, np. 999

Zliczanie wystąpień


Wyobraźmy sobie sytuację, w której chcemy podliczyć wystąpienia określonych wartości różnych zmiennych. Na przykład w ankiecie dotyczącej konsumpcji leków będziemy mieli wiele zmiennych opisujących zażywanie (lub nie) różnych leków.

Czy bierze Pan/Pani Aspirynę? tak/nie zmienna „czy_aspi”, wartości 1 i 2


Czy bierze Pan/Pani Etopirynę? tak/nie zmienna „czy_etop”, wartości 1 i 2
Czy bierze Pan/Pani Pyralginę? tak/nie zmienna „czy_pyra”, wartości 1 i 2.

Chcemy policzyć ile, spośród podanych, leków bierze nasz respondent.



Klikamy Przekształcenia, Zlicz wystąpienia.

Pojawia się nowe okno: „Zlicz wystąpienia wartości w obrębie obserwacji”.

Podajemy nazwę zmiennej, którą chcemy utworzyć oraz jej etykietę.




Wybieramy które zmienne będą wykorzystywane do utworzenia nowej zmiennej

Zmienia się zawartość pola „zmienne”

Klikamy Definiuj wartości

Pojawia się okno „Zlicz wystąpienia wartości w obrębie obserwacji: wartość zliczana

Definiujemy jakie wartości mają być liczone i naciskamy dodaj

Zmienia się zawartość pola „Wartości do zliczenia”

Zakończywszy wybieranie wartości naciskamy OK.

Powrót do poprzedniego okna

Ważne jest zrozumienie idei tej operacji: SPSS zwróci zmienną, której wartość będzie liczbą wystąpień określonych wartości pewnych zmiennych. Policzy ile razy wybrane przez nas zmienne uzyskały określone wartości i ta liczba wystąpień będzie wartością nowej zmiennej. Jeśli pani Kasia brała spośród tych trzech leków tylko aspirynę, wartość nowej zmiennej będzie wynosić „1”.

Wracając do naszego przykładu w oknie „Zlicz wystąpienia wartości w obrębie obserwacji” wpiszemy nazwę nowej zmiennej ile, do pola „zmienne numeryczne” wprowadzimy nasze trzy zmienne: czy_aspi, czy_etop i czy_pyra, klikniemy zdefiniuj wartości i do pola „wartości do zliczenia” wprowadzimy tylko wartość „1”. Dzięki temu nowa zmienna ile będzie oznaczać liczbę leków, których zażywanie respondent deklaruje. (Bo jedynka oznacza „tak”).


Wybieranie i organizowanie danych do analiz

Podział na podzbiory


Jeśli będziemy chcieli pewne analizy wykonać oddzielnie dla mężczyzna i kobiet, albo oddzielnie dla np. prawo- i leworęcznych, możemy podzielić nasz zbiór danych na podzbiory. Klikamy Dane, podziel na podzbiory. Pojawia się okno „Podziel dane na podzbiory”, które służy zarówno do włączania jak i wyłączania podziału.

W oknie musimy zdecydować czy SPSS ma porównywać grupy czy przedstawiać wyniki w podziale na grupy. Wybór dotyczy kwestii głównie estetycznej: formy, w jakiej będą przedstawiane raporty (jedna tabelka, w każdym wierszu poszczególne wyniki czy wiele tabelek).

Decydujemy jaka zmienna ma być kryterium podziału na grupy i zatwierdzamy to przyciskiem „OK”. Powstanie tyle grup, ile wartości przybiera wybrana zmienna (nawet, jeśli jakaś wartość zdefiniowana jest jako brak danych). Okienko znika, ale na pasku statusu, który jest na dole okna SPSS’a pojawia się napis „Podzbiory wł”. W tej sytuacji wszystkie obliczenia wykonywane będą oddzielnie dla np. kobiet i mężczyzn (jeśli wybraliśmy, że zmienna płeć ma być kryterium podziału na grupy.

Wybór obserwacji do analizy


Jeśli chcemy analizować tylko niektóre obserwacje, spełniające jakieś kryterium, na przykład tylko osoby pełnoletnie, albo tylko tych, którzy mają prawo jazdy musimy klikać: Dane, wybierz obserwacje. Pojawi się okno „wybierz obserwacje”, w którym musimy podać kryterium wyboru.

Mogą to być obserwacje spełniające jakiś warunek: zaznaczamy opcję Jeżeli spełniony jest warunek, klikamy jeżeli i pojawi się nowe, znane już okno do którego wpisujemy test logiczny (np. wiek=<18 jeśli chcemy wybrać obserwacje, w których zmienna wiek osiąga wartość równą 18 lub większą niż 18).

Możemy chcieć wybrać jakąś losową próbę z naszego zbioru, wtedy zaznaczamy Próba losowa obserwacji, klikamy próba, pojawia się nowe okno, w którym wybieramy, czy SPSS ma losować jakiś procent wszystkich obserwacji czy wylosować określoną liczbę z pierwszych n obserwacji (np. mamy plik z 4096 obserwacjami, chcemy wylosować 500 obserwacji z pierwszych dwóch tysięcy).

Możemy chcieć wybrać konkretny zakres obserwacji, np. od obserwacji o numerze 100 do obserwacji o numerze 150. Zaznaczamy na podstawie czasu lub zakresu obserwacji, klikamy zakres i wybieramy pożądany zakres.

Opcja niewybrane obserwacje zostaną jest bardzo ważna! Jeśli wybierzemy „niewybrane obserwacje zostaną usunięte” spowodujemy wykasowanie danych z naszego zbioru, co może mieć bardzo bolesne konsekwencje!

Zdefiniowaliśmy kryteria, klikamy OK. Co się stało? Po pierwsze na pasku statusu SPSS’a pojawił się napis „filtr wł.”. Po drugie numery niektórych obserwacji w arkuszu „dane” są przekreślone – to te obserwacje, które nie spełniają zdefiniowanych przez nas warunków. Po trzecie powstała zmienna o nazwie filter_$. To taki zapisany filtr, tak, jakbyśmy swoje kryteria gdzieś zasejwowali.

Zdejmujemy filtr, wracamy do korzystania ze wszystkich obserwacji w obliczeniach klikając dane, wybierz obserwacje i zaznaczając „wybierz wszystkie obserwacje”.

Jeśli chcemy ponownie założyć ten sam filtr możemy użyć opcji „Użyj zmiennej filtrującej”, a następnie wprowadzić wybraną zmienną, która powstała przy tamtym filtrowaniu (zmienną taką jak filter_$) .


Kategoryzacja zmiennych w SPSS 11,5


Dla zrozumienia czym jest kategoryzacja zmiennych konieczne jest zrozumienie pojęcia mediany i/lub pojęć takich jak kwantyl, kwartyl, centyl, percentyl itp. Wyobraź sobie, że dowodzisz oddziałem 100 marynarzy. Potrzebujesz wybrać 25 najniższych, którzy będą czyścić zęzy i 25 najwyższych, którzy będą wkręcać żarówki. Co robisz? Ustawiasz ich według wzrostu, a potem dzielisz: 25 najniższych, 25 raczej niższych, 25 raczej wyższych i 25 nawyższych. Wybierasz 25 najniższych i 25 najwyższych, czyli pierwszy i czwarty kwartyl. Tym samym skategoryzowałaś/eś ich na cztery kategorie. SPSS też tak umie, ale z danymi, a nie marynarzami.

Jeśli dzielimy na cztery grupy – powstają kwartyle, na pięć – kwintyle, na sześć – sekstyle, na siedem – septentyle (choć w praktyce to się nie zdarza :). Jeśli dzielimy na sto – powstają centyle (lub, innymi słowy, percentyle).

Klikamy Przekształcenia, kategoryzacja zmiennych, a następnie wybieramy która zmienna ma być kryterium kategoryzacji, ile ma być kategorii i zatwierdzamy to przyciskając OK.

Co się stało? Przybyła nam nowa zmienna. Jej nazwa zależeć będzie od tego, jaka zmienna była kryterium podziału, i tak jeśli kryterium była zmienna age to nowa zmienna będzie się nazywać nage. Jej wartości pokazywać nam będą do której kategorii przypisana jest dana obserwacja.

Kategoryzacja przydaje się, kiedy np. chcemy porównywać osoby o wysokich i niskich wynikach w czymś. Ta procedura jest często używana przy przygotowywaniu danych do analizy wariancji, którą będziemy się zajmować na początku drugiego semestru.

Nie musimy wyłączać kategoryzacji – to proces, który tworzy nam nową zmienną, która daje nam lepsze rozeznanie w naszych danych.




©snauka.pl 2016
wyślij wiadomość