Strona główna

Rozkład Normalny


Pobieranie 21.11 Kb.
Data19.06.2016
Rozmiar21.11 Kb.
Rozkład Normalny

Mówimy, że zmienna losowa ciągła X ma rozkład normalny o wartości oczekiwanej μ i odchyleniu standardowym σ i zapisujemy: , wtedy i tylko wtedy gdy Funkcja gęstości w rozkładzie normalnym o postaci:



(określona dla wszystkich rzeczywistych wartości zmiennej X)

Przykładowe rozkłady funkcji gęstości i dystrybuant dla danych μ i σ







Reguła „trzech sigma” - jeżeli zmienna losowa (cecha) ma rozkład normalny to:

  • 68,3 % populacji mieści się w przedziale (m - σ; m + σ)

  • 95,5 % populacji mieści się w przedziale (m - 2σ; m + 2σ)

  • - 99,7 % populacji mieści się w przedziale (m - 3σ; m + 3σ)

*************************************

Hipotezy i test statystyczny

Przed przystąpieniem do badania jakiegoś problemu możemy sformułować wiele hipotez. Hipotezę wyróżnioną, która ma być poddana weryfikacji nazywamy hipotezę zerową i oznaczamy symbolem H0, natomiast metoda umożliwiająca jej weryfikację nazywa się testem statystycznym. Test statystyczny daje jeden z dwóch wyników:



Gdy odrzucamy hipotezę zerową, powinniśmy przyjąć jakąś inną. Hipotezę przyjmowaną w wyniku odrzucenia H0 nazywamy hipotezą alternatywną. Przypuśćmy, że interesuje nas populacja krów i na podstawie jakichś informacji spodziewamy się, że średnia wydajność mleka w tej populacji jest równa 0 = 5200 kg mleka. Gdybyśmy chcieli na podstawie jakieś próby sprawdzić czy rzeczywiście wartość średnia populacji jest równa 5200, przyjęlibyśmy hipotezę zerową H0: = 5200. Moglibyśmy sformułować wiele hipotez alternatywnych (np. HA: = 5384 kg mleka), jednak sens mają tylko trzy:

H1: < 5200
H2: > 5200
H3:  5200.

Hipoteza typu < 0 lub > 0 nazywa się hipotezą jednostronną, a test związany z jej weryfikacją – testem jednostronnym. Analogicznie, testem dwustronnym nazywa się test użyty do weryfikowania hipotezy dwustronnej, tzn. hipotezy postaci: 0. Może się zdarzyć, że formułując hipotezę jednostronną, test statystyczny da podstawy do jej przyjęcia (bo odrzucona zostanie hipoteza zerowa), natomiast nie będzie można przyjąć hipotezy alternatywnej w przypadku hipotezy dwustronnej. Dlatego przed przystąpieniem do testowania muszą być sformułowane obie hipotezy: zerowa i alternatywna.



Przystępując do testowania hipotezy zerowej zakładamy, że jest ona prawdziwa. Na tej podstawie definiujemy statystykę, której obliczona w próbie wartość użyta zostanie jako kryterium weryfikujące hipotezę. Oznaczmy tę statystykę przez T i załóżmy dla uproszczenia, że zostanie ona użyta do weryfikowania hipotezy postaci H0: d=d0 przy jednostronnej hipotezie alternatywnej HA: d>d0. Niech t oznacza wartość statystyki T uzyskaną w próbie. Znając rozkład statystyki (jest ona zmienną losową), można określić prawdopodobieństwo, że T przyjmie wartość z określonego przedziału; oznaczmy to prawdopodobieństwo przez 1 –  :

P(t1 < t < t2) = 1 – .

Umówmy się, że jeżeli będzie to wartość z przedziału (t1, t2), to nie zaprzecza to prawdziwości hipotezy zerowej (co nie jest równoznaczne z uznaniem jej prawdziwości). Wartości t1, t2 można tak dobrać, żeby wartość prawdopodobieństwa 1 – była duża. Wtedy uzyskanie wartości statystyki spoza wymienionego przedziału będzie mało prawdopdodobne (prawdopodobieństwo ) i jeśli to nastąpi, może to świadczyć o fałszywości hipotezy zerowej. Zbiór wartości statystyki uprawniających do odrzucenia hipotezy zerowej nazywa się obszarem krytycznym, a wartości t1 i t2 wydzielające ten obszar nazywają się wartościami krytycznymi. Prawdopodobieństwo  wyznaczające obszar krytyczny nazywa się poziomem istotności testu Powyższe rozważania ilustrują poniższe rysunki, przedstawiające rozkład statystyki T.


 



Typy obszarów krytycznych (rozkład statystyki T)– zakreskowany obszar krytyczny odpowiada poziomowi istotności 
Obszar krytyczny testu jednostronnego jest jednoczęściowy i usytuowany jest u jednego z końców rozkładu statystyki użytej do testowania.
W przypadku testu dwustronnego obszar krytyczny składa się z 2 części zlokalizowanych u obu końców rozkładu, przy czym wielkości tych części, mierzone prawdopodobieństwem przyjęcia przez statystykę wartości z tego przedziału, są jednakowe: /2. Gdy rozkład statystyki jest symetryczny o wartości średniej 0 (np. jest to standaryzowany rozkład normalny lub Studenta), wtedy wartości krytyczne określające oba podobszary różnią się tylko znakiem, tzn. t2 = toraz t1 = –t. Ustalając wartości krytyczne, należy uwzględniać czy odnoszą się one do testu jednostronnego, czy dwustronnego.
 
 

 






 .

Wnioskowanie statystyczne obejmuje następujące czynności:

  • Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

  • Ustalenie poziomu istotności .

  • Wybór statystyki do weryfikacji hipotezy H0 i ustalenie obszaru krytycznego (wartości krytycznych).

  • Obliczenie wartości statystyki w próbie.

  • Sformułowanie wniosków (weryfikacja hipotezy H0) przez porównanie wartości obliczonej statystyki z wartościami krytycznymi; będzie to jeden z dwóch wniosków:

odrzuca się hipotezę zerową i za prawdziwą uznaje się hipotezę alternatywną,
nie ma podstaw do odrzucenia H0 (co nie oznacza jej przyjęcia).

Błędy związane z weryfikowaniem hipotez statystycznych

Test statystyczny opiera się na założeniu, że gdy prawdziwa jest hipoteza zerowa, mało prawdopodobne jest uzyskanie w próbie wartości statystyki z obszaru krytycznego, co nie oznacza, że nie jest w ogóle niemożliwe. Przyjmijmy, że poziom istotności = 0,05 i wyobraźmy sobie, że z populacji pobrano bardzo dużo prób tej samej wielkości. Nawet jeżeli hipoteza H0 jest prawdziwa, w 5% wszystkich prób uzyskamy wartość statystyki z obszaru krytycznego. Wśród tych 5% prób może znaleźć się ta jedna realna próba, którą dysponujemy i gdyby na jej podstawie testować hipotezę H0, należałoby ją – mimo prawdziwości – odrzucić. Popełniony zostałby błąd pierwszego rodzaju, polegający na odrzuceniu hipotezy prawdziwej. Prawdopodobieństwo popełnienia takiego błędu wyznacza poziom istotności testu, . Przyjmując niższe wartości , zmniejszamy ryzyko popełnienia błędu pierwszego rodzaju.



Gdybyśmy nie odrzuconą hipotezę zerową uznali za prawdziwą, moglibyśmy popełnić błąd drugiego rodzaju, polegający na przyjęciu hipotezy fałszywej. Prawdopodobieństwa popełnienia błędów pierwszego ( ) i drugiego ( ) rodzaju oraz liczebności próby (n) są wielkościami zależnymi. Jeżeli liczebność próby się nie zmienia, to zmniejszając wartość zwiększamy prawdopodobieństwo , chcąc natomiast przy danym poziomie istotności  zmniejszyć prawdopodobieństwo popełnienia błędu drugiego rodzaju, należałoby zwiększyć liczebność próby. Z tego powodu stwierdziliśmy wcześniej, że nieodrzucenie H0 nie może oznaczać jej automatycznego przyjęcia.

Hipotezę H0 można by przyjąć tylko wtedy, gdy liczebność próby jest wystarczająco (bardzo) duża; niestety, błąd drugiego rodzaju nie może być kontrolowany tak jak błąd pierwszego rodzaju – przez wyznaczenie obszaru krytycznego. Z tego powodu w miarę możliwości należy starać się tak formułować hipotezy, aby hipoteza, którą w wyniku testowania chcielibyśmy przyjąć, była hipotezą alternatywną. Jeżeli na przykład  x1 i x2 są średnimi arytmetycznymi obserwacji z dwóch prób i chcemy wykazać, że próby pochodzą z populacji o różnych wartościach średnich 1 i 2, sformułujemy hipotezę H0: 1 = 2 oraz hipotezę alternatywną HA: 1 2.(i użyjemy testu dwustronnego) lub gdybyśmy przypuszczali, że wartość średnia 1 jest mniejsza od 2HA: 1 < 2 (teraz zastosujemy test jednostronny).


©snauka.pl 2016
wyślij wiadomość