niedziela, 23 grudnia 2012

Weryfikacja hipotez statystycznych


Weryfikacja hipotez parametrycznych

Głównym przedmiotem statystyki matematycznej jest tzw. wnioskowanie statystyczne, polegające na tym żeby na podstawie przebadania odpowiednio wybranej części elementów (próby) badanego zbioru (populacji generalnej) wyciągnąć matematycznie uzasadnione wnioski dotyczące całego tego zbioru. 
Zasadniczym aparatem formalnym statystyki matematycznej jest teoria prawdopodobieństwa, można ją zatem traktować jako dział zastosowań tej teorii. Historycznie rzecz biorąc niektóre idee zastosowań rachunku prawdopodobieństwa w statystyce matematycznej pochodzą od Bayesa (teoria estymacji), Laplace`a (kontrola jakości leków) i Gaussa (rachunek błędów). Dopiero w XX w. statystyka matematyczna przekształciła się w samodzielną dyscyplinę matematyki. 

 


Przykład

Należy dokonać oceny partii pudelek zapalek liczącej 100 tys. sztuk. dostawca twierdzi, że w pudelku znajdują się przecietnie 54 zapalki. Zweryfikować hipotezę H0(m = m0 = 54). Ponieważ nie znamy rozkładu liczby zapałek w pudełkach w populacji generalnej, a mozemy łatwo pobrać próbę >= 30 możemy wieć w przybliżeniu skorzystać z rozkładu normalnego. Zkaldamy, że przy próbie o wielkości n = 100 odnotowano średnią arytmetyczną mn = 51,21 natomiast σn' = 2,54. Weryfikujemy przy poziomie istotności α = 0,02 ponieważ obraliśmy dużą próbę wiec \sigma_{M_n} \approx {{\sigma_n'} \over { \sqrt{n}}} = 0{,}245. Musimy zatem wyznaczyć t dla ktorego P \left ( {{|M_n-m_0|} \over {\sigma_{M_n}}} \ge t \right ) = 0{,}02 
Definiujemy unormowaną zmienną Y: 
Y={{M_n-m_0} \over {\sigma_{M_n}}} 
podstawiamy do wzoru 
P(|Y| \ge t) = 0{,}02 
Z własności bezwzględnej wartości: 
P[(Y \ge t) \vee (Y \le -t)] = 0{,}02 
P(Y \ge t)+P(Y \le -t) = 0{,}02 
Ponieważ funkcja gęstości jest dla rozkładu N(0,1) parzysta to zachodzi równość: 
P(Y \ge t) = P(Y \le -t) 
2P(Y \ge t) = 0{,}02 
P(Y \ge t) = 0{,}01 
Wiadomo, że P(A) to to samo co 1-P(A') więc: 
1 − P(Y < t) = 0,01 
P(Y < t) = 0,99 
A P(Y<x) to dystrybuanta - czyli F(x): 
F(t) = 0,99 
Teraz w tablicy rozkładu normalnego znajdujemy najmniejszą wartość t dla której F(t) wynosi conajmniej 0,99. Jest to wartość 2,33. 
Hipotezę H0 należy wiec odrzucić na poziomie istotności α jeżeli |M_n - 54| \ge t \cdot 0{,}245, w przeciwnym wypadku przy zadanej istotności α = 0,02 nie możemy ani potwierdzić hipotezy, ani jej odrzucić. 
Zgodnie z naszymi danymi wychodzi: 
Mn − 54 | = | 51,21 − 54 | = 2,79 
\sigma_{M_n} \cdot t = 0{,}245 \cdot 2{,}33 = 0{,}57085 
Więc: 
| M_n - 54 | \ge \sigma_{M_n} \cdot t 
2{,}79 \ge 0{,}57085 
Zatem hipotezę możemy odrzucić (jeśli wyjdzie odwrotnie to piszemy że nie odrzucamy ani nie potwierdzamy - tak właśnie trzeba było zrobić na egzaminie, bo wychodziło <).