Presentation is loading. Please wait.

Presentation is loading. Please wait.

Statistično zaključevanje (inferenčna statistika)

Similar presentations


Presentation on theme: "Statistično zaključevanje (inferenčna statistika)"— Presentation transcript:

1 Statistično zaključevanje (inferenčna statistika)
= zaključevanje o značilnostih populacije ven

2 Inferenčna statistika
Izberemo vzorec. Določimo statistiko (npr. M). Posplošujemo z vzorca na populacijo. ocenjevanje parametra Vprašanje: Kolikšen je parameter (m) v populaciji? testiranje hipotez Vprašanje: Ali je M pomembno različna od neke vrednosti? ven

3 Populacija in vzorec posploševanje z vzorca na populacijo
opredelitev populacije in vzorca sestavljanje liste, s katere vzorčimo reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev) velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez ven

4 Vzorčne porazdelitve ven

5 Vzorčne porazdelitve ven

6 Vzorčne porazdelitve Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo. vzorčne porazdelitve statistik opisnih statistik vzorca, npr. M, var, p, r… drugih izrazov, npr. Vsako vzorčno porazdelitev lahko opišemo: Mstatistike SD = SEstatistike ven

7 Vzorčne porazdelitve frekvenčna porazdelitev spremenljivke SD M
različnih statistik se razlikujejo: normalna, F, t, c2 vzorčna porazdelitev statistike SEstatistike Mstatistike ven

8 Vzorčne porazdelitve frekvenčna porazdelitev spremenljivke SD M
Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša. vzorčna porazdelitev statistike za manjše / večje vzorce SEstatistike Mstatistike ven

9 Standardna napaka Standardna napaka se z večanjem vzorca manjša.
Standardna napaka M SEM = standardni odklon vzorčnih aritmetičnih sredin Standardna napaka se z večanjem vzorca manjša. ven

10 Ocenjevanje parametra
Vzorčna statistika je ocena populacijskega parametra. Točkovna ocena parametra Nepristranska ocena: Sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru. Velja za vse mere centralne tendence, deleže, korelacijske koeficiente. Pristranska ocena: Mere razpršenosti. Vzorčna SD podcenjuje vrednost s. ven

11 Ocenjevanje parametra
Intervalna ocena parametra razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo B = B-odstotni interval zaupanja ven

12 Ocenjevanje parametra
Intervalno ocenjevanje M pri velikih vzorcih SEM m M vzorčna porazdelitev M je N.D. N (0,1) 1 z

13 sp zg  zsp zzg z = 0 1 - a p = a / 2 a / 2 1 - a p = a / 2 a / 2
grafični prikaz kvantilov vzorčna porazdelitev M 1 - a SEM · zp p = a / 2 a / 2 SEM sp zg a / 2 vzorčna porazdelitev z zsp zzg p = a / 2 1 - a SDz = 1 z = 0 SDz · zp ven

14 Ocenjevanje parametra
Pri majhnih vzorcih Vzorčna porazdelitev M je N.D. le, če je frekvenčna porazdelitev spremenljivke normalna. preveriti Vrednost SEM se spreminja z velikostjo vzorca. Vzorčna porazdelitev je odvisna od stopenj prostosti. SEM m 1 Interval zaupanja za m: df = N - 1

15 Testiranje hipotez Postavimo dve nasprotni si hipotezi (ničelno in alternativno). H0: V našem vzorcu je povprečni IQ enak (oz. naš vzorec izhaja iz populacije, kjer je povprečni IQ enak 100; M = 100). H1: V našem vzorcu je povprečni IQ različen od (oz. naš vzorec ne izhaja iz populacije, kjer je povprečni IQ enak 100; M  100). Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze). odvisna od velikosti vzorca razpršenosti v populaciji SE 100

16 Testiranje hipotez Na osnovi vzorčne porazdelitve poznamo verjetnost
pojavljanja določene vrednosti statistike. Če je vrednost statistike verjetna (znotraj intervala zaupanja), ohranimo ničelno hipotezo. Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativna hipoteza je verjetnejša. Statistika našega vzorca se od poznanega / predpostavljenega parametra pomembno razlikuje.) SE SE 100 M 100 M

17 Napake pri statističnem zaključevanju
naš zaključek r = 0 M = m r  0 M  m pravilna potrditev ničelne hipoteze r = 0 M = m a napaka dejansko stanje pravilna zavrnitev ničelne hipoteze r  0 M  m b napaka

18 Napake pri statističnem zaključevanju
a napaka zkrit. zkrit. z b napaka zkrit. z ven

19 Raziskovalni načrti z 1 NV in 1 OV
primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra) primerjava statistik dveh vzorcev primerjava statistik več vzorcev Ali so vrednosti preveč različne? Ali vzorci pripadajo isti populaciji? ven

20 Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo
H0: M = m H1: M  m SEM m M tkrit. tkrit. t primerjamo s tkrit 1 z

21 Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo
Študenti v povprečju na nekem testu dosegajo rezultat 6.0, rezultati testa v naši skupini pa so bili naslednji: Vprašanje: Ali je naša skupina običajna skupina študentov ali morda ne? Ali je povprečje našega vzorca enako 6.0? Če bi bila ničelna hipoteza pravilna (če bi vzorčili iz populacije s sredino 6.0), bi vrednosti t v 5 % vzorcev presegale Verjetnost pojavljanja t vrednosti 4.60 zaradi napake vzorčenja bi bila zelo majhna, manjša od 5 %. Večja verjetnost je, da vrednost našega vzorca ni posledica napake vzorčenja, temveč da naš vzorec pripada neki drugi populaciji. Ničelno hipotezo zavrnemo, sprejmemo alternativno. Povprečje našega vzorca statistično pomembno odstopa od 6.0. H0: M = 6.0 H1: M  6.0 M = 8.0 s’ = 1.95 SEM = 1.95 / Sqrt(20) = 0.44 t = ( ) / 0.44 = 4.60 df = N - 1 = 19 tkrit (19) = 2.09 t > tkrit 0.44 6.0 t = 4.6

22 t-test Primerjava povprečij dveh vzorcev
Ali oba vzorca izhajata iz iste populacije? Je razlika med njunimi M ničelna? Ima NV vpliv na OV?

23 Primer t testa dva neodvisna vzorca Vprašanje:
Ali se študenti iz EU po znanju slovenščine razlikujejo od študentov iz drugih držav? Pr.1 S1 S M s’ var’ t = ( ) / 1.16 = 2.97 df = = 18; t.05(18) = 2.101 kritični t Naša vzorca se razlikujeta za 3.45, medtem ko je variabilnost vrednosti znotraj vsakega vzorca sorazmerno majhna. Razlika med vzorcema je v primerjavi z razlikami med osebami znotraj vzorcev precejšnja. S t-testom ugotovimo, ali je razlika med sredinama obeh vzorcev tudi statistično pomembna. Če bi neštetokrat vzorčili po dva vzorca iz iste populacije, bi pri 5% primerov vzorčenj vrednost t-testa presegla kritično vrednost Naš dobljeni t znaša 2.97 in je višji od kritične vrednosti. To pomeni, da bi v manj kot 5% primerov vzorčenj iz iste populacije potegnili dva tako različna vzorca, kot sta naša. Ker je naša dobljena vrednost t višja od kritične, zaključujemo, da je verjetnost, da smo oba vzorca potegnili iz iste populacije, premajhna. Najverjetneje vzorca izhajata iz dveh različnih populacij. Zaključimo, da se aritmetični sredini pri naših vzorcih statistično pomembno razlikujeta, oz. da je S1 dosegala statistično pomembno drugačne rezultate od S2. Neodvisna spremenljivka (to, iz katere skupine držav je učenec) je imela učinek na merjeno odvisno spremenljivko (znanje slovenščine).

24 Analiza variance Primerjava povprečij več vzorcev
preverjamo pomembnost razlik med sredinami več vzorcev meritve v več pogojih (oz. vzorčenje iz več populacij) H0: ni razlik med njihovimi m ven

25 Analiza variance preverjamo pomembnost razlik med sredinami več vzorcev meritve v več pogojih (oz. vzorčenje iz več populacij) H0: ni razlik med njihovimi m ven

26 Analiza variance Ocena variance
Skupno varianco vseh podatkov lahko razstavimo na dva dela: varianco napake, ki je posledica: napak merjenja (slabih merskih instrumentov), napak kontrole (zunanjih spremenljivk), razlik med posamezniki varianco, nastalo zaradi učinkov neodvisne spremenljivke vsota kvadratov odklonov (SS) df

27 Analiza variance Mtot Mj Yi skupna variabilnost variabilnost
znotraj skupin variabilnost med skupinami

28 Primer analize variance za dva vzorca 2 3 4 5 6 7 8 9 10 11 12 ven
MT = 7 SSznotraj-1 = 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12 SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12 SSmed = 9(4-7)2 + 9(10-7)2 = = 162 dfznotraj = N - a = = dfmed = a - 1 = = 1 MSznotraj = SSznotraj / dfznotraj = 24 / 16 = 1.5 MSmed = SSmed / dfmed = 162 / 1 = 162 F = 162 /1.5 = 108 Ft (1,16) = 4.49 ven

29 Tabela povzetka analize variance
Primer analize variance za dva vzorca Tabela povzetka analize variance izvor variabilnost SS df MS F p NV < .001 napaka skupaj Skupina 1 (M = 4.0, SD = 1.2) je dosegla statistično pomembno drugačne rezultate od skupine 2 (M = 10.0, SD = 1.2), F (1, 16) = 108, p < .001. ven t-test

30 Analiza variance neponovljene in ponovljene meritve pogoji:
nominalna NV OV na vsaj intervalni merski ravni normalna porazdelitev spremenljivke v populaciji enakost varianc vzorcev analiza variance za več NV dvosmerna, trismerna ANOVA glavni učinki + interakcija med NV ven

31 Statistično zaključevanje za frekvence
Opis: tabele, frekvenčni poligoni, histogrami Običajna vprašanja: - enakost deležev kategorij pri več vzorcih - ujemanje dejanskih podatkov s pričakovanimi, testiranje hipotez o obliki porazdelitve - povezanost (interakcija) med dvema nominalnima spremenljivkama ven

32 c2 test za eno spremenljivko
Ali je višja pogostost ene kategorije slučajna? pričakovane frekvence H0: Populacijska frekvenčna distribucija je enaka pričakovani. odstopanje dejanskih od pričakovanih vrednosti … Pearsonov c2 - približek c2 distribucije df = a - 1 ven

33 Primer c2 testa za preverjanje pravokotnosti porazdelitve (= enakosti deleža oseb v vseh kategorijah) Delež izbir napačnih alternativ na vprašanju zaprtega tipa: a) b) c) fe skupaj 150 dejanski delež ft teoretični delež c2(2) = (30-50)2/50 + (40-50)2/50 + (80-50)2/50 = 28 kritična vrednost c2 pri 5% tveganju: 5.99 Naš dobljeni c2 presega kritično vrednost. Če bi neštetokrat vzorčili iz populacije, kjer osebe enakovredno izbirajo napačne alternative (kjer je delež izbire vseh alternativ enak, in sicer 0.33), bi kritično vrednost c2 po slučaju preseglo le 5 % vzorcev. Ker so bili deleži v našem vzorcu zelo različni od teoretičnega deleža 0.33 in je zato c2 pri našem vzorcu zelo presegel kritično vrednost, ni preveč verjetno, da smo ga potegnili iz populacije, kjer osebe enako pogosto izbirajo vse tri alternative. Bolj verjetno kot to je, da smo ga povlekli iz populacije, kjer osebe različne alternative izbirajo različno pogosto. Zaključimo torej, da alternativni odgovori niso enako privlačni. ven

34 c2 test odvisnosti dveh spremenljivk
kontingenčna tabela H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (na vseh ravneh ene spremenljivke so ravni druge enako izražene). pričakovana frekvenca ft = fvrsta fstolpec / N v vsakem polju izračunamo seštejemo izračune v vseh poljih, dobimo c2 Dobljeno vrednost primerjamo s kritično vrednostjo c2 df = (število vrstic - 1) (število stolpcev - 1) ven

35 c2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05
uspešnost pri nalogi 1 + - ženske (29) (21) moški c2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05 df = (število vrstic - 1) ·(število stolpcev - 1) = (2-1)(2-1) = 1 kritična vrednost: c2.05 (1) = 3.841 Naš dobljeni c2 je višji od kritične vrednosti, kar pomeni, da je rezultat statistično pomemben. Če bi naš vzorec izhajal iz populacije, kjer se moški in ženske ne bi razlikovali v uspešnosti pri nalogi, bi v manj kot 5% vzorcev dejanske frekvence tako zelo odstopale od teoretičnih. To pomeni, da je bolj kot to, da smo vzorec vlekli iz populacije, kjer oba spola enako pogosto pravilno odgovorita, verjetno, da smo vzorec vlekli iz populacije, v kateri se ženske in moški razlikujejo v uspešnosti reševanja naloge. Zaključimo, da so ženske pri reševanju naloge statistično pomembno bolj uspešne kot moški. robna vsota frekvenc V oklepajih so navedene teoretične frekvence. robna vsota frekvenc število vseh oseb

36 Previdnost! Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta. Statistična pomembnost je relativen pojem. Raste z velikostjo vzorca. Pregledati velikost učinka Ni statistično pomembno = ni dokazano. Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja. V nekaterih primerih parametričnih testov ne moremo uporabiti. ven

37 Izbor ustreznega statističnega testa
vrsta statistike raven merjenja normalnost porazdelitve enakost varianc odvisni / neodvisni vzorci majhni / veliki vzorci vrednost ničelne hipoteze nivo tveganja enosmerno / dvosmerno testiranje Neparametrični testi pogosto pri majhnih vzorcih, pri omejenosti razpona, stališča (U-porazdelitev) Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij - nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo). ven

38 Testiranje hipotez o povprečju
Povprečja N.D. parametrični testi 1 vzorec 2 vzorca več vzorcev neodvisna odvisna neodvisnih odvisnih t test (one-sample) t test (independent) t test (paired-samples) enosmerna ANOVA (GLM - univariate) enosmerna ANOVA (GLM - repeated-measures) ven

39 Testiranje hipotez o povprečju
Povprečja ni N.D. neparametrični testi 1 vzorec 2 vzorca več vzorcev neodvisna odvisna neodvisnih odvisnih binomski test - Mann- Whitneyev U - medianski test - Wilcoxonov T test (matched pairs) - test predznakov - Kruskal- Wallisov H - razširjeni medianski test Friedmanov test ven

40 Osnovna literatura ven
Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill. Graveter, F.J., in Wallnau, L.B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning. Pagano, R.R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning. Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap. Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning. Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill. ven


Download ppt "Statistično zaključevanje (inferenčna statistika)"

Similar presentations


Ads by Google