u organskoj poljoprivredi Statistika u organskoj poljoprivredi
Cilj predmeta Cilj predmeta Statistika je da student: upozna statističku terminologiju nauči kako se podaci prikupljaju, organizuju i obrađuju razume jednostavne statističke metode i interpretaciju rezultata primeni statističke testove na primerima iz agronomije
Šta je statistika ? nauka koja se bavi (1) sakupljanjem, organizacijom i kondenzacijom podataka i (2) analizom u cilju izvodjenja zaključka o prirodi tih podataka kada se posmatra samo jedan njihov deo Statistika je skup procedura i principa za prikupljanje podataka i analiziranje informacija koje podaci nose, a u cilju donošenje odluke uprkos neizvesnosti koja postoji
Zašto učimo statistiku? Čak i elementarno znanje statistike pomaže da se rešavaju problemi u poslu kojim se bavimo, ali i u svakodnevnom životu Poznavanje osnovnih statističkih metoda može da pomogne u boljem obavljanju posla i time napredovanju u karijeri Poznavanje statističke analize može biti korisno i za učenje drugih predmeta
Statističke metode Statističke metode Deskriptivna statistika Inferencijalna statistika
Deskriptivna statistika Obuhvata procedure za: sakupljanje podataka uređivanje podataka tabelarno predstavljanje podataka grafičko predstavljanje podataka numeričku karakterizaciju podataka Svrha: opisivanje podataka
Inferencijalna statistika Obuhvata metode za: ocenjivanje nepoznatih veličina testiranje hipoteza Svrha: izvođenje zaključka o većoj grupi na osnovu podataka dobijenih iz pripadajuće manje grupe
Statistička terminologija Populacija Uzorak Promenljive veličine (varijable) Podaci Statistički izrazi imaju značenje koje može da se razlikuje od svakodnevnog korišćenja
Populacija Sve vrednosti, ljudi ili stvari koje nas interesuju iz određenih razloga, odnosno za određene studije Definisanje populacije tek kada je poznata svrha sakupljanja podataka
Populacija Populacija pola Populacija nivoa obrazovanja Populacija godina starosti Populacija nivoa obrazovanja
Uzorak Uzorak je deo populacije
Odabir uzoraka Odabir uzoraka Bez verovatnoće Sa verovatnoćom (slučajni) Prost Prema slobodnoj proceni Sistematski Prema svrsi istraživanja Stratificirani Klaster (Cluster)
Prost slučajni uzorak Uzorak čiji svaki član ima istu verovatnoću ili šansu da bude izabran iz populacije Izbor jednog objekta ne utiče na izbor ostalih Izbor članova uzorka može biti sa ponavljanjem ili bez ponavljanja
Sistematski uzorak Odredi se veličina uzorka: n Populacija od N osoba podeli se u grupe od po k osoba k = N/n Slučajnim izborom se izabere jedna osoba u prvoj grupi Dalje se izabira svaka k-ta osoba Primer: N = 64, n = 8, k = 64/8 = 8
Stratificirani uzorak Populacija se podeli u dve ili više grupa prema nekoj zajedničkoj osobini Iz svake grupe se slučajnim izborom formira uzorak Formirani uzorci se spoje u jedan
Klaster uzorak Populacija se podeli u više grupa - “klastera”, svaki ima karakteristike populacije Od ukupnog brojha klastera odabere se nekoliko U odabranim klasterima se analizira svaka jedinka ili se iz svakog klastera izabere slučajni uzorak Izabrani klasteri, odnosno uzorci iz klastera, kombinuju u jedan uzorak
klaster uzorak kombinovan sa prostim slučajnim uzorkom Kompanije (klasteri) klaster 1 klaster 2 klaster uzorak klaster uzorak kombinovan sa prostim slučajnim uzorkom
Greška zbog korišćenja uzorka populacija dostupan deo populacije nalazi se u telefonskom imeniku odabran uzorak stvarni uzorak (odgovorili na anketu) Frame Error The sampling frame is also called the ‘working population.’ Frame error is the discrepancy between population and sampling frame. e.g., Not all students may be in phone book Sampling Error Sampling units may not perfectly represent the population. All samples vary. Sampling error is a function of sample size Systematic (Nonresponse & Measurement) Error Nonresponse, badly worded questions, interview error. 68
Prednosti i nedostaci Prost slučajni uzorak i sistematski uzorak Jednostavni za odabir Ne predstavljaju uvek karakteristike populacije Stratificirani uzorak Obezbeđuje izbor članova kroz celu populaciju Klaster uzorak Skup Zahteva veliki uzorak da bi se postigao isti nivo preciznosti
Promenljiva veličina (varijabla) Promenljiva veličina je entitet koji može imati različite vrednosti (Sve ono što se menja može biti varijabla) Promenljive nisu obavezno kvantitativne veličine Promenljive mogu imati specifične atribute Promenljive mogu biti zavisne i nezavisne Statistički eksperiment - sakupljanje informacija
Podaci Podaci Kvantitativni (numerički) Kvalitativni (kategorički) Podaci su informacije kojima se izražavaju vrednosti promenljivih i koje statističari sakupljaju, obrađuju i analiziraju Podaci Kvantitativni (numerički) Kvalitativni (kategorički) Diskretni Kontinuirani
Kako se podaci mere ? Četiri nivoa (skale) merenja: 1. Nominalna skala 2. Ordinalna skala 3. Intervalna skala 4. Skala odnosa
Kategorički podaci Objekti koji se proučavaju grupisani su u kategorije bazirane na nekoj kvalitativnoj osobini Primer: Boja kose plava, smeđa, crvena, crna itd. Mišljenje studenata o nekom događaju nezadovoljni, neutralni, zadovoljni Status pušenja pušač, nepušač
Kategorički podaci Kategorički podaci Ne-binarni Binarni Ordinalni Nominalni
Nominalna skala Vrsta kategoričkih podataka koji se svrstavaju u neuređene kategorije Primer: Boja kose: smeđa, plava, crna itd. Rasa: bela, crna, žuta itd. Pol: muški, ženski Status pušenja: pušači, nepušači Nijedna kategorija nema prioritet!
Ordinalna skala Vrsta kategoričkih podataka koji su klasifikovani po određenom redosledu, pri čemu rastojanje između kategorija nema tačno određeno značenje a. rating skala b. ranking skala
Ordinalna skala Rating skala Ranking skala težina bolesti: blaga, umerena, teška, vrlo teška mišljenje o kvalitetu hrane u restoranu: odlična, osrednja, loša ocena kvaliteta nastave: na skali od 1 do 5 Rangiranje je izvršeno na osnovu subjektivnog doživljaja ispitanika Ranking skala redosled sportista na takmičenju redosled kandidata na prijemnom ispitu Rangiranje je izvršeno na osnovu značaja, važnosti, interesovanja...
Binarni podaci Vrsta kategoričkih podataka kod kojih postoje samo dve kategorije Binarni podaci se izražavaju nominalnom ili ordinalnom skalom Primer: Status pušenja: pušač, nepušač Prisustvo na času: prisutan, odsutan Rezultata ispita: položio, nije položio
Kvantitativni podaci Kvantitativni podaci su rezultat “merenja” neke kvantitativne osobine objekata koji se proučavaju Kvantitativni podaci Kontinuirani Diskretni
Kvantitativni podaci Diskretni podaci – moguće su samo neke vrednosti između koji postoji određeno rastojanje Diskretni podaci se dobijaju prebrojavanjem Primer: broj studenata na času broj dece u porodici 1 2 3 4 5 6 7
Kvantitativni podaci Kontinuirani podaci – moguće su sve vrednosti unutar nekog intervala i nema razmaka između vrednosti Kontinuirani podaci se dobijaju merenjem Primer: visina, težina, sadržaj aktivne supstance u leku, koncentracija glukoze u krvi 1000
Kvantitativni podaci Intervalna skala Primer: Podaci su uređeni u kategorije po određenom redosledu Rastojanje između kategorija ima određeno značenje Početak skale (nula) i merne jedinice su proizvoljno određene Primer: temperatura, kalendar, sati, rezultati psiholoških testova
Kvantitativni podaci Skala odnosa Primer: Podaci su uređeni u kategorije po određenom redosledu Rastojanje između kategorija ima određeno značenje Uvek postoji apsolutna nula sa određenim značenjem Primer: visina, težina, broj pacijenata, fiziološka merenja
Uređivanje i prikazivanje podataka
Uređivanje i prikazivanje podataka Podaci u “sirovom” obliku nisu pogodni za analiziranje i donošenje odluke Potrebno organizovanje podataka uređivanje u tabele grafičko prikazivanje
Podaci Podaci Numerički (kvantitativni) Kategorički (kvalitativni) Diskretni Kontinuirani
Uređivanje podataka Numerički podaci Uredjivanje po veličini Raspodela frekvenci Histogram Poligon frekvenci Poligon kumuliranih frekvenci
Uređivanje numeričkih podataka Razvrstavanje u klase, intervale, kategorije, grupe - klasne intervale Broj klasnih intervala: N ili 1 + 3,22 logN Širina klasnog intervala Broj podataka u intervalu - frekvenca, f Raspodela frekvenci
Sirovi podaci PRIMER 1. Kod 120 osoba određen je bilirubin (vrednosti su date u μmol/l). Dobijene vrednosti grupisati u klasne intervale.
Klasni intervali Sirovi podaci: 4,1 … 22,5 , N = 120 Broj klasnih intervala: 120 11 Širina klasnog intervala: (22,5 - 4,1)/11 = 18,9/11 = 1,72 = 2 Granice intervala: 4 - 6 6 - 8 …. 22 - 24
Raspodela frekvenci širina donja granica gornja granica
Raspodela frekvenci Ki=2 μmol/L f fr fr (%) fk fkr fkr (%) 4,0 - 5,9 3 0,025 2,5 6,0 - 7,9 4 0,033 3,3 7 0,058 5,8 8,0 - 9,9 9 0,075 7,5 16 0,133 13,3 10,0 - 11,9 13 0,108 10,8 29 0,241 24,1 12,0 - 13,9 22 0,183 18,3 51 0,424 42,4 14,0 - 15,9 26 0,217 21,7 77 0,641 64,1 16,0 - 17,9 18 0,150 15,0 95 0,791 79,1 18,0 - 19,9 12 0,100 10,0 107 0,891 89,1 20,0 - 21,9 8 0,067 6,7 115 0,958 95,8 22,0 - 23,9 5 0,042 4,3 120 1,000 100,0 ukupno -
Prikazivanje numeričkih podataka Raspodela frekvenci Histogram Poligon frekvenci Poligon kumuliranih frekvenci
Histogram 4 6 8 10 12 14 16 18 20 22 24 bilirubin, μmol/L
Poligon frekvenci
Poređenje više grupa podataka 10 20 30 40 50 60 70 1 1,5 2 2,5 3 3,5 4 4,5 5 Log PO-aze Log DZO-aze Aktivnost enzima PON1 Broj osoba KV KG
Poligon kumuliranih frekvenci
Podaci Podaci Numerički (kvantitativni) Kategorički (kvalitativni) Diskretni Kontinuirani
Uređivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Tablica kontingencije
Sumarna tabela Spisak kategorija Broj elemenata u kategoriji (frekvenca) studenti f frel (%) I godina 505 25,4 II godina 430 21,7 III godina 410 20,7 IV godina 380 19,1 V godina 260 13,1 ukupno 1985 100 relativna frekvenca kategorija apsolutna frekvenca
Prikazivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Tablica kontingencije Štapičasti dijagram Kružni dijagram Pareto dijagram
Štapičasti dijagram
Kružni dijagram 3600 x 20,7/100 = 74,50
Pareto dijagram Kumulativni poligon % Štapičasti dijagram Obavezno !
Uredjivanje kategoričkih podataka Kategorički podaci 1 promenljiva 2 promenljive Sumarna tabela Tablica kontingencije Štapičasti dijagram Kružni dijagram Pareto dijagram
Tablica kontingencije studenti pol ukupno ženski muški I godina 305 200 505 II godina 230 430 III godina 240 170 410 IV godina 250 130 380 V godina 90 260 1195 790 1985
Histogram
Histogram
Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (15,4) 200 (10,1) 505 (25,4) II godina 230 (11,6) 430 (21,7) III godina 240 (12,1) 170 (8,6) 410 (20,7) IV godina 250 (12,6) 130 (6,5) 380 (19,1) V godina 90 (4,5) 260 (13,1) 1195 (60,2) 790 (39,8) 1985 (100) f x 100 ukupna suma 170/1985 x 100 = 8,6%
Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (25,5) 200 (25,3) 505 (25,4) II godina 230 (19,2) 430 (21,7) III godina 240 (20,1) 170 (21,5) 410 (20,7) IV godina 250 (20,9) 130 (16,5) 380 (19,1) V godina 170 (14,2) 90 (11,4) 260 (13,1) 1195 (100) 790 (100) 1985 (100) f x 100 suma u koloni 170/1195 x 100 = 14,2%
Tablica kontingencije studenti pol ukupno ženski muški I godina 305 (60,4) 200 (39,6) 505 (100) II godina 230 (53,5) 200 (46,5) 430 (100) III godina 240 (58,5) 170 (41,5) 410 (100) IV godina 250 (65,8) 130 (34,2) 380 (100) V godina 170 (65,4) 90 (34,6) 260 (100) 1195 (60,2) 790 (39,8) 1985 (100) f x 100 suma u redu 170/260 x 100 = 65,4%