Opis podataka Doc. dr. sc. Ana Jerončić

Slides:



Advertisements
Similar presentations
Ma.
Advertisements

Kliničke implikacije nesukladnosti između serumskih vrijednosti anti-Milerovog hormona (AMH) i broja antralnih folikula(AFC) Miro Šimun Alebić Odjel za.
Click on each of us to hear our sounds.
Sigurnost i zdravlje na radu je odgovornost svih. Za Vaše je dobro. Dobro je za poslovanje. Paneuropska anketa mišljenja o sigurnosti i zdravlju na radu.
MA. ME MI MO MU MÁ MÉ MÍ MÓ MŮ LA LE LI.
Katedra za informatiku
Metode merenja i obrade podataka Dragan Mirkov
1.6. Pohrana podataka.
Stabilnost, promjena i koherentnost ličnosti
Programi zasnovani na prozorima
Uvod u programiranje - matematika – VI predavanje
Osnove (i još malo više) statistike
JESMO LI NAPREDOVALI U IVF-U?
Compression Plus Nonsteroidal Antiinflammatory Drugs, Aspiration, and Aspiration With Steroid Injection for Nonseptic Olecranon Bursitis ; RCT Joon Yub.
Programiranje - Blokovi naredbi i logički tipovi –
Opis podataka Doc. dr. sc. Ana Jerončić
The Present Perfect Continuous Tense
SEMINARSKI RAD MS WORD.
Petlje FOR - NEXT.
Procjena.
Reference ćelije i opsega
Integrirana nastava u sedmom razredu
Armin Teskeredzic Zagreb, Hrvatska,
LAPLACEOVA TRANSFORMACIJA
Mere položaja z vrednost (ili statndardna vrednost)
Dizajniranje upitnika
Sveučilište u Splitu Medicinski fakultet
Sveučilište u Zagrebu Filozofski fakultet Odsjek za psihologiju
Prikupljanje podataka Planiranje istraživanja
STATISTIKA Metoda uzoraka.
Element form Milena Kostadinović.
MessageBox.
KORELACIJSKA I REGRESIJSKA ANALIZA
Analitička statistika Testiranje hipoteze
Koordinatori: Doc.prim.dr.sc. Silvana Smojver-Ježek
OSNOVE STATISTIČKE OBRADE PODATAKA
DISKRETNI DINAMIČKI SUSTAVI –LOGISTIČKI MODEL -KAOS-
Pojmovi digitalnog zapisa
Uzorci i pogreška uzorkovanja
Prikupljanje podataka Planiranje istraživanja
Institute of Oceanography and Fisheries Split Croatia
EPIDEMIOLOGIJA HIV INFEKCIJE U HRVATSKOJ
ELEKTRONIČKA POŠTA ( ) OTVARANJE RAČUNA.
JEDNOSTAVNA LINEARNA REGRESIJA UTJECAJA VARIJABLI NA GODINE ŽIVOTA
Do While ... Loop struktura
Programiranje – Small Basic
Analiza varijance prof. dr. sc. Nikola Šakić.
Strukture podataka i algoritmi 5. VRIJEME IZVRŠAVANJA ALGORITMA
Analiza varijance prof. dr. sc. Nikola Šakić.
Autor: Marko Pletikosa Mentor: doc.dr.sc. Domagoj Jakobović
Naredbe u php-u.
Programski jezik C++ - Vježbe - 5. dio
Programski jezik Python
Medicina utemeljena na dokazima
VAŽNOST ČITANJA U NIŽIM RAZREDIMA OSNOVNE ŠKOLE
Ljepota matematike Slijedi nekoliko zanimljivih jednakosti koje ukazuju na ljepotu matematike te povezanost matematike s Bogom koji je izvor svih čuda.
MANAGEMENT OF NASAL INJURIES BY UK ACCIDENT AND EMERGENCY CONSULTANS
Kratkotrajne veze žena i muškaraca
LimeSurvey Uvjetni prikaz pitanja Internetska istraživanja
STATISTIKA (STRUČNI STUDIJ) Korelacijska analiza Regresijska analiza.
Ljepota matematike Slijedi nekoliko zanimljivih jednakosti koje ukazuju na ljepotu matematike te povezanost matematike s Bogom koji je izvor svih čuda.
BILJEŽNICA MS WORD.
7. Baze podataka Postavke MS Accessa.
Analiza varijance prof. dr. sc. Nikola Šakić.
Ponavljanje Pisana provjera
Programiranje - Naredbe za kontrolu toka programa – 1. dio
INTERPOLACIJA PO DIJELOVIMA POLINOMIMA
Vježbenica 2: struktura grananja – 2.dio
Kako zaštititi privatnost na facebooku
Višestruko grananje.
Presentation transcript:

Opis podataka Doc. dr. sc. Ana Jerončić Katedra za istraživanja u biomedicini i zdravstvu

Opis kvantitativnih (brojčanih) podataka ? Mjere srednje vrijednosti (centralne tendencije) Mjere raspršenja

Mjere srednje vrijednosti (centralne tendencije) Kojoj vrijednosti teže moji podatci?

Mjere raspršenja (varijabilnosti) Koliko su moji podatci različiti?

Mjere srednje vrijednosti (centralne tendencije) Aritmetička sredina (prosječna vrijednost) Medijan Mod

Aritmetička sredina, Koristi se isključivo za kvantitativne (brojčane) podatke - intervalne i omjerne varijable Izračuna se tako da se zbroje sve vrijednosti jedne varijable u uzorku i taj broj se podijeli s brojem mjerenja. Primjer: Porođajne mase beba su: 3, 4, 2, 3 i 3 kg Ukupni zbroj 3+4+2+3+4= 15 kg Broj mjerenja (beba) = 5 Aritmetička sredina (prosječna vrijednost) = 15/ 5 = 3 kg

Medijan, Md Koristi se uvijek za ordinalne podatke, te za brojčane podatke kada su “asimetrično raspodijeljeni” Aritmetička sredina

Medijan, Md Poredaj brojeve po veličini: 2,3,5,6,7 Srednji broj je 5 Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli donjih 50% podataka od gornjih 50%. Primjer: Broj prethodnih trudnoća je 3,6,2,5,7. Koliki je medijan? Poredaj brojeve po veličini: 2,3,5,6,7 Srednji broj je 5 Medijan je 5

Medijan, Md Medijan za paran broj ispitanika Primjer: Odredi medijan za broj prethodnih trudnoća u slijedećih šest ispitanica: 2,7,1,6,6,3 Poredaj brojeve po veličini: 1,2,3,6,6,7 Srednji brojevi su: 3 i 6 Medijan je

Mod, Mo Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane podatke Vrijednost (broj) koji se pojavljuje najveći broj puta u uzorku Primjer: Podatci o 2,2,2,4,5,6,7,7,7,7,8 7 je broj koji se pojavljuje najučestalije (najveći broj puta) Mod je 7

Mjere srednje vrijednosti na primjeru

Mjere raspršenja (varijabilnosti) Raspon Interkvartilni raspon Varijanca Standardna devijacija

Raspon, R Koristi se kao mjera raspršenja uz medijan ili mod Razlika najviše i najniže vrijednosti u podatcima R=maxpodatak-minpodatak Greške pri mjerenju utječu na njega

Raspon, R u literaturi RAD: Merewood A et al. Vitamin D status among 4-month-old infants in New England: a prospective cohort study. J Hum Lact. 2012. 28:159-66 CILJ: Odrediti prediktore nedostatka vitamina D, 25(OH)D u skupini dojenčadi starih 4 mjeseca, testiranih nakon poroda. REZULTATI: At 4 months, 11.9% of the 177 infants were vitamin D deficient compared to 37.5% at birth (25(OH)D <20 ng/mL). Median 25(OH)D was 35.2 ng/mL (range, 5.0-100.8). …

Interkvartilni raspon – umjesto raspona kada imamo veliki uzorak

Varijanca, s2 podatci za n ispitanika Koristi se kao mjera raspršenja uz aritmetičku sredinu Prosječno kvadratno odstupanje podataka od aritmetičke sredine Rijetko se koristi jer se izražava u mjernim jedinicama2 pa je praktično tumačenje problematično npr. ovisno o tome što mjerimo: ng2/mL2, g2/danu2, … s2 -1

Standardna devijacija, s (SD) Standardna devijacija – uvijek uz aritmetičku sredinu! Korijen iz varijance => Prosječno odstupanje podataka od aritmetičke sredine Mjerne jedinice iste kao i u aritmetičke sredine: ng/mL, g/danu

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici Izmjerene su težine N=812 novorođenčadi. Izračunali smo da je aritmetička sredina 3624 g, a s (SD) 464 g. Razdioba težina je prikazana grafički (plavi histogram). 68% novorođenčadi ima težinu od 3624-464=3160 g do 3624+464=4088 g 95% novorođenčadi ima težinu od 3624-2*464=2696 g do 3624+2*464=4552 g

Mjere raspršenja vrijednosti na primjeru IQR

Opis podataka u literaturi - postoji li značajna razlika u regeneraciji jetre između vremena T1 i T2? Functional elements associated with hepatic regeneration in living donors after right hepatic lobectomy. “Twelve donors were studied at baseline; eight retested at (mean±SD) 11±3 days(T1), 10 at 91±9 days(T2), and 10 at 185±17 days(T3) after donation. Regeneration rates (mL liver per kg body weight per day) were 0.60±0.22 from baseline to T1, 0.05±0.02 from T1 to T2, 0.01±0.01 from T2 to T3 by CT, 0.54±0.20, 0.04±0.01 and 0.01±0.02 by SPECT. At T3, liver volume was 84±7% of baseline by CT and 92±13% by SPECT. “ 0.60 ± 0.22 => 0.60-0.22= 0.38 0.60+0.22= 0.82 Najveći dio podataka u vremenu T1 nalazi se u rasponu od 0.38 do 0.82 ml jetre/kg tijela po danu Najveći dio podataka u vremenu T2 nalazi se u rasponu od 0.03 do 0.07 ml jetre/kg tijela po danu

Zašto se opisna statistika koristi? Opis uzorka usporedba s populacijskim parametrima Opis uzorka u ograncima RCT kvaliteta randomizacije Procjena razdiobe podataka (odabir statističkog testa)

U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se s tvrdnjom?

Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena?   Unilateralna N=49 Bilateralna N=47 Varijable Aritmetička sredina±SD /medijan (IQR) MD (95% CI)* Dob [godine] 29.3±3.31 29.3±3.05 0.08 (-1.23, 1.38) BMI [kg/m2] 25.1±1.94 25.0±2.10 0.02 (-0.81, 0.85) FSH [IU/L] 5.5±1.19 5.1±1.15 0.38 (-0.09, 0.86) LH [IU/L] 13.0±2.64 12.3±3.50 0.68 (-0.58, 1.95) Prosječna vrijednost ukupnog V [cm3] 11.3±1.79 11.4±2.74 -0.13 (-1.08, 0.82) Prosječna vrijednost AFC  15.0±2.37 14.8±3.20 0.21 (-0.94, 1.37) A [nmol/L]  15.2±4.62 11.9±4.18 3.13 (1.34, 4.93) ǂ SHBG [nmol/L] 35.0±9.32 39.0±10.45 -4.02 (-8.07, 0.03) Prolactin [µg/L] 294.0±96.27 284.4±78.08 9.78 (-26.20, 45.77) AMH [ng/ml] 5.9 (2.7) 6.5 (3.6) -0.7 (-1.6, 0.1) T [nmol/L] 2.7 (0.6) 3.0 (1.1) -0.2 (-0.5, -0.1) ǂ DHESO4 [μmol/L] 7.8 (4.3) 7 (2.7) 0.4 (-0.6, 1.5) FAI 7.8 (1.4) 8.0 (3.3) -0.4 (-1.4, 0.2) Klinički neznačajno

Razdioba brojčanih podataka Opis preko mjera srednje vrijednosti i raspršenja ili Grafičkim prikazom (histogram)

Razdioba brojčanih podataka Opis preko mjera srednje vrijednosti i raspršenja ili Grafičkim prikazom (histogram)

Grafički prikaz razdiobe brojčanih podataka - histogram Ispitanici su podijeljeni prema veličini tumora u kategorije jednako širokih intervala 0-1, 1-2, … 8-9 cm Pobrojeno je koliko ispitanika ima u pojedinoj kategoriji Broj ispitanika po kategoriji je prikazan grafički.

Histogram – Razdioba veličine tumora u 13 bolesnika Srednja vrijednost veličine tumora u ovoj skupini je 3-4 cm (3 bolesnika) Veličina tumora je raspršena – od >0 do 9 cm Najveći dio tumora ima veličinu od 1 do 6 cm (9 bolesnika) Računanjem iz aritmetičke sredine i SD 3.77-2.25=1.52 3.77+2.25=6.02

Oblik histograma Krivulja normalne (Gaussove) razdiobe

Oblik histograma

Laž s prosječnom plaćom

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

Opis kvalitativnih (nominalnih, ordinalnih) podataka Kvalitativne varijable – vrijednost tih varijabli je kategorija: Spol (muško/žensko) Stupanj tumora (mali/ srednji/ veliki) Stupanj opeklina (1/ II/ III) Kvalitativne varijable pobrojavamo!

Opis kvalitativnih podataka Nakon provedenoga istraživanja ispunili ste slijedeći obrazac za unos podataka. Što možete reći o razdiobi spola u vašem ispitivanju? apsolutna učestalost SPOL EEG nalaz muško patološki žensko uredan Nžena=12 Nmuškaraca=5 Je li vaše istraživanje dobro izbalansirano s obzirom na spol? relativna učestalost Postotak žena=12*100/17=71% Postotak mušk=5*100/17=29%

Zapamti! Apsolutna učestalost ili apsolutna frekvencija 3 bolesnika u uzorku od 10 Relativna učestalost ili relativna frekvencija 3/10=30% bolesnika Postotak 30% = Proporcija 0.3

Dvije varijable? Povezanost varijabli

Opis kvalitativnih podataka - 2 varijable Tablica frekvencija (2X2) EKG nalaza prema spolu ispitanika   EEG nalaz patološki uredan Ukupno SPOL muško 4 1 5 žensko 11 12 17 Tablice frekvencija (ili tablice kontigencija) s više varijabli služe: prikazu odnosa između odabranih varijabli (SPOL i EKG nalaz) ili kao podloga za primjenu statističkog testa koji ispituje postoji li povezanost između tih varijabli.

Opis kvalitativnih podataka - 2 varijable Tablica 1. Broj (%) ispitanika prema EKG nalazu u odnosu na spol Patološki (n=5) Uredan (n=12) Ukupno (n=17)  Spol   muškarci 4 (80) 1 (8) 5 žene 1 (20) 11 (92) 12 Slika 1. Razdioba ispitanika prema EKG nalazu u odnosu na spol

Opis kvalitativnih podataka – 2 varijable Slika. Razdioba ispitanika prema EKG nalazu u odnosu na spol

Opis kvantitativnih (brojčanih) podataka za 2 varijable? npr. interesira nas povezanost duljine bubrega s porastom životne dobi djece Za svako dijete imamo podatke za dvije varijable (obilježja) Dob djeteta [dani] Duljina bubrega [mm]

TOČKASTI GRAF Duljina bubrega [mmi] Starost djeteta [dani] Na x osi je dob (dani)- NEOVISNA VARIJABLA, a na y je duljina bubrega (mm)-OVISNA VARIJABLA.

Hvala na pozornosti! Pitanja?