Presentation is loading. Please wait.

Presentation is loading. Please wait.

Thống Kê Trong Nghiên Cứu Khoa Học

Similar presentations


Presentation on theme: "Thống Kê Trong Nghiên Cứu Khoa Học"— Presentation transcript:

1 Thống Kê Trong Nghiên Cứu Khoa Học
CITAR Workshop – Hue , Vietnam July 2008 Hao Duong

2 Nội Dung Đo lường tần suất bệnh
Thiết kế nghiên cứu và các đo lường tương quan Một số test thống kê thường gặp Them mot so thong tin cho thao luan nhom

3 Đo lường tần suất bệnh Xác định tần suất bệnh hoặc những vấn đề sức khoẻ khác trong những nhóm dân số quan tâm. Hai loại đo lường tần suất bệnh: tình trạng mới mắc và tỷ lệ lưu hành. The choice typically depends on the study design and the goal of the study.

4 Đo lường tần suất bệnh Định nghĩa:
Tình trạng mới mắc đo lường những trường hợp mới mắc bệnh trong một khoảng thời gian. Tỷ lệ lưu hành đo lường những trừơng hợp bệnh hiện có tại một thời điểm đặc biệt hoặc trong một khoảng thời gian. Point prevalence – proportion of all cases at a specific point in time. Period prevalence – proportion of all cases during a period of time. Must have a starting and ending point. Incidence generally a more relevant measure of disease occurrence. However in chronic diseases, where flow of new disease is slow, prevalence is more employed.

5 Đo lường tần suất bệnh Dân số có nguy cơ
Incidence measures are useful for identifying risk factors and assessing disease etiology. Typically, incidence measures are estimated from clinical trials and from cohort studies, which involve the follow-up of subjects over time. Prevalence measures are not as useful as incidence measures for assessing etiology because prevalence does not consider persons who die from the disease before the prevalence study begins. Typically, prevalence measures are estimated from cross-sectional studies and from case-control studies that use prevalent, rather than incident, cases. Since the number of prevalent cases indicates demand for health care, prevalence measures are most useful in the planning of health services.

6 Đo lường tần suất bệnh P=C/N Loại nghiên cứu: P: Tỷ lệ lưu hành
C: Số lượng bệnh hiện có N: Số lượng dân số ổn định Loại nghiên cứu: Nghiên cứu cắt ngang Đăng kí bệnh Incidence concerns new cases of a disease or other health outcome over a period of follow-up. Prevalence concerns existing cases of a disease at a point in time. Incidence measures are useful for identifying risk factors and assessing disease etiology. Prevalence measures are most useful in the planning of health services. By steady state, we mean that even though the population may be dynamic, the number of persons who enter and leave the population for whatever reasons are essentially equal over the study period, so that the population does not change.

7 Đo lường tần suất bệnh CI=I/N IR=I/PT CI: Tỷ lệ phát sinh tích luỹ
I: Số lượng bệnh mới mắc N: Số lượng dân số không bị bệnh được theo dõi trong một khoảng thời gian IR=I/PT IR: Tỷ suất phát sinh PT: Thời gian trải nghiệm của dân số có nguy cơ The part of population which is susceptible to a disease is called the population at risk. Occupational injuries occur only among working people so the population at risk is the workforce. Men should not be included in calculations of the frequency of carcinoma of cervix. Cumulative incidence: fixed population

8 Đo lường tần suất bệnh Loại nghiên cứu: Đăng kí bệnh Nghiên cứu cohort
Nghiên cứu thử nghiệm Incidence concerns new cases of a disease or other health outcome over a period of follow-up. Prevalence concerns existing cases of a disease at a point in time. Incidence measures are useful for identifying risk factors and assessing disease etiology. Prevalence measures are most useful in the planning of health services.

9 Đo lường tần suất bệnh D+ D- E+ a b a+b E- c d c+d a+c b+d a+b+c+d
D+ : bệnh D- : không bệnh E+ : phơi nhiễm E- : không phơi nhiễm

10 Đo lường tần suất bệnh Nếu a+b là số ngươì có nguy cơ thì đây là tỷ lệ phát sinh tích luỹ Nếu a+b là số người năm có nguy cơ thì đây là tỷ suất phát sinh/mật độ phát sinh Re = a/a+b Rne= c/c+d

11 Tỷ lệ phát sinh tích luỹ

12 Tỷ lệ phát sinh tích luỹ Ví dụ: Sử dụng thuốc giảm ăn Nhồi máu cơ tim
không tổng 30 470 500 11 489 41 959 1000

13 Tỷ lệ phát sinh tích luỹ Re=a/a+b 95% CI of Re= Re ±Z*SE(Re)
SE(Re) là phương sai của Re. Phương sai của Re là: The standard error is a measure of the statistical variability of the estimate. Under the binomial model. Z(a/2): two-tail Z(a): one tail

14 Sự phân bố Z (Sự phân bố bình thường chuẩn)

15 Bảng Z http://www.sjsu.edu/faculty/gerstman/StatPrimer/negative-z.pdf
2.5% 2.5% -1.96 1.96

16 Tỷ lệ phát sinh tích luỹ Re=30/500=0.06, or 6 per 100
95% CI for Re=0.06±1.96*0.01 95% CI for the risk estimate of 6 per 100 is 4-8 per 100

17 Tỷ suất phát sinh/Mật độ phát sinh

18 Tỷ suất phát sinh/Mật độ phát sinh
a: số bệnh PT: người-thời gian E+: phơi nhiễm E-: không phơi nhiễm case PT E+ a PT1 E- c PT2 a+c PT1+PT2 Incidence density/rate data is observed through the transformation of non cases into cases (prospective study). Follow two populations: those exposed and those unexposed to the factor.

19 Tỷ suất phát sinh/Mật độ phát sinh

20 Tỷ suất phát sinh/Mật độ phát sinh
Ví dụ: Ung thư vùng miệng Người thời gian (năm) Hút thuốc lá 15 4768.5 Không hút thuốc lá 5 4872.5

21 Tỷ suất phát sinh/Mật độ phát sinh
Follow the Poisson distribution 95% CI for IR=3.1±1.96*0.8 95% CI for the rate estimate of 3.1 per 1000 person-years is per 1000 person-years

22 Đo lường tần suất bệnh P=I*D nếu dân số ổn định và bệnh hiếm gặp.
P=(I*D)/[(I*D)+1] nếu bệnh không hiếm gặp. By steady state, we mean that even though the population may be dynamic, the number of persons who enter and leave the population for whatever reasons are essentially equal over the study period, so that the population does not change. Example: prevalence of AIDS increases. Could be good: duration of disease increases. Could be bad: incidence increases.

23 Thiết kế nghiên cứu và các đo lường tương quan

24 Thiết kế nghiên cứu và các đo lường tương quan
Nghiên cứu cohort: Câu hỏi nghiên cứu: So với những người không phơi nhiễm, những người phơi nhiễm có xu hướng dễ mắc bệnh hơn? Đo lường: Nguy cơ tương đối (Tỷ số nguy cơ)

25 Nghiên cứu cohort Tình trạng bệnh a b a +b Tình trạng phơi nhiễm c d
không tổng a b a +b Tình trạng phơi nhiễm không c d c +d a +c b +d N

26 Nghiên cứu cohort Ví dụ: Sử dụng thuốc giảm ăn Nhồi máu cơ tim có
không tổng 30 470 500 11 489 41 959 1000 Data were obtained in a study in which 1000 nurses were followed for 20 years to examine the hypothesis that use of a certain diet pill is a risk factor for heart attack. Nguy cơ tương đối (Tỷ số nguy cơ)

27 Nghiên cứu cohort Re= Incidence rate or cumulative incidence or prevalence in exposed Rne= Incidence rate or cumulative incidence or prevalence in unexposed

28 Nghiên cứu cohort RR=(30/100)/(11/100)=2.7
95% CI for the relative risk of 2.7 is Pay attention on person, time, and place when interpreting.

29 Nghiên cứu cohort Giải thích: Những người dùng thuốc hạn chế ăn có nguy cơ bị nhồi máu cơ tim gấp 2.7 lần so với những người không sử dụng thuốc. Pay attention on person, time, and place when interpreting.

30 Nghiên cứu cohort Ví dụ: Ung thư vùng miệng Người thời gian (năm)
Hút thuốc lá 15 4768.5 Không hút thuốc lá 5 4872.5 Tỷ số của tỷ xuất phát sinh

31 Nghiên cứu cohort

32 Nghiên cứu cohort Giải thích: Những người hút thuốc lá có 3.1 lần tỷ xuất mắc bệnh ung thư vùng miệng so với những người không hút thuốc.

33 Thiết kế nghiên cứu và đo lường mối liên quan
Nghiên cứu bệnh-chứng: Câu hỏi nghiên cứu: So sánh với nhóm không bị bệnh, nhóm bị bệnh có xu hướng bị phơi nhiễm với một yếu tố nào đó hơn? Đo lường: Tỷ số số chênh

34 Nghiên cứu bệnh chứng Tình trạng bệnh a b a +b Tình trạng phơi nhiễm c
không tổng a b a +b Tình trạng phơi nhiễm không c d c +d a +c b +d N

35 Nghiên cứu bệnh chứng

36 (CD4 count>200 cells/microL and a VL<10,000 copies/mL)
Nghiên cứu bệnh chứng Ví dụ: Còn khả năng miễn dịch (CD4 count>200 cells/microL and a VL<10,000 copies/mL) HIV + ung thư cổ tử cung HIV tổng 1 35 36 không 13 20 33 14 55 69 Leitao et al., Cancer 2008

37 Nghiên cứu bệnh chứng OR=(1*20)/(13*35)=0.04
. dis exp(ln(0.04)+1.96*sqrt(1+1/20+1/13+1/35)) . dis exp(ln(0.04)-1.96*sqrt(1+1/20+1/13+1/35)) = 95% CI for the odds ratio of 0.04 is

38 Nghiên cứu bệnh chứng Giải thích: Những bệnh nhân HIV mà phát triển ung thư cổ tử cung, có 0.04 lần số chênh (odds) “có khả năng miễn dịch” so với bệnh nhân HIV không có ung thư cổ tử cung.

39 Nghiên cứu cắt ngang Tình trạng bệnh Tình trạng phơi nhiễm a b a +b c
không tổng Tình trạng phơi nhiễm a b a +b không c d c +d N a +c b +d

40 Nghiên cứu cắt ngang Thiết kế nghiên cứu cắt ngang:
Câu hỏi nghiên cứu: So với nhóm không bị phơi nhiễm, nhóm phơi nhiễm có xu hướng bị bệnh hơn? So với nhóm không bị bệnh, nhóm bị bệnh có xu hướng bị phơi nhiễm hơn? Đo lường: Tỷ số lưu hành (giống RR) or Tỷ số chênh lưu hành (giống OR)

41 Nghiên cứu cắt ngang Tỷ số lưu hành bệnh trong nhóm phơi nhiễm và nhóm không phơi nhiễm: Tỷ số chênh lưu hành:

42 Nghiên cứu cắt ngang Tỷ số tình trạng phơi nhiễm trong nhóm bệnh và nhóm không bị bệnh:

43 Thiết kế nghiên cứu và đo lường mối liên quan
RR, OR (PR, POR) = 1: Không có mối liên quan RR, OR (PR, POR) > 1: Liên quan thuận RR, OR (PR, POR) < 1: Liên quan nghịch

44 Thiết kế nghiên cứu và đo lường mối liên quan
95% CI chứa giá trị 1: Không liên quan có ý nghĩa 95% CI không chứa giá trị 1: Liên quan có ý nghĩa: Liên quan thuận hoặc Liên quan nghịch

45 Lệnh trong Stata Cohort studies
cs var_case var_exposed [if] [in] [weight] [, cs_options] csi #a #b #c #d [, csi_options] ir var_case var_exposed var_time [if] [in] [weight] [, ir_options] iri #a #b #N1 #N2 [, tb level(#)] Case-control studies cc var_case var_exposed [if] [in] [weight] [, cc_options] cci #a #b #c #d [, cci_options] Matched case-control studies mcc var_exposed_case var_exposed_control [if] [in] [weight] [, tb level(#)] mcci #a #b #c #d [, tb level(#)]

46 Test thống kê

47 Test thống kê t-tests: test sự đồng nhất hoặc (không) liên quan:
t-test một mẫu t-test hai mẫu: t-test cặp đôi và t-test không cặp test sự đồng nhất hoặc (không) liên quan: test chi bình phương test chính xác của Fisher test của McNemar

48 t-test một mẫu So sánh giá trị trung bình của một mẫu với giá trị trung bình của dân số giả định : trung bình mẫu : sai số chuẩn : trung bình dân số với n-1 độ tự do t statistics must be evaluated against the t distribution that is defined by the appropriate degrees of freedom. [df = n - 1]

49 t-test một mẫu Gỉa thuyết: Các giá trị của mẫu phải độc lập
Sự phân bố của các giá trị trong dân số là chuẩn With small samples, this is very important As sample size increases (> 30) the sampling distribution will approach normality and this assumption is met

50 t-test một mẫu Ví dụ: df=n-1=10-1=9 Chọn alpha

51 Bảng giá trị t

52 t-test một mẫu trong Stata
. ttest hypertension=100 One-sample t test Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] hypert~n | mean = mean(hypertension) t = Ho: mean = degrees of freedom = Ha: mean < Ha: mean != Ha: mean > 100 Pr(T < t) = Pr(|T| > |t|) = Pr(T > t) =

53 t-test 2 mẫu độc lập So sánh giá trị trung bình của một biến giữa 2 nhóm cá nhân Ví dụ: So sánh huyết áp trung bình của nam và nữ So sánh huyết áp trung bình sau khi điều trị thuốc A và thuốc B

54 t-test 2 mẫu độc lập (đồng phương sai)
with n(x)+n(y)-2 degree of freedom

55 t-test 2 mẫu độc lập Gỉa thuyết: Sự độc lập của các giá trị quan sát
Sự phân bố chuẩn của dân số Đồng phương sai

56 t-test 2 mẫu độc lập (khác phương sai)

57 t-test 2 mẫu độc lập Thường sử dụng t-test đồng phương sai trừ trường hợp kích thước mẫu không giống nhau và: (a) mẫu nhỏ có phương sai lớn và; (b) và phương sai mẫu nhỏ lớn hơn gấp đôi phương sai của mẫu lớn, thì dùng t-test khác phương sai.

58 Phương sai

59 t-test 2 mẫu độc lập trong Stata (đồng phương sai)
. ttest hypertension, by(gender) Two-sample t test with equal variances Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] female | male | combined | diff | diff = mean(female) - mean(male) t = Ho: diff = degrees of freedom = Ha: diff < Ha: diff != Ha: diff > 0 Pr(T < t) = Pr(|T| > |t|) = Pr(T > t) =

60 t-test 2 mẫu độc lập trong Stata (khác phương sai)
. ttest hypertension, by(gender) unequal Two-sample t test with unequal variances Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] female | male | combined | diff | diff = mean(female) - mean(male) t = Ho: diff = Satterthwaite's degrees of freedom = Ha: diff < Ha: diff != Ha: diff > 0 Pr(T < t) = Pr(|T| > |t|) = Pr(T > t) =

61 t-test cặp đôi (phụ thuộc)
Còn được gọi là test đo lường lặp lại, test mẫu liên quan. Một biến được đo lường ở một nhóm cá nhân tại 2 thơì điểm khác nhau. This test is especially good for looking at change over time as a result of some treatment or intervention. By using the same set of subjects for both conditions, you reduce the size of your total sample and eliminate variance associated with individual differences.

62 t-test cặp đôi (phụ thuộc)
: trung bình của những giá trị khác nhau Sd: độ lệch chuẩn của những giá trị khác nhau với n-1 độ tự do

63 t-test cặp đôi (phụ thuộc)
Gỉa thuyết: Sự phân bố của những giá trị khác nhau trong dân số là chuẩn.

64 Bảng giá trị t

65 t-test cặp đôi trong Stata
. ttest hypertension1= hypertension2 Paired t test Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] hypert~1 | hypert~2 | diff | mean(diff) = mean(hypertension1 - hypertension2) t = Ho: mean(diff) = degrees of freedom = Ha: mean(diff) < Ha: mean(diff) != Ha: mean(diff) > 0 Pr(T < t) = Pr(|T| > |t|) = Pr(T > t) =

66 Những trường hợp đặc biệt của t-test
t-test cặp đôi (phân bố không chuẩn): signed-rank test t-test 2 mẫu độc lập (phân bố không chuẩn): rank-sum test So sánh giá trị trung bình của nhiều nhóm (phân bố chuẩn): One way ANOVA So sánh giá trị trung bình của nhiều nhóm (phân bố không chuẩn): Kruskal-Wallis analysis of ranks

67 Test chi bình phương Áp dụng cho hai biến phân loại
So sánh phần trăm hoặc tỷ lệ Thường được sử dụng trong nghiên cứu cohort hoặc nghiên cứu bệnh chứng

68 Test chi bình phương D+ D- E+ a b a+b E- c d c+d a+c b+d n
df=(row-1)*(colum-1)

69 Test chi bình phương Ví dụ: Sử dụng thuốc chán ăn Nhồi máu cơ tim có
không tổng 30 470 500 11 489 41 959 1000 Data were obtained in a study in which 1000 nurses were followed for 20 years to examine the hypothesis that use of a certain diet pill is a risk factor for heart attack.

70 Bảng chi bình phương

71 Test chi bình phương Với 1 độ tự do và 95% CI, giá trị tương ứng là 3.84 = (1.96)*(1.96) 9.2 > 3.84: loại bỏ giả thuyết “null” Kết luận: Có mối liên quan có ý nghĩa giữa sự dụng thuốc chán ăn và nhồi máu cơ tim.

72 Chi bình phương trong Stata
. tabi \11 959, chi col row | col row | | Total 1 | | | | | | 2 | | | | | | Total | ,429 | 1,470 | | | | Pearson chi2(1) = Pr = 0.000

73 Chi bình phương trong Stata
. tabi \11 959\13 400, chi expect | Key | | | | frequency | | expected frequency | | col row | | Total 1 | | | | 2 | | | | 3 | | | | Total | ,829 | 1,883 | ,829.0 | 1,883.0 Pearson chi2(2) = Pr = 0.000

74 Test chính xác của Fisher
Áp dụng khi giá trị mong đợi nhỏ hơn 1 hoặc hơn 20% của các nhóm (cells) có giá trị nhỏ hơn 5.

75 Test chính xác của Fisher trong Stata
. tabi 3 20\12 15, chi exact expect | Key | | | | frequency | | expected frequency | | col row | | Total 1 | | | | 2 | | | | Total | | | | Pearson chi2(1) = Pr = 0.016 Fisher's exact = 1-sided Fisher's exact =

76 Test chính xác của Fisher trong Stata
. tabi 3 27\7 40, chi exact expect | Key | | | | frequency | | expected frequency | | col row | | Total 1 | | | | 2 | | | | Total | | | | Pearson chi2(1) = Pr = 0.533 Fisher's exact = 1-sided Fisher's exact =

77 Test chính xác của Fisher trong Stata
. tabi 3 27\7 40\12 50, chi exact expect | Key | | | | frequency | | expected frequency | | col row | | Total 1 | | | | 2 | | | | 3 | | | | Total | | | | Pearson chi2(2) = Pr = 0.503 Fisher's exact =

78 Test của McNemar Mẫu không độc lập. Controls
Cặp đôi (e.g. cặp đôi giữa bệnh và chứng liên quan đến tuổi, chủng tộc, giới). Controls Cases E+ E- a b c d

79 Test của McNemar OR=b/c

80 Test của McNemar trong Stata
. mcci | Controls | Cases | Exposed Unexposed | Total Exposed | | Unexposed | | Total | | McNemar's chi2(1) = Prob > chi2 = Exact McNemar significance probability = Proportion with factor Cases Controls [95% Conf. Interval] difference ratio rel. diff odds ratio (exact)

81 Tài liệu tham khảo Principles of Biostatistics, Marcello Pagano and Kimberlee Gauvreau. ActivEpi Companion Textbook. David G. Kleinbaum, Kevin M. Sullivan, Nancy D. Barker. Statistics with Stata, for Version 9 by Lawrence C. Hamilton. Lecture notes. Dr. Kay Dunn, Department of Biostatistics, UT SPH. Lecture notes. Dr. Tarwater, Department of Biostatistics, UT SPH, El paso Regional Campus.


Download ppt "Thống Kê Trong Nghiên Cứu Khoa Học"

Similar presentations


Ads by Google