Presentation is loading. Please wait.

Presentation is loading. Please wait.

Hoài qui phi tuyeán Hoài qui phi tuyeán vaø hoài qui tuyeán tính : Moâ hình hoài qui ñöôïc goïi laø phi tuyeán neáu caùc ñaïo haøm cuûa moâ hình töông.

Similar presentations


Presentation on theme: "Hoài qui phi tuyeán Hoài qui phi tuyeán vaø hoài qui tuyeán tính : Moâ hình hoài qui ñöôïc goïi laø phi tuyeán neáu caùc ñaïo haøm cuûa moâ hình töông."— Presentation transcript:

1 Hoài qui phi tuyeán Hoài qui phi tuyeán vaø hoài qui tuyeán tính : Moâ hình hoài qui ñöôïc goïi laø phi tuyeán neáu caùc ñaïo haøm cuûa moâ hình töông öùng vôùi caùc thoâng soá cuûa moâ hình tuøy thuoäc vaøo moät hay nhieàu thoâng soá.. Ñònh nghóa naøy caàn thieát ñeå phaân bieät hoài qui phi tuyeán vôùi hoài qui ñöôøng cong. Moâ hình hoài qui khoâng nhaát thieát laø phi tuyeán neáu ñöôøng khuynh höôùng cuûa hoài qui laø ñöôøng cong. Chaúng haïn moâ hình ña thöùc y = b 0 + b 1 x + b 2 x 2 + e xuaát hieän laø ñöôøng cong khi khi veõ y theo x. tuy nhieân noù khoâng phaûi laø moâ hình phi tuyeán

2 Ñeå thaáy ñieàu naøy, haõy laáy caùc ñaïo haøm cuûa y töông öùng vôùi caùc thoâng soá b 0, b 1, vaø b 2 : : dy/db 0 = 1 dy/db 1 = x dy/db 2 = x 2 Caùc ñaïo haøm naøy khoâng phuï thuoäc vaøo thoâng soá cuûa moâ hình, moâ hình laø tuyeán tính Ngöôïc laïi, xeùt moâ hình log-logistic y = d + (a - d)/(1 + exp{b log(x/g)}) + e. Laáy ñaïo haøm töông öùng vôùi d chaúng haïn : dy/dd = 1 - 1/(1 + exp{b log(x/g)}). Ñaïo haøm lieân quan ñeán caùc thoâng soá khaùc, nhö vaäy moâ hình laø phi tuyeán. Laøm phuø hôïp moät moâ hình hoài qui phi tuyeán vôùi caùc soá lieäu laø hôi phöùc taïp hôn laøm phuø hôïp moät moâ hình tuyeán tính, tuy nhieân chuùng coù moät soá öu ñieåm : A/ caùc moâ hình phi tuyeán thöôøng xuaát phaùt töø caên baûn cuûa caùc quan saùt vaät lyù vaø/hay sinh hoïc

3 -,Thí duï, töø caùc phöông trình vi phaân vaø coù caùc giaûi thích trong phaïm vi khaùi nieäm ñònh löôïng cuûa quaù trình ñöôïc quan taâm B/ Caùc thoâng soá cuûa moâ hình phi tuyeán thöôøng coù söï giaûi thích tröïc tieáp qua quaù trình nghieân cöùu. - Trong moâ hình log-logistic keå treân chaúng haïn, ñaùp öùng coù daïng sigmoid giöõa d vaø a, g laø giaù trò ôû ñoù ñaùp öùng baèng (a + d)/2. Laøm phuø hôïp caùc hoài qui phi tuyeán laø moät quaù trình laäp laïi Moät trong caùc ñieåm baát lôïi cuûa caùc moâ hình phi tuyeán laø quaù trình laäp laïi

4 Ñeå öôùc löôïng caùc thoâng soá cuûa moâ hình, phaûi baét ñaàu vôùi moät taäp hôïp caùc giaù trò khôûi ñaàu do ngöôøi söû duïng cung caáp. Khi ñoù phaàn meàm maùy tính coá gaéng caûi thieän chaát löôïng cuûa moâ hình phuø hôïp vôùi soá lieäu baèng caùch lieân tieáp ñieàu chænh caùc giaù trò cuûa caùc thoâng soá. Söï ñieàu chænh taát caû caùc thoâng soá ñöôïc xem nhö moät laàn laäp laïi Trong laàn laäp laïi keá tieáp, chöông trình moät laàn nöõa, coá gaéng caûi thieän söï phuø hôïp baèng caùch thay ñoåi caùc thoâng soá Moät khi söï caûi thieän khoâng theå thöïc hieän ñöôïc nöõa, söï phuø hôïp ñöôïc xem nhö ñaõ ñöôïc hoäi tuï

5 Caàn thaän troïng trong vieäc choïn caùc giaù trò khôûi ñaàu vì chöông trình coù theå khoâng caûi thieän ñöôïc söï phuø hôïp cuûa moâ hình giöõa 2 laàn laäp laïi lieân tieáp,, ñieàu naøy coù theå khoâng phaûi laø soá öôùc löôïng toát nhaát cuûa thoâng soá ñaõ ñöôïc tìm thaáy maø chæ chöùng toû thieáu söï tieán boä trong thuaät toaùn laäp laïi. Nhö vaäy caàn khôûi ñaàu tieán trình laäp laïi vôùi caùc taäp hôïp khaùc nhau cuûa caùc giaù trò khôûi ñaàu vaø quan saùt xem chöông trình coù ñaït ñeán cuøng caùc soá öôùc löôïng.

6 Thuû tuïc SAS laøm phuø hôïp hoài qui phi tuyeán laø PROC NLIN Xeùt moât taäp hôïp soá lieäu sau ñaây : data weeds; input tx rate y; rate = rate * 1.12; /* convert from lbs/acre to kg/ha */ if rate < 1E-6 then rate = 1E-6; datalines; 1 0.000 99 1 0.020 84 1 0.040 95 1 0.080 84 1 0.160 53 1 0.320 6 1 0.641 6 1 0.000 103 1 0.020 84 1 0.040 94 1 0.080 79 1 0.160 75 1 0.320 27 1 0.641 7 1 0.000 113 1 0.020 91 1 0.040 80 1 0.080 76 1 0.160 52 1 0.320 6 1 0.641 6 1 0.000 86 1 0.020 78 1 0.040 85 1 0.080 80 1 0.160 53 1 0.320 30 1 0.641 8 1 0.000 110 1 0.020 104 1 0.040 89 1 0.080 84 1 0.160 44 1 0.320 17 1 0.641 9 1 0.000 94 1 0.020 103 1 0.040 97 1 0.080 85 1 0.160 58 1 0.320 17 1 0.641 7 1 0.000 95 1 0.020 113 1 0.040 85 1 0.080 79 1 0.160 33 1 0.320 19 1 0.641 4 1 0.000 101 1 0.020 107 1 0.040 105 1 0.080 87 1 0.160 75 1 0.320 20 1 0.641 11 ; run;

7 Taïm thôøi khoâng löu yù ñeán bieán nghieäm thöùc TX, chuùng ta muoán laøm phuø hôïp moâ hình log-logistic y = d + (a - d)/(1 + exp{b log(x/g)}) + e vôùi caùc soá lieäu : proc nlin data=weeds; parameters alpha=100 delta=4 beta=2.0 gamma=0.2; model y = delta + (alpha-delta)/ (1 + exp(beta*log(rate/gamma))); run; Phaùt bieåu PARAMETERS xaùc ñònh caùc thoâng soá cuûa moâ hình caàn ñöôïc öôùc löôïng (teân thoâng soá coù theå duøng ñeán 8 kyù töï nhöng khoâng ñöôïc baét ñaàu baèng soá ) Phaùt bieåu MODEL chöùa bieåu thöùc toaùn cuûa moâ hình. Chæ coù moät bieán ôû phía phaûi cuûa moâ hình khoâng ñöôïc xaùc ñònh trong PARAMETERS laø RATE. Sau ñaây laø keát quaû :

8 Non-Linear Least Squares Iterative Phase Dependent Variable Y Method: Gauss-Newton Iter ALPHA DELTA BETA GAMMA Sum of Squares 0 100.000000 4.000000 2.000000 0.200000 5284.20 7076 1 97.265416 1.238334 2.202450 0.191326 4468.645 787 2 97.155009 0.894100 2.222681 0.193661 4464.406 826 3 97.109336 1.039029 2.236293 0.193424 4464.263 887 4 97.097903 1.047721 2.238380 0.193463 4464.257 070 5 97.095319 1.052604 2.238974 0.193461 4464.256 734 6 97.094723 1.053402 2.239095 0.193462 4464.256 717 NOTE: Convergence criterion met. Baûng ñaàu tieân trình baøy quaù trình laäp laïi cuûa moâ hình Haøng ITER 0 chöùa caùc giaù trò khôûi ñaàu vaø SS sai bieät. Khi ñoù SAS baét ñaàu caäp nhaät nhöõng giaù trò naøy trong laàn laäp laïi keá tieáp. Chuù yù SS sai bieät giaûm cho ñeán khi söï caûi thieän khoâng ñöôïc thöïc hieän sau laàn laäp laïi thöù saùu. Moâ hình ñaõ hoäi tuï. Keá tieáp laø baûng ANOVA phaân chia SS toång coäng thaønh SS ñöôïc giaûi thích bôûi moâ hình vaø SS sai bieät

9 Non-Linear Least Squares Summary Statistics Dependent Variable Y Source DF Sum of Squares Mean Square Regression 4 300475.74328 75118.93582 Residual 52 4464.25672 85.85109 Uncorrected Total 56 304940.00000 (Corrected Total) 55 74538.85714. Baûng keá tieáp trình baøy caùc öôùc löôïng cuûa caùc thoâng soá, sai soá chuaån vaø khoaûng tin caäy 95% tieäm caän. Chuù yù taát caû keát quaû trong hoài qui phi tuyeán laø tieäm caän.Ñieàu naøy coù nghóa sai soá chuaån, chaúng haïn, chæ ñuùng neáu coù ñoä lôùn cuûa maãu laø voâ haïn. Ñoái vôùi ñoä lôùn maãu xaùc ñònh, sai soá chuaån ñöôïc baùo caùo chæ laø soá gaàn ñuùng vaø ñöôïc caûi thieän khi ñoä lôùn maãu gia taêng.

10 Tieâu bieåu cho hoài qui phi tuyeán laø caùc heä soá töông quan giöõa caùc thoâng soá. Moät caùch caên baûn, ñieàu naøy noùi raèng neáu moät thoâng soá thay ñoåi thì caùc thoâng soá khaùc seõ thay ñoåi. Neáu coù caùc heä soá töông quan cao, söï phuø hôïp cuûa moâ hình coù theå bò aûnh höôûng. Khi ñoù coù theå choïn moät phöông phaùp laøm phuø hôïp khaùc

11 Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper ALPHA 97.09472257 2.2526644734 92.574427306 101.61501784 DELTA 1.05340175 5.4120397147 - 9.806634348 11.91343785 BETA 2.23909502 0.3642121689 1.508250919 2.96993912 GAMMA 0.19346184 0.0162266928 0.160900642 0.22602303 Asymptotic Correlation Matrix Corr ALPHA DELTA BETA GAMMA ---------------------------------------------------------------------------------- ALPHA 1 -0.301160511 -0.52588196 - 0.108538167 DELTA -0.301160511 1 0.7586141693 - 0.754366204 BETA -0.52588196 0.7586141693 1 - 0.465204141 GAMMA -0.108538167 -0.754366204 -0.465204141 1

12 Baûng ñaàu tieân trình baøy quaù trình laäp laïi cuûa moâ hình Haøng ITER 0 chöùa caùc giaù trò khôûi ñaàu vaø SS sai bieät. Khi ñoù SAS baét ñaàu caäp nhaät nhöõng giaù trò naøy trong laàn laäp laïi keá tieáp. Chuù yù SS sai bieät giaûm cho ñeán khi söï caûi thieän khoâng ñöôïc thöïc hieän sau laàn laäp laïi thöù saùu. Moâ hình ñaõ hoäi tuï. Keá tieáp laø baûng ANOVA phaân chia SS toång coäng thaønh SS ñöôïc giaûi thích bôûi moâ hình vaø SS sai bieät. Baûng keá tieáp trình baøy caùc öôùc löôïng cuûa caùc thoâng soá, sai soá chuaån vaø khoaûng tin caäy 95% tieäm caän. Chuù yù taát caû keát quaû trong hoài qui phi tuyeán laø tieäm caän.Ñieàu naøy coù nghóa sai soá chuaån, chaúng haïn, chæ ñuùng neáu coù ñoä lôùn cuûa maãu laø voâ haïn

13 Ñoái vôùi ñoä lôùn maãu xaùc ñònh, sai soá chuaån ñöôïc baùo caùo chæ laø soá gaàn ñuùng vaø ñöôïc caûi thieän khi ñoä lôùn maãu gia taêng. Tieâu bieåu cho hoài qui phi tuyeán laø caùc heä soá töông quan giöõa caùc thoâng soá. Moät caùch caên baûn, ñieàu naøy noùi raèng neáu moät thoâng soá thay ñoåi thì caùc thoâng soá khaùc seõ thay ñoåi. Neáu coù caùc heä soá töông quan cao, söï phuø hôïp cuûa moâ hình coù theå bò aûnh höôûng. Khi ñoù coù theå choïn moät phöông phaùp laøm phuø hôïp khaùc

14 3.2. Duøng moät maïng löôùi caùc giaù trò khôûi ñaàu : Neáu khoâng baûo ñaûm veà caùc giaù trò khôûi ñaàu, coù theå duøng moät maïng löôùi baèng caùch cung caáp cho SAS nhieàu hôn moät giaù trò khôûi ñaàu. SAS seõ tính SS sai bieät ban ñaàu cho taát caû caùc toå hôïp cuûa caùc giaù trò khôûi ñaàu vaø baét ñaàu caùc söï laäp laïi vôùi taäp hôïp toát nhaát. Thí duï :

15 proc nlin data=weeds; parameters alpha=100 delta=4 beta=1 to 2 by 0.5 gamma=0.1 to 0.4 by 0.1; model y = delta + (alpha-delta) / (1 + exp(beta*log(rate/gamma))); run; seõ taïo ra 12 taäp hôïp khaùc nhau cuûa caùc giaù trò khôûi ñaàu. Baûng laäp laïi nhö sau :

16 Non-Linear Least Squares Grid Search Dependent Variable Y ALPHA DELTA BETA GAMMA Sum of Squares 100.000000 4.000000 1.000000 0.100000 18289.313156 100.000000 4.000000 1.500000 0.100000 15482.810583 100.000000 4.000000 2.000000 0.100000 16378.826233 100.000000 4.000000 1.000000 0.200000 12021.327337 100.000000 4.000000 1.500000 0.200000 6699.920592 100.000000 4.000000 2.000000 0.200000 5284.207076 100.000000 4.000000 1.000000 0.300000 17317.275381 100.000000 4.000000 1.500000 0.300000 14778.328159 100.000000 4.000000 2.000000 0.300000 14874.379385 100.000000 4.000000 1.000000 0.400000 24644.017200 100.000000 4.000000 1.500000 0.400000 25883.425514 100.000000 4.000000 2.000000 0.400000 28375.884864

17 Non-Linear Least Squares Iterative Phase Dependent Variable Y Method: Gauss-Newton Iter ALPHA DELTA BETA GAMMA Sum of Squares 0 100.000000 4.000000 2.000000 0.200000 5284.2 07076 1 97.265416 1.238334 2.202450 0.191326 4468.6 45787 2 97.155009 0.894100 2.222681 0.193661 4464.4 06826 3 97.109336 1.039029 2.236293 0.193424 4464.2 63887 4 97.097903 1.047721 2.238380 0.193463 4464.2 57070 5 97.095319 1.052604 2.238974 0.193461 4464.2 56734 6 97.094723 1.053402 2.239095 0.193462 4464.2 56717 NOTE: Convergence criterion met. Laäp laïi thöù saùu laø toát nhaát, noù cho SS sai bieät nhoû nhaát (5284.2)

18 3.3.Duøng caùc bieåu thöùc trong NLIN Khaùc vôùi haàu heát caùc thuû tuïc khaùc cuûa SAS, coù theå tính caùc bieán vaø caùc bieåu thöùc trong PROC NLIN. Ñieàu naøy ñaëc bieät coù ích neáu moâ hình coù nhieàu thaønh phaàn phöùc taïp. Thí duï : proc nlin data=weeds; parameters alpha=100 delta=4 beta=2.0 gamma=0.2; term = 1 + exp(beta*log(rate/gamma)); model y = delta + (alpha-delta) / term; run;

19 3.4. Coá ñònh moät thoâng soá Ñoâi khi caàn coá ñònh moät thoâng soá ôû moät giaù trò naøo ñoù hôn laø öôùc löôïng noù.Ñieàu naøy coù ích neáu khoâng coù ñuû soá lieäu ñeå öôùc löôïng taát caû caùc thoâng soá moät caùch chính xaùc vaø/hay khi bieát giaù trò phaûi coù cuûa moät thoâng soá. Ñoái vôùi moät taäp hôïp soá lieäu ñaëc bieät, lyù thuyeát cho bieát raèng, a, soá tieäm caän treân cuûa ñaùp öùng phaûi baèng 100, vì ñaùp öùng ñöôïc bieåu dieån töông ñoái so vôùi giaù trò ñoái chöùng maø töø ñoù noù seõ giaûm. Coá ñònh ôû 100, laø loaïi boû noù ra khoûi phaùt bieåu PARAMETERS vaø cho alpha = 100 :

20 proc nlin data=weeds; parameters delta=4 beta=2.0 gamma=0.2; alpha = 100; term = 1 + exp(beta*log(rate/gamma)); model y = delta + (alpha-delta) / term; run;

21 3.5. Tính R 2 Caùc ngöôøi söû duïng caùc moâ hình hoài qui tuyeán tính thöôøng quen bieåu dieån chaát löôïng cuûa söï phuø hôïp moâ hình qua heä soá xaùc ñònh R 2 (ñoøi hoûi söï hieän dieän cuûa intercept). ÔÛ hoài qui phi tuyeán (haàu heát khoâng coù intercept) ngöôøi ta tính Pseudo-R 2 = 1 - SS(Residual)/SS(TotalCorrected)

22 3.6. Choïn thuaät toaùn laøm phuø hôïp : Caàn löïa choïn moät caùch kyõ löôõng thuaät toaùn ñöôïc duøng laøm phuø hôïp moâ hình cho caùc soá lieäu. Trong PROC NLIN caùc thuaät toùan laøm phuø hôïp khaùc nhau ñöôïc khôûi ñoäng vôùi METHOD = option. Sau ñaây laø moät soá höôùng daãn : –Neáu coù theå choïn phöông phaùp duøng ñaïo haøm, traùnh duøng –Neáu caùc thoâng soá töông quan chaët vôùi nhau, choïn phöông phaùp Levenberg- Marquardt method (keyword METHOD=MARQUARDT) –Trong soá caùc phöông phaùp phuï thuoäc ñaïo haøm, phöông phaùp Newton-Raphson (METHOD=NEWTON) ñöôïc öa chuoäng hôn phöông phaùp Gauss (METHOD=GAUSS) method.

23 Ruûi thay neáu khoâng xaùc ñònh ñaïo haøm vaø a METHOD= option, SAS seõ maëc ñònh phöông phaùp DUD. Vì vaäy coù theå duøng moät trong hai phaùt bieåu sau : proc nlin data=whatever method=newton; run; hay neáu caùc thoâng soá coù heä soá töông quan cao (> 0.8, < -0.8) proc nlin data=whatever method=marquardt; run;

24 3.7. Tính caùc giaù trò döï ñoaùn vaø khoaûng tin caäy: Caùc giaù trò döï ñoaùn khoâng ñöôïc trình baøy treân maøn hình vôùi PROC NLIN. Tuy nhieân coù theå yeâu caàu löu laïi chuùng trong taäp hôïp soá lieäu ñeå söû duïng sau naøy. Coù theå tính khoaûng tin caäy cho soá döï ñoaùn trung bình hay cho töøng soá döï ñoaùn proc nlin data=weeds method=newton; parameters alpha=100 delta=4 beta=2.0 gamma=0.2; term = 1 + exp(beta*log(rate/gamma)); model y = delta + (alpha-delta) / term; output out=nlinout predicted=pred l95m=l95mean u95m=u95mean l95=l95ind u95=u95ind; run; proc print data=nlinout; run;

25 Caùc phaùt bieåu treân seõ taïo ra moät taäp hôïp soá lieäu NLINOUT chöùa caùc giaù trò döï ñoaùn (trong bieán PRED), giôùi haïn treân vaø döôùi cuûa khoaûng tin caäy 95% ñoái vôùi söï döï ñoaùn trung bình (bieán U95MEAN vaø bieán L95MEAN), vaø söï döï ñoaùn 95% cho töøng soá quan saùt (bieán U95IND vaø bieán L95IND). Sau ñaây laø keát quaû in ra cuûa NLINOUT :

26 OBS TX RATE Y PRED L95MEAN U95MEAN L95IND U95IND 1 1 0.00000 99 97.0946 92.3001 101.889 77.8936 116.296 2 1 0.02240 84 96.3318 92.2998 100.364 77.3069 115.357 3 1 0.04480 95 93.5968 90.1265 97.067 74.6830 112.511 4 1 0.08960 84 82.5522 76.8186 88.286 63.0954 102.009 5 1 0.17920 53 53.1811 47.8220 58.540 33.8314 72.531 6 1 0.35840 6 20.3498 14.8513 25.848 0.9611 39.739 7 1 0.71792 6 5.8938 -0.2713 12.059 -13.6944 25.482 8 1 0.00000 103 97.0946 92.3001 101.889 77.8936 116.296 9 1 0.02240 84 96.3318 92.2998 100.364 77.3069 115.357 10 1 0.04480 94 93.5968 90.1265 97.067 74.6830 112.511 11 1 0.08960 79 82.5522 76.8186 88.286 63.0954 102.009 12 1 0.17920 75 53.1811 47.8220 58.540 33.8314 72.531 13 1 0.35840 27 20.3498 14.8513 25.848 0.9611 39.739 14 1 0.71792 7 5.8938 -0.2713 12.059 -13.6944 25.482 15 1 0.00000 113 97.0946 92.3001 101.889 77.8936 116.296 16 1 0.02240 91 96.3318 92.2998 100.364 77.3069 115.357 17 1 0.04480 80 93.5968 90.1265 97.067 74.6830 112.511 vaø tieáp tuïc …

27 3.8. Tính caùc giaù trò döï ñoaùn ñeå veõ hình Muoán veõ ñöôøng hoài qui caàn moät taäp hôïp khaù coâ ñoïng cuûa caùc giaù trò x theo ñoù tính caùc soá döï ñoaùn. Coù 2 caùch ñeå thöïc hieän ñieàu naøy : –Laáy caùc giaù trò cuûa caùc soá öôùc löông thoâng soá töø SAS vaøo trong chöông trình graphics vaø tính caùc giaù trò döï ñoaùn cho moät taäp hôïp coâ ñoïng caùc giaù trò x –Noái keát taäp hôïp soá lieäu thöù hai chöùa caùc giaù trò theo ñoù muoán tính soá döï ñoaùn

28 Giaû ñònh trong thí duï chuùng ta muoán caùc soá döï ñoaùn cho rate bieán thieân töø 0 ñeán 0.8 g/ha vôùi khoaûng caùch 0.05. Chuùng ta muoán SAS tính caùc giaù trò döï ñoaùn nhöng dó nhieân chuùng ta khoâng theå duøng nhöõng ñieåm giaù trò naøy trong vieäc laøm phuø hôïp moâ hình phi tuyeán. Haõy thieát laäp moät taäp hôïp soá lieäu thöù hai chöùa caùc giaù trò cuûa rate theo ñoù muoán tính caùc soá öôùc löôïng nhöng khoâng coù ñaùp öùng ( no response) :

29 data filler; do rate = 0.05 to 0.8 by 0.05; predict=1; output; end; run; noái soá lieäu treân vôùi soá lieäu ban ñaàu : data fitthis; set weeds filler; run; vaø chaïy PROC NLIN vôùi taäp hôïp soá lieäu môùi : proc nlin data=fitthis method=newton; parameters alpha=100 delta=4 beta=2.0 gamma=0.2; term = 1 + exp(beta*log(rate/gamma)); model y = delta + (alpha-delta) / term; output out=nlinout predicted=pred; run; proc print data=nlinout(where=(predict=1)); run;

30 SAS seõ loaïi tröø caùc quan saùt ñeán töø taäp hôïp soá lieäu FILLER trong vieäc laøm phuø hôïp moâ hình, vì khoâng coù thoâng tin Y trong taäp hôïp soá lieäu naøy. Khi tính caùc giaù trò döï ñoaùn, chæ caàn tìm caùc bieán naèm ôû phía phaûi cuûa phaùt bieåu MODEL vaø tính caùc soá döï ñoaùn cho caùc quan saùt töø FILLER. Baèng caùch ñöa vaøo dö ñoaùn bieán trong FILLER vôùi giaù trò 1 khoâng coù trong taäp hôïp soá lieäu WEEDS, chöùa caùc soá lieäu ban ñaàu, chuùng ta coù theå loâi ra caùc giaù trò döï ñoaùn trong taäp hôïp soá lieäu FILLER. Sau ñaây laø caùc quan saùt cuûa taäp hôïp soá lieäu keát quaû :

31 OBS TX RATE Y PREDICT PRED 57. 0.05. 1 92.6668 58. 0.10. 1 79.2515 59. 0.15. 1 62.3952 60. 0.20. 1 47.2881 61. 0.25. 1 35.6570 62. 0.30. 1 27.2184 63. 0.35. 1 21.1817 64. 0.40. 1 16.8346 65. 0.45. 1 13.6563 66. 0.50. 1 11.2901 67. 0.55. 1 9.4958 68. 0.60. 1 8.1112 69. 0.65. 1 7.0252 70. 0.70. 1 6.1607 71. 0.75. 1 5.4632 72. 0.80. 1 4.8936 Baèng caùch thay ñoåi ñoä lôùn cuûa böôùc trong voøng laëp DO khi taïo taäp hôïp soá lieäu FILLER, ta coù theå taïo moät maïng löôùi caùc giaù trò döï ñoaùn theo yù muoán

32 4.Traéc nghieäm caùc giaû thuyeát 4.1. Traéc nghieäm giaû thuyeát veà moät thoâng soá : Maëc ñònh ouput NLIN bao goàm khoaûng tin caäy 95% trong moãi thoâng soá trong moâ hình. Nhöõng giaù trò naøy coù theå ñöôïc duøng ñeå traéc nghieäm caùc giaû thuyeát veà thoâng soá. Ñeå thöïc hieän traéc nghieäm 2 ñuoâi ôû möùc 5%, chæ caàn xem giaù trò theo giaû thuyeát naèm trong hay ngoaøi khoaûng tin caäy. Neáu naèm ngoaøi, ta baùc boû giaû thuyeát voâ hieäu. Neáu naèm trong ta chaáp nhaän giaû thuyeát voâ hieäu H 0

33 Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper ALPHA 97.09472257 2.2526644734 92.574427306 101.61501784 DELTA 1.05340175 5.4120397147 -9.806634348 11.91343785 BETA 2.23909502 0.3642121689 1.508250919 2.96993912 GAMMA 0.19346184 0.0162266928 0.160900642 0.22602303 Trong thí duï naøy, traéc nghieäm H 0 = 2.5, ta so saùnh giaù trò 2.5 vôùi khoaûng tin caäy cuûa b. Vì noù naèm trong khoaûng tin caäy neân chaáp nhaän H0. Chuùng ta baùc boû H 0 : b = 3.0 or H 0 : b = 1.2, chaúng haïn. Ñeå traéc nghieäm caùc giaû thuyeát moät ñuoâi hay traéc nghieäm ôû möùc yù nghóa khaùc 5%, coù theå duøng chính soá öôùc löôïng cuûa thoâng soá vaø sai soá chuaån cuûa noù ñeå thaønh laäp traéc nghieäm. Ñeå traéc nghieäm H 0 : d = c ôû möùc yù nghóa n vôùi ñoái thuyeát H 1 : d > c, chaúng haïn, ta so saùnh soá thoáng keâ tobs = (d - c)/se(d) vôùi giaù trò t trong baûng phaân phoái t ôû ñoä töï do baèng ñoä tö do cuûa sai bieät trong baûng ANOVA taïo ra bôûi NLIN, d dieån taû soá öôùc löôïng cuûa thoâng soá d

34 4.2. So saùnh caùc nghieäm thöùc Ñeå so saùnh 2 hay nhieàu nghieäm thöùc trong hoài qui phi tuyeán, chuùng ta tieán haønh moät caùch töông töï nhö trong phaân tích phöông sai. Tröôùc heát, ñaùnh giaù xem coù söï khaùc bieät giöõa caùc nghieäm thöùc hay khoâng. neáu coù, chuùng ta coá gaéng tìm ra nhöõng söï khaùc bieät ñoù ôû ñaâu. Ñeå traû lôøi caâu hoûi thöù nhaát, sum of square reduction test ñöôïc duøng. Ñaây laø phöông phaùp raát toång quaùt coù theå ñöôïc duøng ñeå traéc nghieäm taát caû caùc kieåu giaû thuyeát. YÙ töôûng laø laøm phuø hôïp 2 kieåu cuûa moâ hình. Moät kieåu laø xeùt moâ hình ñaày ñuû vaø coù nhieàu thoâng soá. Moâ hình ruùt goïn vôùi ít thoâng soá hôn laø kieåu giôùi haïn cuûa moâ hình ñaày ñuû.

35 Giaû söû coù 2 nghieäm thöùc khaùc nhau theo ñoù moâ hình log-logistic ñöôïc laøm phuø hôïp.giaû thuyeát ñöôïc traéc nghieäm laø H 0 : khoâng coù söï khaùc bieät trong ñaùp öùng log-logistic giöõa 2 nghieäm thöùc. Moâ hình ñaày ñuû laø yj = dj + (aj - dj)/(1 + exp{bj log(x/gj)}) + e trong ñoù j töôïng tröng nghieäm thöùc. Moâ hình naøy coù 2*4 = 8 thoâng soá ( 2 taäp hôïp cuûa 4 thoâng soá, moãi taäp hôïp cho moät nghieäm thöùc). Ñeå tính moâ hình ruùt goïn, chuùng ta phaûi thöïc hieän giaû thuyeát H 0. Neáu khoâng coù yù nghóa trong ñaùp öùng log-logistic, hai nghieäm thöùc seõ coù cuøng thoâng soá d, a …. Luùc ñoù moâ hình ruùt goïn laø yj = d + (a - d)/(1 + exp{b log(x/g)}) + e.

36 Ñeå tính SS cuûa traéc nghieäm ruùt goïn, caàn phaûi laøm phuø hôïp caû moâ hình ñaày ñuû vaø moâ hình ruùt goïn. Sau ñoù tính soá thoáng keâ cuûa traéc nghieäm F obs = (SS(Residual) reduced - SS(Residual )full)/( df(Residual) reduced - df(Residual )full) }/MSError (full) vaø so saùnh vôùi giaù trò F trong baûng phaân phoái F vôùi ñoä töï do cuûa töû soá laø df(Residual) reduced - df(Residual) full vaø cuûa maãu soá laø df(Residual) full. Trong thí duï log-logistic, giaû söû coù 2 nghieäm thöùc. Bieán T X vôùi hai giaù trò 1 vaø 2 xaùc ñònh caùc nghieäm thöùc vaø coù moät quan saùt gaén vôùi nghieäm thöùc. Ñeå

37 proc nlin data=weeds method=marquardt; parameters alpha1=100 delta1=4 beta1=2.0 gamma1=0.2 alpha2=100 delta2=4 beta2=2.0 gamma2=0.2; term1 = 1 + exp(beta1*log(rate/gamma1)); term2 = 1 + exp(beta2*log(rate/gamma2)); model y = (delta1 + (alpha1-delta1 ) / term1 ) * (Tx = 1) + (delta2 + (alpha2-delta2 ) / term2 ) * (Tx = 2) ; run;

38 Chuù yù caùch vieát phaùt bieåu MODEL Bieåu thöùc (Tx = 1) laø moät bieåu thöùc luaän lyù, traû veà giaù trò 1 neáu ñuùng, vaø 0 neáu ngöôïc laïi. Ñoái vôùi caùc quan saùt töø nghieäm thöùc 1, phaùt bieåu MODEL laø : model y = (delta1 + (alpha1-delta1 ) / term1 ); ñoái vôùi caùc quan saùt töø nghieäm thöùc 2 : model y = (delta2 + (alpha2-delta2 ) / term2 ); Kyõ thuaät naøy coù theå deã daøng phaùt trieån cho tröôøng hôïp nhieàu hôn 2 nghieäm thöùc vaø cho tröôøng hôïp nhieàu hôn moät yeáu toá cuûa nghieäm thöùc.

39 Sau ñaây laø baûng ANOVA cuûa PROC NLIN : Source DF Sum of Squares Mean Square Regression 8 461499.21539 57687.40192 Residual 104 8113.78461 78.01 716 Uncorrected Total 112 469613.00000 (Corrected Total) 111 150643.99107 Moâ hình ruùt goïn coù theå ñöôïc laøm phuø hôïp theo 2 caùch. Hoaëc laø vieát moâ hình coù 4 thoâng soá : proc nlin data=weeds method=marquardt; parameters alpha=100 delta=4 beta=2.0 gamma=0.2; term = 1 + exp(beta*log(rate/gamma)); model y = delta + (alpha-delta) / term; run;

40 hoaëc laø duøng phaùt bieåu MODEL töø moâ hình ñaày ñuû vaø ñaët caùc gioái haïn : proc nlin data=weeds method=marquardt; parameters alpha1=100 delta1=4 beta1=2.0 gamma1=0.2; alpha2 = alpha1; beta2 = beta1; delta2 = delta1; gamma2 = gamma1; term1 = 1 + exp(beta1*log(rate/gamma1)); term2 = 1 + exp(beta2*log(rate/gamma2)); model y = (delta1 + (alpha1-delta1 ) / term1 ) * (Tx = 1) + (delta2 + (alpha2-delta2 ) / term2 ) * (Tx = 2) ; run;

41 Caû 2 caùch ñeàu cho baûng ANOVA ñoái vôùi moâ hình ruùt goïn nhö sau : Source DF Sum of Squares Mean Square Regression 4 458686.00007 114671.50002 Residual 108 10926.99993 101.17593 Uncorrected Total 112 469613.00000 (Corrected Total) 111 150643.99107 Ñeå traéc nghieäm coù söï khaùc bieät giöõa 2 nghieäm thöùc hay khoâng ta tính sum of square reduction test: F obs = { (10926.9 - 8113.8 ) / (108 - 104 ) } / 78.01 = 9.015 vaø giaù trò p ôû F4,104 laø 0.000002. H 0 bò baùc boû. Ñeå tính giaù trò p duøng PROBF trong SAS: data one; prob = 1 - probf(9.015,4,104); run; proc print; run;

42 4.3. So saùnh caùc thoâng soá giöõa caùc nghieäm thöùc Neáu coù nhieàu nghieäm thöùc hay ñieàu kieän thí nghieäm, coù theå so saùnh moät thoâng soá naøo ñoù giöõa 2 nghieäm thöùc. Chaúng haïn caùc thoâng soá g giöõa caùc nghieäm thöùc laø khaùc nhau moät caùch coù yù nghóa. Vì g ño löôøng rate ôû ñoù ñaùp öùng ñaït ½ giaù trò. Ñaây laø moät giaû thuyeát raát quan troïng trong nghieân cöùu lieàu löôïng – ñaùp öùng trong ñoù g töôïng tröng lieàu gaây cheát 50% hay lieàu laøm giaûm (hay kích thích) söï taêng tröôûng 50%. Ñeå traéc nghieäm giaû thuyeát naøy, chuùng ta caàn thöïc hieän SS cuûa traéc nghieäm moâ hình ruùt goïn baèng caùch so saùnh moâ hình ñaày ñuû yj = dj + (aj - dj)/(1 + exp{bj log(x/gj)}) + e vaø moâ hình ruùt goïn yj = dj + (aj - dj)/(1 + exp{bj log(x/g)}) + e. Coù moät kyõ thuaät ñôn giaûn hôn traû lôøi giaû thuyeát trong moät laàn thöïc hieän moâ hình vaø cung caáp soá öôùc löôïng veà hieäu soá 2 nghieäm thöùc.

43 Thoâng soá hoaù moâ hình nhö sau yj = dj + (aj - dj)/(1 + exp{bj log(x/ [g+D(Tx=2)])}) + e. g laø thoâng soá cho nghieäm thöùc 1 vaø D(Tx = 2) laø moät kyõ xaûo. Ñoái vôùi nghieäm thöùc 1, (Tx = 2) laø sai vaø D (Tx = 2) = 0. Moâ hình trôû thaønh yj = dj + (aj - dj)/(1 + exp{bj log(x/ g)}) + e. Keát quaû laø D ño löôøng söï khaùc bieät ôõ thoâng soá g giöõa 2 nghieäm thöùc. Vì söï khaùc bieät naøy trôû thaønh moät thoâng soá cuûa moâ hình maø chuùng ta coù soá öôùc löôïng veà söï khaùc bieät, sai soá chuaån vaø khoaûng tin caäy cuûa noù laø moät phaàn trong maëc ñònh cuûa NLIN output. Haõy kieåm tra xem khoaûng tin caäy coù chöùa zero khoâng. Neáu khoâng chöùa zero, baùc boû giaû thuyeát H 0 : g1 = g2. Sau ñaây laø maõ chöông trình (gammaD kyù hieäu D) :

44 proc nlin data=weeds method=marquardt; parameters alpha1=100 delta1=4 beta1=2.0 gamma1 =0.2 alpha2=100 delta2=4 beta2=2.0 gammaD=0; gamma = gamma1 + gammaD*(Tx = 2); term1 = 1 + exp(beta1*log(rate/gamma)); term2 = 1 + exp(beta2*log(rate/gamma)); model y = (delta1 + (alpha1-delta1 ) / term1 ) * (Tx = 1) + (delta2 + (alpha2-delta2 ) / term2 ) * (Tx = 2) ; run; vaø keát quaû :

45 source DF Sum of Squares Mean Square Regression 8 461499.21539 57687.40192 Residual 104 8113.78461 78.01716 Uncorrected Total 112 469613.00000 (Corrected Total) 111 150643.99107 Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper ALPHA1 97.09476643 2.1474329718 92.836298979 101.35323387 DELTA1 1.05333359 5.1592338940 -9.177686368 11.28435354 BETA1 2.23908569 0.3471959352 1.550578714 2.92759267 GAMMA1 0.19346181 0.0154687141 0.162786576 0.22413705 ALPHA2 99.87785954 3.0989027433 93.732579745 106.02313934 DELTA2 6.24530769 3.1954993106 -0.091527950 12.58214333 BETA2 1.45175763 0.1943051202 1.066440816 1.83707444 GAMMAD -0.07189134 0.0194866415 -0.110534329 -0.03324835 Soá öôùc löôïng cuûa D, kyù hieäu GAMMAD trong baûng keát quaû laø –0.0718. Khoaûng tin caäy khoâng chöùa 0. Nhö vaäy söï khaùc bieät g giöõa 2 nghieäm thöùc laø coù yù nghóa ôû möùc 5%. Chuù yù giaù trò khôûi ñaàu cho GAMMAD laø 0, nguï yù khoâng coù söï khaùc bieät Kyõ thuaät naøy coù theå ñöôïc duøng ñeå laøm phuø hôïp moâ hình ñaày ñuû. Bieåu dieån moät caùch ñôn giaûn thoâng soá cho moät nghieäm thöùc baèng caùc thoâng soá cuûa nghieäm thöùc khaùc coäng vôùi hieäu soá cuûa moät vaøi thoâng soá

46 proc nlin data=weeds method=marquardt; parameters alpha1=100 delta1=4.0 beta1=2.0 gamma1 =0.2 alphaD=0 deltaD=0.0 betaD=0.0 gammaD=0; alpha = alpha1 + alphaD * (Tx = 2); beta = beta1 + betaD * (Tx = 2); gamma = gamma1 + gammaD * (Tx = 2); delta = delta1 + deltaD * (Tx = 2); term = 1 + exp(beta*log(rate/gamma)); model y = (delta + (alpha-delta ) / term ); run; vôùi keát quaû

47 Source DF Sum of Squares Mean Square Regression 8 461499.21539 57687.40192 Residual 104 8113.78461 78.01716 Uncorrected Total 112 469613.00000 (Corrected Total) 111 150643.99107 Parameter Estimate Asymptotic Asymptotic 95 % Std. Error Confidence Interval Lower Upper ALPHA1 97.09479838 2.1474362814 92.836324374 101.35327239 DELTA1 1.05329147 5.1592501178 -9.177760659 11.28434360 BETA1 2.23907927 0.3471948408 1.550574465 2.92758408 GAMMA1 0.19346177 0.0154687609 0.162786439 0.22413710 ALPHAD 2.78306112 3.7702361724 -4.693506583 10.25962883 DELTAD 5.19201619 6.0686965382 -6.842513872 17.22654625 BETAD -0.78732165 0.3978677382 -1.576313356 0.00167006 GAMMAD -0.07189130 0.0194866786 -0.110534358 -0.03324823 Chuù yù baûng ANOVA gioáng vôùi baûng ANOVA cuûa moâ hình ñaày ñuû trong 4.2. ñaây laø moâ hình ñaày ñuû


Download ppt "Hoài qui phi tuyeán Hoài qui phi tuyeán vaø hoài qui tuyeán tính : Moâ hình hoài qui ñöôïc goïi laø phi tuyeán neáu caùc ñaïo haøm cuûa moâ hình töông."

Similar presentations


Ads by Google