Presentation is loading. Please wait.

Presentation is loading. Please wait.

Stata教學 第五講 兩個類別變數的關連分析 ©Ming-chi Chen 社會統計.

Similar presentations


Presentation on theme: "Stata教學 第五講 兩個類別變數的關連分析 ©Ming-chi Chen 社會統計."— Presentation transcript:

1 Stata教學 第五講 兩個類別變數的關連分析 ©Ming-chi Chen 社會統計

2 列聯表contingency tables
我們可以用列聯表來展現兩個類別變數之間的關係。 邊際分配marginal distrib. . tabulate religion fethnicity if fethnicity < 4 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total 佛教 | | 道教 | | 民間信仰或其他 | | 基督教天主教 | | 無宗教信仰 | | Total | 1, | 1,906 欄column 列 row 列的邊際次數 ©Ming-chi Chen 社會統計

3 列聯表contingency tables
從這個列聯表裡我們不容易一眼看出兩個變數之間的關係。 轉換成百分比。 . tabulate religion fethnicity if fethnicity < 4, column nofreq 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南 本省客家 大陸各省 | Total 佛教 | | 道教 | | 民間信仰或其他 | | 基督教天主教 | | 無宗教信仰 | | Total | | 條件機率conditional probabilities ©Ming-chi Chen 社會統計

4 ---------------+---------------------------------+----------
聯合分配 . tabulate religion fethnicity if fethnicity < 4, cell nofreq 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total 佛教 | | 道教 | | 民間信仰或其他 | | 基督教天主教 | | 無宗教信仰 | | Total | | =395/1906 ©Ming-chi Chen 社會統計

5 期望次數與觀察次數 就像所有的假設檢定一樣,我們分析如果虛無假設H0為真,會產生一個期望的值(比如說u=0)。
我們把這個期望值和實際觀察得到的值作比較。 期望和觀察的差異是否大到讓我們必須要拒斥虛無假設? ©Ming-chi Chen 社會統計

6 變數間獨立性的卡方檢定 在兩變數獨立性檢定時,我們討論期望次數(expected frequencies)和觀察次數(observed frequencies)的差別。 fo是實際觀察到次數 fe是預期觀察到次數 ©Ming-chi Chen 社會統計

7 fe預期次數的計算 我們首先要計算預期次數 ©Ming-chi Chen 社會統計

8 ---------------+---------------------------------+----------
fe預期次數的計算 Exp.本省閩南信奉佛教這一個格子(cell)的預期次數是(512*1438)/1906=386.3,也就是說如果族群跟宗教信仰無關的話我們會在這個格子裡觀察到386.3個人 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total 佛教 | | 道教 | | 民間信仰或其他 | | 基督教天主教 | | 無宗教信仰 | | Total | 1, | 1,906 ©Ming-chi Chen 社會統計

9 ---------------+---------------------------------+----------
fe預期次數Stata的計算 | Key | | | | frequency | | exp. frequency | . tabulate religion fethnicity if fethnicity < 4, expected 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total 佛教 | | | | 道教 | | | | 民間信仰或其他 | | | | 基督教天主教 | | | | 無宗教信仰 | | | | Total | 1, | 1,906 | 1, | 1,906.0 ©Ming-chi Chen 社會統計

10 Chi-Squared Test Statistic
變數間獨立性的卡方檢定是因為在大樣本時,檢定統計量呈現卡方分配而得名。 ‧x2越大,我們越有信心拒斥兩變數互相獨立的虛無假設。 ©Ming-chi Chen 社會統計

11 ---------------+---------------------------------+----------
. tabulate religion fethnicity if fethnicity < 4, chi2 expected 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total 佛教 | | | | 道教 | | | | 民間信仰或其他 | | | | 基督教天主教 | | | | 無宗教信仰 | | | | Total | 1, | 1,906 | 1, | 1,906.0 Pearson chi2(8) = Pr = 0.000 夠不夠大到足以拒斥虛無假設?透過查表ν=8,0.01的顯著水準的臨界值是20.09,此處的chi2遠大於此數,所以可以放心的拒絕兩變數互相獨立的虛無假設 族群和宗教信仰有關 ©Ming-chi Chen 社會統計

12 卡方檢定與變數類別 上述族群和宗教信仰之間獨立性的卡方檢定受到我們界定類別的影響,比如說如果我們把宗教界定為只有「佛教」和「非佛教」這兩個類別,會得到下面的結果。 tabulate rel fethnicity if fethnicity <4, chi2 | 您父親的籍貫是那裡? rel | 本省閩南? 本省客家? 大陸各省?| Total 佛教 | | 非佛教 | 1, | 1,394 Total | 1, | 1,906 Pearson chi2(2) = Pr = 0.120 ‧所以報告中要列出變數的類別。 ‧卡方檢定把變數當作是名目尺度的變數來處理。 ©Ming-chi Chen 社會統計

13 調整殘值與Stata Stata 9標準運算不會報告調整殘值 我們要去網上下載相關的A-do檔案
相關說明請見 這個網站上還有很多其他有用的ado檔案。 如何在Stata上下載安裝這些由使用者自己寫的程式作為補充? Host這些ado files的地方叫ssc (Statistical Software Components)是在Boston College Economic Department 先確認電腦已經連上線 ©Ming-chi Chen 社會統計

14 Stata與SSC http://ideas.repec.org/s/boc/bocode.html
More pages of listings: 0|1|2|3|4|5到第四頁去 ©Ming-chi Chen 社會統計

15 還有很多其他好用的ado file ©Ming-chi Chen 社會統計

16 Stata與SSC 要下載SSC上面的ado file,在指令欄裡鍵入ssc install tab_chi 怎麼知道可以這樣做?
去Statalist server找,Statalist是Stata使用者的線上討論區,在這裡可以post妳的問題,往往也可以得到解答,不過語氣要好一點。 ©Ming-chi Chen 社會統計

17 ©Ming-chi Chen 社會統計

18 Tab_chi的使用 其協助檔案不叫做tab_chi,而是tabchi。 Help tab_chi ©Ming-chi Chen 社會統計

19 tab_chi的操作 . tabchi religion fethnicity if fethnicity < 4, r a
observed frequency expected frequency raw residual adjusted residual 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南人 本省客家人 大陸各省市 佛教 | | | | | 道教 | | | | ©Ming-chi Chen 社會統計

20 續上頁 | 民間信仰或其他 | | | | 基督教天主教 | | | | 無宗教信仰 | | | | Pearson chi2(8) = Pr = 0.000 likelihood-ratio chi2(8) = Pr = 0.000 ©Ming-chi Chen 社會統計

21 小樣本Fisher’s exact test
10個格子的預期值小於5 . tab religion fethnicity, chi2 expected 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省? 原住民 其他 | Total 佛教 | | | | 道教 | | | | 民間信仰或其他 | | | | 基督教天主教 | | | | 無宗教信仰 | | | | Total | 1, | 1,921 | 1, | 1,921.0 Pearson chi2(16) = Pr = 0.000 ©Ming-chi Chen 社會統計 不準確

22 . tabulate fethnicity religion, chi2 exact expected
因為計算複雜,而記憶體default只有10m,出現下列訊息: exceeded memory limits using exact(1); try again with larger #; see help tabulate for details 加大memory 先clear清掉所有在記憶體中的資料。 Set memory 128m 把資料叫回來 use “C:\Documents and Settings\Ming-chi Chen\桌面\85q1_temp.dta”, clear 不過既使是加大了memory,也提高了exact程序可運用的記憶體倍數,歷經了大約兩個小時還是沒有結果,於是直接關閉Stata。 ©Ming-chi Chen 社會統計


Download ppt "Stata教學 第五講 兩個類別變數的關連分析 ©Ming-chi Chen 社會統計."

Similar presentations


Ads by Google