Stata教學 第五講 兩個類別變數的關連分析 ©Ming-chi Chen 社會統計.

Slides:



Advertisements
Similar presentations
FCU, Department of ECE, IC Design Research Lab. TEL: # 4945 Pre-SIm , Post-Sim.
Advertisements

第五章 卡方檢定 5-1 卡方檢定 (X2 test) 5-2 適配度檢定 (good-of-fit test)
第 七 章 開放式問句與探究.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
第三講 Recode、missing value、假設檢定與信賴區間
Stata教學 第六講 變異數分析ANOVA ©Ming-chi Chen 社會統計.
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
: A-Sequence 星級 : ★★☆☆☆ 題組: Online-judge.uva.es PROBLEM SET Volume CIX 題號: Problem D : A-Sequence 解題者:薛祖淵 解題日期: 2006 年 2 月 21 日 題意:一開始先輸入一個.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
3Com Switch 4500 切VLAN教學.
Reference, primitive, call by XXX 必也正名乎 誌謝 : 部份文字取於前輩 TAHO 的文章.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
Structural Equation Modeling Chapter 7 觀察變數路徑分析=路徑分析 觀察變數路徑分析.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 網路同步學習 如何使用中山大學管理學院知識管理平台 愷中 製作. 2 如何登入中山大學網路學習平台 1. 首先, 請輸入 2. 點選申請帳號, 依照螢幕所示, 輸入個人資訊.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
民意調查的分析 II 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 假設的檢定 研究假設 H1: 研究假設 ( 例: X 與 Y 相關 ) H0: 虛無假設 ( 例: X 與 Y 無關 ) 檢定結果:接受虛無假設或拒斥虛無假 設,但不代表接受研究假設.
©Ming-chi Chen 社會統計 Page.1 Stata 教學 第二講 描述性統計. ©Ming-chi Chen 社會統計 Page.2 用 do-file 來界定變數並加上標籤.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
24-6 設定開始與結束場景中的 程式 最後我們要替這個遊戲收個尾, 幫它把開始 的等待畫面跟結束畫面處理一下。
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
3-3 使用幾何繪圖工具 Flash 的幾何繪圖工具包括線段工具 (Line Tool) 、橢圓形工具 (Oval Tool) 、多邊星形 工具 (Rectangle Tool) 3 種。這些工具畫出 來的幾何圖形包括了筆畫線條和填色區域, 將它們適當地組合加上有技巧地變形與配 色, 不但比鉛筆工具簡單,
Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface : Eigenvector 和 eigenvalue 的應用. Fractal : Affine transform( rotation, translation,
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
幼兒行為觀察與記錄 第一章 導論.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
資料結構實習-一 參數傳遞.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/25 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH 2.4~CH 2.6 &
函式 Function Part.2 東海大學物理系‧資訊教育 施奇廷. 遞迴( Recursion ) 函式可以「呼叫自己」,這種動作稱為 「遞迴」 此程式的執行結果相當於陷入無窮迴圈, 無法停止(只能按 Ctrl-C ) 這給我們一個暗示:函式的遞迴呼叫可以 達到部分迴圈的效果.
「防止青少年吸煙」 回顧與前瞻. 流程:  計劃簡介  服務特色  報告研究事項  回顧工作內容  展望未來.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Chapter 7 Sampling Distribution
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2009.
連續隨機變數 連續變數:時間、分數、重量、……
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
指導教授 : 林啟芳 教授 組員 : 邱秉良 林育賢. 何謂 GPS  GPS 即全球定位系統,是一個中距離圓 型軌道衛星導航系統。它可以為地球表面 絕大部分地區( 98% )提供準確的定位、 測速和高精度的時間標準。
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2010.
家庭社會工作 陳阿梅.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
第十一章 卡方檢定 陳順宇 教授 成功大學統計系.
幼兒行為觀察與記錄 第八章 事件取樣法.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

Stata教學 第五講 兩個類別變數的關連分析 ©Ming-chi Chen 社會統計

列聯表contingency tables 我們可以用列聯表來展現兩個類別變數之間的關係。 邊際分配marginal distrib. . tabulate religion fethnicity if fethnicity < 4 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total ---------------+---------------------------------+---------- 佛教 | 395 64 53 | 512 道教 | 228 26 13 | 267 民間信仰或其他 | 609 83 55 | 747 基督教天主教 | 31 7 38 | 76 無宗教信仰 | 175 42 87 | 304 Total | 1,438 222 246 | 1,906 欄column 列 row 列的邊際次數 ©Ming-chi Chen 社會統計

列聯表contingency tables 從這個列聯表裡我們不容易一眼看出兩個變數之間的關係。 轉換成百分比。 . tabulate religion fethnicity if fethnicity < 4, column nofreq 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南 本省客家 大陸各省 | Total ---------------+---------------------------------+---------- 佛教 | 27.47 28.83 21.54 | 26.86 道教 | 15.86 11.71 5.28 | 14.01 民間信仰或其他 | 42.35 37.39 22.36 | 39.19 基督教天主教 | 2.16 3.15 15.45 | 3.99 無宗教信仰 | 12.17 18.92 35.37 | 15.95 Total | 100.00 100.00 100.00 | 100.00 條件機率conditional probabilities ©Ming-chi Chen 社會統計

---------------+---------------------------------+---------- 聯合分配 . tabulate religion fethnicity if fethnicity < 4, cell nofreq 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total ---------------+---------------------------------+---------- 佛教 | 20.72 3.36 2.78 | 26.86 道教 | 11.96 1.36 0.68 | 14.01 民間信仰或其他 | 31.95 4.35 2.89 | 39.19 基督教天主教 | 1.63 0.37 1.99 | 3.99 無宗教信仰 | 9.18 2.20 4.56 | 15.95 Total | 75.45 11.65 12.91 | 100.00 =395/1906 ©Ming-chi Chen 社會統計

期望次數與觀察次數 就像所有的假設檢定一樣,我們分析如果虛無假設H0為真,會產生一個期望的值(比如說u=0)。 我們把這個期望值和實際觀察得到的值作比較。 期望和觀察的差異是否大到讓我們必須要拒斥虛無假設? ©Ming-chi Chen 社會統計

變數間獨立性的卡方檢定 在兩變數獨立性檢定時,我們討論期望次數(expected frequencies)和觀察次數(observed frequencies)的差別。 fo是實際觀察到次數 fe是預期觀察到次數 ©Ming-chi Chen 社會統計

fe預期次數的計算 我們首先要計算預期次數 ©Ming-chi Chen 社會統計

---------------+---------------------------------+---------- fe預期次數的計算 Exp.本省閩南信奉佛教這一個格子(cell)的預期次數是(512*1438)/1906=386.3,也就是說如果族群跟宗教信仰無關的話我們會在這個格子裡觀察到386.3個人 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total ---------------+---------------------------------+---------- 佛教 | 395 64 53 | 512 道教 | 228 26 13 | 267 民間信仰或其他 | 609 83 55 | 747 基督教天主教 | 31 7 38 | 76 無宗教信仰 | 175 42 87 | 304 Total | 1,438 222 246 | 1,906 ©Ming-chi Chen 社會統計

---------------+---------------------------------+---------- fe預期次數Stata的計算 +--------------------+ | Key | |-------------------- | | frequency | | exp. frequency | . tabulate religion fethnicity if fethnicity < 4, expected 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total ---------------+---------------------------------+---------- 佛教 | 395 64 53 | 512 | 386.3 59.6 66.1 | 512.0 道教 | 228 26 13 | 267 | 201.4 31.1 34.5 | 267.0 民間信仰或其他 | 609 83 55 | 747 | 563.6 87.0 96.4 | 747.0 基督教天主教 | 31 7 38 | 76 | 57.3 8.9 9.8 | 76.0 無宗教信仰 | 175 42 87 | 304 | 229.4 35.4 39.2 | 304.0 Total | 1,438 222 246 | 1,906 | 1,438.0 222.0 246.0 | 1,906.0 ©Ming-chi Chen 社會統計

Chi-Squared Test Statistic 變數間獨立性的卡方檢定是因為在大樣本時,檢定統計量呈現卡方分配而得名。 ‧x2越大,我們越有信心拒斥兩變數互相獨立的虛無假設。 ©Ming-chi Chen 社會統計

---------------+---------------------------------+---------- . tabulate religion fethnicity if fethnicity < 4, chi2 expected 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省?| Total ---------------+---------------------------------+---------- 佛教 | 395 64 53 | 512 | 386.3 59.6 66.1 | 512.0 道教 | 228 26 13 | 267 | 201.4 31.1 34.5 | 267.0 民間信仰或其他 | 609 83 55 | 747 | 563.6 87.0 96.4 | 747.0 基督教天主教 | 31 7 38 | 76 | 57.3 8.9 9.8 | 76.0 無宗教信仰 | 175 42 87 | 304 | 229.4 35.4 39.2 | 304.0 Total | 1,438 222 246 | 1,906 | 1,438.0 222.0 246.0 | 1,906.0 Pearson chi2(8) = 208.2023 Pr = 0.000 夠不夠大到足以拒斥虛無假設?透過查表ν=8,0.01的顯著水準的臨界值是20.09,此處的chi2遠大於此數,所以可以放心的拒絕兩變數互相獨立的虛無假設 族群和宗教信仰有關 ©Ming-chi Chen 社會統計

卡方檢定與變數類別 上述族群和宗教信仰之間獨立性的卡方檢定受到我們界定類別的影響,比如說如果我們把宗教界定為只有「佛教」和「非佛教」這兩個類別,會得到下面的結果。 tabulate rel fethnicity if fethnicity <4, chi2 | 您父親的籍貫是那裡? rel | 本省閩南? 本省客家? 大陸各省?| Total -----------+---------------------------------+---------- 佛教 | 395 64 53 | 512 非佛教 | 1,043 158 193 | 1,394 Total | 1,438 222 246 | 1,906 Pearson chi2(2) = 4.2467 Pr = 0.120 ‧所以報告中要列出變數的類別。 ‧卡方檢定把變數當作是名目尺度的變數來處理。 ©Ming-chi Chen 社會統計

調整殘值與Stata Stata 9標準運算不會報告調整殘值 我們要去網上下載相關的A-do檔案 相關說明請見http://ideas.repec.org/c/boc/bocode/s368901.html 這個網站上還有很多其他有用的ado檔案。 如何在Stata上下載安裝這些由使用者自己寫的程式作為補充? Host這些ado files的地方叫ssc (Statistical Software Components)是在Boston College Economic Department 先確認電腦已經連上線 ©Ming-chi Chen 社會統計

Stata與SSC http://ideas.repec.org/s/boc/bocode.html More pages of listings: 0|1|2|3|4|5到第四頁去 ©Ming-chi Chen 社會統計

還有很多其他好用的ado file ©Ming-chi Chen 社會統計

Stata與SSC 要下載SSC上面的ado file,在指令欄裡鍵入ssc install tab_chi 怎麼知道可以這樣做? 去Statalist server找,Statalist是Stata使用者的線上討論區,在這裡可以post妳的問題,往往也可以得到解答,不過語氣要好一點。 ©Ming-chi Chen 社會統計

©Ming-chi Chen 社會統計

Tab_chi的使用 其協助檔案不叫做tab_chi,而是tabchi。 Help tab_chi ©Ming-chi Chen 社會統計

tab_chi的操作 . tabchi religion fethnicity if fethnicity < 4, r a observed frequency expected frequency raw residual adjusted residual --------------------------------------------------- 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南人 本省客家人 大陸各省市 ---------------+----------------------------------- 佛教 | 395 64 53 | 386.283 59.635 66.082 | 8.717 4.365 -13.082 | 1.047 0.703 -2.016 | 道教 | 228 26 13 | 201.441 31.099 34.461 | 26.559 -5.099 -21.461 | 4.072 -1.049 -4.224 ©Ming-chi Chen 社會統計

續上頁 | 民間信仰或其他 | 609 83 55 | 563.581 87.006 96.412 | 45.419 -4.006 -41.412 | 4.951 -0.586 -5.796 基督教天主教 | 31 7 38 | 57.339 8.852 9.809 | -26.339 -1.852 28.191 | -7.164 -0.676 9.843 無宗教信仰 | 175 42 87 | 229.356 35.408 39.236 | -54.356 6.592 47.764 | -7.901 1.286 8.912 --------------------------------------------------- Pearson chi2(8) = 208.2023 Pr = 0.000 likelihood-ratio chi2(8) = 169.6775 Pr = 0.000 ©Ming-chi Chen 社會統計

小樣本Fisher’s exact test 10個格子的預期值小於5 . tab religion fethnicity, chi2 expected 您目前信甚麼教 | 您父親的籍貫是那裡? ? | 本省閩南? 本省客家? 大陸各省? 原住民 其他 | Total ---------------+-------------------------------------------------------+---------- 佛教 | 395 64 53 3 2 | 517 | 387.0 59.7 66.2 3.2 0.8 | 517.0 道教 | 228 26 13 0 0 | 267 | 199.9 30.9 34.2 1.7 0.4 | 267.0 民間信仰或其他 | 609 83 55 0 0 | 747 | 559.2 86.3 95.7 4.7 1.2 | 747.0 基督教天主教 | 31 7 38 9 0 | 85 | 63.6 9.8 10.9 0.5 0.1 | 85.0 無宗教信仰 | 175 42 87 0 1 | 305 | 228.3 35.2 39.1 1.9 0.5 | 305.0 Total | 1,438 222 246 12 3 | 1,921 | 1,438.0 222.0 246.0 12.0 3.0 | 1,921.0 Pearson chi2(16) = 347.8780 Pr = 0.000 ©Ming-chi Chen 社會統計 不準確

. tabulate fethnicity religion, chi2 exact expected 因為計算複雜,而記憶體default只有10m,出現下列訊息: exceeded memory limits using exact(1); try again with larger #; see help tabulate for details 加大memory 先clear清掉所有在記憶體中的資料。 Set memory 128m 把資料叫回來 use “C:\Documents and Settings\Ming-chi Chen\桌面\85q1_temp.dta”, clear 不過既使是加大了memory,也提高了exact程序可運用的記憶體倍數,歷經了大約兩個小時還是沒有結果,於是直接關閉Stata。 ©Ming-chi Chen 社會統計