第十一章 卡方檢定 陳順宇 教授 成功大學統計系.

Slides:



Advertisements
Similar presentations
第五章 卡方檢定 5-1 卡方檢定 (X2 test) 5-2 適配度檢定 (good-of-fit test)
Advertisements

第三講 Recode、missing value、假設檢定與信賴區間
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
What is static?. Static? 靜態 ? class Test { static int staticX; int instanceX; public Test(int var1, int var2) { this.staticX = var1; this.instanceX =
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
Chapter 8 Inference for Proportions 第八章 母體比率的推論
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
南投縣社區大學 Excel 實務應用入門 講師 : 林泉成
民意調查的分析 II 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 假設的檢定 研究假設 H1: 研究假設 ( 例: X 與 Y 相關 ) H0: 虛無假設 ( 例: X 與 Y 無關 ) 檢定結果:接受虛無假設或拒斥虛無假 設,但不代表接受研究假設.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
3-3 使用幾何繪圖工具 Flash 的幾何繪圖工具包括線段工具 (Line Tool) 、橢圓形工具 (Oval Tool) 、多邊星形 工具 (Rectangle Tool) 3 種。這些工具畫出 來的幾何圖形包括了筆畫線條和填色區域, 將它們適當地組合加上有技巧地變形與配 色, 不但比鉛筆工具簡單,
Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface : Eigenvector 和 eigenvalue 的應用. Fractal : Affine transform( rotation, translation,
第二章 供給與需求 中興大學會計學系 授課老師:簡立賢.
第二章 統計檢定 由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
行政院國家科學委員會工程技術發展處自動化學門 * 試以國立成功大學製造工程研究所 鄭芳田教授 產學合作計畫 : 智慧預測保養系統之設計與實作 成果報告盤點為範例 國科會工程處專題計畫成果典藏 自動化學門成果報告盤點範例.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
第二十一章 研究流程、論文結構        與研究範例 21-1  研究流程 21-2  論文結構 21-3  研究範例.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
Analysis of Variance (ANOVA) CH 13 變異數分析. What is ANOVA? n 檢定 3 個或 3 個以上的母體平均數是否相等的統計檢定 n 檢定多個母體平均數是否相同 n 比較大二、大三、大四學生實習滿意度是否一樣 ? ( 來 自相同的 population)
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
資料結構實習-一 參數傳遞.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
觀測量的權 權的觀念與計算.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
2010 MCML introduction 製作日期: 2010/9/10 製作人 : 胡名霞.
Chapter 3 Entropy : An Additional Balance Equation
逆向選擇和市場失調. 定義  資料不對稱 在交易其中,其中一方較對方有多些資料。  逆向選擇 出現在這個情況下,就是當買賣雙方隨意在 市場上交易,與比較主動交易者作交易為佳 。
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
連續隨機變數 連續變數:時間、分數、重量、……
第八章 估計.
家庭社會工作 陳阿梅.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
幼兒行為觀察與記錄 第八章 事件取樣法.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Slide Slide 第 9 章 假設檢定 Part B ( ). 2 Slide Slide 第 9 章 假設檢定 Part B  9.5 母體比例  9.6 假設檢定與決策  9.7 計算型 II 錯誤的機率  9.8 在檢定母體平均數時決定樣本大小 第 9 章假設檢定.
Presentation transcript:

第十一章 卡方檢定 陳順宇 教授 成功大學統計系

卡方檢定分成兩大類, 一類為適合度檢定 一類為獨立性檢定

適合度檢定是檢驗某組資料 是否符合某種分配 獨立性檢定是驗證 兩個屬性是否有相關

適合度檢定 檢查一組資料滿足某種分配的問題 稱為適合度檢定(Goodness of Fit), 最常用的檢定方法是卡方檢定, 此分類資料常以次數分配表 的方式呈現資料

獨立性檢定 也是在探討因果關係,只是〝因〞與〝果〞都是離散型(分類)的資料, 探討教育程度與性別是否有相關的問題, 此分類資料常以列聯表方式呈現

11.1 離散型資料之適合度檢定

有傳說”台南市成年市民, 國中、高中(職)及大專以上的 教育程度比例分別為 15%,35%與50%”, 張三認為這種傳說不實。

此題寫成檢定問題為

表11.1 50位台南市市民 教育程度次數分配表

理論上50位市民各種 教育程度期望人數的次數

量化指標

卡方值

即沒有證據說此傳說是不正確

期望次數

適合度檢定卡方值

棄卻域

例11.1、 某媒體報導台中市市民 各種宗教信仰人數所佔比例如下表:

某人懷疑此報導不實,隨機抽樣200位市民,各種宗教信仰人數

各種宗教信仰期望人數

卡方值

有證據說此報導是不實的

例11.2、 某城市有7個行政區, 已知各區人口所佔比例分別為 0.21,0.08 ,0.15,0.12,0.09, 0.10, 0.25, 隨機抽樣100位, 結果各區樣本所佔比例分別為 0.18,0.13,0.14,0.12,0.08,0.11, 0.24

(1) 試問抽樣的樣本比例與母體比例 是否有一致性? (2) 如果抽樣1000位,而各行政區樣本 所佔比例不變,分別為 0.18,0.13,0.14,0.12,0.08,0.11,0.24 試問各行政區抽樣樣本比例與 母體比例 是否有一致性?

  (3)試問抽樣1000位的卡方值與 抽樣100位的卡方值有何關係?

(1) 抽樣100位

無證據說7個行政區抽樣的 樣本比例與母體比例沒有一致性

(2) 抽樣1000位

有證據說7個行政區抽樣的 樣本比例與母體比例沒有一致性

(3) 由(1)與(2), 抽樣1000位之卡方值是 抽樣100位卡方值的10倍

均勻分配 的適合度檢定 在第十章檢驗一個銅板是否公正? 我們利用一組樣本比例來做檢定, 它是屬於二項分配。

如果要檢定一個骰子是不是公正? 因為擲一個骰子出現點數有 1,2,3,4,5,6共有6種可能, 它是屬於多項分配, 需要利用卡方檢定

例11.3、 有人懷疑某骰子是不公正的 ? 假使擲此骰子120次

擲120次骰子出現 各種點數之次數表

有無證據說這個骰子是不公正呢?

均勻分配,即檢定

擲120次骰子出現各種點數之 觀察次數與期望次數

即無證據說這個骰子 是不公正的

例11.4、(例11.3續) 假使擲此骰子1200次

有無證據說這個骰子是不公正的呢?

擲1200次骰子出現 各種點數之次數

卡方值

有證據說這個骰子 是不公正的

2. 二項分配 的適合度檢定

例11.7、(例10.8續)有人懷疑某銅板是否公正 ? 即檢定

假如他擲此銅板10次, 結果出現正面9次, 試問是 否顯著?

擲10次銅板出現正、反面 觀察與期望次數

卡方值

有證據說此銅板是不公正的

卡方檢定所得的卡方值 與例10. 8 檢定z值有平方關係

例11.8、(例10.9續) 某公司為了降低產品不良率, 提出改善計畫, 若已知改善前不良率為10%, 改善後由生產線隨機抽樣400個產品, 得樣本不良率為8%, 試以卡方檢定此改善策略是否有效?

左尾檢定

不良品與良品 觀察次數與期望次數

卡方值

沒有證據說改善策略有效

11.2 連續型資料之適合度檢定

例11.9、(例1.9續) 由台南市成年市民抽樣50位 身高資料如表1.2, 試問是否有證據說 此組身高分佈不是常態分配?

檢定

抽樣50位台南市成年市民 身高次數分配表

期望次數計算方式

例如,第2組的期望次數

第1組的期望次數

抽樣50位台南市成年市民 身高觀察與期望次數

合併後的表格

卡方值

11.3 獨立性之檢定 政府想知道民眾對某政策(如核四興建) 男女生意見是否一致? 即檢定男女生贊成比例相同, 不贊成的比例也相同, 11.3 獨立性之檢定 政府想知道民眾對某政策(如核四興建) 男女生意見是否一致? 即檢定男女生贊成比例相同, 不贊成的比例也相同, 故稱一致性檢定

獨立性檢定 事實上,它就等於要問此政策的 意見(屬性B)與性別(屬性A)是否有關? 即兩種屬性是否獨立,故稱獨立性檢定 隨機抽樣1000位

男女生對法案贊成與否的 交叉列表

男女生對法案贊成與否比例 完全一致的交叉列表

交叉列表卡方值

卡方值

無證據說男女生對此法案 有不同的意見

去除沒有意見者後之交叉列表

去除沒有意見者後 觀察與期望次數

卡方值

無證據說男女生對此法案 有不同的意見

男女生對此法案贊成的比例,一致性問題可寫成檢定

無證據說男女生對此法案的 贊成比例不一致

注意:

(2) 一般在 22 的一致性檢定中,如果表格之數據

如上面例子,以(11.12)式算出

例11.10、 某人想了解統計學成績與性別是否有關? 抽樣100位男女生統計學成績及格與否

男女生對統計學成績及格與否之交叉列表

試問統計學成績與性別是否有相關?

男女生統計學成績及格、 不及格人數與期望人數

卡方值

統計學成績與性別有相關 (即成績與性別不獨立)

例11.11、 想了解男、女生 對紅、綠兩種顏色喜愛是否有顯著差異? 甲、乙、丙 3地區 各抽樣調查 150、150、200位市民

甲、乙、丙地區男、女生對 顏色(紅、綠)喜愛

(1)甲地區市民顏色喜愛與性別是否有相關? (2)乙地區市民顏色喜愛與性別是否有相關? (3)丙地區市民顏色喜愛與性別是否有相關? (4)全體3區市民顏色喜愛與性別是否有相關?

(1) 甲地區的卡方值

甲地區市民顏色喜愛與性別 沒有相關

(2) 乙地區的卡方值

乙地區市民顏色喜愛與性別 有相關

(3) 丙地區的卡方值

丙地區市民顏色喜愛與性別 有相關

(4)全體3區男女對顏色喜愛 統計表

注意: (1)甲地區市民男女生喜愛紅色比例都是 即男女生喜愛紅色比例完全一致, 所以卡方值為0, 因此顏色喜愛與性別是沒有相關

(2)乙地區市民 男生喜愛紅色比例是100%, 女生喜愛紅色比例是0%, 即男女生喜愛紅色比例完全不一致, 所以卡方值很大, 因此顏色喜愛與性別是有相關

(3) 丙地區市民 男生喜愛紅色比例是10%, 女生喜愛紅色比例是90%, 男女生喜愛紅色比例也相當不一致, 所以卡方值也很大, (3) 丙地區市民 男生喜愛紅色比例是10%, 女生喜愛紅色比例是90%, 男女生喜愛紅色比例也相當不一致, 所以卡方值也很大, 因此顏色喜愛與性別是有相關。

(4) 三地區全體市民 男女生顏色喜愛有一致性, 做分地區後各地區男女生對顏色喜愛 有很大的差別, 即地區與性別對顏色喜愛有“交互作用” (4) 三地區全體市民 男女生顏色喜愛有一致性, 做分地區後各地區男女生對顏色喜愛 有很大的差別, 即地區與性別對顏色喜愛有“交互作用” 有關交互作用的詳細說明在第十二章。:

3 地區男女生喜愛紅色比例

不良率是否有差異? 第十章比較甲、乙 兩生產線不良率是否有差異, 即檢定,利用兩組獨立樣本比例 檢定方法,以統計量檢定即可, 但如要比較甲、乙、丙 三生產線不良率是否有差異時, 不能以兩兩比較進行

卡方檢定 生產線(甲、乙、丙)與 產品(良品、不良品)) 檢定其獨立性, 或說檢定三條生產線良率的一致性。 即檢定

例11.12、(例10.17續) 若由甲、乙、丙三生產線分別隨機抽樣100個、200個、200個產品, 結果分別有5個、20個與25個不良品, 請問甲、乙、丙三生產線不良率 是否有顯著差異?

甲、乙、丙三生產線 良品、不良品個數

卡方值

甲、乙、丙三生產線不良率 沒有顯著差異

例11.13、(例2.4續) 試問台南市市民 性別與教育程度是否有相關?

檢定性別與教育程度是否有相關,即檢定三種教育程度男女生所佔比例是否一致?

台南市性別與教育程度人數

卡方值

教育程度與性別無關, 男女生的教育程度有一致性

例11.14、 想瞭解某次某地區選舉, 不同宗教信仰的選民對候選人甲的 支持度是否不一樣? 以隨機抽樣,抽樣200位選民, 結果各種信仰支持人數如下:

各種信仰支持、不支持 候選人甲人數

請問此地區選舉, 不同宗教信仰的選民 對候選人甲的支持度是否不一樣?

卡方值

不同宗教信仰的選民對 候選人甲的支持度是不一樣

註:回教支持、不支持期望次數小於5,回教合併到其他宗教

第十一章 摘要

1.適合度檢定 卡方檢定可用來檢定一組資料 (包括離散型與連續型資料) 是否取樣自某種分配(適合度檢定)

2.卡方值

3.合併 當某組期望次數小於5時, 此組要合併到鄰近的組

4.損失自由度 若母體參數(如平均數等)未知 而以樣本統計量取代, 會損失自由度

5.獨立性檢定 可以卡方檢定對列聯表的兩種屬性 做獨立性檢定, 卡方分配的自由度為

6.一致性檢定 卡方檢定也可做為各組母體比例 相等與否的檢定 一致性檢定,即檢定 它是第十章檢定兩組母體比例 相等的擴展。