Presentation is loading. Please wait.

Presentation is loading. Please wait.

第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。

Similar presentations


Presentation on theme: "第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。"— Presentation transcript:

1 第十三章 卡方檢定

2 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。

3 本 章 架 構本 章 架 構本 章 架 構本 章 架 構  13.1 多項試驗  13.2 卡方適合度檢定  13.3 卡方獨立性檢定

4 本 章 內 容本 章 內 容本 章 內 容本 章 內 容 在前面章節中,我們所處理的資料大多是數量資料 (quantitative data ),再透過計算其平均數或標準差, 然後做估計或檢定等統計推論工作。 在前面章節中,我們所處理的資料大多是數量資料 (quantitative data ),再透過計算其平均數或標準差, 然後做估計或檢定等統計推論工作。 有時我們所遇到的資料為質的資料或類別資料 ( categorical data ),此時我們所擁有的訊息大多是 各不同類別資料的所佔的個數或比例,所以此種資 料亦稱為計數資料。 有時我們所遇到的資料為質的資料或類別資料 ( categorical data ),此時我們所擁有的訊息大多是 各不同類別資料的所佔的個數或比例,所以此種資 料亦稱為計數資料。 本章即介紹一些分析類別資料的方法,通稱為「卡 方檢定法」( chi-square tests )。 本章即介紹一些分析類別資料的方法,通稱為「卡 方檢定法」( chi-square tests )。

5 13.1 多項試驗  多項試驗( multinomial experiment) 的條件 1. 包含 n 個完全相同的試行( trials) 。 2. 每次試行的結果有 k 個可能性,而且一定是 k 個可 能之一。 3.k 個可能性中第 i 個的機率為 p i ,不同試行的 p i 均相 同,且 p 1 + p 2 + … + p k =1 。 4. 所有試行的結果互相獨立。 5.n 次試行中第 i 個可能性發生的次數 n i

6 13.1 多項試驗 ( 續 )  多項試驗的結果可由次數分配表( frequency distribution table )來表示 ,如表 13.1 。 表 13.1表 13.1  二項試驗是多項試驗的特例,當多項試驗的 k=2 時, 我們即得二項試驗。下一節即是將有關 p 1 與 p 2 差異 比較的統計分析方法推廣到 p 1 , p 2 , … , p k 的差異比 較。

7 13.1 多項試驗 ( 續 1) 表 13.1 教學滿意度調查

8 13.2 卡方適合度檢定  卡方統計量之功能 1. 估計或檢定一母體的變異數。 2. 檢定母體分配的適合度。  卡方適合度檢定( Chi-square Goodness of Fit Test ) 之使用時機 1. 分析多項分配中的機率 (p 1, p 2, …, p k ) 是否服從某 一假設的結果。 2. 檢定樣本所來自的母體是否服從某一特定或假 設的分配。

9 13.2 卡方適合度檢定(續)  卡方適合度檢定過程 1.H 0 : p 1 = p 1, 0, p 2 = p 2, 0, …, p k = p k, 0 2.H 1 :至少兩個以上的 pi 值與虛無假設有異。 3. 檢定統計量 χ 2 是自由度為 k - 1 - m 之卡方統計量。 χ 2 是自由度為 k - 1 - m 之卡方統計量。 4. 拒絕域: 。 5.p 值: 。

10 13.2 卡方適合度檢定 ( 續 1)  卡方適合度檢定通常只適用於大樣本,一般說來, 當所有的 E i  5 時,卡方適合度檢定才適用。若有 E i < 5 時,該組必須與相鄰組合併至 E i  5 為止,即 組數亦必須減少。 E i < 5 時,該組必須與相鄰組合併至 E i  5 為止,即 組數亦必須減少。

11 例 13.1 均等分配的檢定  快餐店老闆欲檢定顧客對這四種不同快餐的喜好度 是否相同,隨機記錄 1000 名不同顧客所點的快餐種 類後,可設立虛無與對立假設如下 H 0 : p 1 = p 2 = p 3 = p 4 = 1/4 H 0 : p 1 = p 2 = p 3 = p 4 = 1/4 H 1 : p 1 、 p 2 、 p 3 與 p 4 不全相等 H 1 : p 1 、 p 2 、 p 3 與 p 4 不全相等  在計算期望次數的過程中,並無任何母體參數須預 先估計,所以 m=0 ,因此在此例中的卡方檢定統計 量之自由度為 k-1=3 。透過附錄表五之卡方分配表得 知臨界值 。

12 例 13.1 均等分配的檢定(續)  卡方檢定統計量值可計算如下表所示:  卡方檢定統計量值為 1.048 小於臨界值 7.81 ,在 0.05 的顯著 水準下,我們無法拒絕虛無假設;換言之,我們沒有足夠的 證據顯示該快餐店顧客對四種快餐的點餐次數分配不為均等 分配。

13 練習題一

14 例 13.2 波松分配  欲檢定每航班遺失行李數是否服從波松分配,航空公司隨機 抽取並紀錄 1000 個航班中每航班遺失行李數,可設立虛無 與對立假設為 H 0 :每航班遺失行李數服從波松分配 H 0 :每航班遺失行李數服從波松分配 H 1 :每航班遺失行李數不服從波松分配 H 1 :每航班遺失行李數不服從波松分配  在計算期望次數的過程中,須先估計波松分配之平均數 λ=0.4 ,所以 m=1 。因此在此例中的卡方檢定統計量之自由度 為 k-1-m=2 。透過附錄表五之卡方分配表得知臨界 值 。

15 例 13.2 波松分配 ( 續 )  卡方檢定統計量值可計算如下表所示:  卡方檢定統計量值為 26.76 大於臨界值 5.99 ,在 0.05 的顯著 水準下,我們拒絕虛無假設;換言之,我們有足夠的證據顯 示該航空公司每航班遺失行李數不為波松分配。

16 練習題二

17 例 13.3 常態分配  欲檢定旅館之旅客年齡是否為常態分配,該經理隨 機蒐集了 100 個旅客之年齡資料,得到平均旅客年 齡為 40 歲,標準差為 15 歲,可設立虛無假設與對 立假設為 H 0 :旅館旅客年齡之分配為常態分配 H 0 :旅館旅客年齡之分配為常態分配 H 1 :旅館旅客年齡之分配不為常態分配 H 1 :旅館旅客年齡之分配不為常態分配  在計算期望次數的過程中,須先用樣本平均估計常 態母體之平均數與用樣本標準差估計常態母體標準 差,所以 m=2 。因此在此例中的卡方檢定統計量之 自由度為 k-1-m=3 。透過附錄表五之卡方分配表得知 臨界值 。

18 例 13.3 常態分配(續)  卡方檢定統計量值可計算如下表所示:  卡方檢定統計量值為 7.539 略小於臨界值 7.81 ,在 0.05 的顯著水準下,我們無法拒絕虛無假設;換言 之,我們沒有足夠的證據顯示該旅館旅客之年齡分 配不為常態分配。

19 練習題三

20 13.3 卡方獨立性檢定  卡方獨立性檢定 ( Chi-square Test of Independence ) : ( Chi-square Test of Independence ) : 分析兩個不同變數的分類次數分配,以決定該兩變 數間是否獨立。 分析兩個不同變數的分類次數分配,以決定該兩變 數間是否獨立。 例如:電影製作公司可能有興趣知道不同型態電影 的喜好度是否與觀眾年齡有關、股票分析師也許希 望分析熱門股與產業別是否有關、政治分析家可能 希望研究候選人的得票數是否會受到選民省籍的影 響。這些種種探討兩變數間是否獨立的問題,均可 利用卡方統計量來進行分析。 例如:電影製作公司可能有興趣知道不同型態電影 的喜好度是否與觀眾年齡有關、股票分析師也許希 望分析熱門股與產業別是否有關、政治分析家可能 希望研究候選人的得票數是否會受到選民省籍的影 響。這些種種探討兩變數間是否獨立的問題,均可 利用卡方統計量來進行分析。

21 13.3 卡方獨立性檢定(續)  卡方獨立性檢定可以用來分析各種型態的資料,尤 其是最常用於名目尺度的資料。在資料分析中的兩 個變數代表兩種不同的分類方法,資料經過兩種不 同的分類方法所觀察到的結果,通常可交叉整理成 列聯表 。  列聯表( contingency table ):將資料用兩種不同分 類方法,計次分類結果用行與列共同表列,如表 13.8 所示。 表 13.8表 13.8

22 13.3 卡方獨立性檢定 ( 續 1) 表 13.8 r  c 列聯表

23 13.3 卡方獨立性檢定 ( 續 2)  卡方獨立性檢定過程 1.H 0 :列分類與行分類獨立 2.H 1 :列分類與行分類不獨立 3. 檢定統計量: χ 2 :自由度為 (r - 1)(c - 1) 之卡方統計量。 χ 2 :自由度為 (r - 1)(c - 1) 之卡方統計量。 4. 拒絕域: 5. p 值:

24 13.3 卡方獨立性檢定 ( 續 3)  若虛無假設正確,則樣本資料在列聯表中之期望次 數為行總和與列總和的乘積再除以樣本大小。 ; i=1,2,…,r j=1,2,…,r ; i=1,2,…,r j=1,2,…,r  與卡方適合度檢定相同,卡方獨立性檢定通常只適 用於大樣本,一般說來,當所有的 E ij  5 時,卡方適 合度檢定才適用。若有 E ij < 5 時,很容易產生異常 大的卡方檢定統計量,因此該行或該列分類就必須 與相鄰行或列合併至 E ij  5 為止。

25 例 13.4 理財方式與年齡  隨機選取的 500 名成人年齡與其最喜愛的投資方式 列聯表,欲檢定人們喜好的投資理財方式是否會因 年齡有所不同,可設定虛無與對立假設為 H 0 :年齡大小與喜愛的投資方式無關 H 0 :年齡大小與喜愛的投資方式無關 H 1 :年齡大小與喜愛的投資方式有關 H 1 :年齡大小與喜愛的投資方式有關  卡方檢定統計量之自由度為 (r  1)(c  1) = (3  1)(4  1) = 6 。透過附錄表五之卡方分配表得知臨界值 。

26 例 13.4 理財方式與年齡(續)  500 名成年人喜好的理財方式與年齡之觀察次數(期望次數) 如下表所示: 期望次數  卡方檢定統計量為 6.9324 小於臨界值 12.5916 ,在 0.05 的顯 著水準下,我們無法拒絕虛無假設;換言之,我們沒有足夠 的證據顯示年齡大小與喜愛的投資方式有關。

27 例 13.4 理財方式與年齡 ( 續 1)  若虛無假設正確,則不同年齡與理財方式組合下之 期望次數可計算為  (21-35) 與「基金」:  (21-35) 與「股票」:  其餘計算以此類推。

28 練習題四


Download ppt "第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。"

Similar presentations


Ads by Google