Presentation is loading. Please wait.

Presentation is loading. Please wait.

第十一章 卡方檢定 陳順宇 教授 成功大學統計系.

Similar presentations


Presentation on theme: "第十一章 卡方檢定 陳順宇 教授 成功大學統計系."— Presentation transcript:

1 第十一章 卡方檢定 陳順宇 教授 成功大學統計系

2 卡方檢定分成兩大類, 一類為適合度檢定 一類為獨立性檢定

3 適合度檢定是檢驗某組資料 是否符合某種分配 獨立性檢定是驗證 兩個屬性是否有相關

4 適合度檢定 檢查一組資料滿足某種分配的問題 稱為適合度檢定(Goodness of Fit), 最常用的檢定方法是卡方檢定,
此分類資料常以次數分配表 的方式呈現資料

5 獨立性檢定 也是在探討因果關係,只是〝因〞與〝果〞都是離散型(分類)的資料, 探討教育程度與性別是否有相關的問題,
此分類資料常以列聯表方式呈現

6 11.1 離散型資料之適合度檢定

7 有傳說”台南市成年市民, 國中、高中(職)及大專以上的 教育程度比例分別為 15%,35%與50%”, 張三認為這種傳說不實。

8 此題寫成檢定問題為

9 表 位台南市市民 教育程度次數分配表

10 理論上50位市民各種 教育程度期望人數的次數

11

12 量化指標

13 卡方值

14 即沒有證據說此傳說是不正確

15

16

17 期望次數

18 適合度檢定卡方值

19 棄卻域

20 例11.1、 某媒體報導台中市市民 各種宗教信仰人數所佔比例如下表:

21 某人懷疑此報導不實,隨機抽樣200位市民,各種宗教信仰人數

22 各種宗教信仰期望人數

23 卡方值

24 有證據說此報導是不實的

25 例11.2、 某城市有7個行政區, 已知各區人口所佔比例分別為 0.21,0.08 ,0.15,0.12,0.09, 0.10, 0.25,
隨機抽樣100位, 結果各區樣本所佔比例分別為 0.18,0.13,0.14,0.12,0.08,0.11, 0.24

26 (1) 試問抽樣的樣本比例與母體比例 是否有一致性? (2) 如果抽樣1000位,而各行政區樣本 所佔比例不變,分別為
0.18,0.13,0.14,0.12,0.08,0.11,0.24 試問各行政區抽樣樣本比例與 母體比例 是否有一致性?

27 (3)試問抽樣1000位的卡方值與 抽樣100位的卡方值有何關係?

28 (1) 抽樣100位

29 無證據說7個行政區抽樣的 樣本比例與母體比例沒有一致性

30 (2) 抽樣1000位

31 有證據說7個行政區抽樣的 樣本比例與母體比例沒有一致性

32 (3) 由(1)與(2), 抽樣1000位之卡方值是 抽樣100位卡方值的10倍

33 均勻分配 的適合度檢定 在第十章檢驗一個銅板是否公正? 我們利用一組樣本比例來做檢定, 它是屬於二項分配。

34 如果要檢定一個骰子是不是公正? 因為擲一個骰子出現點數有 1,2,3,4,5,6共有6種可能, 它是屬於多項分配, 需要利用卡方檢定

35 例11.3、 有人懷疑某骰子是不公正的 ? 假使擲此骰子120次

36 擲120次骰子出現 各種點數之次數表

37 有無證據說這個骰子是不公正呢?

38 均勻分配,即檢定

39 擲120次骰子出現各種點數之 觀察次數與期望次數

40

41 即無證據說這個骰子 是不公正的

42 例11.4、(例11.3續) 假使擲此骰子1200次

43 有無證據說這個骰子是不公正的呢?

44 擲1200次骰子出現 各種點數之次數

45 卡方值

46 有證據說這個骰子 是不公正的

47 2. 二項分配 的適合度檢定

48 例11.7、(例10.8續)有人懷疑某銅板是否公正 ? 即檢定

49 假如他擲此銅板10次, 結果出現正面9次, 試問是 否顯著?

50 擲10次銅板出現正、反面 觀察與期望次數

51 卡方值

52 有證據說此銅板是不公正的

53 卡方檢定所得的卡方值 與例10. 8 檢定z值有平方關係

54 例11.8、(例10.9續) 某公司為了降低產品不良率, 提出改善計畫, 若已知改善前不良率為10%, 改善後由生產線隨機抽樣400個產品,
得樣本不良率為8%, 試以卡方檢定此改善策略是否有效?

55 左尾檢定

56 不良品與良品 觀察次數與期望次數

57 卡方值

58 沒有證據說改善策略有效

59 11.2 連續型資料之適合度檢定

60 例11.9、(例1.9續) 由台南市成年市民抽樣50位 身高資料如表1.2, 試問是否有證據說 此組身高分佈不是常態分配?

61 檢定

62 抽樣50位台南市成年市民 身高次數分配表

63 期望次數計算方式

64 例如,第2組的期望次數

65 第1組的期望次數

66 抽樣50位台南市成年市民 身高觀察與期望次數

67 合併後的表格

68 卡方值

69

70 11.3 獨立性之檢定 政府想知道民眾對某政策(如核四興建) 男女生意見是否一致? 即檢定男女生贊成比例相同, 不贊成的比例也相同,
11.3 獨立性之檢定 政府想知道民眾對某政策(如核四興建) 男女生意見是否一致? 即檢定男女生贊成比例相同, 不贊成的比例也相同, 故稱一致性檢定

71 獨立性檢定 事實上,它就等於要問此政策的 意見(屬性B)與性別(屬性A)是否有關? 即兩種屬性是否獨立,故稱獨立性檢定 隨機抽樣1000位

72 男女生對法案贊成與否的 交叉列表

73 男女生對法案贊成與否比例 完全一致的交叉列表

74 交叉列表卡方值

75 卡方值

76

77 無證據說男女生對此法案 有不同的意見

78 去除沒有意見者後之交叉列表

79 去除沒有意見者後 觀察與期望次數

80 卡方值

81 無證據說男女生對此法案 有不同的意見

82 男女生對此法案贊成的比例,一致性問題可寫成檢定

83

84

85 無證據說男女生對此法案的 贊成比例不一致

86 注意:

87 (2) 一般在 22 的一致性檢定中,如果表格之數據

88

89 如上面例子,以(11.12)式算出

90

91 例11.10、 某人想了解統計學成績與性別是否有關? 抽樣100位男女生統計學成績及格與否

92 男女生對統計學成績及格與否之交叉列表

93 試問統計學成績與性別是否有相關?

94 男女生統計學成績及格、 不及格人數與期望人數

95 卡方值

96 統計學成績與性別有相關 (即成績與性別不獨立)

97 例11.11、 想了解男、女生 對紅、綠兩種顏色喜愛是否有顯著差異? 甲、乙、丙 3地區 各抽樣調查 150、150、200位市民

98 甲、乙、丙地區男、女生對 顏色(紅、綠)喜愛

99 (1)甲地區市民顏色喜愛與性別是否有相關? (2)乙地區市民顏色喜愛與性別是否有相關? (3)丙地區市民顏色喜愛與性別是否有相關? (4)全體3區市民顏色喜愛與性別是否有相關?

100 (1) 甲地區的卡方值

101 甲地區市民顏色喜愛與性別 沒有相關

102 (2) 乙地區的卡方值

103 乙地區市民顏色喜愛與性別 有相關

104 (3) 丙地區的卡方值

105 丙地區市民顏色喜愛與性別 有相關

106 (4)全體3區男女對顏色喜愛 統計表

107

108 注意: (1)甲地區市民男女生喜愛紅色比例都是 即男女生喜愛紅色比例完全一致, 所以卡方值為0, 因此顏色喜愛與性別是沒有相關

109 (2)乙地區市民 男生喜愛紅色比例是100%, 女生喜愛紅色比例是0%, 即男女生喜愛紅色比例完全不一致, 所以卡方值很大,
因此顏色喜愛與性別是有相關

110 (3) 丙地區市民 男生喜愛紅色比例是10%, 女生喜愛紅色比例是90%, 男女生喜愛紅色比例也相當不一致, 所以卡方值也很大,
(3) 丙地區市民 男生喜愛紅色比例是10%, 女生喜愛紅色比例是90%, 男女生喜愛紅色比例也相當不一致, 所以卡方值也很大, 因此顏色喜愛與性別是有相關。

111 (4) 三地區全體市民 男女生顏色喜愛有一致性, 做分地區後各地區男女生對顏色喜愛 有很大的差別, 即地區與性別對顏色喜愛有“交互作用”
(4) 三地區全體市民 男女生顏色喜愛有一致性, 做分地區後各地區男女生對顏色喜愛 有很大的差別, 即地區與性別對顏色喜愛有“交互作用” 有關交互作用的詳細說明在第十二章。:

112 3 地區男女生喜愛紅色比例

113 不良率是否有差異? 第十章比較甲、乙 兩生產線不良率是否有差異, 即檢定,利用兩組獨立樣本比例 檢定方法,以統計量檢定即可,
但如要比較甲、乙、丙 三生產線不良率是否有差異時, 不能以兩兩比較進行

114 卡方檢定 生產線(甲、乙、丙)與 產品(良品、不良品)) 檢定其獨立性, 或說檢定三條生產線良率的一致性。 即檢定

115 例11.12、(例10.17續) 若由甲、乙、丙三生產線分別隨機抽樣100個、200個、200個產品,
結果分別有5個、20個與25個不良品, 請問甲、乙、丙三生產線不良率 是否有顯著差異?

116 甲、乙、丙三生產線 良品、不良品個數

117 卡方值

118 甲、乙、丙三生產線不良率 沒有顯著差異

119 例11.13、(例2.4續) 試問台南市市民 性別與教育程度是否有相關?

120 檢定性別與教育程度是否有相關,即檢定三種教育程度男女生所佔比例是否一致?

121 台南市性別與教育程度人數

122 卡方值

123 教育程度與性別無關, 男女生的教育程度有一致性

124 例11.14、 想瞭解某次某地區選舉, 不同宗教信仰的選民對候選人甲的 支持度是否不一樣? 以隨機抽樣,抽樣200位選民,
結果各種信仰支持人數如下:

125 各種信仰支持、不支持 候選人甲人數

126 請問此地區選舉, 不同宗教信仰的選民 對候選人甲的支持度是否不一樣?

127

128 卡方值

129 不同宗教信仰的選民對 候選人甲的支持度是不一樣

130 註:回教支持、不支持期望次數小於5,回教合併到其他宗教

131 第十一章 摘要

132 1.適合度檢定 卡方檢定可用來檢定一組資料 (包括離散型與連續型資料) 是否取樣自某種分配(適合度檢定)

133 2.卡方值

134

135 3.合併 當某組期望次數小於5時, 此組要合併到鄰近的組

136 4.損失自由度 若母體參數(如平均數等)未知 而以樣本統計量取代, 會損失自由度

137 5.獨立性檢定 可以卡方檢定對列聯表的兩種屬性 做獨立性檢定, 卡方分配的自由度為

138 6.一致性檢定 卡方檢定也可做為各組母體比例 相等與否的檢定 一致性檢定,即檢定 它是第十章檢定兩組母體比例 相等的擴展。


Download ppt "第十一章 卡方檢定 陳順宇 教授 成功大學統計系."

Similar presentations


Ads by Google