Presentation is loading. Please wait.

Presentation is loading. Please wait.

Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense.

Similar presentations


Presentation on theme: "Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense."— Presentation transcript:

1 Chapter 6 Introduction to Inference 推論簡介

2 Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense of Statistical Significance 6.4 Error Probabilities and Power

3 統計推論 根據樣本資料,提出特定方法描述母 體,稱為統計推論 (Statistical Inference) 。 常見的統計推論: – 信賴區間 (confidence intervals) :對母體參 數的估計。 – 顯著性檢定 (tests of significance) :對母體 參數所能提供之證據的宣告。 統計推論是在資料為隨機樣本或是來 自隨機實驗的假設前提下提出的。

4 Section 6.1 Estimating with Confidence 具信賴度的估計

5 例題 6.1 NAEP 調查研究 National Assessment of Educational Progress ( 全國性教育進展評量,簡記為 NAEP) 調查包括一份簡短測驗,內容有 數量技能,涵括基礎算術及應用到實際 問題的能力。測驗分數 0 ~ 500 分。 –233 分以上的人會加總兩張存款條上金額 –325 分以上的人會判別菜單上一份餐的金額 –375 分以上的人會將每盎司 (ounce) 幾分 (cents) 轉換成每磅 (pound) 幾元 (dollars)

6 樣本資料 一份含 840 個樣本,由全體 21~25 歲男 性中隨機抽出。這 840 個男性的 NAEP ( 樣本 ) 平均成績為 。 這樣的結果,可以對全體九千五百萬個 21~25 歲男性的平均成績  做什麼推論?

7 大數法則推論 根據大數法則,隨機大樣本之樣本均數 會很接近母體均數  。 因此用樣本平均成績 來估計全 體平均成績  。 即全體九千五百萬個 21~25 歲男性的平 均成績  大約是  。

8 樣本平均數的變異 取很多份樣本數為 840 的隨機樣本,則 樣本平均成績 的變異如何? 根據中央極限定理,隨機大樣本之樣本 平均數分配近似常態。 – 此近似常態的平均數與原母體平均數相同  。 – 近似常態的變異數為原母體變異數  2 的  分之一,即樣本平均數的變異數為  2  。 假設原標準差  為 60 ,則近似常態的標 準差為 。

9 樣本平均數的分配 取很多組樣本數為 840 的隨機樣本,樣 本平均成績分別為 = 272, =268, = 273, etc. 其直方圖可呈現樣本均數的分配。 Population  = ?  = 60 SRS n = 840

10 樣本平均數的分配圖形 的值 的樣本分配 未知參數 

11 統計信賴度 (Statistical Confidence) 根據常態 68-95-99.7 規則, 95% 樣本組的 樣本均數 會落在母體均數  的兩個標 準差之間。即 95% 的 落在 。 95% 的樣本組,根據樣本平均數計算出 的區間 會包括母體平均數  。

12 樣本平均數的信賴區間 (Confidence Interval) 取很多組樣本數為 840 的隨機樣本,根 據樣本均數 及公式 計算出這 些區間中,有 95% 會包括母體均數  。 Population  = ?  = 60 SRS n = 840

13

14 95% 信賴區間圖示 的樣本分配 未知參數   機率 = 0.95

15 信賴區間之一般型式 (form) 未知參數的信賴水準 (confidence level) C 之信賴區間,或稱為 100C % 信賴區間, 為: – 區間型式為 估計量 ± 誤差域 (estimate ± margin of error) – 在重覆取樣下,估計區間 ( 視為隨機區間 ) 會 包括未知參數的機率,即為信賴水準 C 。

16 單組樣本 z 統計量 常態母體均數為  標準差為  ,則樣本 平均數 服從 。 標準化之統計量 服從標準常態,稱為單組樣本 z 統計量。

17 常態母體平均數  之信賴區間 常態母體均數  之 100C % 信賴區間的 求法: – 標示出常態曲線下中央面積為 C 的區域, 邊界值稱為臨界值 (critical value) ,記為 z * 。 – 即 z 介於 ± z * 之間的機率為 C 。

18 例題 6.3 80% 之信賴區間圖示 標準常態曲線 0  1.28 機率 = 0.8 z * =1.28 機率 = (1-0.8)/2=0.1 機率 = 0.1

19 常態母體平均數  之信賴區間 常態母體平均數  之 80 % 信賴區間:

20 常態平均數  之信賴區間圖示 標準常態曲線 0  z * 機率 = C z*z* 機率 = (1-C)/2

21 母體平均數  之信賴區間 母體平均數  未知標準差  已知,抽出 一組樣本數為 n 之隨機樣本,則  之 100C % 信賴區間為 (z * 可由表 C 查得 ) 若母體為常態,則為正確的 (exact) 信賴 區間。在其他情況,樣本數 n 夠大時為 近似信賴區間。

22 常用之信賴水準及臨界值

23 例題 6.4 製藥的分析 藥廠對每一組產品樣本分析其成份濃度。 假設每一樣本重複測度的結果接近常態。 分析程序無偏差,成份分析結果可估計 真正的母體濃度平均數  。 已知標準差為  = 0.0068 公克 / 公升。 實驗室提供每一樣本 3 次的成份分析結果。

24 例題 6.4( 續 ) 某一樣本 3 次成份濃度分析重複測度的 結果如右: 0.8403, 0.8363, 0.8447 – 樣本平均數 母體均數  之 99 % 信賴區間 – 由表 C 查得 z * = 2.576 –99 % 信賴區間為 [0.8303, 0.8505]

25 信賴水準的意義 99 % 的信賴水準的意義如下: 每一份樣本 3 次成份濃度分析重複 測度的結果,可得到一個母體平均數  之 99 % 信賴區間。則 100 份樣本使用 同樣的方法算出的 100 個 99 % 信賴區 間中,其中大約有 99 個信賴區間包含 了真正的母體均數  。

26 例題 6.4 ( 再續 ) 假設只用一次濃度分析的結果: 0.8404 – 樣本平均數 則母體均數  之 99 % 信賴區間 –99 % 信賴區間為 [0.8229, 0.8579]

27 圖 6.7 n 越大信賴區間越短。 0.840.850.860.830.82 n = 1 n = 3

28 信賴區間的行為 (behavior) 信賴區間的中心位置由樣本平均數決定。 信賴區間寬度之一半稱為誤差域 (margin of error) m – 臨界值 z * :信賴水準越高 z * 越大,信賴區間越寬。 – 標準差  :  越大,信賴區間越寬。 – 樣本數 n : n 越大,信賴區間越窄。

29 例題 6.5 改變誤差域 例題 6.4 之信賴度由 99% 改為 90% , z* 由 2.576 改為 1.645 。樣本平均數與變異數 仍然相同。 信賴區間為 –90 % 信賴區間為 [0.8339, 0.8469] – 誤差域由 ± 0.0101 變為 ± 0.0065 。

30 圖 6.8 信賴度越高,信賴區間越寬。 0.840.850.860.830.82 90% 信賴度 99% 信賴度

31 樣本數的選擇 給定誤差域 m 及信賴水準,可查表求 得臨界值 z * ,則在已知標準差  時可計 算所需要的樣本數。

32 例題 6.6 需要多少樣本數? m = 0.005, 信賴水準 95% ,臨界值 z * =1.96 ,  = 0.0068 ,則所需要的樣本 數為 7.1 以上。 取 n = 8

33 一些注意事項 資料必須是從母體中隨機抽樣取得的。 因為 會被一些極端觀察值強烈的影響,所 以離群值對信賴區間有很大的影響作用。 區間完全倚靠於 的分配。 – 如果母體不為常態而且樣本很小,真正的信賴水 準會與計算區間時的信賴度不相同。 – 當 n ≧ 15 ,除非有極端的離群值或是相當強烈的不 對稱,信賴水準不會因母體非常態而大受影響。 必須知道母體的標準差 σ 。這個不切實際的 假設使得區間 在統計實務上用處較小。


Download ppt "Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense."

Similar presentations


Ads by Google