Presentation is loading. Please wait.

Presentation is loading. Please wait.

第八章 估計.

Similar presentations


Presentation on theme: "第八章 估計."— Presentation transcript:

1 第八章 估計

2 點估計:用樣本平均數 x來估計全體的平均數叫做點估計.
缺點:點估計命中目標的機會是很低的. 因少數樣本觀察值得到的結果要和全體平均數吻合幾乎不可能.不用點估計而改用區間估計.

3 以95%信賴係數為例,如果我們進行一百次獨立的抽樣估計,會有一百個樣本平均數,亦會有一百個區間估計
以95%信賴係數為例,如果我們進行一百次獨立的抽樣估計,會有一百個樣本平均數,亦會有一百個區間估計.In Fact,我們不會做一百次抽樣,而是只做一次. 此次抽樣而來的區間估計會包含的機會是95%. 信賴係數越高所估計的區間也越寬.區間越寬越好?

4 Ex: 預估計全國七至十二歲小孩的壓歲錢平均數是在100元至3000元之間.此估計既使有99.7%的信賴區間也沒用
因此區間實在太寬. 如980元至990元之間,信賴係數是99.7% . 這就是個非常好的估計. 學習抽樣的方法是要使這個信賴區間儘可能的縮小.

5 不偏估計量 若估計式抽樣分配的平均數等於母體參數值 ,則該估計式為不偏估計式,否則為偏誤估計式。即若 ,則 為的不偏估計式。
不偏性 不偏估計量 若估計式抽樣分配的平均數等於母體參數值 ,則該估計式為不偏估計式,否則為偏誤估計式。即若     ,則 為的不偏估計式。

6 有效性 不偏估計量的相對有效性

7 區間估計: 對未知的母體參數估計出一個上、下限的區間,並指出該區間包含母體參數的可靠度。
區間估計: 對未知的母體參數估計出一個上、下限的區間,並指出該區間包含母體參數的可靠度。 信賴區間: 是在一個既定的信賴水準下所構成的一個區間。是由樣本統計量及抽樣誤差所構成的一個(包含上限,下限的)區間。

8 1.估計:字元被字做是母體平均     數的點估值時,大家    會問這估計值是否好?
2.抽樣誤差:|x- | 但一般 都是未知 a用x的抽樣分配來算出抽樣誤 差的機率

9 Ex:n=100,:20 利用中央極限定理 ⇨用常態分配來做為x的抽樣分配 常態分配,平均數  :未知 標準差 x :  / n =20/ 100 =2
95% 0.025 0.025 1.960 1.960 x

10 1.查表:95%的x會落在的+1.96個標準    差之內,用0.475→查表得知,    對應值1.96。
2. 因1.96o x =1.96(2) =3.92,  有95%的樣本平均數,  會落在母體平均數的= + 3.92範圍。 3.一個樣本平均數的抽樣誤差等於或小於 之機率為0.95。 4.o (x-3.92, x+3.92)的區間, 有95%的信賴度會包含母體平均數。

11 樣本平均數的抽樣誤差會小於或等於Z(/2)x 的機率為1-α
1-o

12 信  賴 水  準 α α/2 Zα/2 90% 0.1 0.05 1.645 95% 0.025 1.96 99% 0.01 0.005 2.57

13 Ex:有100位custom的樣本平均 滿意分數,x=82, 利用區間x+3. 92, 發現母體平均數的信賴區間 估計於為82+3

14 母體平均數之區間估計: j大樣本(n≥30), 母體標準差(o )已知 x+Z(α/2)×(o / n) 其中1-o:信賴係數   Z(α/2):標準常態分配右尾,   只α/2面積所對應的Z值。

15 k大樣本(n ≥ 30), 母體標準差(S)未知 x+Z(α/2) × S/ n 其中S:樣本標準差   1-α:信賴係數 Z(α/2):標準常態分配右尾 具α/2面積所對應的Z值。

16 Ex:壽險公司,定期抽出36位保險人進 行調查,在一次調查中,公司主管 被要求對母體保險人的平均年齡進 行具90%信賴係數的區間估計
x =39.5,S樣=36=7.77 39.5+Z0.05× ((7.77)/ 36) =39.5+1.645×((7.77)/6) =39.5+2.13=(37.37,41.63) 主管可說明XX公司的壽險保險人的平均年齡在90%的信賴係數下為37.37歲到41.63歲。

17 Ex:同上題,若用95%信賴係 數的區間估計: A 95% Confidence Interval
The assumed Sigma=7.7 (樣本ox來 代替母體o ) N 36 Mean 39.5 S+Dew 7.77 95% C.I (36.96,42.04)

18 36.96 37.37 42.04 41.63 B 90% Confidence Interval The assumed
Sigma=7.7 N 36 Mean 39.50 S+Dew 7.77 95% C.I (37.37,41.63) 所有 x 值 的90% 所有 x 值的95% 36.96 37.37 42.04 41.63

19 *抽樣之後所計算出的信賴區間可能會或不會包含u。 if 1-α夠大,則區間包含u 的可能性h。
95%的信賴區間較90%的信賴區間大 *抽樣之後所計算出的信賴區間可能會或不會包含u。 if 1-α夠大,則區間包含u 的可能性h。 *if 信賴區間太大,可用n樣本h 來縮短信賴區間。

20 母體平均數的區間估計: (小樣本), n<30,x抽樣分配隨母體機率分配型態改變,但母體若呈常態分配, 無論n的大小,n的抽樣分配 ⇒ 常態、且母體o已知 ⇒x+Z(α/2)×(o / n)為母體平均數的區間估計。 n<30,但若o未知,用以樣本的標準差S代替母體標準差o 值⇒ 用t分配。

21 任何t分配有其特定的參數(df),與df h, t分配與標準常態分配較為接近。 The no of free choices,you can make in repeated,random samples that constritute, a sampling distriibution reflects the djustment to the sample size. t (df=20) t (df=10)

22 T右尾機率 O面積為α的分配 P(-tα/2<t < tα/2) =1-d
n<30,母體o未知,母體平均數的區間估計 x+t(α/2)×(S/ n),其中1-α為信賴係數,t(α/2)自由度n-1,右尾面積:α/2所對應的t值 S:樣本標準差,且母體假設為常態分配

23 其中t的df用n-1原因 S來估計o, S= ((Σ(xi-x)2)/(n-1))
df:Σ(xi-x)2中, 提供資訊的獨立資料個數。 即Σ(xi-x)=0,我們只要知道 n-1個(xi-x)的資料值。最後一個值可利用Σ(xi-x)=0來推算出。

24 ax:df =10,t0.0025=2.228 Ex:xx公司經理想用電腦來協助訓練公司維修人員15名員工,接受新的訓練,每一位員工所需訓練天數,如下:
52 6 59 11 56 2 44 7 50 12 58 3 55 8 54 13 60 4 9 62 14 5 45 10 46 15 63

25 x=(Σxi)/n =(808)/15≑53.87天 S= ((Σ(xi-x)2)/n) = (651.73)/(14)= (用來推算o ) n=15,df=14 假設母體:常態分配,具有14df t(α/2)=t(0.025)=2.145 x+t(α/2)×(S/ n) ⇨ 53.87+2.145((6.82)/ 15)=53.87+3.78 ⇨ 母體平均訓練時間的95%信賴區間 為50.09~57.65天

26 e值:使用者在特定信賴水準下,願意接受 的最大抽樣誤差,計算區間估計,最常 用的為95%信賴係數對應的Z(0.025)=1.96
樣本大小的決定:樣本平均數的抽樣誤差 有1-α的機率會≤ Z(α/2)× ox ∵ox=o / n 樣本平均數的抽樣誤差 有1-α的機率會≤ Z(α/2) ox e:希望的精確度之抽樣誤差的最大值  =Z(α/2) (o / n),n=(Z(α/2)o )/e 母體平均數區間所需的樣本數n: n=(((Z(α/2)2)o2)/(e2))

27 n=(z(α/2)2o2)/e2=((1.96)2(6.82)2)/4=44.67 即建議45人
上一題,母體平均時間95%的信賴區間 為53.87+3.78天,假設,經理覺得+3.78天的抽樣 誤差太大了。 ⇨ 想改成在95%的信賴係數下,抽樣誤差在2天之內。 Sol:e=2,在95%的信賴區間:1-α=0.95,  α=0.05,α/2=0.025,Zα/2=Z(0.025)=1.96, then 需要一個o 的計劃值, 有xx公司中,有提供o 的計劃值嗎? 利用上題15位員工,S=6.82天⇨ o 值 n=(z(α/2)2o2)/e2=((1.96)2(6.82)2)/4=44.67 即建議45人 *若n未決定前,無法用t分配(∵自由度n-1), 優先用Z值而不用t值。

28 母體比例的區間估計 z np≥5,n(1-p) ≥5 p 的抽樣機率分配 常態分配 定義:抽樣誤差 | p-p| (樣本比例與母體比例之差距) *樣本比例的抽樣誤差有Zα/2op 或連小值的機率1-α。

29 母體比例的區間估計 大樣本母體比例的信賴區間

30 估計母體平均數時樣本數的選擇 估計誤差不超過d值

31 當np≥5,n(1-p) ≥5,p 抽樣分配⇒ 常態分配 ⇨ ⇨
母體比的區間估計: j p+Zα/2op,  其中區間是以1-α做為其信賴係數  ∵op= (P(1-P))/n ⇨p+Z(α/2) (P(1-P))/n o p= (P(1-P))/n 1-α α/2 α/2 p Z(α/2)Op Z(α/2)Op 當np≥5,n(1-p) ≥5,p 抽樣分配⇒ 常態分配 ⇨ ⇨

32 母體比的區間估計 p+Zα/2o p, 1-α信賴係數, Z(α/2):標準常態分配已右尾面積     (α/2) 所對應的Z值。 Ex.XX公司抽出45位受到新方法訓練員工, 有36位Pass test,p=(36)/(45)=0.8, 在95%的信賴係數下, P+Z(0.025) ((P(1-P))/n =0.8+1.96 ((0.8×0.2)/45)=0.8+ ⇨在95%的信賴係數下, 母體比例的區間估計為0.68~0.92

33 P的區間估計所需樣本數: e:抽樣誤差的最大值: Z(α/2) P(1-P)/n ⇨ 母體比例區間估計所需樣本數: n=((Z(α/2)2P(1-P))/(e2)), 大部份情況 e≤ 0.1

34 Ex.XX公司,想估計有通過test的員工 比例,需要多少樣本,才能使95% 信賴水準下的抽樣誤差小於或等於 0.1?
解:E=0.1之Z(0.005)=1.96下,   p=(36)/(45)=0.8,   n=((Z(α/2)2P(1-P))/(e2)   =((1.96)20.8×0.2)/(0.01)) =61.47   ⇒共需62位員工資料

35 母體平均數區間估計程序 摘要: n≥ 30或n<30,母體是否常態?
o 已知或未知 n ≥30 母體常態? yes no o 已知 yes o 已知? no yes no 用樣本標準 差S估計o 用樣本標準 差S估計o x+Z(α/2) o /n x+Z(α/2) o /n 增加樣本數 到n≥ 30, 使得區間 估計可計算 x+Z(α/2) S/ n x+Z(α/2) S/ n

36 重要公式: 抽樣誤差 | x - u | 母體平均數區間估計(n≥30或o已知) x+Z(α/2) o / n 母體平均數區間估計(n≥30或o未知) x+Z(α/2) S/ n 母體平均數區間估計(n<30或o未知) x+t(α/2) S/ n 母體平均數區間估計所需樣本數n=(Z(α/2)2 o2)/(e2) 母體平均數區間估計 p+Z(α/2) (( p (1- p )/n) 母體比例區間估計所需樣本數 n= ((Z(α/2))2p(1-p))/(e2))

37 信賴水準(信賴係數) 信賴水準是指信賴區間包含母體參數的信心(或稱可靠度,信賴度)。課pg291 例8.6
母體參數的信賴區間 = 點估計+ or - 抽樣誤差 信賴水準(信賴係數) 信賴水準是指信賴區間包含母體參數的信心(或稱可靠度,信賴度)。課pg291 例8.6

38 信賴區間 信賴水準1-a下,以 估計 所得的信賴區間為: 稱為信賴區間下限, 稱為信賴區間上限。課本pg287
母體變異數為已知 信賴區間 信賴水準1-a下,以 估計 所得的信賴區間為:      稱為信賴區間下限,    稱為信賴區間上限。課本pg287

39 母體變異數未知 大樣本變異數未知,母體平均數的 信賴區間 課本pg287

40 小樣本常態母體變異數已知,母體平均數的信賴區間
母體為常態分配且變異數已知 小樣本常態母體變異數已知,母體平均數的信賴區間 課本pg287

41 t分配: 自常態母體X~N 隨機抽取樣本 ,則統計量 為自由度n-1的t分配。課本pg293
母體為常態分配但變異數 未知 t分配: 自常態母體X~N   隨機抽取樣本     ,則統計量 為自由度n-1的t分配。課本pg293

42 小樣本常態母體變異數未知,母體平 均數的信賴區間
 母體為常態分配但變異數  未知 小樣本常態母體變異數未知,母體平 均數的信賴區間 課本pg293 例8.7


Download ppt "第八章 估計."

Similar presentations


Ads by Google