第八章估計.

第八章估計

點估計：用樣本平均數 x來估計全體的平均數叫做點估計.
缺點:點估計命中目標的機會是很低的. 因少數樣本觀察值得到的結果要和全體平均數吻合幾乎不可能.不用點估計而改用區間估計.

以95%信賴係數為例,如果我們進行一百次獨立的抽樣估計,會有一百個樣本平均數,亦會有一百個區間估計
以95%信賴係數為例,如果我們進行一百次獨立的抽樣估計,會有一百個樣本平均數,亦會有一百個區間估計.In Fact,我們不會做一百次抽樣,而是只做一次. 此次抽樣而來的區間估計會包含的機會是95%. 信賴係數越高所估計的區間也越寬.區間越寬越好?

Ex: 預估計全國七至十二歲小孩的壓歲錢平均數是在100元至3000元之間.此估計既使有99.7%的信賴區間也沒用
因此區間實在太寬. 如980元至990元之間,信賴係數是99.7% . 這就是個非常好的估計. 學習抽樣的方法是要使這個信賴區間儘可能的縮小.

不偏估計量若估計式抽樣分配的平均數等於母體參數值，則該估計式為不偏估計式，否則為偏誤估計式。即若，則為的不偏估計式。
不偏性不偏估計量若估計式抽樣分配的平均數等於母體參數值，則該估計式為不偏估計式，否則為偏誤估計式。即若　　　　　，則為的不偏估計式。

有效性不偏估計量的相對有效性

區間估計: 對未知的母體參數估計出一個上、下限的區間，並指出該區間包含母體參數的可靠度。
區間估計: 對未知的母體參數估計出一個上、下限的區間，並指出該區間包含母體參數的可靠度。信賴區間: 是在一個既定的信賴水準下所構成的一個區間。是由樣本統計量及抽樣誤差所構成的一個（包含上限，下限的）區間。

1.估計：字元被字做是母體平均　　　數的點估值時，大家　　　會問這估計值是否好？
2.抽樣誤差：|x－ | 但一般 都是未知 a用x的抽樣分配來算出抽樣誤差的機率

Ex：n=100，：20 利用中央極限定理 ⇨用常態分配來做為x的抽樣分配常態分配，平均數  ：未知標準差 x :  / n =20/ 100 =2
95% 0.025 0.025 1.960  1.960 x

1.查表：95%的x會落在的＋1.96個標準　　　差之內，用0.475→查表得知，　　　對應值1.96。
2. 因1.96o x ＝1.96(2) ＝3.92，　有95%的樣本平均數，　會落在母體平均數的= ＋ 3.92範圍。 3.一個樣本平均數的抽樣誤差等於或小於之機率為0.95。 4.o (x－3.92, x＋3.92)的區間，有95%的信賴度會包含母體平均數。

樣本平均數的抽樣誤差會小於或等於Z(/2)x 的機率為1－α
1－o

信　賴水　準 α α/2 Zα/2 90% 0.1 0.05 1.645 95% 0.025 1.96 99% 0.01 0.005 2.57

Ex：有100位custom的樣本平均滿意分數，x＝82，利用區間x＋3. 92，發現母體平均數的信賴區間估計於為82＋3

母體平均數之區間估計： j大樣本(n≥30)，母體標準差(o )已知 x＋Z(α/2)×(o / n) 其中1－o：信賴係數　 Z(α/2)：標準常態分配右尾，　只α/2面積所對應的Z值。

k大樣本(n ≥ 30)，母體標準差(S)未知 x＋Z(α/2) × S/ n 其中S：樣本標準差　 1－α：信賴係數 Z(α/2)：標準常態分配右尾具α/2面積所對應的Z值。

Ex：壽險公司，定期抽出36位保險人進行調查，在一次調查中，公司主管被要求對母體保險人的平均年齡進行具90%信賴係數的區間估計
x ＝39.5，S樣=36＝7.77 39.5＋Z0.05× ((7.77)/ 36) ＝39.5＋1.645×((7.77)/6) ＝39.5＋2.13＝(37.37,41.63) 主管可說明XX公司的壽險保險人的平均年齡在90%的信賴係數下為37.37歲到41.63歲。

Ex：同上題，若用95%信賴係數的區間估計： A 95% Confidence Interval
The assumed Sigma=7.7 (樣本ox來代替母體o ) N 36 Mean 39.5 S＋Dew 7.77 95% C.I (36.96,42.04)

36.96 37.37 42.04 41.63 B 90% Confidence Interval The assumed
Sigma=7.7 N 36 Mean 39.50 S＋Dew 7.77 95% C.I (37.37,41.63) 所有 x 值的90% 所有 x 值的95% 36.96 37.37 42.04 41.63

＊抽樣之後所計算出的信賴區間可能會或不會包含u。 if 1－α夠大，則區間包含u 的可能性h。
95%的信賴區間較90%的信賴區間大＊抽樣之後所計算出的信賴區間可能會或不會包含u。 if 1－α夠大，則區間包含u 的可能性h。＊if 信賴區間太大，可用n樣本h 來縮短信賴區間。

母體平均數的區間估計： (小樣本)， n＜30，x抽樣分配隨母體機率分配型態改變，但母體若呈常態分配，無論n的大小，n的抽樣分配 ⇒ 常態、且母體o已知 ⇒x＋Z(α/2)×(o / n)為母體平均數的區間估計。 n＜30，但若o未知，用以樣本的標準差S代替母體標準差o 值⇒ 用t分配。

任何t分配有其特定的參數(df)，與df h， t分配與標準常態分配較為接近。 The no of free choices,you can make in repeated,random samples that constritute, a sampling distriibution reflects the djustment to the sample size. t (df＝20) t (df＝10)

T右尾機率 O面積為α的分配 P(－tα/2＜t < tα/2) ＝1－d
n＜30，母體o未知，母體平均數的區間估計 x＋t(α/2)×(S/ n)，其中1－α為信賴係數，t(α/2)自由度n－1，右尾面積：α/2所對應的t值 S：樣本標準差，且母體假設為常態分配

其中t的df用n－1原因 S來估計o， S＝ ((Σ(xi－x)2)/(n－1))
df：Σ(xi－x)2中，提供資訊的獨立資料個數。即Σ(xi－x)＝0，我們只要知道 n－1個(xi－x)的資料值。最後一個值可利用Σ(xi－x)＝0來推算出。

ax：df =10,t0.0025＝2.228 Ex：xx公司經理想用電腦來協助訓練公司維修人員15名員工，接受新的訓練，每一位員工所需訓練天數，如下：
52 6 59 11 56 2 44 7 50 12 58 3 55 8 54 13 60 4 9 62 14 5 45 10 46 15 63

x＝(Σxi)/n ＝(808)/15≑53.87天 S＝ ((Σ(xi－x)2)/n) ＝ (651.73)/(14)＝ (用來推算o ) n＝15，df＝14 假設母體：常態分配，具有14df t(α/2)＝t(0.025)＝2.145 x＋t(α/2)×(S/ n) ⇨ 53.87＋2.145((6.82)/ 15)＝53.87＋3.78 ⇨ 母體平均訓練時間的95%信賴區間為50.09～57.65天

e值：使用者在特定信賴水準下，願意接受的最大抽樣誤差，計算區間估計，最常用的為95%信賴係數對應的Z(0.025)＝1.96
樣本大小的決定：樣本平均數的抽樣誤差有1－α的機率會≤ Z(α/2)× ox ∵ox＝o / n 樣本平均數的抽樣誤差有1－α的機率會≤ Z(α/2) ox e：希望的精確度之抽樣誤差的最大值　＝Z(α/2) (o / n)，n＝(Z(α/2)o )/e 母體平均數區間所需的樣本數n： n＝(((Z(α/2)2)o2)/(e2))

n＝(z(α/2)2o2)/e2＝((1.96)2(6.82)2)/4＝44.67 即建議45人
上一題，母體平均時間95%的信賴區間為53.87＋3.78天，假設，經理覺得＋3.78天的抽樣誤差太大了。 ⇨ 想改成在95%的信賴係數下，抽樣誤差在2天之內。 Sol：e＝2，在95%的信賴區間：1－α＝0.95，　 α＝0.05，α/2＝0.025，Zα/2＝Z(0.025)＝1.96, then 需要一個o 的計劃值，有xx公司中，有提供o 的計劃值嗎？利用上題15位員工，S＝6.82天⇨ o 值 n＝(z(α/2)2o2)/e2＝((1.96)2(6.82)2)/4＝44.67 即建議45人＊若n未決定前，無法用t分配(∵自由度n－1)，優先用Z值而不用t值。

母體比例的區間估計 z np≥5，n(1－p) ≥5 p 的抽樣機率分配常態分配定義：抽樣誤差 | p－p| (樣本比例與母體比例之差距) ＊樣本比例的抽樣誤差有Zα/2op 或連小值的機率1－α。

母體比例的區間估計大樣本母體比例的信賴區間

估計母體平均數時樣本數的選擇估計誤差不超過d值

當np≥5，n(1－p) ≥5，p 抽樣分配⇒ 常態分配 ⇨ ⇨
母體比的區間估計： j p＋Zα/2op，　其中區間是以1－α做為其信賴係數　∵op＝ (P(1－P))/n ⇨p＋Z(α/2) (P(1－P))/n o p＝ (P(1－P))/n 1－α α/2 α/2 p Z(α/2)Op Z(α/2)Op 當np≥5，n(1－p) ≥5，p 抽樣分配⇒ 常態分配 ⇨ ⇨

母體比的區間估計 p＋Zα/2o p， 1－α信賴係數， Z(α/2)：標準常態分配已右尾面積　　　　(α/2) 所對應的Z值。 Ex.XX公司抽出45位受到新方法訓練員工，有36位Pass test，p＝(36)/(45)＝0.8，在95%的信賴係數下， P＋Z(0.025) ((P(1－P))/n ＝0.8＋1.96 ((0.8×0.2)/45)=0.8＋ ⇨在95%的信賴係數下，母體比例的區間估計為0.68～0.92

P的區間估計所需樣本數： e：抽樣誤差的最大值： Z(α/2) P(1－P)/n ⇨ 母體比例區間估計所需樣本數： n＝((Z(α/2)2P(1－P))/(e2))，大部份情況 e≤ 0.1

Ex.XX公司，想估計有通過test的員工比例，需要多少樣本，才能使95% 信賴水準下的抽樣誤差小於或等於 0.1？
解：E＝0.1之Z(0.005)＝1.96下，　　p＝(36)/(45)＝0.8，　　n＝((Z(α/2)2P(1－P))/(e2) 　＝((1.96)20.8×0.2)/(0.01)) ＝61.47 　　⇒共需62位員工資料

母體平均數區間估計程序摘要： n≥ 30或n＜30，母體是否常態？
o 已知或未知 n ≥30 母體常態？ yes no o 已知 yes o 已知？ no yes no 用樣本標準差S估計o 用樣本標準差S估計o x＋Z(α/2) o /n x＋Z(α/2) o /n 增加樣本數到n≥ 30，使得區間估計可計算 x＋Z(α/2) S/ n x＋Z(α/2) S/ n

重要公式：抽樣誤差 | x － u | 母體平均數區間估計(n≥30或o已知) x＋Z(α/2) o / n 母體平均數區間估計(n≥30或o未知) x＋Z(α/2) S/ n 母體平均數區間估計(n＜30或o未知) x＋t(α/2) S/ n 母體平均數區間估計所需樣本數n＝(Z(α/2)2 o2)/(e2) 母體平均數區間估計 p＋Z(α/2) (( p (1－ p )/n) 母體比例區間估計所需樣本數 n＝ ((Z(α/2))2p(1－p))/(e2))

信賴水準（信賴係數）信賴水準是指信賴區間包含母體參數的信心（或稱可靠度，信賴度）。課pg291 例8.6
母體參數的信賴區間 = 點估計+ or - 抽樣誤差信賴水準（信賴係數）信賴水準是指信賴區間包含母體參數的信心（或稱可靠度，信賴度）。課pg291 例8.6

信賴區間信賴水準1-a下，以估計所得的信賴區間為：稱為信賴區間下限，稱為信賴區間上限。課本pg287
母體變異數為已知信賴區間信賴水準1-a下，以　估計　所得的信賴區間為：　　　　　稱為信賴區間下限，　　　稱為信賴區間上限。課本pg287

母體變異數未知大樣本變異數未知，母體平均數的信賴區間課本pg287

小樣本常態母體變異數已知，母體平均數的信賴區間
母體為常態分配且變異數已知小樣本常態母體變異數已知，母體平均數的信賴區間課本pg287

t分配: 自常態母體X~N 隨機抽取樣本，則統計量為自由度n-1的t分配。課本pg293
母體為常態分配但變異數未知 t分配: 自常態母體X~N　　　隨機抽取樣本　　　　　，則統計量為自由度n-1的t分配。課本pg293

小樣本常態母體變異數未知，母體平均數的信賴區間
　母體為常態分配但變異數　未知小樣本常態母體變異數未知，母體平均數的信賴區間課本pg293 例8.7

第八章估計.

Similar presentations

Presentation on theme: "第八章估計."— Presentation transcript:

Similar presentations

About project

Feedback

Log in

Auth with social network:

第八章 估計.

Similar presentations

Presentation on theme: "第八章 估計."— Presentation transcript:

Similar presentations

About project

Feedback

第八章估計.

Presentation on theme: "第八章估計."— Presentation transcript: