第八章 估計.

Slides:



Advertisements
Similar presentations
Chapter Four Parameter Estimation and Statistical Inference.
Advertisements

第三講 Recode、missing value、假設檢定與信賴區間
本章結構 前言 符號介紹與立透法則 指數機率分配 基本無限來源模式 基本有限來源模式 等候系統的經濟分析-最佳化 進階等候模式 16-1.
第07章 計量值管制圖.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Ch05 點估計與抽樣分配 授課老師 薛欣達. 學習目標 估計母體參數的樣本統計量 應用中央極限定理 根據估計式的需求性質判斷估計式的好壞 應用自由度的概念 利用樣板計算抽樣分配與相關的結果.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Advanced Chemical Engineering Thermodynamics
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
Chapter 7 Inference for Distributions 7.1 Inference for the Mean of a Population 7.2 Comparing Two Means 7.3 Inference for Population Spread.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
Chapter 8 Inference for Proportions 第八章 母體比率的推論
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
信度.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
資料結構實習-一 參數傳遞.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
逆向選擇和市場失調. 定義  資料不對稱 在交易其中,其中一方較對方有多些資料。  逆向選擇 出現在這個情況下,就是當買賣雙方隨意在 市場上交易,與比較主動交易者作交易為佳 。
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
Chapter 10 m-way 搜尋樹與B-Tree
演算法課程 (Algorithms) 國立聯合大學 資訊管理學系 陳士杰老師 Course 7 貪婪法則 Greedy Approach.
Chapter 8 The logic of hypothesis testing. 假設檢定 假設檢定 (hypothesis testing) 是利用對樣本 統計量 (sample statistics) 進行檢定已決定 對母體叁數 (population parameters) 的假設 是否成立.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense.
連續隨機變數 連續變數:時間、分數、重量、……
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
兩黨與多黨政黨體系 Lijphart (1984) Party Systems: Two-Party and Multiparty Patterns.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
幼兒行為觀察與記錄 第八章 事件取樣法.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
: How many 0's? ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11038: How many 0’s? 解題者:楊鵬宇 解題日期: 2007 年 5 月 15 日 題意:寫下題目給的 m 與 n(m
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Slide Slide 第 9 章 假設檢定 Part B ( ). 2 Slide Slide 第 9 章 假設檢定 Part B  9.5 母體比例  9.6 假設檢定與決策  9.7 計算型 II 錯誤的機率  9.8 在檢定母體平均數時決定樣本大小 第 9 章假設檢定.
Presentation transcript:

第八章 估計

點估計:用樣本平均數 x來估計全體的平均數叫做點估計. 缺點:點估計命中目標的機會是很低的. 因少數樣本觀察值得到的結果要和全體平均數吻合幾乎不可能.不用點估計而改用區間估計.

以95%信賴係數為例,如果我們進行一百次獨立的抽樣估計,會有一百個樣本平均數,亦會有一百個區間估計 以95%信賴係數為例,如果我們進行一百次獨立的抽樣估計,會有一百個樣本平均數,亦會有一百個區間估計.In Fact,我們不會做一百次抽樣,而是只做一次. 此次抽樣而來的區間估計會包含的機會是95%. 信賴係數越高所估計的區間也越寬.區間越寬越好?

Ex: 預估計全國七至十二歲小孩的壓歲錢平均數是在100元至3000元之間.此估計既使有99.7%的信賴區間也沒用 因此區間實在太寬. 如980元至990元之間,信賴係數是99.7% . 這就是個非常好的估計. 學習抽樣的方法是要使這個信賴區間儘可能的縮小.

不偏估計量 若估計式抽樣分配的平均數等於母體參數值 ,則該估計式為不偏估計式,否則為偏誤估計式。即若 ,則 為的不偏估計式。 不偏性 不偏估計量 若估計式抽樣分配的平均數等於母體參數值 ,則該估計式為不偏估計式,否則為偏誤估計式。即若     ,則 為的不偏估計式。

有效性 不偏估計量的相對有效性

區間估計: 對未知的母體參數估計出一個上、下限的區間,並指出該區間包含母體參數的可靠度。 區間估計: 對未知的母體參數估計出一個上、下限的區間,並指出該區間包含母體參數的可靠度。 信賴區間: 是在一個既定的信賴水準下所構成的一個區間。是由樣本統計量及抽樣誤差所構成的一個(包含上限,下限的)區間。

1.估計:字元被字做是母體平均     數的點估值時,大家    會問這估計值是否好? 2.抽樣誤差:|x- | 但一般 都是未知 a用x的抽樣分配來算出抽樣誤 差的機率

Ex:n=100,:20 利用中央極限定理 ⇨用常態分配來做為x的抽樣分配 常態分配,平均數  :未知 標準差 x :  / n =20/ 100 =2 95% 0.025 0.025 1.960  1.960 x

1.查表:95%的x會落在的+1.96個標準    差之內,用0.475→查表得知,    對應值1.96。 2. 因1.96o x =1.96(2) =3.92,  有95%的樣本平均數,  會落在母體平均數的= + 3.92範圍。 3.一個樣本平均數的抽樣誤差等於或小於 3.92之機率為0.95。 4.o (x-3.92, x+3.92)的區間, 有95%的信賴度會包含母體平均數。

樣本平均數的抽樣誤差會小於或等於Z(/2)x 的機率為1-α 1-o

信  賴 水  準 α α/2 Zα/2 90% 0.1 0.05 1.645 95% 0.025 1.96 99% 0.01 0.005 2.57

Ex:有100位custom的樣本平均 滿意分數,x=82, 利用區間x+3. 92, 發現母體平均數的信賴區間 估計於為82+3

母體平均數之區間估計: j大樣本(n≥30), 母體標準差(o )已知 x+Z(α/2)×(o / n) 其中1-o:信賴係數   Z(α/2):標準常態分配右尾,   只α/2面積所對應的Z值。

k大樣本(n ≥ 30), 母體標準差(S)未知 x+Z(α/2) × S/ n 其中S:樣本標準差   1-α:信賴係數 Z(α/2):標準常態分配右尾 具α/2面積所對應的Z值。

Ex:壽險公司,定期抽出36位保險人進 行調查,在一次調查中,公司主管 被要求對母體保險人的平均年齡進 行具90%信賴係數的區間估計 x =39.5,S樣=36=7.77 39.5+Z0.05× ((7.77)/ 36) =39.5+1.645×((7.77)/6) =39.5+2.13=(37.37,41.63) 主管可說明XX公司的壽險保險人的平均年齡在90%的信賴係數下為37.37歲到41.63歲。

Ex:同上題,若用95%信賴係 數的區間估計: A 95% Confidence Interval The assumed Sigma=7.7 (樣本ox來 代替母體o ) N 36 Mean 39.5 S+Dew 7.77 95% C.I (36.96,42.04)

36.96 37.37 42.04 41.63 B 90% Confidence Interval The assumed Sigma=7.7 N 36 Mean 39.50 S+Dew 7.77 95% C.I (37.37,41.63) 所有 x 值 的90% 所有 x 值的95% 36.96 37.37 42.04 41.63

*抽樣之後所計算出的信賴區間可能會或不會包含u。 if 1-α夠大,則區間包含u 的可能性h。 95%的信賴區間較90%的信賴區間大 *抽樣之後所計算出的信賴區間可能會或不會包含u。 if 1-α夠大,則區間包含u 的可能性h。 *if 信賴區間太大,可用n樣本h 來縮短信賴區間。

母體平均數的區間估計: (小樣本), n<30,x抽樣分配隨母體機率分配型態改變,但母體若呈常態分配, 無論n的大小,n的抽樣分配 ⇒ 常態、且母體o已知 ⇒x+Z(α/2)×(o / n)為母體平均數的區間估計。 n<30,但若o未知,用以樣本的標準差S代替母體標準差o 值⇒ 用t分配。

任何t分配有其特定的參數(df),與df h, t分配與標準常態分配較為接近。 The no of free choices,you can make in repeated,random samples that constritute, a sampling distriibution reflects the djustment to the sample size. t (df=20) t (df=10)

T右尾機率 O面積為α的分配 P(-tα/2<t < tα/2) =1-d n<30,母體o未知,母體平均數的區間估計 x+t(α/2)×(S/ n),其中1-α為信賴係數,t(α/2)自由度n-1,右尾面積:α/2所對應的t值 S:樣本標準差,且母體假設為常態分配

其中t的df用n-1原因 S來估計o, S= ((Σ(xi-x)2)/(n-1)) df:Σ(xi-x)2中, 提供資訊的獨立資料個數。 即Σ(xi-x)=0,我們只要知道 n-1個(xi-x)的資料值。最後一個值可利用Σ(xi-x)=0來推算出。

ax:df =10,t0.0025=2.228 Ex:xx公司經理想用電腦來協助訓練公司維修人員15名員工,接受新的訓練,每一位員工所需訓練天數,如下: 52 6 59 11 56 2 44 7 50 12 58 3 55 8 54 13 60 4 9 62 14 5 45 10 46 15 63

x=(Σxi)/n =(808)/15≑53.87天 S= ((Σ(xi-x)2)/n) = (651.73)/(14)=6.82 (用來推算o ) n=15,df=14 假設母體:常態分配,具有14df t(α/2)=t(0.025)=2.145 x+t(α/2)×(S/ n) ⇨ 53.87+2.145((6.82)/ 15)=53.87+3.78 ⇨ 母體平均訓練時間的95%信賴區間 為50.09~57.65天

e值:使用者在特定信賴水準下,願意接受 的最大抽樣誤差,計算區間估計,最常 用的為95%信賴係數對應的Z(0.025)=1.96 樣本大小的決定:樣本平均數的抽樣誤差 有1-α的機率會≤ Z(α/2)× ox ∵ox=o / n 樣本平均數的抽樣誤差 有1-α的機率會≤ Z(α/2) ox e:希望的精確度之抽樣誤差的最大值  =Z(α/2) (o / n),n=(Z(α/2)o )/e 母體平均數區間所需的樣本數n: n=(((Z(α/2)2)o2)/(e2))

n=(z(α/2)2o2)/e2=((1.96)2(6.82)2)/4=44.67 即建議45人 上一題,母體平均時間95%的信賴區間 為53.87+3.78天,假設,經理覺得+3.78天的抽樣 誤差太大了。 ⇨ 想改成在95%的信賴係數下,抽樣誤差在2天之內。 Sol:e=2,在95%的信賴區間:1-α=0.95,  α=0.05,α/2=0.025,Zα/2=Z(0.025)=1.96, then 需要一個o 的計劃值, 有xx公司中,有提供o 的計劃值嗎? 利用上題15位員工,S=6.82天⇨ o 值 n=(z(α/2)2o2)/e2=((1.96)2(6.82)2)/4=44.67 即建議45人 *若n未決定前,無法用t分配(∵自由度n-1), 優先用Z值而不用t值。

母體比例的區間估計 z np≥5,n(1-p) ≥5 p 的抽樣機率分配 常態分配 定義:抽樣誤差 | p-p| (樣本比例與母體比例之差距) *樣本比例的抽樣誤差有Zα/2op 或連小值的機率1-α。

母體比例的區間估計 大樣本母體比例的信賴區間

估計母體平均數時樣本數的選擇 估計誤差不超過d值

當np≥5,n(1-p) ≥5,p 抽樣分配⇒ 常態分配 ⇨ ⇨ 母體比的區間估計: j p+Zα/2op,  其中區間是以1-α做為其信賴係數  ∵op= (P(1-P))/n ⇨p+Z(α/2) (P(1-P))/n o p= (P(1-P))/n 1-α α/2 α/2 p Z(α/2)Op Z(α/2)Op 當np≥5,n(1-p) ≥5,p 抽樣分配⇒ 常態分配 ⇨ ⇨

母體比的區間估計 p+Zα/2o p, 1-α信賴係數, Z(α/2):標準常態分配已右尾面積     (α/2) 所對應的Z值。 Ex.XX公司抽出45位受到新方法訓練員工, 有36位Pass test,p=(36)/(45)=0.8, 在95%的信賴係數下, P+Z(0.025) ((P(1-P))/n =0.8+1.96 ((0.8×0.2)/45)=0.8+1.2 ⇨在95%的信賴係數下, 母體比例的區間估計為0.68~0.92

P的區間估計所需樣本數: e:抽樣誤差的最大值: Z(α/2) P(1-P)/n ⇨ 母體比例區間估計所需樣本數: n=((Z(α/2)2P(1-P))/(e2)), 大部份情況 e≤ 0.1

Ex.XX公司,想估計有通過test的員工 比例,需要多少樣本,才能使95% 信賴水準下的抽樣誤差小於或等於 0.1? 解:E=0.1之Z(0.005)=1.96下,   p=(36)/(45)=0.8,   n=((Z(α/2)2P(1-P))/(e2)   =((1.96)20.8×0.2)/(0.01)) =61.47   ⇒共需62位員工資料

母體平均數區間估計程序 摘要: n≥ 30或n<30,母體是否常態? o 已知或未知 n ≥30 母體常態? yes no o 已知 yes o 已知? no yes no 用樣本標準 差S估計o 用樣本標準 差S估計o x+Z(α/2) o /n x+Z(α/2) o /n 增加樣本數 到n≥ 30, 使得區間 估計可計算 x+Z(α/2) S/ n x+Z(α/2) S/ n

重要公式: 抽樣誤差 | x - u | 母體平均數區間估計(n≥30或o已知) x+Z(α/2) o / n 母體平均數區間估計(n≥30或o未知) x+Z(α/2) S/ n 母體平均數區間估計(n<30或o未知) x+t(α/2) S/ n 母體平均數區間估計所需樣本數n=(Z(α/2)2 o2)/(e2) 母體平均數區間估計 p+Z(α/2) (( p (1- p )/n) 母體比例區間估計所需樣本數 n= ((Z(α/2))2p(1-p))/(e2))

信賴水準(信賴係數) 信賴水準是指信賴區間包含母體參數的信心(或稱可靠度,信賴度)。課pg291 例8.6 母體參數的信賴區間 = 點估計+ or - 抽樣誤差 信賴水準(信賴係數) 信賴水準是指信賴區間包含母體參數的信心(或稱可靠度,信賴度)。課pg291 例8.6

信賴區間 信賴水準1-a下,以 估計 所得的信賴區間為: 稱為信賴區間下限, 稱為信賴區間上限。課本pg287 母體變異數為已知 信賴區間 信賴水準1-a下,以 估計 所得的信賴區間為:      稱為信賴區間下限,    稱為信賴區間上限。課本pg287

母體變異數未知 大樣本變異數未知,母體平均數的 信賴區間 課本pg287

小樣本常態母體變異數已知,母體平均數的信賴區間 母體為常態分配且變異數已知 小樣本常態母體變異數已知,母體平均數的信賴區間 課本pg287

t分配: 自常態母體X~N 隨機抽取樣本 ,則統計量 為自由度n-1的t分配。課本pg293 母體為常態分配但變異數 未知 t分配: 自常態母體X~N   隨機抽取樣本     ,則統計量 為自由度n-1的t分配。課本pg293

小樣本常態母體變異數未知,母體平 均數的信賴區間  母體為常態分配但變異數  未知 小樣本常態母體變異數未知,母體平 均數的信賴區間 課本pg293 例8.7