民意調查的分析 I 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 名目變數之描述性統 計 連續變數之描述性統 計 順序變數.

Slides:



Advertisements
Similar presentations
第五章 卡方檢定 5-1 卡方檢定 (X2 test) 5-2 適配度檢定 (good-of-fit test)
Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
1 Chemical and Engineering Thermodynamics Chapter 2 Conservation of mass and energy Sandler.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Chapter Two Data Summary and Presentation. Statistics II2 敘述統計 Vs. 推論統計 n 敘述統計 : 使用分析方法或圖形來描述一組來自於母 體或樣本之資料 n 推論統計 : 利用抽樣方法取得一樣本, 並針對此樣本 計算樣本統計量, 以推論未之母體之參數.
Advanced Chemical Engineering Thermodynamics
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Structural Equation Modeling Chapter 7 觀察變數路徑分析=路徑分析 觀察變數路徑分析.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
民意調查的分析 II 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 假設的檢定 研究假設 H1: 研究假設 ( 例: X 與 Y 相關 ) H0: 虛無假設 ( 例: X 與 Y 無關 ) 檢定結果:接受虛無假設或拒斥虛無假 設,但不代表接受研究假設.
信度.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface : Eigenvector 和 eigenvalue 的應用. Fractal : Affine transform( rotation, translation,
Ch05 確定研究變項.
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
觀測量的權 權的觀念與計算.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
Chapter 10 m-way 搜尋樹與B-Tree
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
SQL 進階查詢.
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
Structural Equation Modeling Chapter 8 潛伏變數路徑分析=完全 SEM 潛伏變數路徑分析.
連續隨機變數 連續變數:時間、分數、重量、……
兩黨與多黨政黨體系 Lijphart (1984) Party Systems: Two-Party and Multiparty Patterns.
Ch05 確定研究變項.
單因子變異數分析 多重比較 雙因子變異數分析
計數值抽樣計劃 使用 MIL-105D 表. 表 10-1 Sample Sizes Code Letters.
第六章 衡量.
Regression 相關 –Cross table –Bivariate –Contingency Cofficient –Rank Correlation 簡單迴歸 多元迴歸.
牽涉兩個變數的 Data Table 汪群超 11/1/98. Z=-X 2 +4X-Y 2 +6Y-7 觀察 Z 值變化的 X 範圍 觀察 Z 值變化的 Y 範圍.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
第十一章 卡方檢定 陳順宇 教授 成功大學統計系.
Ch 11 建立研究工具的效度與信度.
幼兒行為觀察與記錄 第八章 事件取樣法.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 柱體與錐體 1. 找出柱體與錐體的規則 2. 柱體的命名與特性 3. 柱體的展開圖 4. 錐體的命名與特性 5. 錐體的展開圖
Presentation transcript:

民意調查的分析 I 蔡佳泓 政大選舉研究中心 副研究員

課程大綱 名目變數之描述性統 計 連續變數之描述性統 計 順序變數

11%+89%=100%

贊成意見與時間

名目變數描述性統計 類別資料例如性別、 居住地、贊成反對 等皆可以用次數分配表示。 表示的重點在於指出那一個類別佔多數, 即眾數。

使用 SPSS 分析資料 以「台灣的公民意識」為例 檔案 -  讀取文字資料 分析 -  描述統計 -  次數分配表 統計圖 -  圓餅圖或線形圖

SPSS 介面

名目變數次數分配 1

次數分配 2

次數分配 3

集中趨勢

參考傳院課程

交叉列表 1-1

交叉列表 1-2

交叉列表 1-3

交叉列表的獨立性檢定 用 Chi-square 分布做獨立性檢定。 如果拒斥檢定假設表示兩者是相關的。 如果接受檢定假設表示兩者是獨立的。 也就是期待值跟觀察值非常相近。 χ 2 =∑( 期待值 - 觀察值 ) 2 / 期待值 Chi-square test

交叉列表 12 1E11E12B1 2E21E22B2 A1A2N E11/A1 = E12/A2 = B1/N E21/A1 = E22/A2 = B2/N 所以: E11= A1*B1/N ,每一格子數目由邊際 機率決定

婚姻與政黨支持

交叉列表的獨立性檢定

試算使用語言及政黨支持的卡方 值

名目變數的相關性 名目尺度只有類別沒有順序或距離, 因 此相關性的原理是用某個變數的眾數去 猜另一個變數, 猜對減猜錯的比率就是 相關性。 PRE(proportional reduction of error): 用 依變數的全部減眾數為底, 分子為該數 值與自變數猜錯之間的差。 [(N-m)-(d1- m1)-(d2-m2) … ]/ (N-m)

名目變數的相關性

以有沒有出去玩當依變數 N=1124 眾數為 627 N-m=497 用年齡當做自變數時, 每個年齡對應的 d-m 為 86, 122, 129, 75, 39( 猜錯的 ) /497=.093

名目變數相關係數 : lambda 可用在對稱性或有依變數之名目變數之 關聯性計算 不對稱 :lambda= ( 每個 X 變項下 Y 的眾值 )-Y 之眾值 /N-Y 之眾 值 對稱 :( 每個 X 變項下 Y 的眾值 )+( 每個 y 變項 下 x 的眾值 )-Y 之眾值 -X 眾值 /2N-Y 之眾值 - X 之眾值

試算這兩個變數的相關性

順序尺度資料分析 以TVBS的「春節交通狀況民調 」為例。 順序尺度變數可以用中位數表示其中間 趨勢。 中位數指的是將全部觀察值分成 一半的觀察值。 例如: 2,5,5,8,10,13,60,77,125,336,336,999,10 21 之中 60 為中位數。

順序尺度變數

重新歸類為比較好、 差不多、 比較差三類。 中位數為 2 — 差不多, 因為累積次數過半。 眾數也是 2 。

順序尺度變數條狀圖

順序尺度變數相關性 如果有兩個順序尺度的變數,一般而言 是用 Gamma 表示其相關程度。 Gamma 的觀念是比對觀察值在兩個變數 上的順序,順序一致的比率越高,則兩 者的相關性越高。 另外一種指標是 Kendall ’ s tau-b ,可以 幫助 Gamma 係數處理一些平手的配對。

Gamma: Ns-Nd/Ns+Nd Tau-a:Ns-Nd/0.5*N(N-1) Tau-b:Ns-Nd/sqrt(Ns+Nd+Tx) (Ns+Nd+Ty) Sommer ’ s D: Ns-Nd/Ns+Nd+Ty Ns: 同序的數目 Nd: 不同序的數目 Tx:X 變數下平手的格子

計算方式 123 1f11f12f13 2f21f22f23 3f31f32f33 Ns=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22(f3 3) Nd=f13(f22+f21+f32+f31)+f12(f21+f31)+f23(f32+f31)+f22(f3 1) Ty=f11(f12+f13)+f12(f13)+f21(f22+f23)+f22(f23)+f31(f32+f3 3)+f32(f33)

順序尺度變數相關性

檢驗假設 以上相關係數皆可用 t 分配檢驗 Gamma 標準化 Z 值的計 算 :G(sqrt[(Ns+Nd)/N(1-G 2 )])

小結 Somer ’ s D 及 Kendall ’ s Tau-b 適合於不對 稱的情形。 Tau-b 適合於兩個變數有同樣數目的變項