Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data.

Slides:



Advertisements
Similar presentations
Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
Advertisements

布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
HSR 課程介紹. 指定用書 Health Services Research Method Leiyu Shi 2008.
Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點 行為 清楚掌握主題 - 當「事件」出現時才開 始記錄 記錄程序 等待目標事件的發生 開始記錄 事件結束,停止記錄.
Chapter Two Data Summary and Presentation. Statistics II2 敘述統計 Vs. 推論統計 n 敘述統計 : 使用分析方法或圖形來描述一組來自於母 體或樣本之資料 n 推論統計 : 利用抽樣方法取得一樣本, 並針對此樣本 計算樣本統計量, 以推論未之母體之參數.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
第二章 敘述統計:表格與圖形法 定性資料的彙總 定量資料的彙總 探究性的資料分析 交叉表格與散佈圖 CH2-
1 Advanced Chemical Engineering Thermodynamics Appendix BK The Generalized van der Waals Partition Function.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
第三章 統計資料的呈現:統計圖表. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 利用統計圖表作資料的呈現,讓人有一目了然的 感覺。 2. 繪製屬質資料的統計圖表:次數分配表、長條圖 與圓形圖。 3. 繪製屬量資料的統計圖表:有序枝葉圖、次數分 配表、直方圖、多邊形圖與時間數列圖。
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
1 真理大學運輸管理學系 實務實習說明 目錄  實務實習類別  實務實習條例  校外實習單位  實務實習成績計算方式  校外實習甄選 / 自洽申請流程  附錄:相關表格.
: ShellSort ★★☆☆☆ 題組: Problem D 題號: 10152: ShellSort 解題者:林一帆 解題日期: 2006 年 4 月 10 日 題意:烏龜王國的烏龜總是一隻一隻疊在一起。唯一改變烏龜位置 的方法為:一隻烏龜爬出他原來的位置,然後往上爬到最上方。給 你一堆烏龜原來排列的順序,以及我們想要的烏龜的排列順序,你.
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
第二章 統計圖表.
8.1 何謂高度平衡二元搜尋樹 8.2 高度平衡二元搜尋樹的加入 8.3 高度平衡二元搜尋樹的刪除
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
南投縣社區大學 Excel 實務應用入門 講師 : 林泉成
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
國立中央大學電機工程學系 99 學年度第 2 學期 助教會議 中央大學電機工程學系 工程認證 1.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
最新計算機概論 第 5 章 系統程式. 5-1 系統程式的類型 作業系統 (OS) : 介於電腦硬體與 應用軟體之間的 程式,除了提供 執行應用軟體的 環境,還負責分 配系統資源。
2003/09/12 第三章 統計資料的呈現:統計圖表. 2003/09/12 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 利用統計圖表作資料的呈現,讓人有一目了然 的感覺。 2. 繪製屬質資料的統計圖表:次數分配表、長條 圖與圓形圖。 3. 繪製屬量資料的統計圖表:有序枝葉圖、次數.
Chapter 20 塑模動態觀點:狀態圖 Statechart Diagram. 學習目標  說明狀態圖的目的  定義狀態圖的基本記號  展示狀態圖的建構  定義活動、內部事件及遞延事件的狀態 圖記號.
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2008.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
: Beautiful Numbers ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11472: Beautiful Numbers 解題者:邱經達 解題日期: 2011 年 5 月 5 日 題意: 若一個 N 進位的數用到該.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
Chapter 10 m-way 搜尋樹與B-Tree
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2009.
Chapter 2 Frequency Distributions 次數分配
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
Ch 3 Central Tendency 中央集中趨勢測量.
連續隨機變數 連續變數:時間、分數、重量、……
統計緒論 _ Chap2 資料整理 2.1 基本的資料整理  排序,例: length of 60 sea trouts ( 課本 p13 ) ( 可用 EXCEL)  長條圖,例 2.1 number of times of delay in a week for the 48 flights.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2010.
單因子變異數分析 多重比較 雙因子變異數分析
牽涉兩個變數的 Data Table 汪群超 11/1/98. Z=-X 2 +4X-Y 2 +6Y-7 觀察 Z 值變化的 X 範圍 觀察 Z 值變化的 Y 範圍.
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Introduction to Java Programming Lecture 3 Mathematical Operators Spring 2009.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
: How many 0's? ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11038: How many 0’s? 解題者:楊鵬宇 解題日期: 2007 年 5 月 15 日 題意:寫下題目給的 m 與 n(m
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Slide Slide 第 2 章 敘述統計I:表格與圖形法. 2 Slide Slide 敘述統計 I :表格與圖形法 類別資料的彙總 定量資料的彙總 探究性資料分析:莖葉圖 交叉表格與散佈圖.
1 柱體與錐體 1. 找出柱體與錐體的規則 2. 柱體的命名與特性 3. 柱體的展開圖 4. 錐體的命名與特性 5. 錐體的展開圖
Presentation transcript:

Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data

Chapter 1 Examining Distributions 探討分配 ( 分佈、分布 ) 1.1 Displaying Distributions with Graphs 1.2 Describing Distributions with Numbers 1.3 Normal Distributions

數字會說話 數字可以告訴我們事實真相,協助規 劃,如何做決策。 – 航空公司的班機延誤率。 – 已修學分之統計資料可以協助未來修課 計劃。

數字如何說話,說什麼話 統計是數字說話所用的語言。 資料處理就是以整合、展示和問問題 的方式幫助數字說話。 正確的資料,經過資料處理,產生的 資料產品 ( 資訊 ) ,就可以用來做統計 推論。

數字說話過程圖示 數字數字 資料處理資料處理 數字產品數字產品 統計推論統計推論 基礎原理 進階推論 正確 資料 來源 一般推論 第 4,5,6 章 第 7,8 章 第 9,10,11 章

資料記錄 資料多以試算表 (spreadsheet) 方式記錄。 – 包括個體 (Individual) :一筆資料所描述的對 象 (object) 。電子試算表中鍵入在一列。 – 及變數 ( Variable ) :描述任何一個個體的特 質,一個變數對不同的個體取用不同的數值 (value) 。電子試算表中鍵入在一行。 – 例:美國各州教育相關資料。

變數 變數分為類別 (categorical) 變數及數量 (quantitative) 變數。 – 類別變數:將每個個體指定為數個組群或類 別之一;例:性別或大學主修科目。 – 數量變數:將每個個體指定為一個有意義的 數值,以便做數學運算;例:身高或平均成 績點數 (GPA) 。 變數的取值,和該值發生的頻率,稱為 該變數的分配 (distribution) 。

Section 1.1 Displaying Distributions with Graphs 圖示分配

圖示分配 類別變數的圖示 – 長條圖 (bar Chart) – 圓形圖 (pie Chart) 數量變數的圖示 – 直方圖 (histogram) – 莖葉圖 (stemplot 或 stem-and-leaf plot)

製作方法 先統計類別變數中各類別發生的次數, 再計算百分比 填寫表格包括次數及百分比 長條圖 (Bar Chart) – 橫軸為類別,縱軸為發生次數 圓形圖 (Pie Chart) – 在圓上呈現各類別之百分比

表格

長條圖

圓形圖

Exercise Table 1.6 資料 – 製作變數 Region 的長條圖與圓形圖 – 提示 製作表格

直方圖的製作 適用於數量變數 – 例:各州 65 歲以上人口百分比資料 製作方法 – 將資料適當分組, ( 多為等組距 ) – 計算變數值落在各組的次數 – 製作表格 – 橫軸為各組,縱軸為發生次數畫圖

各州 65 歲以上人口百分比資料

各州 65 歲以上人口百分比表格

65 歲以上人口百分比直方圖

直方圖在說話 直方圖描述資料的整體分佈型態 – 包括形狀 (shape) 、中心 (center) 及離散度 (spread) 等 直方圖也呈現資料的偏差 (deviation) – 離群值 (outliers) :與眾不同之個別值

資料的整體分佈 對稱資料 (Symmetric Data) – 圖例 1.3 偏斜資料 (Skewed Data) – 右偏斜資料 (skewed to the right) :資料中線的右 邊延伸較長。 – 左偏斜資料 (skewed to the left) :資料中線的左 邊延伸較長。

對稱資料 (Figure 1.3)

右偏斜資料 (Figure 1.4)

莖葉圖 適用於資料較少之數量變數 – 例:各州 65 歲以上人口百分比資料 – 例:期中考成績 製作方法 – 將各資料分成莖 ( 最右一個數字以外的所有 數 ) 及葉 ( 最右一個數字 ) 。 – 將莖由小到大排成一欄並在其右畫一垂直線 – 將葉由小到大在對應莖的右排成一列

65 歲以上 人口百分 比莖葉圖

時間數列圖 (Time Plot) 蒐集資料的順序為 X 軸,觀察值為 Y 軸畫 出的散佈圖 – 例 1.6 :每十萬人癌症死亡數

每十萬人癌症死亡數時間數列圖