Presentation is loading. Please wait.

Presentation is loading. Please wait.

機器學習 指導教授:歐昱言教授 961456 闕裕峰 961536 黃茱纓.

Similar presentations


Presentation on theme: "機器學習 指導教授:歐昱言教授 961456 闕裕峰 961536 黃茱纓."— Presentation transcript:

1 機器學習 指導教授:歐昱言教授 闕裕峰 黃茱纓

2 Directory Motivation Target Flow Chart Tissue Specific
Properties Combination Promoter Process Classifier Results Reference Q & A

3 Motivation 越來越多的基因體資料被發現而被定序 有如此大量的資訊卻不知道該基因體的作用或者是在組織的表現為何
能透過機器學習的方式,在初步找出基因體與組織的關連性

4 What is Promoter? 啟動子 (promoter) 是一個基因轉訊開端的訊息提供者

5 Target Promoter在模型內會有高度的跨組織的表現性,很容易指出這些promoter擁有的共同的結構模式

6 Flow Chart Tissue-Specific 屬性結合 Promoter處理 分類器

7 Tissue-Specific STEP 1 STEP 2
先由多個Sample ID計算出,61個組織後,再算出每個基因的Z-Score,當Z-Score高過 於3時,才算tissue specific,也就是分類後有表現,我們把它設成為TRUE,小於三的則設為FALSE。 STEP 2 要有50個以上的tissue specific才是我們要當作分類的組織。

8 Tissue-Specific (圖一 Sample id)

9 Tissue-Specific (圖二 Subset形式)

10 Tissue-Specific (圖三 Z-Score)

11 Properties Combination
將tissue specific的條件化作為一個表格後,開始做屬性的結合 我們在論文中所抓的檔案是可以得到Affy probe ID,屬性則是要從Entrez ID來做連結才能找到基因序列,這時就需要到生物的資料庫來找尋,我們使用的是DAVID以BioGPS來做我們的搜尋依據。

12 Properties Combination
Entrez ID Affy probe ID Gene ID Converton Mouse Promoter ATCG DNA (圖四 屬性結合步驟)

13 Properties Combination
(圖五 DAVID ID Conversion tool) (圖六 BioGPS ID Conversion tool)

14 Promoter Process STEP 1 promoter長1201個DNA
以一條promoter來說,計算在promoter中,A的數量有幾個除以總長度1201設為第一個屬性,T的數量有幾個除以總長度1201設為第二個屬性,以此類推。 一個單位(ex A)的有四個屬性,兩個單位(ex AA)的有十六個屬性,三個單位(ex AAA)的有六十四個屬性,共有八十四個屬性。

15 Promoter Process (圖七 屬性表)

16 Promoter Process STEP 2 最後加上0,1即為先前Z-Score所判斷是否為tissue specific的TRUE、FALSE值,將之存成.CSV檔,之後要放入分類器做分析

17 Promoter Process (圖八 共84個屬性的.csv檔)

18 Classifier 使用的流程: 啟動WEKA → Open file(選擇我們圖八處理完的.csv檔) →Classify點擊
Choose選擇RandomForest → Start

19 Classifier (圖九 裡面參數的用途)

20 Classifier (圖十 WEKA分類結果)

21 Results F (FALSE) T (TRUE) <-- classified as 136 21 | N (Negative)
    |  P (Positive) Accuracy: Precision: Recall:

22 Reference Su,A.I., Wiltshire,T., Batalov,S., Lapp,H., Ching,K.A., Block,D.,Zhang,J., Soden,R., Hayakawa,M., Kreiman,G. et al. (2004) A gene atlas of the mouse and human protein-encoding transcriptomes. Proc. Natl Acad. Sci. USA, 101, 6062–6067. Modeling tissue-specific structural patterns in human and mouse promoters(Alexis Vandenbon1 and Kenta Nakai1,2,3,*)

23 Q & A

24 Thanks for your Attention


Download ppt "機器學習 指導教授:歐昱言教授 961456 闕裕峰 961536 黃茱纓."

Similar presentations


Ads by Google