Presentation is loading. Please wait.

Presentation is loading. Please wait.

基因微陣列分類系統 組 員 : 陳昭瑋 李進旗 何榮倫 陳勇達 指導教授 : 張玉盈 教授. Outline  目的  系統簡介  演算法說明  DEMO 2.

Similar presentations


Presentation on theme: "基因微陣列分類系統 組 員 : 陳昭瑋 李進旗 何榮倫 陳勇達 指導教授 : 張玉盈 教授. Outline  目的  系統簡介  演算法說明  DEMO 2."— Presentation transcript:

1 基因微陣列分類系統 組 員 : 陳昭瑋 李進旗 何榮倫 陳勇達 指導教授 : 張玉盈 教授

2 Outline  目的  系統簡介  演算法說明  DEMO 2

3 目的  生物資訊是最近非常熱門的一個研究方向  生物資訊其最終目標是要完全了解人類所有 基因的秘密。  生物資訊中,微陣列 (microarray) 是用來了解 基因表現的重要工具。  藉由針對微陣列設計分類系統,可以幫助 醫學界更精準地判斷基因相關的疾病。 3

4 系統簡介  利用微陣列設計分類系統  微陣列 (Microarray) 二維陣列 一維 : 基因 一維 : 條件  陣列所記錄的值,即某個基因在某個 condition 下所表現的程度。 4

5 Classification  Classification 是從兩組已知分類結果的資料中, 找出能夠用來區分分類的 classifier ,之後便利 用此 classifier 來預測新資料的所屬分類。  本專題使用的 classifier 為 eJEP 。 A 組 B 組 classifier TEST TEST 的分類結果 5

6 演算法  Preprocessing( 將輸入資料轉換成有用資料 )  P-tree(Pattern tree) Construction and merge  Using the P-tree to Mine eJEPs (Essential Jumping Emerging Patterns)  Compute similarity by score function  將輸入資料分類到應屬的 Class 6

7 Preprocessing  Normal Data  Cancer Data NameTest1Test2Test3Label Gene14.3070N Gene26.91.392N Gene311.20.465N NameTest1Test2Test3Label Gene15.5-1.4153C Gene22.70.595C Gene33.8-0.7102C 7

8 NameTest1Test2Test3Label Gene14.3070N Gene26.91.392N Gene311.20.465N NameTest1Test2Test3Label Gene15.5-1.4153C Gene22.70.595C Gene33.8-0.7102C Normal Data Cancer Data NameCut Point >=< Test15a=1a=0 Test20b=1b=0 Test3100c=1c=0 Nameabc Gene1101 Gene2010 Gene3001 Nameabc Gene1010 Gene2110 Gene3110 Normal Class(Class D1) Cancer Class(Class D2) 8

9 Nameabc Gene1101 Gene2010 Gene3001 Nameabc Gene1010 Gene2110 Gene3110 Class D1 Class D2 b a b D1 D2 a c b c Preprocessing 9

10 P-tree Construction and merge  A pattern tree (P-tree) is an ordered multiway tree structure.  The ordered is item ’ s supports-ration- descending order.  Nodes will be merged, which ensures the complete set of eJEPs are generated. 10

11 data class 1={{a,c,d,e},{a},{b,e},{b,c,d,e}} data class 2={{a,b},{c,e},{a,b,c,d},{d,e}} the supports-ratio-descending order: e > a > b > c >d Data class 1={{e,a,c,d},{a},{e,b},{e,b,c,d}} Data class 2={{a,b},{e,c},{a,b,c,d},{d,e}} Construct the P-tree P-tree Construction and merge 11

12 P-tree Construction and merge 12

13 P-tree Construction and merge 13

14 P-tree Construction and merge 14

15 P-tree Construction and merge 15

16 P-tree Construction and merge 16

17 P-tree Construction and merge 17

18 eJEP  eJEP 定義 : a b 可以互換  根據定義我們就可以找出 eJEP  這裡定義 μ = 1 ba ab 18

19 e32a22b22c22d22 b02c11d11c11d11 d21 c01d01 d01 d11d11 a10b20c21d21 c10d10c10d10d20 d10 d10 eJEP: {e,a} (1:0) {e,b} (2:0) {e,c,d} (2:0) {a,b} (0:2) 19

20 Similarity  Score Function  where eJEP(Ci) are all the eJEPs in Ci  The eJEPs-Classifier determines the class label as the class where s obtains the largest Ci  SUPP(X) 代表 X 在 Class 中出現次數 20

21 Testing Data s = {e, a, b, c} score(D1) = supp( {e, a} ) +supp( {e, b} ) =1+2=3 score(D2) = supp( {a,b} )=2 Thus, the class label of Data s is D1 a b e c a b c d e d e a c d a b e b c d e Class1(D1)Class2(D2) e a e b e c d eJEPs in Class1(D1) a b eJEPs in Class2(D2) 21

22 DEMO 前的說明 Demo 用的 microarray 資料是急性白血病 的分類,有: (1) 急性髓細胞白血病 (AML) (2) 急性淋巴細胞白血病 (ALL)  我們要由系統來偵測出所輸入資料的急性 白血病分類, AML 或者 ALL 。  Microarray 資料來源 : http://www.broad.mit.edu/ 22

23 23 視窗介面

24

25

26

27

28 DEMO 時間


Download ppt "基因微陣列分類系統 組 員 : 陳昭瑋 李進旗 何榮倫 陳勇達 指導教授 : 張玉盈 教授. Outline  目的  系統簡介  演算法說明  DEMO 2."

Similar presentations


Ads by Google