1 Query Optimization for Inter Document Relationships in XML Structured Document Radha Senthilkumar, A. Kannan, D.Vimala, M. Bhuvaneswari Department of.

Slides:



Advertisements
Similar presentations
Simple Linear Work Suffix Array Construction J. Kärkkäinen, P. Sanders Proc. 30th International Conference on Automata, Languages and Programming 2003.
Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
: A-Sequence 星級 : ★★☆☆☆ 題組: Online-judge.uva.es PROBLEM SET Volume CIX 題號: Problem D : A-Sequence 解題者:薛祖淵 解題日期: 2006 年 2 月 21 日 題意:一開始先輸入一個.
:Word Morphing ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10508:word morphing 解題者:楊家豪 解題日期: 2006 年 5 月 21 日 題意: 第一行給你兩個正整數, 第一個代表下面會出現幾個字串,
Advanced Chemical Engineering Thermodynamics
“Rule” By OX. By Check CREATE TABLE 員工薪資 ( 編號 int IDENTITY PRIMARY KEY, 薪資 smallmoney, CHECK ( 薪資 > 0 AND 薪資
1 第一章 Word 的基本觀念 內容概要: Word 的特色 啟動與離開 Word 的方法 滑鼠游標與外型的介紹 基本操作 Word 視窗法則 使用 Word 遭遇問題時, 應如何利用軟體特 性而獲得輔助解說.
CH-23 失效原因樹分析 FTA Failure Tree Analysis. 前言 為了提昇系統可靠度,產品在開發階段,利 用類似品管方法之魚骨圖分析手法,找出潛在 缺點,並加以改進,此種分析方法稱之為失效 原因樹分析法 (Failure Tree Analysis)– FTA 。 FTA 是一種系統化的方法,可以有效的找出.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
: Factstone Benchmark ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: : Factstone Benchmark 解題者:鐘緯駿 解題日期: 2006 年 06 月 06 日 題意: 假設 1960.
1 Secure Context-sensitive Authorization 2005 Author : Kazuhiro Minami, David Kotz Presented by Shih Yu Chen.
: ShellSort ★★☆☆☆ 題組: Problem D 題號: 10152: ShellSort 解題者:林一帆 解題日期: 2006 年 4 月 10 日 題意:烏龜王國的烏龜總是一隻一隻疊在一起。唯一改變烏龜位置 的方法為:一隻烏龜爬出他原來的位置,然後往上爬到最上方。給 你一堆烏龜原來排列的順序,以及我們想要的烏龜的排列順序,你.
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
1.1 電腦的特性 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
1 Lab 6 D2E Design Platform Introduction FPGA Design Platform.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Chapter One 心理測驗的性質與用途.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
Introduction to Java Programming Lecture 10 Array I Declaring, Creating, and Initializing Arrays.
: Happy Number ★ ? 題組: Problem Set Archive with Online Judge 題號: 10591: Happy Number 解題者:陳瀅文 解題日期: 2006 年 6 月 6 日 題意:判斷一個正整數 N 是否為 Happy Number.
: Fast and Easy Data Compressor ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10043: Fast and Easy Data Compressor 解題者:葉貫中 解題日期: 2007 年 3.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
第三章 自動再裝載運用篇 使用時機:裝載計劃完成時,尚有剩餘空 間的情形,維持已固定計劃而繼續做裝載 最佳化。以支持次日裝載計劃而提前調整 作業模式。 裝載物品設定和裝載容器設定如前兩章介 紹,於此不再重複此動作,直接從裝載計 劃設定開始,直接從系統內定的物品和容 器選取所需.
資料結構實習-一 參數傳遞.
6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專 屬的元件庫 (Library) ;另一種則是內建元 件庫 (Common Libraries), 兩者皆可透過 『視窗』功能表來開啟, 以下即為您說明。
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2008.
: Problem G e-Coins ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10306: Problem G e-Coins 解題者:陳瀅文 解題日期: 2006 年 5 月 2 日 題意:給定一個正整數 S (0
: 05-2 Rendezvous ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11015: 05-2 Rendezvous 解題者:池明洋 解題日期: 2006 年 4 月 16 日 題意: 給 node N 個 , edge.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/25 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH 2.4~CH 2.6 &
Analyzing Case Study Evidence
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
資料結構實習-二.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
第十二章 供應鏈管理之決策支援系統 Decision-Support Systems for Supply Chain Management
Chapter 3 Entropy : An Additional Balance Equation
: Flip Sort ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10327: Flip Sort 解題者:歐子揚 解題日期: 2010 年 2 月 26 日 題意:在這個問題中使用一種排序方式 (Flip) ,意思就是 只能交換相鄰的.
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
Chapter 10 m-way 搜尋樹與B-Tree
E XPLOITING R ANDOM F OREST TO P REDICT S ULFATED T YROSINE 宋孟純 洪敏華 洪瑜珊.
網路介紹及其運用 講師陳炯勳. 5-2 IP 協定 ( 一 ) IP 協定運作 (1) – 網路成員:主機 (Host) 與路由器 (Router) – 路由表 – 電報傳輸運作.
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2009.
ArcINFO &Geodatabase 由 ESRI 產生 1970 ArcINFO 一開始被設計在迷你電 腦上, 後來逐漸發展, 在 UNIX 系統上也能 執行, 直到今天, 已經可以在不同的平台上 運作.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
幼兒行為觀察與記錄 第十章 軼事記錄法.
Cambridge Scientific Abstracts 系列資料庫 圖 書 館
:Commandos ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11463: Commandos 解題者:李重儀 解題日期: 2008 年 8 月 11 日 題意: 題目會給你一個敵營區內總共的建築物數,以及建築物 之間可以互通的路有哪些,並給你起點的建築物和終點.
函式 Function 東海大學物理系‧資訊教育 施奇廷. 函式簡介 當程式越來越大、越複雜時,程式的維護、 除錯會變得更困難,此時必須引入函式來 簡化程式或將程式分段,將程式重複的部 分改寫為函式,將程式「模組化」 這種作法有下列優點:節省程式發展的時 間、邏輯容易瞭解、程式容易除錯、可分 工合作完成程式.
第五章 1 效度 測試效度 (test validity) 可回答下列的問題:「此測試是否可以 衡量出它所想要衡量的特質?」以員工的徵選來說,效度指的 是測試的結果是否與工作相關。 二種主要的測試效度,此即準則效度 (criterion validity) 與內容 效度 (content validity)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
Microsoft Excel.
Introduction to Java Programming Lecture 16 Super and Sub Classes.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
第12章 團體溝通情境中的領導者.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
Ch 11 建立研究工具的效度與信度.
幼兒行為觀察與記錄 第八章 事件取樣法.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

1 Query Optimization for Inter Document Relationships in XML Structured Document Radha Senthilkumar, A. Kannan, D.Vimala, M. Bhuvaneswari Department of Information Technology, MIT, Anna University, Chennai, India International Conference on Computational Intelligence and Multimedia pplications 2007 報告者:劉芸如

2 Outline Introduction The Proposed Optimization Techniques –Tree Construction –XPath to PAT –Optimization of Input PAT Expression Normalization Semantic Transformation Simplification Optimized PAT to XPath Mapping XML to Relational SIMULATION AND RESULTS Conclusion and Future work

3 Introduction 相對於其他資料模型,最佳化的 XML 資料 庫是極具挑戰性,由於有高度的複雜性。 在早期工作,查詢最佳化是為遏制在一個 XML 結構化文件的關係。 然而,這樣一個最佳化的問題引起多個相 互關聯的表時使用。 為了做到查詢優化有必要確定屬性的每個 表,以及在不同表的關係屬性。

4 The Proposed Optimization Techniques Figure 1. Overall Flow of Optimization

5 The optimization starts with the conversion of XPath to a PAT expression. The conversion is followed by three level of optimization, namely Normalization, Semantic Transformation and Simplification. The Semantic Transformation phase uses the three structural properties, Exclusivity, Obligation, Entrance Location. The output of the three levels is the optimized PAT expression. This PAT expression is converted into an SQL statement for executing on a RDBMS(relational database management system).

6 Tree Construction Each node in the tree represents the elements in the table and the edges give the structural relationship that exists among the nodes. Figure.2. Node Representation for an element in XML document

7 XPath to PAT XPath expression specifies a pattern that selects a set of XML nodes. XPath query is represented in PAT so that algebraic transformation can be performed. XPath queries are transformed into an equivalent PAT algebraic expression to perform optimization by applying certain rules.

8 Optimization of Input PAT Expression(1) Normalization –During this phase, the algebraic properties of the PAT algebra are exploited to isolate different types of operators at different levels, eliminate the ∩ operator from the query expression and push down the more selective operations. –Pushing the $ operators to the bottom level can simplify the identification of potential indices. –The normalization phase also performs obvious simplifications, like transforming “E U E” to a single E, to make the subsequent semantic optimization more efficient.

9 Optimization of Input PAT Expression(2) Semantic Transformation –The primary goal of this phase is to identify the opportunities of applying potential structure indices which is a short cut path between any two nodes. –This semantic transformation phase focuses on exploiting the opportunities of using an available structure index or enabling such an opportunity to applying a structure index.

10 Optimization of Input PAT Expression(3) Simplification –Hence, a further run of the simplification rules of Phase 1 is desired, and additional simplification rules are needed to handle the combination of the index operator with the ∩ operator. –The third phase is intended to carry out a bottom-up cleaning on the output of semantic optimization.

11 Optimization of Input PAT Expression(4) Optimized PAT to XPath –The optimized PAT expression is converted to its equivalent XPath expression for mapping to SQL. –As the given input is XPath query, the PAT expression after optimization is converted back to XPath so that the query can be directly executed to obtain the results using stylesheets.

12 Optimization of Input PAT Expression(5) Mapping XML to Relational –Relational database is used to show the effect of query optimization. –The original XPath query and the optimized XPath query are mapped to their respective SQL queries for testing the performance in a relational database Oracle [10]. –To clearly show the time differences in the execution times of the non-optimized and optimized XPath queries they are mapped to equivalent SQL queries based on the algorithm.

13 SIMULATION AND RESULTS The first database [Database 1] uses two XML documents having less number of levels. –Thus the complexity involved in the optimization is less and not much of difference is noticed in the execution time for the optimized and non-optimized queries. The second database [Database 2] is complex than the first in that it contains two XML documents, which have large number of levels. –As the levels are larger, XPath queries written for these documents involve larger path length. –Time taken for execution of both the optimized and non- optimized queries has a clear difference, which is depicted in Fig.4. The third database [Database 3] is used for the purpose of showing the applicability of this approach for more than two documents.

14 Figure 3 Performance result for Database 2

15 Figure 4 scaling effect of optimized queries with Database 2

16 Figure.5 Effect of selectivity on optimized queries with Database 3

17 Conclusion and Future work 這樣技術證明有效實施和測試執行時間、 可擴展性和選擇性。 這種方法運行在邏輯層,因此可獨立於任 何儲存模型。 最佳化開發基於這種方法可以很容易地適 用於廣泛的 XML 數據 / 信息伺服器來實現更 快的查詢優化。