2015/10/241 Query by Tapping 敲擊選歌 J.-S. Roger Jang ( 張智星 ) Multimedia Information Retrieval Lab CS Dept., Tsing Hua Univ., Taiwan

Slides:



Advertisements
Similar presentations
Retrieval Methods for QBSH (Query By Singing/Humming) J.-S. Roger Jang ( 張智星 ) Multimedia Information Retrieval.
Advertisements

第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
走過生命中的轉彎處 從心出發. 這次的宣傳海報 首先由馬副校長來致詞 充滿元氣的謝坤山先生, 開朗的笑聲,讓全場都 感受到他的活力。
Chapter 2 Random Vectors 與他們之間的性質 (Random vectors and their properties)
期末專題 - 吊人頭遊戲 第 35 組 組員 : 電機系 49841XXXX XXX 電機系 49841OOOO OOO.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
社研法助教課, 2007/04/11 如何閱讀 SPSS 圖表 (迴歸分析篇) By 黃昱珽. 小考題目 大華用 SPSS 得到以下的資料: (圖表見下面) 說明 : BABYMORT = 嬰兒死亡率, GDP_CAP = 一國國民生產毛額, LIT_FEMA = 女性識字率。 資料來源 : 聯合國,
: Boxes ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11003: Boxes 解題者:蔡欣燁 解題日期: 2007 年 3 月 19 日.
Chapter 4 教學軟體融入教學  教學軟體有哪幾大類 ? 可以如何在教學上被 應用 ? 各有什麼優缺點 及使用要領 ?  教學軟體是是一種輔工具 能不能發揮功用取 決於教師如何運用 ( 淑珠 ) 以你認教科目 你覺 得哪些教學軟體可以配合你的教學需要 ? 你 要如何運用 ?  你對反覆練習軟體和遊戲軟體的看法.
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
大陸軍機偵測 學號 : 姓名 : 莊 啟 宏. 大綱 簡介 飛機偵測方法概述 結論 簡介 近年來各國科技發達,衛星利用日漸 廣泛。 利用間諜衛星拍攝的照片判斷他國武 力優劣。 探討如何用衛星影像做飛機偵測。
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
請問 : 科技融入教學再你的心目中只是一 個不同於其他教學法的選擇 (optional choice) ? 或是一個必要的需要 (demanding needs)?
Chapter 9 Hypothesis tests with the t statistic. 當母體  為未知時 ( 我們通常不知 ) ,用樣本 s 來取代 因為用 s 來估計  ,所呈現出來的分佈已不 是 z distribution ,而是 t distribution.
1 單元三 查詢結果的引用分析 Web of Science 利用指引 查看出版及被引用情況 在查詢結果的清單中,可以瀏覽近 20 年來查詢主題出版和被引用的情況。
圖片索引專題 指導教授:陳淑媛 教授 黃伯偉 林育瑄. 動機 & 理念  目前圖像檢索系統中使用的大多都為利用文字 標籤圖像或是圖像輪廓特徵來進行搜尋,然而 輪廓特徵的缺點卻是所有組成圖像的線條都要 逐一處理相當耗時。  所以本研究的目標在於,提出一個以像素點為 特徵的有效率與正確率的圖像檢索演算法實作。
Network Connections ★★★☆☆ 題組: Contest Archive with Online Judge 題號: Network Connections 解題者:蔡宗翰 解題日期: 2008 年 10 月 20 日 題意:給你電腦之間互相連線的狀況後,題.
資源整合查詢系統. (2) 找尋資料時面臨的問題 1. 如何取得檢索結果的全文或相關資料 ? Ex: GoogleScholar, ISI SCI? 2. 如何看到參考文獻 (Citation, Reference) 的全文 ? 3. 該從那個資料庫開始查 ? 4. 如何分類儲存查詢結果 ? 5.
Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface : Eigenvector 和 eigenvalue 的應用. Fractal : Affine transform( rotation, translation,
: War on Weather ★★☆☆☆ 題組: Contest Volumes Archive with Online Judge 題號: 10915: War on Weather 解題者:陳明凱 題意:題目總共會給你 k 個點座標代表殺手衛星的位置, 距離地球表面最少 50 公里以上,並且會給你.
: Point of View in Flatland ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 11037: Point of View in Flatland 解題者:黃士庭 解題日期: 2007 年 5 月 15 日 題意:在座標平面上給三個圓,找一個點使從這.
Fourier Series. Jean Baptiste Joseph Fourier (French)(1763~1830)
: Little Red Riding Hood ★★★☆☆ 題組: Contest Volumes Archive with Online Judge 題號: 11067: Little Red Riding Hood 解題者:陳明凱 解題日期: 2008 年 3 月 14 日 題意:
: Playing War ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11061: Playing War 解題者:陳盈村 解題日期: 2008 年 3 月 14 日 題意:在此遊戲中,有一類玩家一旦開始攻擊, 就會不停攻擊同一對手,直到全滅對方或無法再.
: Problem A : MiniMice ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11411: Problem A : MiniMice 解題者:李重儀 解題日期: 2008 年 9 月 3 日 題意:簡單的說,題目中每一隻老鼠有一個編號.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
Final-project 資科碩二 蔡瑞陽 Furukawa, Y. and Ponce, J. “ Accurate, Dense, and Robust Multi-View Stereopsis ” IEEE Conference on Computer Vision and.
Basic Features of Audio Signals ( 音訊的基本特徵 ) Jyh-Shing Roger Jang ( 張智星 ) MIR Lab, CS Dept, Tsing Hua Univ. Hsinchu, Taiwan.
: Lucky Number ★★★★☆ 題組: Proble Set Archive with Online Judge 題號: 10909: Lucky Number 解題者:李育賢 解題日期: 2008 年 4 月 25 日 題意:給一個奇數數列 1,3,5,7,9,11,13,15…
Image Interpolation Use SSE 指導教授 : 楊士萱 學 生 : 楊宗峰 日 期 :
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Density and control Reproduction curve 劉耀仁. Density :濃度、密度 ► 1 號區是 High-Density 區、 2 號是 Middle-density 區、 3 號區是 Low- Density 區。 ► 計算反射率( R )或透射率( T )
-Antidifferentiation- Chapter 6 朝陽科技大學 資訊管理系 李麗華 教授.
生涯規劃與發展 羅寶鳳. 我的志願 很小的時候,爸爸曾經問我,你長大 後要做什麼? 我一手拿著玩具,一手拿著糖果,我 長大後要做總統。 六年級的時候,老師也曾問我,你長 大後要做什麼? 愛迪生的故事,最讓我佩服,我長大 要做科學家。
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
DECISION TREE LEARNING. Outlook Sunny Overcast Rain Humidity Yes Wind High Normal Strong Weak No Yes No Yes.
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
Chapter 10 m-way 搜尋樹與B-Tree
幼兒行為觀察與記錄 第五章 觀察記錄法的簡介.
Extreme Discrete Summation ★★★★☆ 題組: Contest Archive with Online Judge 題號: Extreme Discrete Summation 解題者:蔡宗翰 解題日期: 2008 年 10 月 13 日.
: Dream ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11414: Dream 解題者:李育賢 解題日期: 2008 年 9 月 2 日 題意: 題目會給你一個數字代表測資的數量 ( 最多 100 組 ) , 每組測資第一個數字是此圖形點的個數.
INFORMATION RETRIEVAL AND EXTRACTION 作業: Program 1 第十四組 組員:林永峰、洪承雄、謝宗憲.
連續隨機變數 連續變數:時間、分數、重量、……
葉子─樹的名片 你能不能看到樹上的葉子,就知道是什麼植物?.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
Agile methods: a comparative analysis Diane Strode-University of Wellington the 19 th Annual Conference of the National Advisory Committee on Computing.
National Taiwan University
2015/10/221 Progressive Filtering and Its Application for Query-by-Singing/Humming J.-S. Roger Jang ( 張智星 ) Multimedia Information Retrieval Lab CS Dept.,
Demos for QBSH J.-S. Roger Jang ( 張智星 ) CSIE Dept, National Taiwan University.
Content-based Music Retrieval from Acoustic Input (CBMR)
2016/6/41 Recent Improvement Over QBSH and AFP J.-S. Roger Jang (張智星) Multimedia Information Retrieval (MIR) Lab CSIE Dept, National Taiwan Univ.
QBSH Corpus The QBSH corpus provided by Roger Jang [1] consists of recordings of children’s songs from students taking the course “Audio Signal Processing.
Some Research Activities in MIR Lab J.-S. Roger Jang ( 張智星 ) Multimedia Information Retrieval Lab CS.
DTW for Speech Recognition J.-S. Roger Jang ( 張智星 ) MIR Lab ( 多媒體資訊檢索實驗室 ) CS, Tsing Hua Univ. ( 清華大學.
! !美洲華語 李雅莉老師製作 TextVocabularyusageStoryChallenge $100 $200 $300 $400 $500 $600 $100 $200 $300 $400 $500 $600 $100 $200 $300 $400 $500 $600 $100 $200.
Beat Tracking (節拍追蹤) 張智星 (Roger Jang)
Distance/Similarity Functions for Pattern Recognition J.-S. Roger Jang ( 張智星 ) CS Dept., Tsing Hua Univ., Taiwan
Introduction to Music Information Retrieval (MIR)
Introduction to ISMIR/MIREX
Onset Detection, Tempo Estimation, and Beat Tracking
Query by Singing/Humming via Dynamic Programming
Singing Voice Separation via Active Noise Cancellation 使用主動式雜訊消除於歌聲分離
Introduction to Music Information Retrieval (MIR)
論文 代寫 -
Introduction to Music Information Retrieval (MIR)
Query by Singing/Humming via Dynamic Programming
Presentation transcript:

2015/10/241 Query by Tapping 敲擊選歌 J.-S. Roger Jang ( 張智星 ) Multimedia Information Retrieval Lab CS Dept., Tsing Hua Univ., Taiwan

Query by Tapping zGoal: yMusic search based on uses’ tapping (at notes’ onsets) over the microphone/keyboard zCharacteristics yOnly note duration is used for comparison, note pitch is discarded. yA hard task for human to recognize (which is different from query by singing/humming) xTry this…

Query by Tapping zGoal: yMusic search based on uses’ tapping (at notes’ onsets) over the microphone/keyboard zCharacteristics yOnly note duration is used for comparison, note pitch is discarded. yA hard task for human to recognize (which is different from query by singing/humming) xTry this…

Query by Tapping zChallenges: yUsers is unlikely to use the same tempo as the intended song yUsers tend to lose notes instead of gaining ones yWe have about 13,000 songs in the database zMajor approach: yA distance measure based on dynamic programming

Flowchart of Query by Tapping Ryhthm Extraction Microphone Input Off-line processing Note duration extraction About MIDI songs On-line processing DP-based comparison Normalization Query results

Feature Extraction via Microphone yMicrophone input: yAfter frame blocking, energy computation, and thresholding:

Performance Evaluation of Onset Detection zsimSequence.m precision=3/6=0.5 recall=3/5=0.6 f-measure=2pr/(p+r)=0.5455

Similarity Comparison with Songs in Database zA fast method based on IOI ratios yCompute the IOI ratios for both query and db IOI vectors yCompute the Euclidean distance these two ratio vectors

Music Note Alignment t(3) t: test (input) IOI vector r: reference IOI vector r(1) t(1) t(2) r(2) r(3) Normalization Alignment by DP trtrtr

-10- Normalization zNormalization to have (Multiplication of 1000 to guarantee high resolution in fixed-point computation.) z

-11- Dynamic-programming-based Distance i j t(i-2) r(j-1) t: test IOI vector of length m r: reference IOI vector of length n Recurrent relation: r(j-2) t(i-1)t(1) t(2) r(1) r(2)

-12- Experimental Environment z269 test wave files of tapping clips y9 contributors (7 males, 2 females) yWave length: 15 seconds yWave format: PCM, 11025Hz, 8bits, Mono yStart position: Beginning of a song zEnvironment yPentium III 800, 256MB RAM zDatabase y11,744 MIDI files

-13- Test Results Using Clips of 15 Seconds Average response time: 3.42 seconds (29.98 notes) zRecognition rates: yTop-1 (top %): 15% yTop-10 (top 0.085%): 51% yTop-100 (top 0.85%): 80%

-14- Error Analysis zErrors analysis of low-ranked clips ySome users cannot tap consistently through 15 seconds yFeature extraction is not robust enough to handle noisy input. ySome MIDI files are not faithful rendition of the original tunes. yUsers cannot keep up with short consecutive notes.

-15- Recog. Rates w.r.t. Tapping Duration zTop-100 and 1000 curves level off after 10 seconds. zTop-100 curve does not go up monotonically. Top-100 Top-10 Top-1000

-16- Demo zNo. of MIDI files: 12982

-17- Partial List of Songs  All I have to do is dream  You are my sunshine  Beautiful Sunday  Do Re Mi  Feelings  A time for us  Love is blue  Let it be me  My way  Love story  More than I can say  Only you  Rain and tears  Rhythm of the rain  Rose Rose I love you  The sound of silence  Unchained melody  We are the world  Yesterday  I just call to say I love you  Close to you  Mr. Lonely  Ben  Hey Jude  Donna Donna  Sealed with a kiss

-18- Potential Applications zInteractive toys zBeat-tracking training and games zSong retrieval in noisy karaoke bars

-19- Conclusions zOur MIR system is the first one with query- by-tapping capability. zRhythm-based search can be used in conjunction with pitch-contour-based search to achieve a better recognition rate.

-20- Future Work zSearch scope expansion yHow to retrieve MP3 or CD music directly? zScale-up by hierarchical filtering method yHow to deal with database with 100,000 songs? yWhat if the user tap from anywhere in the middle of a song?

-21- 敲擊選歌  目標:  以敲擊的方式,敲出一首歌的節拍,並從歌曲 資料庫中找出這首歌  技術困難點:  敲快、敲慢、多敲、少敲、從頭敲、從中間敲  如何大量歌曲的快速比對  方法: Dynamic programming

-22- 敲擊選歌  展示  /users/jang/demo/tapping/go_tap.m  All I have to do is dream 、 You are my sunshine 、 Puff  平安夜、原來你什麼都不想要、用心良苦、青春舞 曲、榕樹下、雙人枕頭、萍聚、夜來香、月亮代表 我的心、花心、小小羊兒要回家  應用面  玩具