999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多樣本字典的單音符實時穩健識別算法

2014-08-10 12:26:56劉興永
太原理工大學學報 2014年2期
關鍵詞:信號音樂

劉興永,李 鏘,關 欣

(天津大學 電子信息工程學院,天津 300072)

基于多樣本字典的單音符實時穩健識別算法

劉興永,李 鏘,關 欣

(天津大學 電子信息工程學院,天津 300072)

在時域線性疊加識別法原理的基礎上,提出多樣本字典、多樣本字典后處理等技術,這些技術克服了單樣本字典中單輸入對應單輸出權重系數α,導致正確識別幀數少,從而引起結果可靠性降低的缺點,提高了音符識別正確率和穩健度。經實驗驗證,本文音符識別算法與單樣本字典識別法相比,識別率提高了3%,穩健度提高近2倍(尤其對于高八度區音符識別穩健度更高),實現了對輸入單音符音頻實時、準確的識別。

單音符;時域識別;多樣本字典;實時;穩健度

音樂轉錄是計算機自動將實際音樂音頻轉換到音樂抽象符號的技術,與人工音樂轉錄相比,可大大提高轉錄效率與質量,是音樂信息檢索領域中重要且具有挑戰性的研究問題之一[1]。本文主要針對單基音音樂進行轉錄(音頻信號來源于實際鋼琴演奏的88個單基音音樂),提取音頻信號中的音符信息,即根據演奏者演奏的實際音樂音頻,確定某特定時間片段內的聲音由哪些單音符組合而成。該技術在樂器輔助練習、計算機自動伴奏、音樂信息檢索等相關領域具有廣泛的應用價值。

早期單基音音樂音頻中音符識別方法通過分析所錄制音頻頻域信息得到音符信息[2-3],klapuri采用迭代估計、消除機制來估算音樂音頻中存在的基頻f0[4]。但由于跨八度音符的基音頻率、諧波頻率重合與時頻分辨率等問題,音符頻域識別較為困難。Raphael采用模式識別的方法,在提取和弦序列頻域特征的基礎上,用隱形馬爾科夫模型來描述和弦序列,進而實現音符的識別[5],RBF神經網絡模型也可用于鋼琴音符的識別[6]。但是模式識別只適用于非實時識別,且計算量大。日本學者Yoshiaki Tadokoro提出采用梳狀濾波器的方法,即建立多個并行濾波器,僅濾掉或保留特定頻率的信號(88單音符所在頻率),從而判斷輸入信號的頻率即音符名,達到了較好的識別效果[7]。法國學者Juan Bello提出時域音符識別方法,建立88個獨立音符的樣本字典,將輸入數據與樣本字典中各音符樣本數據分別做互相關,得出輸入信號中各單基音音符所占權重系數[8]。Juan Bello時域識別法使用單樣本字典,正確識別幀數較少,識別結果不穩健,難以應用到實際音符識別系統。

筆者在Juan Bello線性疊加時域識別法的基礎上,采用多樣本字典、多樣本字典后處理與能量檢測技術,將正確識別率提高到98%,穩健度提高了2倍,實現對鋼琴單音符實時、穩健的識別,達到較好的實際應用效果。

1 線性疊加模型

時域線性疊加模型假設任何音樂音頻都是由一個或多個單基音音符線性組合而成的,通過與事先建立的單基音音符樣本字典比較,即可得到音樂音頻中所包含的單音符音名。xi(n)為歸一化后的鋼琴單音符時域信號(i=1,2,…,M,M=88)。定義樣本字典D={xi},i=1,2,…,M,即包括88個單音符波形的數據庫。s(n)為測試輸入信號波形(n=1,2…,N,這里輸入信號時長為100 ms,則N=0.1×fs,fs為音頻采樣率)。本文假設樣本庫中單音符xi(n)與其響度無關,即波形與按鍵力度、速度無關。測試輸入信號s(n)是由一個或多個單音同時發聲組成的,這些單音符是線性無關的,即實驗中忽略了單音發聲時的耦合現象,簡化為下列線性模型:

ε.

(1)

(2)

在上述定義下,音符識別任務轉換為計算輸入信號中各音符的權重系數αi,只需通過簡單的矩陣計算,即可得到權重系數,即s(n)中包含的單音符的音名。樣本字典D是M×N矩陣,包括M個單音符歸一化后的波形。由于D中各行是線性無關的[8],因此M×M矩陣DDT是非奇異矩陣,即可逆。s是輸入信號s(n)的矩陣形式,因此權重系數可用下式求取:

α=(DDT)-1Ds-ε′.

(3)

其中ε′=(DDT)-1Dε.

測試輸入信號s(n)與樣本字典D中xi(n)的相位一般不同步,同時和弦s(n)中不同單音符發聲的時刻可能存在差異,因此上述算法得到的結果并不精確,必須調整二者相位,以便得到更為精確的權重系數矩陣。相位調整具體過程:輸入信號s(n)與樣本字典D中的每個xi(n)做互相關運算,求出對應的相位延時ti:

ti=arg max{xcorr(xi,s)}.

(4)

.

(5)

在實際應用中,預先無法得到線性模型和輸入實際信號的差值ε′,因此還需依據特定規則(2.2規則I)對計算所得α系數矩陣進行篩選,最終取出符合規則的α系數矩陣,其最大值對應的midi即可轉換音符名。

2 多樣本字典

2.1 構建多樣本字典

(6)

(7)

2.2 多樣本字典后續處理

多樣本字典后續處理主要目的在于選出最優的α矩陣。幀長為100 ms的測試輸入信號s(n)分別與6個樣本字典D代入(8)式計算,得到6個權重系數α矩陣。在6個α矩陣中,實驗只選取滿足一定規則的α(k)(k=1,2,…,6),從有效α(k)結果中得到輸入信號s所包含的音符名。不失一般性,這里假設αi(k)(i=1,2,…,88)權重系數矩陣中最大值為αi max(k),則α(k)結果有效的準則I為:

1)α(k)中大于0.35×αi max(k)的個數不超過2個,且其midi號相差為12或24(一個或兩個八度);

2)α(k)中大于0.25×αi max(k)的個數不超過5個;

3)α(k)中大于0.15×αi max(k)的個數不超過10個。

圖1 多樣本字典權重系數

只有同時滿足上述三個條件,多樣本字典后處理部分才認為α(k)權重系數矩陣是有效的,即α(k)矩陣中取到的最大值的midi號可作為測試輸入信號s的結果輸出。圖1是測試信號為midi 63的音符計算得到的6組α(k)。樣本字典D2,D3,D4,D5,D6所得αi(k)矩陣中最大值都為α63(k),且每個矩陣的剩余元素都符合規則I中的條件1、2、3,因此保留這四組權重系數矩陣,且midi63為識別結果。

多樣本字典后處理部分保證了在多個樣本字典條件下,結果的唯一性和準確性,不僅適用于音符多樣本字典處理而且適用于單樣本字典的處理,是多樣本字典音符識別系統必不可少的環節。

3 實驗測試與結果分析

實驗中,測試數據一個月內每天隨機選取時間所錄制的88單音符音頻數據:data1、data2、…、data30(安靜室內錄制88個單音符,采樣率為44.1 kHz),其中隨機取某一天所錄制數據作為樣本字典D中數據來源。對于測試數據,本文方法的平均識別率為98%。在音符起始階段出現少數幾幀跨八度的識別錯誤,即識別結果與正確音符相差一個八度,能量檢測算法的應用在一定程度上遏制了這種情況的出現。對于單數據庫和多數據庫識別效果差異主要體現在對低八度區音符(midi號21~60)的識別上,因為低八度區音符的持續時間較高八度區(midi號61~108)長近400 ms。表1是Juan Bello單樣本字典與本文多樣本字典兩種方法下,88單音符的平均識別幀數。

表1 測試結果

使用多樣本字典D情況時,測試輸入幀與6個樣本字典中某一樣本字典相匹配概率的較大,即對于完整測試音符,與樣本庫相匹配的概率為各幀相匹配概率P(S/Di)之和。匹配概率增大意味著存在連續多幀的正確識別結果。而單樣本字典情況下,對于一完整測試音符,只有與樣本庫中相位正好相近的少數測試幀才會出現匹配,此情況下,整個音符的匹配概率為max(P(S/Di)),即存在下式:

(8)

本實驗程序在代碼優化后,耗時有望控制在100 ms內,完全能滿足實時音符檢測。實驗結果表明,多樣本字典比單樣本字典音符識別算法的識別率提高了3%,穩健度提高近2倍,即相比于單樣本字典在低八度區僅1~2幀能正確識別,多樣本字典平均連續近5幀測試結果正確,結果更為可靠穩健,且識別率達98%,更具有實用性。

4 結束語

本文主要討論了在音符時域識別基礎上,采用能量檢測和多樣本字典來提高識別率、降低計算時間以及避免單樣本字典對端點檢測的依賴性。在實際應用中,基于此算法的系統在識別率、運算速度與穩健度等方面完全能滿足實時、穩健的識別。但是,本文時域音符識別算法唯一的缺點就是構建樣本字典的數據和測試數據必須來源于同一架鋼琴,這是由鋼琴的物理特性決定的。在此單音符識別基礎上,若要將其拓展為多音符檢測系統,則需要對多數據庫后處理端的規則進行調整,這個調整需要根據經驗值確定。

[1]Sebastian Bock, Markus Schedl.polyphonic piano transcription with recurrent neural networks[J]. IEEE 2012.

[2]M Piszczalski, B A Galler. Automatic music transcription[J]. Computer Music Journal, 1977(4):24-31.

[3]J AMoorer. On the transcription of music sound by computer[J]. Computer Music Journal, 1997,1(4):32-38.

[4]A Klapuri. T Virtanen, J M Holm.Robust multipitch estimation for the analysis and manipulation of polyphonic musical signals[C]∥ In proceedings of the COST-G6 conference on Digital Audio Effects Verona, Italy, 2000.

[5]C Raphael.Automatic transcription of piano music[C]∥In proceedings of the 3rdinternational conference on Music Information Retrieval. Paris, France, 2002.

[6]張雪英,陳潔,孫穎.改進的HMM系統在英語語音合成中的研究[J].太原理工大學學報,2013,44(1),16 -19.

[7]Tadokoro Y, Matsushita F. Signal identification for a wide-range sound(piano) using notch and resonator-type comb filter[C]∥ICSPCS 2008 2ndinternational conference on signal processing and communication system, 2008.

[8]J P Bello, L Daudet, M B Sandler.Automatic piano transcription using frequency and time-domain information[C]∥ IEEE transactions on Audio Speech and Language Processing, 14:2242-2251.

(編輯:賈麗紅)

Real-timeandRobustNoteRecognitionBasedontheMutil-sampleDictionary

LIUXingyong,LIQiang,GUANXin

(CollegeofElectronicsandInformationEngineering,TianjinUniversity,Tianjin300072,China)

Real-time and robust note recognition algorithm is the fundamental of the note music transcription and music track for the practical application. On the basis of the time domain linear superposition principle of recognition method, the article proposed the techniques of mutil-sample dictionary and mutil-sample dictionary post-processing.The techniques overcame the shortcomings that, in the single sample, the single input corresponds to the single output weight coefficient α, leading to the less correctly identified frame, thus resulting in reduced reliability.Therefore,they improved the recognition accuracy rate and soundness. The experiments prove that, compared to the single sample dictionary, under the help of this article’s note recognition algorithms, the recognition rate increased by 3%, and the soundness increased nearly two-fold, achieving the goal of real-time accurate identification of the audio-input single-note.

single-note; time-domain recognition; mutil-sample dictionary; real-time; soundness

2013-08-06

國家自然科學基金資助項目(61101225)

劉興永(1989-),男,天津人,碩士,主要從事音樂信號處理、模式識別研究,(Tel)13302029660

李鏘,教授,碩士生導師,(Tel)13820516837

1007-9432(2014)02-0252-03

TP391

:A

猜你喜歡
信號音樂
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
奇妙的“自然音樂”
完形填空二則
孩子停止長個的信號
音樂從哪里來?
藝術啟蒙(2018年7期)2018-08-23 09:14:16
圣誕音樂路
兒童繪本(2017年24期)2018-01-07 15:51:37
音樂
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
高處信號強
環球時報(2010-02-11)2010-02-11 13:34:15
主站蜘蛛池模板: 国产日韩欧美视频| 91丝袜美腿高跟国产极品老师| 华人在线亚洲欧美精品| 18禁高潮出水呻吟娇喘蜜芽| 久久精品人人做人人爽97| 色综合热无码热国产| 成·人免费午夜无码视频在线观看| 日韩在线成年视频人网站观看| 四虎精品国产永久在线观看| 国产va在线| 中文字幕欧美日韩高清| 久久激情影院| 91麻豆国产视频| 玖玖精品在线| 国产精品污污在线观看网站| 2019年国产精品自拍不卡| 精品五夜婷香蕉国产线看观看| 国产一二视频| 色婷婷综合在线| 国产区免费| 九九香蕉视频| 亚洲精品无码高潮喷水A| 九九热精品免费视频| 日本国产精品| 国产成人啪视频一区二区三区| 91美女视频在线| 欧美一级爱操视频| 久草热视频在线| 一级香蕉视频在线观看| 日日拍夜夜操| 久久综合五月| 亚洲免费毛片| 欧美日本中文| 国产精品不卡永久免费| 91国内外精品自在线播放| 亚洲欧美h| h视频在线观看网站| 久久五月天国产自| 狠狠色噜噜狠狠狠狠色综合久 | 福利在线一区| 久久青草视频| 伊人激情久久综合中文字幕| 久久综合AV免费观看| 国产在线欧美| 乱人伦99久久| 欧美成人h精品网站| 四虎影视国产精品| 欧美精品啪啪一区二区三区| 国产国语一级毛片| 国产视频久久久久| 免费一级毛片不卡在线播放| 国产精品视频观看裸模| 国产迷奸在线看| 亚洲色图欧美在线| 制服丝袜无码每日更新| 国产乱人伦AV在线A| 精品撒尿视频一区二区三区| 97国产精品视频自在拍| 欧美人与牲动交a欧美精品| 国产精品中文免费福利| 国产电话自拍伊人| 精品视频免费在线| 天天色综网| 免费在线a视频| 无码AV日韩一二三区| 国产精品亚洲综合久久小说| 久久五月视频| 国产精品一区在线观看你懂的| 国语少妇高潮| 久久精品免费看一| 亚洲综合狠狠| 国产精品精品视频| 久一在线视频| 国产成人永久免费视频| 亚洲精品动漫| 日本日韩欧美| 久久精品视频一| 午夜视频日本| 久无码久无码av无码| 日韩精品高清自在线| 久久窝窝国产精品午夜看片| 特级毛片8级毛片免费观看|