劉 婷
(首都醫科大學附屬北京婦產醫院 北京 100026)
?
基于EMD和相空間重構的鋼琴和弦識別*
劉婷
(首都醫科大學附屬北京婦產醫院北京100026)
摘要論文建立了特征參量結合分類器的識別流程。在特征參量方面,論文采用相空間重構的方法獲取和弦信號的非線性特征用于分類器的構造和相關的識別實驗。由于不同和弦信號對應不同的最優相空間重構參數,而在識別未知和弦以及分類器構造過程中,需要固定延遲時間和嵌入維的數值,因此,會造成特征信息丟失的問題,影響識別準確率。為了彌補上述不足,論文在信號預處理環節中引入了EMD自適應信號分解的方法,相關實驗表明,該方法可以較為準確地識別出具體的和弦種類。
關鍵詞和弦識別; 相空間重構; EMD
Piano Chord Recognition Based on EMD and Phase Space Reconstruction
LIU Ting
(Beijing Obstetrics and Gynecology Hospital, Capital Medical University, Beijing100026)
AbstractThe process on the basis of characteristic parameters and classifier is built in this thesis. Nonlinear characteristics extracted from the chord are used in constructing classifier and experiments. Although different chords have different phase space reconstruction parameters, the value of delay-time and embedding dimension has to be fixed. And part of the nonlinear characteristics will be lost which lower the recognition accuracy. For making up the disadvantage mentioned above, EMD adaptive signal decomposition methods are used in preprocessing. The result of experiments show that different type of chords can be recognized by this method.
Key Wordschord recognition, phase space reconstruction, EMD
Class NumberTN912
1引言
隨著計算機網絡和多媒體技術的發展,音樂的種類和數量也在快速地增長,隨之而來的是對音樂進行有效儲存、檢索和管理的實際需求,而和弦作為音樂的重要內容之一,也越來越多地應用到這些領域當中[1]。對于專業的音樂人士,能夠通過聽力來進行音樂和弦種類的識別,而在信號分析識別領域,人們希望讓計算機也具備這樣的能力。已有的音樂識別方法中大多基于時頻分析,該方法容易受噪聲影響,使識別準確率降低,因此,如何提高音樂信號特征信息的抗噪性和識別準確率一直以來都是研究人員關注的問題[2~4]。
隨著混沌理論的不斷發展,音樂信號的非線性特征從一個新的角度反映了信號的本質特征,因此,可以將利用相空間重構方法獲得的特征矩陣應用到和弦分類器的構造和相關的識別實驗中[5~6]。在提取音樂信號的非線性特征時,直接采用相空間重構的方法往往會造成部分和弦特征信息的丟失,因此,在提取和弦信號非線性特征之前,利用EMD自適應信號分解的方法將原始信號分解成若干子信號,然后再對子信號進行相空間重構,該方法在很大程度上能夠減少固定相空間重構參數所造成的信息丟失的問題[7~9]。
2和弦信號的EMD自適應信號分解
一般情況下,對和弦信號進行EMD自適應分解后,原始信號將被分解成十個以上的子信號,其中,絕大部分子信號中所含的信息量都是非常小的,并不能表征原始信號的本質特征,另外,如果對每個子信號都提取非線性特征,就會加大程序的計算量,影響SVM分類器構造速度和未知和弦信號的識別速度,因此,需要從分解出的所有子信號中選取包含信息量較大的子信號作為特征信號,用于分類器構造以及和弦識別實驗。圖1顯示的是對大三和弦CMajor的EMD分解后前三個信號分量。



圖1 對CMajor進行EMD分解的前三個分量
其中,圖1(a)~圖1(c)為對CMajor進行EMD分解后的前三個子信號。
圖2顯示的是上述三個子信號對應的頻譜圖像。



圖2 對CMajor的EMD分解后前三個分量的頻譜
其中,圖2(a)~圖2(c)為前三個子信號對應的頻譜。
通過對和弦信號進行EMD分解后的各分量圖像及對應的頻譜圖可以看出,前三個子信號包含較多的信息量,無論在信號能量還是頻譜上都能夠反映出整個和弦信號的主要特征,因此,構造和弦識別分類器以及提取未知和弦特征的過程中,對分解后的前三個子信號進行相空間重構,得到相應的三個特征矩陣,然后整合這三個特征矩陣后即可提取出該和弦信號的主要特征。
3基于EMD和相空間重構的和弦識別
利用EMD和相空間重構的方法進行和弦識別時,除了要決定特征子信號數量外,還要確定子信號所對應的相空間重構參數,即延遲時間τ和嵌入維m。
3.1相空間重構參數的確定
在提取這三個子信號的非線性特征時,需要確定前三個分量的相空間重構參數,即延遲時間τ和嵌入維m的值,下列各圖顯示的是對大三和弦CMajor進行EMD分解并利用互信息法和偽最近鄰點的改進方法對前三個子信號進行相空間重構參數確定的情況。圖3~圖5是對大三和弦CMajor進行EMD分解后第一分量延遲時間τ、嵌入維m的確定情況以及相空間重構的軌跡。
圖3為利用互信息法求得延遲時間τ=3。
圖4為利用Cao方法求得嵌入維m=13。
圖5為CMajor第一分量對應的相空間重構軌跡。
利用同樣的方法可以對CMajor進行EMD分解后第二分量和第三分量確定延遲時間τ和嵌入維m的值。通過對若干和弦信號進行EMD分解,分析每個和弦前三個EMD分量的延遲時間τ和嵌入維m的情況,確定第一分量的延遲時間τ=3,嵌入維m=10,第二分量的延遲時間τ=5,嵌入維m=10,第三分量的延遲時間τ=6,嵌入維m=10,將這些確定后的相空間重構參數用于特征提取和分類器構造中。

圖4 確定嵌入維

圖5 相空間重構軌跡
3.2識別特征量和分類器的構造
在進行SVM分類器構造時,首先對獲取的每個樣本信號進行EMD自適應信號分解,并且利用前三個子信號分量來提取出能夠表征和弦本質的特征參量。按照前面確定的每個子信號的參數,對每個子信號進行相空間重構。最后,利用重構后的相空間矩陣進行訓練信號特征參量和識別特征參量的構造,其結構如圖6所示。

圖6 基于EMD的特征參量矩陣
在進行SVM分類器的構造過程中,除了進行特征參量矩陣的構造之外,還需要進行訓練參量標簽的標識,根據矩陣行的數目N,進行N×1階標簽矩陣的構造,矩陣中元素設為1、2、3……,分別對應不同種類的和弦以及音符。
在進行SVM分類器的構造過程中,除了訓練信號特征參量和特征參量對應的標簽矩陣以外,還要選擇核函數種類以及懲罰因子C,在本次實驗中,核函數選取徑向基核函數K(x,y)=exp(-‖x-y‖2/2δ2),其中,δ=0.02,懲罰因子C=500。
3.3識別實驗及分析
在確定了相應參數以及特征參量的構造方法后,對三和弦CMajor、DMajor、AMajor、BMajor、CMinor、DMinor、AMinor和BMinor,七和弦Major 7th、Minor 7th、Dominant 7th、Diminished 7th以及C、E、G和A四個單音音符進行種類識別,其識別流程如圖7所示。

圖7 基于EMD和相空間重構的和弦識別流程圖
按照圖7所示的流程,對上述16種音樂信號進行識別實驗,表1顯示的是對十二種和弦及四個單音進行識別實驗的結果,其中

通過識別結果可以看出,從整體上,利用EMD結合相空間重構的識別方法可以提取出和弦信號的非線性特征,準確地識別出具體的和弦種類。在這個過程中,引入自適應信號分解環節,主要是為了解決固定相空間重構參數所引起的非線性特征信息丟失的問題。利用EMD自適應信號分解的方法將原始信號分解成包含若干特征參量的子信號,然后再對每個子信號進行相空間重構,這樣,就在很大程度上彌補了固定參數造成的信息量丟失。然而,通過識別結果發現,不同和弦或單音音符的識別準確率也是不相同的,有些準確率較高,例如DMajor,而有些識別準確率卻相對較低,例如單音E。產生這樣的結果主要是因為自適應EMD方法在進行自適應信號分解時固有的不足造成的,分解后的各個子信號,特別是前幾個子信號中包含的特征信息較多,而且發生了各種特征信息混疊的現象,這在某種程度上也影響了最終的識別準確率。

表1 基于EMD和相空間重構的和弦識別準確率
4結語
為了彌補直接提取和弦非線性特征的不足,本文利用自適應信號分解的方法,將和弦分解成包含若干特征的子信號,再對每個子信號進行相空間重構,將得到的若干相空間重構矩陣整合在一起形成表征和弦本質的非線性特征參量。然而,根據對EMD分解特性的描述,當數據由白噪聲組成,且白噪聲的尺度均勻的分布在整個時間或時間-頻率尺度上,EMD可以作為一個二進濾波組。當數據不是純的白噪聲,一些尺度會丟失,這樣就會出現模式混疊現象[10]。而實驗中獲得的音頻數據中都不可避免地融入了噪聲,因此,會出現EMD模式混疊現象,造成某些和弦或單音識別準確率的下降,在今后的工作中,需要采用改進后的自適應信號分解方法,使分解后生成的子信號中包含較為單一的特征信息,從而能夠更好地反映信號的本質特征。
參 考 文 獻
[1] 袁莉萍.論音樂信息網絡資源的設計與開發[J].現代圖書情報技術,2002,3:61-62,73.
YUAN Liping. Explojtation and Construction of Musical Information in Internet[J]. New Technology of Library and Information Service,2002,3:61-62,73.
[2] Humphrey, E. J., Taemin Cho, Bello, J. P. Learning a robust Tonnetz-space transform for automatic chord recognition[C]//Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), Kyoto, 25-30 March 2012,2012:453-456.
[3] Oudre, L., Grenier, Y., Févotte, C. Chord Recognition by Fitting Rescaled Chroma Vectors to Chord Templates[J]. IEEE Transactions on Audio, Speech, and Language Processing,2011,19(7):2222-2233.
[4] Oudre, L., Févotte, C., Grenier, Y. Probabilistic Template-Based Chord Recognition[J]. IEEE Transactions on Audio, Speech, and Language Processing,2011,19(8):2249-2259.
[5] Yang, Hui. Multiscale Recurrence Quantification Analysis of Spatial Cardiac Vectorcardiogram Signals[J]. IEEE Transactions on Biomedical Engineering,2011,58(2):339-347.
[6] 劉樹勇,朱石堅,俞翔.確定相空間重構嵌入維數的研究[J].哈爾濱工程大學學報,2008,29(4):374-381.
LIU Shuyong, ZHU Shijian, YU Xiang. Determinating the embedding dimension in phase space reconstruction[J]. Journal of Harbin Engineering University,2008,29(4):374-381.
[7] Rainer Typke, Agatha Walczak-Typke. Indexing Techniques for Non-metric Music Dissimilarity Measures[J]. Computational Intelligence,2010,274:3-17.
[8] 陳仁祥,湯寶平,馬婧華.基于EEMD的振動信號自適應降噪方法[J].振動與沖擊,2012,31(15):82-86.
CHEN Renxiang, TANG Baoping, MA Jinghua. Adaptive de-noising method based on ensemble empirical mode decomposition for vibration signal[J]. Journal of Vibration and Shock,2012,31(15):82-86.
[9] 王彪.基于EMD法的語音信號特征提取方法研究[J].科學技術與工程,2012,20(10):2462-2464.
WANG Biao. Speech Signal Feature Extraction Method Research Based on EMD[J]. Science Technology and Engineering,2012,20(10):2462-2464.
[10] 胡勁松,楊世錫,任達千.一種基于EMD的振動信號時頻分析新方法研究[J].振動與沖擊,2008,27(8):71-73,154.
HU Jinsong, YANG Shixi, REN Daqian. Study on the Method of EMD-Based Vibration Signal Time-Frequency Analysis[J]. Journal of Vibration and Shock,2008,27(8):71-73,154.
中圖分類號TN912
DOI:10.3969/j.issn.1672-9722.2016.03.025
作者簡介:劉婷,女,碩士,工程師,研究方向:網絡管理和系統維護。
收稿日期:2015年9月11日,修回日期:2015年10月22日