周婧 范凌云
摘 要: 為了提高電子音樂識別精度,更快從海量電子音樂中找到用戶真正需要的電子音樂,提出基于最小二乘支持向量機的電子音樂識別模型。首先收集電子音樂的數據,并采用小波分析對電子音樂數據進行去噪處理,然后提取電子音樂的特征,并對特征進行歸一化處理,最后采用最小二乘支持向量機對處理后的電子音樂數據進行訓練,建立電子音樂識別模型。采用具體電子音樂數據對模型的有效性進行驗證,結果表明,與傳統電子音樂識別模型相比,支持向量機對噪聲數據具有良好的魯棒性,可以有效識別各種類型的電子音樂,而且電子音樂的識別速度更優。
關鍵詞: 電子音樂; 短時特征; 特征向量歸一化; 最小二乘支持向量機; 噪聲魯棒性; 識別速度
中圖分類號: TN911?34; TP391.9 文獻標識碼: A 文章編號: 1004?373X(2018)09?0109?04
Abstract: In order to improve the recognition accuracy of electronic music, quickly find the electronic music needed by user in massive electronic music, an electronic music recognition model based on least square support vector machine is proposed. The electronic music data is acquired, and denoised with wavelet analysis. The characteristic of electronic music is extracted and normalized. The least square support vector machine is used to train the processed electronic music data, and establish the electronic music recognition model. The specific electronic music data is adopted to verify the effectiveness of the model. The results show that, in comparison with the traditional electronic music recognition model, the proposed model based on support vector machine has stronger robustness for noise data, can identify the various types of electronic music effectively, and its recognition speed is faster.
Keywords: electronic music; short?time feature; eigenvector normalization; least square support vector machine; noise robustness; recognition speed
0 引 言
隨著互聯網快速的發展,近幾年產生了大量的多媒體數據,電子音樂是一種最常用的多媒體數據。面對海量的電子音樂數據,如何建立理想的電子音樂識別模型,快速、準確地從中獲得用戶感興趣、喜歡的電子音樂是當前面臨的一個挑戰[1?3]。
電子音樂識別,顧名思義就是對電子音樂進行分類,本質上是一種模式分類的過程,該過程涉及到許多方面的學科,如心理學、信號處理、模式識別等,是一個十分復雜的過程[4]。在網絡中的電子音樂數據與現實生活中的數據格式不同,其有自身的特殊格式,因此,有學者提出基于內容的電子音樂識別模型,它們提取電子音樂的均值、自相關系數作為特征,然后建立電子音樂識別模型,有學者提出基于MCC的電子音樂識別模型[5?6],將電子音樂的MCC能量作為特征對電子音樂內容進行描述,并采用歐氏距離構建電子音樂識別的分類器[7]。隨后有研究人員提出將MCC、基音頻率作為電子音樂識別的特征向量,通過K最近鄰作為分類器,實現電子音樂識別[8]。這些電子音樂識別模型均有各自的優點和缺陷,如K最近鄰分類器的工作速度快,但是電子音樂識別精度低,歐氏距離的識別速度慢[9],近幾年,出現了基于神經網絡的電子音樂識別模型,該模型通過神經網絡的自動、智能學習能力對電子音樂進行分類,獲得了比較理想的電子音樂識別效果,但神經網絡的結構比較復雜,需要同類電子音樂識別樣本數量大,而且學習過程中收斂性能差,電子音樂識別的效果有待進一步改善[10?12]。
針對當前電子音樂識別無法描述電子音樂的類別,存在識別精度低等難題,為了提高電子音樂識別精度,更快地從海量電子音樂中找到用戶真正需要的電子音樂,提出基于最小二乘支持向量機的電子音樂識別模型。結果表明,最小二乘支持向量機可以有效識別各種類型的電子音樂,而且電子音樂的識別速度更優。
1 小波分析和最小二乘支持向量機
1.1 小波分析
小波分析可以對一維信號進行不同分辨率的分解,將原始信號進行細化處理,這樣可以去掉其中的噪聲,提高信號的信噪比,便于信號的后續處理。通常情況下選擇Mallat算法對信號進行分解和重構,信號分解形式可以采用式(1)進行描述:
1.2 最小二乘支持向量機
當前支持向量機的類型很多,相對于其他類型的支持向量機,最小二乘支持向量機的學習速度更快,而且基于統計學習理論和VC維理論進行建模,泛化能力優異。
2 最小二乘支持向量機的電子音樂識別模型
2.1 提取特征
電子音樂信號的能量隨著時間的變化發生相應的改變,短時能量是電子音樂最常用的一種特性,噪聲的平均能量低,有效的電子音樂信號能量高,而且不同音符的能量是不同的,設語音信號[{x(n)}]的短時平均能量為[En,]計算公式為:
2.2 電子音樂的分類器
電子音樂一般有很多種類型,如流行音樂、古典音樂等,而最小二乘支持向量只能設計二分類的電子音樂識別分類器,因此采用圖1的方式建立電子音樂識別的多分類器。
3 仿真實驗
3.1 數據來源
采用Cool Edit Pro軟件采集電子音樂數據,并采用Matlab 2014軟件進行仿真實驗,電子音樂的類型為流行音樂、民歌、古代器樂、戲曲,它們的樣本數量如表1所示。
3.2 電子音樂識別模型的具體實現過程
首先對電子音樂進行分幀處理,相鄰幀有一定的重復,保持電子音樂的短時平穩,然后采用小波分析對電子音樂信息進行去噪處理,然后提取相應的特征,并采用式(19)對特征進行預處理,最后采用訓練樣本對最小二乘支持向量機進行學習,建立電子音樂識別的分類器。
3.3 結果與分析
選擇BP神經網絡進行對比實驗,統計它們的電子音樂平均識別精度,如圖2所示。由圖2可知:
1) BP神經網絡的電子音樂識別精度低,而且電子音樂的識別結果不穩定,這是因為BP神經網絡容易出現過擬合的電子音樂識別結果,導致電子音樂的識別誤差大。
2) 相對BP神經網絡,最小二乘支持向量機的電子音樂識別精度明顯提高,這是因為最小二乘支持向量機的學習性能更優,建立高精度的電子音樂識別模型,有效降低了電子音樂的識別誤差。
統計不同模型的電子音樂平均識別時間,結果如圖3所示。對電子音樂的平均時間進行對比和分析可知,最小二乘支持向量機的電子音樂平均識別時間更短,這主要是由于通過小波分析消除了原始電子音樂信號中的噪聲,加快了電子音樂特征的提取速度,并有利于最小二乘支持向量機建立電子音樂的分類,加快了電子音樂的建模速度,可以更好地滿足海量電子音樂的在線檢索要求。
4 結 論
電子音樂識別的研究具有重要實際價值,針對當前電子音樂識別精度低等難題,提出基于最小二乘支持向量機的電子音樂識別模型,通過仿真實驗可以得到如下結論:
1) 通過小波分析對電子音樂數據進行去噪處理,消除了噪聲對電子音樂建模過程的干擾,提高了電子音樂數據的信噪比,有利于后續的電子音樂識別建模。
2) 提取多種短時特征,通過短時特征對電子音樂的類型進行描述,可以更加有效地區別電子音樂的類型。
3) 采用最小二乘支持向量機對處理后的電子音樂數據進行訓練,建立電子音樂識別模型,能夠描述電子音樂的內容,提高了電子音樂的識別精度。
4) 與其他電子音樂識別模型相比,本文的電子音樂識別模型的執行速度更快,可以在短時間內找到用戶所需要的電子音樂,具有更高的實際應用價值。
5) 在基于最小二乘支持向量機的電子音樂識別建模過程中,參數對最小二乘支持向量機的學習性能影響很大,這是下一步將要研究的內容。
參考文獻
[1] MALLATS G. A theory for multiresolution signal decomposition: the wavelet representation [J]. IEEE transactions on pattern analysis and machine intelligence, 1989, 11(7): 674? 693.
[2] 盧堅,陳毅松,孫正興,等.語音/音樂自動分類中的特征分析[J].計算機輔助設計與圖形學學報,2002(3):233?237.
LU Jian, CHEN Yisong, SUN Zhengxing, et al. Characteristic analysis in automatic classification of speech/music [J]. Computer aided design and graphics, 2002(3): 233?237.
[3] 田嵐,陸小珊,白樹忠.基于快速神經網絡算法的非特定人語音識別[J].控制與決策,2002,17(1):65?68.
TIAN Lan, LU Xiaoshan, BAI Shuzhong. Non?specific human speech recognition based on fast neural network algorithm [J]. Control and decision, 2002, 17(1): 65?68.
[4] 劉海波,李輝,張琨磊.低信噪比下噪聲抑制的語音活動檢測[J].小型微型計算機系統,2012,33(6):1381?1384.
LIU Haibo, LI Hui, ZHANG Kunlei. Speech activity detection of noise suppression under low SNR [J]. Minicomputer system, 2012, 33(6): 1381?1384.
[5] 李杰,周萍,杜志然.短時TEO能量在帶噪語音端點檢測中的應用[J].計算機工程與應用,2013,49(12):144?147.
LI Jie, ZHOU Ping, DU Zhiran. The application of short time TEO energy in noisy speech endpoint detection [J]. Computer engineering and application, 2013, 49(12): 144?147.
[6] 盧堅,陳毅松,孫正興,等.基于隱馬爾可夫模型的音頻自動分類[J].軟件學報,2002(8):1593?1598.
LU Jian, CHEN Yisong, SUN Zhengxing, et al. Audio automatic classification based on Hidden Markov model [J]. Software journal, 2002(8): 1593?1598.
[7] 許琳,王作英.基于HMM的音樂識別算法[J].計算機工程,2004,30(10):135?136.
XU Lin, WANG Zuoying. HMM based music recognition algorithm [J]. Computer engineering, 2004, 30(10): 135?136.
[8] 王歡良,韓紀慶,張磊.基于支持向量機的變異語音分類研究[J].哈爾濱工業大學學報,2003(4):389?393.
WANG Huanliang, HAN Jiqing, ZHANG Lei. Variant speech classification based on support vector machine [J]. Journal of Harbin Institute of Technology, 2003(4): 389?393.
[9] 秦丹,馬光志.基于挖掘技術的音樂風格識別系統[J].計算機工程與設計,2005,26(11):3094?3096.
QIN Dan, MA Guangzhi. Style of music recognition system based on mining technology [J]. Computer engineering and design, 2005, 26(11): 3094?3096.
[10] 馬希榮,梁景蓮.基于情感音樂模版的音樂檢索系統研究[J].計算機科學,2009,36(1):239?241.
MA Xirong, LIANG Jinglian. Research on music retrieval system based on emotional music template [J]. Computer science, 2009, 36(1): 239?241.
[11] 陳功,張雄偉.一種基于灰關聯分析的語音/音樂分類方法[J].聲學技術,2007,26(2):262?267.
CHEN Gong, ZHANG Xiongwei. A speech/music classification method based on grey correlation analysis [J]. Acoustics technology, 2007, 26(2): 262?267.
[12] 張燕,唐振民,李燕萍,等.基于MFCC和 HMM的音樂分類方法研究[J].南京師范大學學報(工程技術版),2008(4):112?114.
ZHANG Yan, TANG Zhenmin, LI Yanping, et al. Research on the music classification method based on MFCC and HMM [J]. Journal of Nanjing Normal University (engineering technology edition), 2008(4): 112?114.