趙亮



摘 要: 針對傳統模型無法準確實現電子音樂分類和識別的難題,提出改進極限學習機的電子音樂分類模型。首先對電子音樂數據進行采集,并提取其倒譜系數特征,并采用核主成分分析對特征進行篩選;然后采用遺傳算法對極限學習機的參數進行選擇,并用于構建電子音樂的分類器;最后采用多種類型的電子音樂進行仿真實驗,改進極限學習機的電子音樂平均分類率達到了95%以上,電子音樂的錯分率要遠遠低于當前其他電子音樂分類模型。實驗結果驗證了該電子音樂分類模型的可行性以及優越性。
關鍵詞: 音樂分類; 核主成分分析; 極限學習機; 音樂特征; 遺傳算法
中圖分類號: TN912.3?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)05?0155?04
Abstract: It is difficult to class and recognize the electronic music with the traditional model accurately, a new electronic music classification model based on improved extreme learning machine is proposed. The electronic music data is collected to extract the feature of the cepstrum coefficient. The kernel principal component analysis is used to screen the feature. The genetic algorithm is used to select the parameters of the extreme learning machine to construct the classifier of the electronic music. The polytype electronic music is adopted to carry out the simulation experiments. The average classification rate of the electronic music can reach up to 95% with the improved extreme learning machine, and the wrong classification rate of the electronic music is far lower than that of other electronic music classification models. The feasibility and superiority of the electronic music classification model were verified with the experimental results.
Keywords: music classification; kernel principal component analysis; extreme learning machine; music characteristic; genetic algorithm
0 引 言
隨著信息技術的不斷發展,與音樂的結合更加緊密,出現了許多種類的電子音樂,電子音樂可以減輕人們生活、工作上的壓力,然而每一個用戶喜歡的電子音樂類型不同,如何從海量的電子音樂庫準確找到用戶喜歡的音樂十分重要[1]。電子音樂分類是提高電子音樂查詢效率的關鍵,成為人們關注的焦點[2]。
電子音樂分類研究可以劃分為兩個階段:傳統階段和現代階段,傳統階段是一種人工分類方式,通過一些專家和專業人員對電子音樂進行分析,將它們劃分到相應的類別中[3]。當電子音樂的數據很小時,傳統分類方法的分類準確率高,可以很好地對分類結果進行解釋。隨著音樂數據的不斷增加,傳統方法的缺陷逐漸體現出來,出現了誤分率高,分類效率低等不足[4]。現代階段主要通過計算機實現電子音樂的自動分類[5]。電子音樂自動分類屬于一種模式識別問題,它首先要提取反映電子音樂的特征信息,然而原始特征數量相當龐大,直接根據原始特征信息進行電子音樂自動分類的時間長、效率低,為此通常對電子音樂的原始特征進行篩選,當前采用主成分分析對特征進行處理,降低特征的數量,加快電子音樂自動分類的速度[6]。主成分分析屬于線性處理方法,不能有效提取描述電子音樂標簽的非線性信息[7]。核主成分分析是一種改進的主成分分析方法,通過引入核函數提取非線性信息,獲得了比主成分分析更優的特征[8]。電子音樂自動識別也需要設計電子音樂分類器,當前主要有隱馬爾可夫模型、神經網絡和支持向量機[9?11],然而這些方法均存在一些不足,如隱馬爾可夫模型只能進行線性分類,電子音樂分類的結果不可靠;人工神經網絡雖然能夠對電子音樂進行非線性分類,但要求電子樣本數據充足,一旦不能滿足樣本充足這個條件,電子音樂分類效果急劇下降;支持向量機雖然沒有神經網絡對樣本數據的要求,但學習過程繁鎖,時間復雜度高,不能滿足海量電子音樂分類的速度要求[12]。
針對傳統模型在電子音樂分類過程中存在的不足,提出了改進極限學習機的電子音樂分類模型。首先提取電子音樂的倒譜系數特征,采用核主成分分析選擇電子音樂的特征,然后改進極限學習機構建電子音樂的分類器,最后仿真實驗結果表明,改進極限學習機提高了電子音樂的平均分類率,電子音樂分類性能優于其他模型。
1 改進極限學習機的電子音樂分類模型
1.1 提取電子音樂的特征
當前電子音樂有很多種特征來描述其類型,而電子音樂實際是一種聲音,Mel倒譜系數可以描述聲音頻率的能量變化,提取特征速度很快,為此本文選擇Mel倒譜系數作為電子音樂分類的特征,具體步驟如下:
(1) 對采集的電子音樂數據進行分幀處理,去除無效幀。
(2) 采用傅里葉變換對電子音樂的幀信號進行處理,得到它們的幅度頻譜。
(3) 通過幅度頻譜的Mel尺度變換,并采用濾波器組對頻譜進行濾波處理,得到第[j]個濾波器的能量值為:
1.3 改進極限學習機
為了解決傳統神經網絡收斂速度慢,易產生過擬合、網絡結構復雜的缺陷,Huang等提出了極限學習機,只要簡單的隨機設置權值和閾值,而且只要確定隱含層的節點數,便可以順利完成訓練過程,得到求解問題的最優解[13]。設隱含層的節點數為[L,]那么極限學習機的輸出函數為:
在極限學習機的工作過程中,參數[ai,bi]直接影響其學習性能,為了解決該問題,本文采用遺傳算法確定極限學習機的參數,具體如圖1所示。
1.4 改進極限學習機的電子音樂分類步驟
(1) 收集電子音樂樣本數據,組成電子音樂數據庫。
(2) 提取電子音樂數據庫的特征,它們組成特征向量庫。
(3) 對電子音樂數據庫中的特征進行歸一化處理。
(4) 采用核主成分分析選擇電子音樂數據庫的特征,組成最優特征子集。
(5) 根據最優特征子集對訓練樣本和測試樣本進行降維處理,減少數據的規模。
(6) 將訓練樣本輸入到極限學習機中進行學習,采用遺傳算法確定最優極限學習機參數。
(7) 根據最優參數,極限學習建立電子音樂分類模型。
(8) 采用電子音樂的測試數據對電子音樂分類模型的性能進行測試與分析。
2 電子音樂分類的性能測試
2.1 電子音樂數據的來源
為了分析改進極限學習機的電子音樂分類效果,選擇大量數據進行仿真測試,該數據可分為4種類型的電子音樂,它們分別為:古箏、琵琶、笛子、箜篌,它們的樣本數量分布如表1所示。為了使IELM的電子音樂分類效果具有可比性,設計了2種對比模型,具體描述如下:
(1) 主成分分析+ELM的電子音樂分類模型(PCA?ELM)。
(2) 核主成分分析+支持向量機的電子音樂分類模型(KPCA?SVM)。
2.2 結果與分析
每一種模型運行10次,計算它們的平均值,KPCA?ELM與對比模型的電子音樂分類正確率、錯誤分類率與平均訓練時間(單位:s)如圖2~圖4所示。
對圖2~圖4進行分析可知:
(1) 相對于PCA?ELM,KPCA?ELM的電子音樂分類率得到了提高,而且錯誤分類率更小,這是因為KPCA可以提取比PCA更好的非線性特征,使得特征可以更加準確地反映電子音樂的類型。
(2) 相對于KPCA?SVM,KPCA?ELM的電子音樂分類率同樣得到了改善,有效降低了電子音樂的錯誤分類率,這是因為ELM集成了傳統神經網絡和支持向量機的優點,建立了性能更優的電子音樂分類模型。
(3) 在所有電子音樂分類模型中,KPCA?ELM的電子音樂分類訓練最少,這是因為KPCA可以有效減少特征維數,而且ELM可以獲得比支持向量機更快的學習速度,加快了電子音樂分類的訓練速度,提高了電子音樂的分類效率,更加適合于海量電子音樂分類的要求。
3 結 語
電子音樂分類可以拓寬多媒體的應用范圍,具有十分重要的應用價值。為了解決當前電子音樂分類模型存在的不足,本文提出了改進極限學習機的電子音樂自動分類模型,該模型集成了核主成分分析和極限學習機的優點,同時采用遺傳算法對極限學習機參數進行選擇,提高了電子音樂分類的準確性,具有廣泛的應用前景。
參考文獻
[1] TZANETAKIS G, COOK E. Musical genre classification of audio signals [J]. IEEE transactions on speech & audio proces?sing, 2001, 10(5): 293?302.
[2] COSTA Y M G, OLIVEIRA L S, KOEFICH A L, et a1. Music genre classification using LBP textural features [J]. Signal processing, 2012, 92(11): 2723?273.
[3] 鄒昊.基于概率神經網絡的流行音樂分類研究[J].北方音樂,2015,35(16):44.
[4] 張寶印,于俊清,唐九飛,等.面向情感的電影背景音樂分類方法[J].計算機科學,2013,40(12):37?41.
[5] 韓浩,王寅瀟,王博,等.基于概率神經網絡的流行音樂分類研究[J].數字技術與應用,2013(8):64?65.
[6] 高林杰,張 明.基于熵和支持向量機的音樂分類方法[J].計算機系統應用,2014,23(5):83?67.
[7] 張燕,唐振民,李燕萍,等.基于MFCC和 HMM的音樂分類方法研究[J].南京師范大學學報(工程技術版),2008(4):112?114.
[8] 胡景凱,吳磊,高陽.基于學習分類器(LCS)的MP3音樂分類方法[J].重慶郵電大學學報(自然科學版),2007(4):417?421.
[9] 張家發,胡景凱,高陽,等.基于MDCT域特征的MP3音樂分類[J].江南大學學報(自然科學版),2007(6):769?773.
[10] 李劍.神經網絡在音樂分類中的應用研究[J].江南大學學報(自然科學版),2010,27(11):168?170.
[11] 孟永輝,蔣冬梅,付中華,等.一種新穎的語言/音樂分割與分類方法[J].計算機工程與科學,2009,31(4):106?109.
[12] 劉建輝,曾麗輝,許金鳳,等.基于最小二乘支持向量機的樂器音樂分類[J].華東交通大學學報,2009,26(6):60?64.
[13] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1): 489?501.