敖培++趙四方++馮志鵬++李延強
摘要:為了克服采用基于Boosting算法和Bagging算法生成的個體網絡時難以滿足誤差獨立條件的問題,本文提出一種基于局部分類精度估計的自適應ELM集成的方法,即通過估計各個體ELM在未知樣本鄰域內的分類精度,選擇具有最大局部分類精度的個體ELM輸出作為分類結果。實驗表明,采用本文方法進行情感識別可以獲得較好的效果。
關鍵詞:ELM集成算法 局部分類精度 情感識別
中圖分類號:TM715 文獻標識碼:A 文章編號:1007-9416(2014)12-0093-02
1 引言
基于Boosting算法和Bagging算法生成的個體網絡很難滿足誤差獨立的條件,通過簡單的平均法或投票法難以獲得滿意的性能。為了避免誤差獨立性假設,本文提出一種基于局部分類精度估計的自適應選擇ELM(Extreme Learning Machine, ELM)[1]集成方法,并對人類情感進行識別[2],獲得較好的識別效果。
2 局部分類精度估計
在為每一個測試模式選擇個體分類器時,其分類精度可以通過定義在測試模式周圍的屬于校驗樣本集的k近鄰領域進行估算,即所謂的局部分類精度。假設已設計得到K個分類器Cj(j=1,…,K),每個分類器均用來解決一個M類(wi,i=1,…,M)的模式分類問題,對任一未知測試模式X*,給定模式X在X*的鄰域內,分類器Cj的局部分類精度可由下式來估算:
(1)
式中,是X被分類器Cj劃分到類別wi的概率,Wn=1/dn為考慮不同樣本的分類重要性給賦予的權重,dn是鄰域內第n個模式樣本Xn到測試模式X*的歐式距離。
3 自適應選擇ELM集成算法
本文通過估計測試模式周圍局部特征空間區域的各個體網絡分類精度,為待分類的測試模式自適應選擇具有最高局部分類精度的個體ELM分類器。具體算法如下:
輸入:測試模式X*,校驗集及其類別,鄰域規模k,拒絕閥值thd_rej,選擇閥值thd_sel
輸出:測試模式X*的分類
Step 1:如果所有的分類器對測試模式X*的分類相同,則直接輸出X*的類別;
Step 2:按式(1)計算局部分類精度CLAj(X*)(j=1,…,K);
Step 3:如果CLAj(X*) Step 4:確定具有最大局部分類精度CLAj(X*)的分類器Cmax; Step 5:對每個分類器Cj計算差值Dj=CLAmax(X*)-CLAj(X*); Step 6:如果,j≠m,Dj>thd_sel,則選擇分類器Cmax;否則,在Dj 鄰域規模k的取值根據不同的數據樣本經過試驗選定,拒絕閥值thd_rej一般取0.5,選擇閥值thd_sel一般取0.02~0.1。 4 實例分析 實驗采用了CohnKandade的人臉表情庫作為表情測試數據庫,并從中隨機提取了403個人臉表情樣本,對每個樣本提取33個情感特征作為人臉數據集。采用Chinese Linguistic Data Consortium作為語音測試數據庫,并對其中的1200條語音分別提取37個帶噪音的語音情感特征作為語音數據集。每個數據集除了包含高興、悲傷、害怕、生氣、驚訝、厭惡6種表情外,人臉數據集還包含了中性人臉表情,如表1所示。 將所有數據集采用隨機抽樣的方法選取60%作為訓練集,20%作為校驗集,其余20%作為測試集,分類結果是重復運行20次的情況下測試集分類精度的平均值。采用本文算法進行分類時,選擇thd_rej=0.5,選擇閥值thd_sel=0.05。這里選取基于Boosting個體ELM生成+投票法集成和Bagging個體ELM生成+投票法集成兩種方法與本文算法進行識別效果比較,如表2所示。從表2中可以看出,與其他兩種方法相比,本文方法具有較高的分類精度,可以有效提高情感識別率。 5 結語 為了避免誤差獨立性假設,本文提出一種基于局部分類精度估計的自適應選擇ELM集成方法,并對人類情感進行識別。與基于Boosting算法和Bagging算法生成個體ELM的方法相比較,本文方法可以獲得較好的識別效果。 參考文獻 [1]YU Q, MICHE Y, EIROLA E, et al. Regularized extreme learning machine for regression with missing data [J]. Neurocomputing,2013,102:45-51. [2]上官鵬超.曲線擬合及蜂群算法用于皮膚電信號的情感識別[D].西南大學碩士學位論文,2014.