摘 要: 針對(duì)云計(jì)算平臺(tái)下的語(yǔ)音信號(hào)處理模型進(jìn)行研究。傳統(tǒng)SVM語(yǔ)音信號(hào)處理識(shí)別模型是在單臺(tái)計(jì)算機(jī)中完成所有數(shù)據(jù)的處理和運(yùn)算。云計(jì)算環(huán)境的Hadoop平臺(tái)下使用SVM對(duì)語(yǔ)音信號(hào)處理,能夠發(fā)揮MapReduce并行計(jì)算優(yōu)勢(shì),通過Map和Reduce操作將所需要的數(shù)據(jù)處理和運(yùn)算任務(wù)分配到多個(gè)計(jì)算機(jī)中同時(shí)進(jìn)行。使用中科院自動(dòng)化研究所建立的CASIA漢語(yǔ)情感數(shù)據(jù)庫(kù)中的語(yǔ)音信號(hào)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,使用云計(jì)算平臺(tái)下的語(yǔ)音識(shí)別模型針對(duì)研究的幾種情感的識(shí)別率基本在70%以上,識(shí)別率可以滿足要求。使用云計(jì)算平臺(tái)處理這種數(shù)據(jù)比較龐大的計(jì)算任務(wù)時(shí),相比傳統(tǒng)單臺(tái)計(jì)算機(jī)平臺(tái),效率較高,優(yōu)勢(shì)比較明顯。
關(guān)鍵詞: 云計(jì)算; 語(yǔ)音信號(hào)處理; 情感識(shí)別; 支持向量機(jī); Hadoop平臺(tái)
中圖分類號(hào): TN911.7?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)02?0015?03
Research on speech signal processing in cloud computing platform
LIU Rundong
(College of Communication Engineering, Jilin University, Changchun 130012, China)
Abstract: The speech signal processing model in the cloud computing platform is studied in this paper. The processing and operation of all data is fulfilled by traditional SVM speech signal processing recognition model and in a single computer. SVM is used to process the speech signal in the Hadoop platform in cloud computing environment, which can give play to MapReduce parallel computing advantages, and assign the required data processing and computing tasksed to multiple computers at the same time through the Map and Reduce operation. The speech signal data in CASIA Chinese language sentiment database established by Chinese Academy of Sciences Institute of Automation is employed as the experimental data. The experimental results show that the emotional recognition rate of the speech recognition model based on the cloud computing platform is more than 70%, and the recognition rate can meet the requirements. When dealing with this kind of mass data calculation, the efficiency of the cloud computing platform is higher than that of the traditional single computer platform, and its superiority is obvious.
Keywords: cloud computing; speech signal processing; emotion recognition; support vector machine; Hadoop platform
人類屬于智能生物的一條重要特質(zhì)即人類擁有豐富的情感,在人們?nèi)粘I罱涣髦校楦斜夭豢缮佟=┠辏S著人工智能的發(fā)展,人們開始對(duì)機(jī)器進(jìn)行訓(xùn)練,一些機(jī)器已經(jīng)能夠懂得人們的語(yǔ)言,科研人員希望機(jī)器能夠更加智能和人性化,希望機(jī)器能夠通過人們的語(yǔ)言判斷人們的情感變化,使得人機(jī)交互變得更加自然和諧。情感識(shí)別已然成為情感計(jì)算的重要分支,并得到了科研工作者的廣泛關(guān)注[1?3]。
1 語(yǔ)音識(shí)別特征
漢語(yǔ)語(yǔ)境下,語(yǔ)言情感識(shí)別研究相對(duì)較晚,但得到了科研工作者的廣泛關(guān)注。如神經(jīng)網(wǎng)絡(luò)、K近鄰法、支持向量機(jī)、貝葉斯分類器等模式識(shí)別分類算法在語(yǔ)言情感識(shí)別中得到了使用。本文使用支持向量機(jī)算法建立語(yǔ)音情感識(shí)別模型,使用語(yǔ)音信號(hào)進(jìn)行預(yù)處理,提取用于識(shí)別的特征參數(shù),使用訓(xùn)練數(shù)據(jù)對(duì)支持向量機(jī)模型進(jìn)行訓(xùn)練,之后使用測(cè)試數(shù)據(jù)對(duì)訓(xùn)練好的模型的泛化能力進(jìn)行測(cè)試。通過對(duì)語(yǔ)音信號(hào)的分析以及參考文獻(xiàn),本文使用的用于語(yǔ)音信號(hào)識(shí)別的語(yǔ)音信號(hào)特征參數(shù)如表1所示[4?6]。本文主要針對(duì)愉悅、平靜、悲傷、驚奇、恐懼以及憤怒6種情感的語(yǔ)音識(shí)別進(jìn)行研究。這6種情感的語(yǔ)音波形如圖1所示[7?8]。
2 MapReduce模型
MapReduce將龐大數(shù)據(jù)操作任務(wù)分配給多個(gè)計(jì)算機(jī)節(jié)點(diǎn)共同完成,并將多個(gè)計(jì)算機(jī)節(jié)點(diǎn)的計(jì)算結(jié)果合成得到傳統(tǒng)單臺(tái)計(jì)算機(jī)計(jì)算得到結(jié)果。MapReduce包括的過程有:Map,Partition,Shuffle,Combine、Sort以及Reduce。但是可以將該過程合并為Map和Reduce兩個(gè)過程。Map過程將任務(wù)分配給多個(gè)計(jì)算機(jī)節(jié)點(diǎn)共同完成,Reduce過程將多個(gè)計(jì)算機(jī)節(jié)點(diǎn)的計(jì)算結(jié)果進(jìn)行合成。
表1 語(yǔ)音信號(hào)特征參數(shù)
注:[frame]代表幀數(shù);[Ei]代表各幀短時(shí)能量。
圖1 6種情感的語(yǔ)音波形
Map過程中,系統(tǒng)會(huì)把一個(gè)龐大的任務(wù)分劃為大小固定的片段,并將各個(gè)片段分解為鍵值對(duì)[K1,V1]。Hadoop平臺(tái)則片段建立Map任務(wù),可以完成用戶自定義的Map函數(shù),并輸入該片段的鍵值對(duì)[K1,V1],從而輸出計(jì)算結(jié)果[K2,V2]。根據(jù)[K2]將計(jì)算的結(jié)果進(jìn)行排序,得到元組[K2,listV2]。Reduce過程中,系統(tǒng)會(huì)把Map計(jì)算的結(jié)果進(jìn)行排序,輸入為[K2,listV2],輸出為[K3,V3]。MapReduce模型結(jié)構(gòu)如圖2所示[9]。
圖2 MapReduce模型結(jié)構(gòu)
3 云計(jì)算環(huán)境下SVM語(yǔ)音信號(hào)處理模型
傳統(tǒng)SVM語(yǔ)音信號(hào)處理識(shí)別模型是在單臺(tái)計(jì)算機(jī)中完成所有數(shù)據(jù)的處理和運(yùn)算。云計(jì)算環(huán)境的Hadoop平臺(tái)下使用SVM對(duì)語(yǔ)音信號(hào)處理,能夠發(fā)揮MapReduce并行計(jì)算優(yōu)勢(shì),通過Map和Reduce操作將所需要的數(shù)據(jù)處理和運(yùn)算任務(wù)分配到多個(gè)計(jì)算機(jī)中同時(shí)進(jìn)行。在云計(jì)算環(huán)境的Hadoop平臺(tái)下使用SVM對(duì)語(yǔ)音信號(hào)處理時(shí),需要使用Map操作將分割的子計(jì)算節(jié)點(diǎn)中的各個(gè)訓(xùn)練數(shù)據(jù)的子支持向量SVs求出,之后使用Reduce操作子計(jì)算節(jié)點(diǎn)的子支持向量SVs進(jìn)行匯總得到完整的支持向量AllSVs,即建立了云環(huán)境的SVM語(yǔ)音信號(hào)處理識(shí)別模型。使用SVM語(yǔ)音信號(hào)處理識(shí)別模型進(jìn)行數(shù)據(jù)測(cè)試時(shí),需要使用Map操作將分割的子計(jì)算節(jié)點(diǎn)中的各個(gè)測(cè)試數(shù)據(jù)的測(cè)試結(jié)果Rs求出,之后經(jīng)過Reduce操作將子計(jì)算結(jié)果合并得到最終的語(yǔ)音信號(hào)處理識(shí)別結(jié)果。具體流程如圖3所示[10?11]。
圖3 云計(jì)算環(huán)境的Hadoop平臺(tái)下使用SVM對(duì)語(yǔ)音信號(hào)處理流程
云計(jì)算環(huán)境的Hadoop平臺(tái)下建立基于SVM的語(yǔ)音信號(hào)處理識(shí)別模型過程如下:
(1) 預(yù)處理語(yǔ)音信號(hào)數(shù)據(jù),將處理后的數(shù)據(jù)按照HDFS要求進(jìn)行分塊處理,并將分解的數(shù)據(jù)塊存儲(chǔ)到集群的各個(gè)計(jì)算機(jī)中。
(2) 建立SVM語(yǔ)音識(shí)別模型,初始化相關(guān)參數(shù),并選取應(yīng)用廣泛,性能優(yōu)越的RBF核函數(shù)作為SVM的核函數(shù)。
(3) 使用語(yǔ)音信號(hào)數(shù)據(jù)的訓(xùn)練樣本對(duì)SVM語(yǔ)音識(shí)別模型進(jìn)行訓(xùn)練,并將訓(xùn)練后得到的識(shí)別模型使用測(cè)試數(shù)據(jù)進(jìn)行泛化能力測(cè)試[12]。
4 實(shí)驗(yàn)分析
通過實(shí)驗(yàn)對(duì)本文研究的云計(jì)算平臺(tái)語(yǔ)音信號(hào)處理識(shí)別模型的性能進(jìn)行驗(yàn)證。實(shí)驗(yàn)平臺(tái)具有一臺(tái)主機(jī)NameNode,CPU為Intel i5 4950,內(nèi)存為8 GB DDR3 1 600 MHz,硬盤為500 GB,數(shù)據(jù)節(jié)點(diǎn)DataNode由三臺(tái)計(jì)算機(jī)組成集群,CPU為Intel i3 4170,內(nèi)存為4 GB DDR3 1 333 MHz,硬盤為500 GB。Hadoop為1.0.2版本,各個(gè)計(jì)算機(jī)集群節(jié)點(diǎn)實(shí)驗(yàn)千兆交換機(jī)進(jìn)行連接。本文使用中科院自動(dòng)化研究所建立的CASIA漢語(yǔ)情感數(shù)據(jù)庫(kù)中的語(yǔ)音信號(hào)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。在此針對(duì)愉悅、平靜、悲傷、驚奇、恐懼以及憤怒這6種情感的語(yǔ)音進(jìn)行識(shí)別,從數(shù)據(jù)庫(kù)中抽取600條情感語(yǔ)句,其中每種情感語(yǔ)句有100條,80條用于對(duì)識(shí)別模型進(jìn)行訓(xùn)練,另外20條用于對(duì)識(shí)別模型進(jìn)行測(cè)試[13]。使用本文研究的云計(jì)算平臺(tái)下的語(yǔ)音信號(hào)處理識(shí)別結(jié)果如表2所示。
表2 云計(jì)算平臺(tái)語(yǔ)音信號(hào)處理識(shí)別結(jié)果
實(shí)驗(yàn)結(jié)果表明,使用云計(jì)算平臺(tái)下的語(yǔ)音識(shí)別模型針對(duì)研究的幾種情感的識(shí)別率基本在70%以上,識(shí)別率可以滿足要求。定義傳統(tǒng)單臺(tái)計(jì)算機(jī)完成任務(wù)所需時(shí)間除以云計(jì)算平臺(tái)完成任務(wù)所需時(shí)間為加速度比,本文使用的一臺(tái)NameNode和三臺(tái)DataNode組成的Hadoop集群平臺(tái)在處理語(yǔ)音情感識(shí)別任務(wù)時(shí)的加速度比達(dá)到了3.6,說(shuō)明使用云計(jì)算平臺(tái)處理這種數(shù)據(jù)比較龐大的計(jì)算任務(wù)時(shí),相比傳統(tǒng)單臺(tái)計(jì)算機(jī)平臺(tái),效率較高,優(yōu)勢(shì)比較明顯。
5 結(jié) 語(yǔ)
情感識(shí)別已然成為情感計(jì)算的重要分支,并得到了科研工作者的廣泛關(guān)注。本文在云計(jì)算平臺(tái)下使用支持向量機(jī)算法建立語(yǔ)音情感識(shí)別模型,使用語(yǔ)音信號(hào)進(jìn)行預(yù)處理,提取用于識(shí)別的特征參數(shù),使用訓(xùn)練數(shù)據(jù)對(duì)支持向量機(jī)模型進(jìn)行訓(xùn)練,之后使用測(cè)試數(shù)據(jù)對(duì)訓(xùn)練好的模型的泛化能力進(jìn)行測(cè)試。使用中科院自動(dòng)化研究所建立的CASIA漢語(yǔ)情感數(shù)據(jù)庫(kù)中的語(yǔ)音信號(hào)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù);針對(duì)愉悅、平靜、悲傷、驚奇、恐懼以及憤怒6種情感的語(yǔ)音進(jìn)行識(shí)別。實(shí)驗(yàn)結(jié)果表明,使用云計(jì)算平臺(tái)下的語(yǔ)音識(shí)別模型針對(duì)研究的幾種情感的識(shí)別率基本在70%以上,識(shí)別率可以滿足要求。使用Hadoop集群平臺(tái)在處理語(yǔ)音情感識(shí)別任務(wù)時(shí)的加速度比達(dá)到了3.6,說(shuō)明使用云計(jì)算平臺(tái)處理這種數(shù)據(jù)比較龐大的計(jì)算任務(wù)時(shí),相比傳統(tǒng)單臺(tái)計(jì)算機(jī)平臺(tái),效率較高,優(yōu)勢(shì)比較明顯。
參考文獻(xiàn)
[1] 韓文靜,李海峰,阮華斌,等.語(yǔ)音情感識(shí)別研究進(jìn)展綜述[J].軟件學(xué)報(bào),2014,25(1):37?50.
[2] 韓一,王國(guó)胤,楊勇.基于MFCC的語(yǔ)音情感識(shí)別[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,20(5):597?602.
[3] 張海燕,唐建芳.基于RBF神經(jīng)網(wǎng)絡(luò)的語(yǔ)音情感識(shí)別[J].四川理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,24(5):552?555.
[4] 陳明義,余伶俐,朱晗,等.基于特征參數(shù)融合的語(yǔ)音情感識(shí)別方法[J].微電子學(xué)與計(jì)算機(jī),2006,23(12):168?171.
[5] 付丹丹.貝葉斯網(wǎng)絡(luò)學(xué)習(xí)算法研究[J].大慶師范學(xué)院學(xué)報(bào),2011,31(3):36?38.
[6] 劉豫軍,夏聰.連續(xù)語(yǔ)音識(shí)別技術(shù)及其應(yīng)用前景分析[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(8):15?16.
[7] 黃程韋,趙力.實(shí)用語(yǔ)音情感的特征分析與識(shí)別的研究[J].電子與信息學(xué)報(bào),2011,33(1):112?116.
[8] 尤鳴宇.語(yǔ)音情感識(shí)別的關(guān)鍵技術(shù)研究[D].杭州:浙江大學(xué),2007.
[9] Tom White. Hadoop權(quán)威指南[M].周敏奇,王曉玲,金澈清,等譯.北京:清華大學(xué)出版社,2011:45?76.
[10] 劉鵬,黃宜華,陳衛(wèi)衛(wèi).實(shí)戰(zhàn)Hadoop[M].北京:電子工業(yè)出版社,2011:126?145.
[11] 汪光慶.基于SVM的網(wǎng)頁(yè)分類技術(shù)研究[D].北京:中國(guó)石油大學(xué),2011.
[12] 邊肇棋,張學(xué)工.模式識(shí)別[M].2版.北京:清華大學(xué)出版社,2002:296?300.
[13] 朱啟敏.基于云計(jì)算平臺(tái)的神經(jīng)網(wǎng)絡(luò)計(jì)算方法及其應(yīng)用研究[D].廣州:華南理工大學(xué),2014.