朱龍珠,田 諾,張 全
(國家電網(wǎng)有限公司客戶服務中心,天津 300000)
語音作為人類情感交流的重要媒介,對于語音情感的分析便成為語音系統(tǒng)發(fā)展過程中較為關鍵的一部分[1]。為此,不少研究學者針對語音情感的在線識別問題進行研究,由此獲取語音系統(tǒng)改良中的重要數(shù)據(jù)[2]。由于在語音情感在線識別研究過程中需要較為精準的語音分析數(shù)據(jù),對于收集的語音信息要求較高,因此需集中分析語義狀況,獲取相應的識別空間[3]。
目前,國內(nèi)外研究大多數(shù)偏向于系統(tǒng)信息整合,將收集的語音數(shù)據(jù)統(tǒng)一放置于識別空間中,利用空間信息不斷推測語音數(shù)據(jù)發(fā)聲信號的狀況,并在狀況數(shù)據(jù)中配置情感監(jiān)測裝置,根據(jù)獲取的信號頻率判斷語音情感,這種方法具有較高的數(shù)據(jù)操作準確率,能夠完整再現(xiàn)語音表達時的真實狀態(tài)[4]。但在實際研究過程中未對數(shù)據(jù)信息進行預處理,且語音數(shù)據(jù)掌控方面較為單一,無法滿足系統(tǒng)全面了解的需求,導致語音數(shù)據(jù)的處理效果較差[5]。針對上述問題,該文提出一種基于語義分析的語音情感在線識別方法。
為整合內(nèi)部語音信息特征,該文對語音數(shù)據(jù)進行信息提取操作,整合語義分析狀態(tài),由于語義分析具有信息類別分類的功能,首先利用其分類的數(shù)據(jù)進行數(shù)據(jù)狀態(tài)調(diào)整,將驗證裝置整合為系統(tǒng)操作提取器,按照提取的空間與標準的不同,將語義分析中的信號傳感裝備投放至中心語音數(shù)據(jù)提取空間中[6]。數(shù)據(jù)信號傳感圖如圖1 所示。

圖1 數(shù)據(jù)信號傳感圖
在實現(xiàn)對數(shù)據(jù)的提取后,整理提取的信息,分析其內(nèi)部語音環(huán)境,將環(huán)境數(shù)據(jù)縮減至半個空間狀態(tài)數(shù)據(jù),由空間狀態(tài)引導數(shù)據(jù)操作系統(tǒng)裝置,并根據(jù)裝置信息條件研究語音內(nèi)容,查找空間數(shù)據(jù)信息,設置數(shù)據(jù)信息查找公式如下:

式(1)中,A表示數(shù)據(jù)信息查找參數(shù),p表示內(nèi)部空間數(shù)據(jù),m表示數(shù)據(jù)操作系統(tǒng)裝置指數(shù),n表示內(nèi)部語音內(nèi)容函數(shù),c表示語音環(huán)境參數(shù)[7]。
根據(jù)上述操作,將獲取的查找參數(shù)收集至中心存儲空間中,并記錄此時的存儲狀態(tài),以備后續(xù)實驗操作研究。不斷增強模擬信息空間數(shù)據(jù)功能,簡化操作步驟,并將錄制的語音信息傳輸至分析通道中[8]。數(shù)據(jù)傳輸圖如圖2 所示。

圖2 數(shù)據(jù)傳輸圖
在圖2 中,語音數(shù)據(jù)隨著傳輸通道傳輸至相匹配的分析空間中,將屬于同一種類的數(shù)據(jù)與空間整合為一個集合,劃分集合類別,按照類別的性質(zhì)進行排序操作。合理規(guī)劃操作流程,時刻監(jiān)視通道中的數(shù)據(jù)狀態(tài),以此保證數(shù)據(jù)傳輸過程的安全性,加大內(nèi)部轉(zhuǎn)換力度,將語音數(shù)據(jù)轉(zhuǎn)換至分析空間中,實現(xiàn)對語音數(shù)據(jù)的分析操作[9]。
在完成語音數(shù)據(jù)的提取與分析后,對其內(nèi)部語音情感信息進行預處理操作。結(jié)合語義分析的數(shù)據(jù)分析性能,提升空間整理能力,標準化處理語音情感信息,處理的同時,將語義分析中的處理空間分解為不同的語音情感種類存儲空間[10]。空間數(shù)據(jù)分解圖如圖3 所示。

圖3 空間數(shù)據(jù)分解圖
獲取分解參數(shù),將這些參數(shù)集中記錄至流程環(huán)節(jié)空間中,結(jié)合語音情感數(shù)據(jù)端點函數(shù)檢測端點數(shù)據(jù)。當收集的語音情感數(shù)據(jù)信號頻率呈現(xiàn)陡峰向下陡增的趨勢時,表示該語音情感處于激動狀態(tài)[11]。此時,需按照狀態(tài)處理準則將此語音情感數(shù)據(jù)集中收錄至內(nèi)部調(diào)節(jié)空間中實施基本調(diào)節(jié),設置數(shù)據(jù)調(diào)節(jié)方程式:

式(2)中,T表示數(shù)據(jù)調(diào)節(jié)參數(shù),S表示語音情感數(shù)據(jù)狀態(tài)數(shù)值,E表示數(shù)據(jù)信號頻率參數(shù),N表示狀態(tài)處理準則參數(shù),Q表示內(nèi)部調(diào)節(jié)空間指數(shù)數(shù)據(jù)[12]。由此,完善空間調(diào)節(jié)信息狀態(tài),處理語音情感參數(shù),將收錄的數(shù)據(jù)全部應用于新式空間的構建中,以語音數(shù)據(jù)的音量信息分析數(shù)據(jù)的位置,并查找位置點,標記信息數(shù)據(jù),數(shù)據(jù)信息標記圖如圖4 所示。

圖4 數(shù)據(jù)信息標記圖
根據(jù)標記的數(shù)據(jù)信息過濾提取所有語音數(shù)據(jù),保留符合系統(tǒng)需求的數(shù)據(jù),清除與數(shù)據(jù)操作無關的干擾信號,達到對語音情感數(shù)據(jù)預處理的目的[13]。
在實現(xiàn)對語音情感數(shù)據(jù)的預處理后,集中處理數(shù)據(jù),將語義分析中的情感檢驗信息錄入語音情感在線識別操作中。該文利用決策樹算法,分析語音情感的流動狀態(tài),利用語音數(shù)據(jù)距離選取特征參數(shù),并盡可能地縮小實驗樣本識別范圍,保證識別的語音情感數(shù)據(jù)的精準性[14]。數(shù)據(jù)流動狀態(tài)監(jiān)測圖如圖5所示。

圖5 數(shù)據(jù)流動狀態(tài)監(jiān)測圖
利用SKIQ 計算決策樹的增長程度,避免因增長程度過緩而造成的語音情感數(shù)據(jù)分析不到位的狀況,加大中心空間語音情感數(shù)據(jù)的配置力度,對應決策樹的每層屬性處理數(shù)據(jù)識別方式,擴大訓練樣本容量,保證樣本存儲的完整性。清除決策樹中的類別表信息,將語音情感數(shù)據(jù)信息補充至此列表空間中,整理屬性列表數(shù)據(jù),設置整理公式如式(3):

式(3)中,C表示數(shù)據(jù)整理參數(shù),t表示訓練樣本容量數(shù)值,u表示決策樹類別表信息數(shù)據(jù)[15]。a表示對應的列表空間數(shù)據(jù),v表示需進行操作的數(shù)據(jù)信息[16]。
根據(jù)整理后的參數(shù)強化識別訓練,分辨語音信號振幅,通過振幅大小辨別情緒狀態(tài)。數(shù)據(jù)辨別圖如圖6 所示。

圖6 數(shù)據(jù)辨別圖
經(jīng)過上述操作步驟,不斷綜合識別處理信息功能,提升識別的有效率及準確率,完成語音情感的整體在線識別。
為精準評估該文基于語義分析的語音情感在線識別方法的識別性能,設置相應的實驗環(huán)境進行性能檢驗。將該文基于語義分析的語音情感在線識別方法與傳統(tǒng)語音情感在線識別方法研究的識別效果進行實驗對比。
針對語義分析數(shù)據(jù)操作的龐雜性以及語音情感在線識別系統(tǒng)信息整合的復雜性,需對其實驗環(huán)境進行數(shù)據(jù)篩選,依據(jù)收集的語音信息狀態(tài),不斷分析其所處的真實位置與產(chǎn)生條件,按照信息處理準則分配處理算法,并將處理后的數(shù)據(jù)進行一定程度的調(diào)整,使其符合實驗操作標準,并進行如下步驟的實驗研究操作:
1)挑選符合系統(tǒng)操作的語音數(shù)據(jù),時刻排除無關因素的干擾,并標定信號頻率信息狀態(tài)。設置基本測試環(huán)境,將所有的語音數(shù)據(jù)集中收集至該測試環(huán)境中,管理環(huán)境信息,并對語音情感數(shù)據(jù)進行分類。
2)獲取分類后的語音情感數(shù)據(jù),預加重數(shù)據(jù)信息,消除聲帶及嘴唇對語音數(shù)據(jù)的影響,避免外來信號的干擾,隨時調(diào)整語音環(huán)境,及時檢測環(huán)境數(shù)據(jù),清除異端數(shù)據(jù)信息,結(jié)合狀態(tài)系統(tǒng)數(shù)據(jù),標記情感數(shù)據(jù)波動信號。
3)在獲得語音信息后,調(diào)節(jié)環(huán)境標記參數(shù),將識別算法應用于操作的語音情感數(shù)據(jù)中,并通過語音情感數(shù)據(jù)的發(fā)射信號頻率計算此時的情感狀況,精準分析狀況數(shù)據(jù),并由此識別信息參數(shù),結(jié)束實驗操作。
在此實驗中,根據(jù)表1 所示實驗參數(shù)進行對比實驗,進一步提高整體對比效果。
圖7 和圖8 分別顯示出在實驗參數(shù)條件下,該文方法與基于數(shù)據(jù)分析的語音情感在線識別方法及基于SVM 的語音情感在線識別方法的識別準確率對比圖及識別信號接收完整度對比圖。

圖7 識別準確率對比圖

圖8 識別信號接收完整度對比圖
根據(jù)圖7、8 分析得出,基于數(shù)據(jù)分析的語音情感在線識別方法具有較高的識別準確率,但識別信號的接收完整度較低,基于SVM 的語音情感在線識別方法的信號接收完整度較高,但其識別準確率較低。而該文基于語義分析的語音情感在線識別方法的識別準確率及識別信號接收完整度均高于其他兩種傳統(tǒng)方法。
造成此種差異的原因在于該文方法結(jié)合了語音信息系統(tǒng),精準分析了語義數(shù)據(jù),并在此基礎上調(diào)整識別信息狀態(tài),按照標準化處理參數(shù)進行數(shù)據(jù)處理操作,整合狀態(tài)數(shù)據(jù),同時追蹤數(shù)據(jù)存在的模式狀況,提升識別系統(tǒng)的識別有效率,獲取較好的識別效果。而傳統(tǒng)基于數(shù)據(jù)分析的語音情感在線識別研究分析了信息的存在模式,并分類語音情感信息數(shù)據(jù),在數(shù)據(jù)操作的標準化處理條件下,實現(xiàn)對語音情感數(shù)據(jù)的多種調(diào)節(jié),獲取較高的識別準確率,但在操作的同時未對數(shù)據(jù)信息的操作步驟進行調(diào)節(jié),收集裝置的收集效果較差,無法獲取較為完整的信號數(shù)據(jù),致使其信號接收度較低。傳統(tǒng)基于SVM 的語音情感在線識別研究優(yōu)化了語音信息狀況,并對其接收系統(tǒng)的中心性能進行強化,不斷分解出不同的強化信息數(shù)據(jù),在數(shù)據(jù)系統(tǒng)進行完整收集的同時標記系統(tǒng)狀態(tài),時刻監(jiān)視狀態(tài)信息,保證了操作安全性,具有較高的信號接收完整度,但正因如此,對于識別信息的管理力度較小,無法集中收集所有數(shù)據(jù),數(shù)據(jù)整合效果較差,導致其識別準確率較低。
綜上所述,該文基于語義分析的語音情感在線識別方法能夠更好地調(diào)整數(shù)據(jù)識別狀況,優(yōu)化識別操作,整合信息數(shù)據(jù),實現(xiàn)語音情感的較好識別,能夠更好地為使用者提供優(yōu)質(zhì)服務。
該文在傳統(tǒng)語音情感在線識別方法的基礎上提出了一種新的基于語義分析的語音情感在線識別方法,并對此進行實驗。實驗結(jié)果表明,該方法的識別效果明顯優(yōu)于傳統(tǒng)方法的識別效果,具有較為廣闊的發(fā)展空間。