李燕萍,林 樂,陶定元
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210000)
基于GMM統(tǒng)計特性的電子偽裝語音鑒定研究
李燕萍,林 樂,陶定元
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210000)
數(shù)字多媒體技術(shù)的發(fā)展使多媒體信息得到廣泛使用和傳播,給人類的信息交流帶來極大的便利。隨著語音相關(guān)技術(shù)的發(fā)展與逐漸成熟,對于語音信號處理的應(yīng)用也越來越廣泛。數(shù)字多媒體信息易于修改的特點,使其面臨著惡意篡改帶來的嚴重危機。近年來,手機應(yīng)用軟件市場上出現(xiàn)了大量的變聲軟件,例如微信變聲器、超級變聲器等等,類似變聲器的下載量動輒上百萬,這些應(yīng)用軟件可使說話人的聲音發(fā)生巨大的改變,致使一般的聽話人無法辨認發(fā)音人的身份、年齡乃至性別,即使是對話者非常熟悉的人也很難識別出說話者的身份。提出了一種鑒定電子偽裝語音的方法,通過GMM模型建模,將其均值矢量構(gòu)成組合特征,然后基于SVM分類器進行訓(xùn)練和鑒別。通過對比語音偽裝前后的梅爾倒譜特征參數(shù)的統(tǒng)計特性變化,對特征參數(shù)的變化規(guī)律進行了分析研究。實驗結(jié)果表明,提出的方法對電子偽裝語音的鑒定正確率達到90%。
變聲軟件;電子偽裝語音;梅爾倒譜系數(shù);支持向量機;高斯混合模型
近年來,手機應(yīng)用軟件市場上出現(xiàn)了大量的變聲軟件,例如微信變聲器、超級變聲器等等,類似變聲器的下載量動輒上百萬,這些應(yīng)用軟件可使說話人的聲音發(fā)生巨大的改變,致使一般的聽話人無法辨認發(fā)音人的身份、年齡乃至性別,即使是對話者非常熟悉的人也很難識別出說話者的身份。……