張犇 李日興 高培喆 李爭琦



摘要:在司法語音檢驗過程中,由于檢材與樣本在錄制時,各自所選取的信道不同,促使語音在聽覺上產生差異,由于信道因素可能會導致素材的客觀真實性受損,以至于影響我們的語音司法檢驗。本文重點針對手機內部錄音,結合語音鑒定技術對其進行具體參數分析和圖譜比對,最終得出有針對性、實用性強的明確結論,對語音鑒定工作有較強的指導意義。
關鍵詞:語音;信道;手機錄音;圖譜
1.引言
隨著科學技術的發展和法制建設的完善,以諸多現代科學技術為基礎的視聽資料被刑事訴訟法規定為訴訟證據,司法語音檢驗是視聽資料作為證據進行檢驗的一個重要組成部分。語音檢驗技術方法日趨成熟的同時,檢驗鑒定人員開始更多地關注語料的獲取方式,由于硬件條件和采集環境所限制,在案件語音檢驗鑒定過程中,很難保證檢材和樣本獲取方式和途徑是一致的。其中,由于檢材與樣本在錄制時,信道的差異促使語音在聽覺上發生畸變。因此,我們在比對過程中就必須考慮這種差異帶來的影響。
本文將通過理論分析、實驗比對和數據統計分析等方式,對上述影響進行具體研究并得出相關結論,以期對司法語音檢驗工作提供有力補充。
2.語音信道及其影響
語音信道是指語音信號傳輸的途徑,它以傳輸語音的媒體和中繼通信設施為基礎,可分為有線信道和無線信道兩類。由于各種實際因素,信道所提供的頻帶總是有限的,信道特性也總是存在著不完善性。因此語音信號通過信道時,往往會或多或少地發生幅度和相位失真,從而產生波形失真,這就為語音傳輸信道差異分析奠定了基礎。在話音信號通過傳輸通路后,一般會受到如下幾種影響:
2.1總衰減
總衰減是指話路的輸入信號電平和輸出信號電平之差,它表示信號在整個話路傳輸后的減弱程度,也即總的傳輸損耗。總衰減越大,話路輸出的信號功率就越小,信噪比降低,通話的清晰度就越差。
2.2衰減頻率失真
衰減頻率失真是指信號通過信道時,不僅幅度被衰減,而且波形也可能發生畸變。由于話音信號占有一定的頻帶,因此經過話路傳輸后,如果在傳輸頻帶內各頻率成分的衰減不等,將會使接收到的信號波形失真。這種失真主要來源于傳輸系統的濾波器。
2.3噪聲
可分為熱噪聲、互調噪聲、串音和脈沖噪聲等。他們對傳真信號的影響是降低了信噪比S/N,最終使接收到的信號出現差錯或使傳輸速率下降,其中以串音和脈沖噪聲猶為常見。串音是指相鄰信道傳輸信號的相互干擾。脈沖噪聲一般是指持續時間小于1ms的電平突然變化,它具有突發性和較大的強度,雖然對話音信號影響不大,但對于頻譜的低頻區域也會產生一定的干擾。
2.4頻率偏差和諧波失真
頻率偏差是由于多路載波系統中調制與解調過程所用的載波供給系統的頻率不一致造成的。諧波失真是由于話路中存在非線性部件所引起的,系統中某不見因過載而進入非線性工作區域時,將會使信號產生諧波和各頻率成分的交互調制,造成附加的噪聲而導致信噪比的降低。
3.手機內部錄音
電話數字錄音的核心部件為數字錄音芯片,根據質量優劣,其錄音效果也分不同等級,普通的手機錄音芯片一般支持采樣率8000Hz,16位量化。通話錄音的基本原理是——語音信號經過濾波和放大后送入A/D轉換器,采樣量化后形成數字信號,再經過錄音軟件壓縮編碼而形成特定的語音文件格式。
語音從口中發出后,經過電話信道傳輸,受到電話受話器、編碼器、中轉系統、解碼器、和電話揚聲器等信道模塊的干擾,在信號頻率成分、功率分布等方面勢必會受到影響,影響程度可以通過后期的圖譜比對和數據分析來加以研究。手機受話器的頻率響應性能如圖1所示。
4.實驗及其分析
4.1實驗條件及方法
語料包括國際音標中的5個元音、10個數字、10個詞語和5個短句。
話者根據語料標準發音,使用手機——手機通話并在接收端開啟內部錄音功能,同時使用高質量麥克直接拾取語音輸入計算機,之后通過專用數據線和提取軟件把手機內部錄音輸入計算機,分別形成語音文件。
4.2實驗結果分析
4.2.1聽覺分析
通過手機信道錄入的語音(下稱X2)與麥克直錄語音(下稱X1)相比較存在明顯的區別。在音色上,麥克直錄語音聽起來非常接近話者真實發音,內容清晰、干凈,聽不出話語失真。而手機信道錄音存在著信號失真,音色感覺頻率成分有較大缺失;個別音節發音不清,有嗡聲存在,在內容識別上產生渾濁感;在整體聽覺上聲音較悶,聲音強度有一定增強。
4.2.2共振峰圖譜分析
檢材X2相對于樣本X1,各共振峰位置和形狀未發現明顯變化,但中高頻共振峰(F2、F3)相對于低頻共振峰(F1)出現明顯的能量增強現象,高頻共振峰(F4)能量有所衰減或者消失;輔音圖譜中頻區能量增強,低頻區(具體為1500Hz以下)能量有所減弱。如圖2,圖3所示。
4.2.3振幅曲線分析
通過觀察比對分析兩組音節的強度曲線,韻母部分走勢和強度基本不變(考慮兩種錄音方式的輸入輸出電平差異);聲母如果是送氣塞擦音,則強度有明顯提升,如果是爆破音,則強度也有一定提升,但效果不明顯。頻譜和共振峰分析結論中,X2效果語音中高頻區域能量得到加強,而絕大部分輔音的主要能量集中區就處于音節的中高頻區域,因此,含有輔音聲母音節的強度曲線變化會出現上述變化。
4.2.4基頻曲線分析
通過觀察分析兩組基頻曲線圖發現,部分音節基頻曲線出現畸變現象,具體為曲線斷裂、起始部位提升、尾部快速提升、部分曲線消失等現象。通過統計觀察,兩個以上元音組合發音時,發生上述畸變的現象較普遍;發送氣擦音[s]和[sh]時,經常會出現基頻曲線起始端畸變。
4.2.5共振峰數據分析
選取15個音節兩種信道下的共振峰一峰、二峰、三峰和基頻數據,應用數理統計的方法進行分析。表1給出兩組所選音節的F1、F2、F3的成對t檢驗和相關回歸分析結果,表中t值和p值分別表明兩種信道的各音節前三共振峰差異較顯著;在對應共振峰之間做相關回歸分析,得出相關系數處于0.82∽0.98之間。
由此。推出回歸方程并得到R2分別為0.95、0.98、0.96,說明利用回歸方程推算出的頻率值有較高的利用價值。
4.2.6基頻數據分析
對基頻曲線發生畸變的音節,測量其基頻平均值已經沒有統計價值,因此在四種調形音節中,選擇沒有發生畸變的音節測量,然后做成對雙樣本均值t檢驗和相關回歸分析,以研究其變化情況,結果見表2。
數據表明:兩種信道的四類調形基頻沒有顯著差異,但陰、陽調形的基頻均差明顯小于另外兩種,說明后者要比前者受信道變化的影響大,這與前面圖譜分析的結論相符。
4.2.7語音自動識別分析
把麥克直錄語音文件作為樣本輸入自動識別系統,庫容量為10000人,然后把手機內錄語音文件作檢材進行訓練比對,輸出的識別分數為0.057,識別結果為接受。該系統為中國刑警學院與清華大學合作開發的司法語音識別系統,目前,已經通過鑒定并進行行業推廣。
5.結論
語音經受信道干擾后,在聽覺上產生失真,有頻率成分缺失現象。圖譜比對發現各共振峰位置和走勢未發生明顯變化,但中高頻區峰的能量明顯增強,而低頻峰的能量明顯減弱。
數據分析的結果表明:各音節共振峰受信道影響在數值上發生較明顯變化,分析這種變化是由于語音受信道影響后,除頻率分布變化外,常規測量各共振峰均值的方法會帶來較大誤差所造成的。
通過觀察比對兩組音節的強度曲線,輔音所產生亂紋沖直條的能量也有所增強,尤其是送氣塞擦音;韻母部分走勢和強度基本不變(考慮兩種錄音方式的輸入輸出電平差異);后期通過頻譜曲線走勢變化情況可以印證上述結論。
對四種基音調形音節的基頻數值進行檢驗未發現顯著變化,但可以得出上、去調形比陰、陽調形更易受信道影響。提取基頻曲線時發現,部分音節的基頻曲線發生畸變,分析推測此類現象是由于設備因素造成的特殊現象。
自動識別結果發現信道差異被系統接受,但被識別的相似度得分普遍較低。
參考文獻:
[1] 岳俊發、王英利(1996)《聲紋鑒定》。北京:警官教育出版社。
[2] 侯風雷、張萬軍、王炳錫(2002)電話信道對語音信號參數影響的研究[J]。信息工程大學學報。
[3] 周靜芳、陳一寧、劉加、劉潤生(2004)說話人識別信道補償技術HNSSM[J]。清華大學學報。
[4] 王煒、王炳錫、王波(2004)信道補償技術的發展及其在說話人識別上的應用[J]。語音技術。
[5] 張輝、曹麗娜《現代通信原理與技術》。西安:西安電子科技大學出版社。