秦 顥 劉 軍 張 宸
(北京物資學院 信息學院,北京101149)
國務院新聞辦公室發布的《中國的糧食安全》白皮書指出2001 年至2018 年年均進口的糧食總量中,大豆占比為75.4%[1]。不難看出,中國的大豆需求量遠遠高于生產量,缺口巨大,如何提高大豆產量迫在眉睫。大豆在生長、收獲和運送途中,種皮都有可能產生裂紋。大豆種皮產生裂紋后,種皮損傷嚴重的會降低種子發芽力和種子活力,同時會使籽粒和幼苗遭受微生物及害蟲的侵害,其造成產量損失約計8.6%~12.3%[2]。因此,必要的種子檢驗可以選出優質大豆,這對于大豆的增產意義重大。介于傳統的人工篩選法和機器篩選法對于種皮裂紋這一物理性狀的識別效率不高,實現對大豆種皮裂紋更高效的自動化識別就有著一定的研究意義。
本研究對大豆撞擊碰撞板產生的聲音進行處理與識別,進而區分種皮完好大豆與種皮裂紋大豆,其依據是不同的物理結構會產生不同的聲音。本文的研究內容是大豆碰撞聲的預處理方法,以待為后展開的特征參數提取和模型識別奠定基礎。
大豆碰撞聲信號的預處理主要包括前端處理,降噪處理和端點檢測。前端處理主要包括碰撞聲信號的采樣、量化、預加重、分幀和加窗[3]。
采樣是按照既定規則在原始信號上取值,將原本連續的模擬原始信號離散成一個個值。當采樣頻率大于兩倍原始信號最高頻率時,采樣生成的信號可替代原始信號,大大提高了可靠性。
量化就是用最接近的電平值代替采樣得到的瞬時值。
大豆碰撞聲信號經過采樣變成離散信號,再通過量化變成計算機能夠處理的數字信號。
在信號傳遞時,碰撞聲信號高頻分段會受損。為了抵消這種信號衰減以及降低信號失真帶來的影響,就需要傳輸前對信號高頻部分進行預加重。預加重一般采用一階數字濾波器,其公

圖1 大豆碰撞聲信號預加重
經過預加重的大豆碰撞聲信號如圖1 所示,可以明顯看出信號的高頻部分得到了加強,信噪比得到提高。
碰撞聲信號整體是不穩定的,但從局部來看,信號是穩定的[4]。分幀是對信號進行加窗處理,得到一個一個的信號幀片段,這些片段都具有短時平穩性。常用的窗函數包括矩形窗、漢明窗和漢寧窗。
矩形窗

漢明窗

漢寧窗

一般情況下,多使用漢明窗,但也要根據實際的情況選擇不同的窗函數。
由于外部噪聲的存在,錄制的大豆碰撞聲信號伴有噪聲,這對信號原始的聲學特性造成了破壞。為了還原信號和降低噪聲對后續相關分析的影響,就需要對采集到的碰撞聲信號進行降噪處理。
噪聲是指一切干擾人們休息、學習和工作的聲音,即人們不需要的聲音[5]。具體來說,大豆碰撞聲信號是帶噪信號,其中原始的純粹碰撞聲信號為目標信號,而同時采集到的環境聲就是噪聲。
噪聲具有可加性,通常分為沖擊噪聲、周期噪聲、寬帶噪聲等。
3.2.1 沖擊噪聲
沖擊噪聲一般來源于一些突發事件,比如爆破,打雷等,其聲音信號的瞬時幅值一般都非常大。消除沖擊噪聲的一種方法是對帶有噪聲的信號幅度求均值,并以此為判斷閾值,高于此值即為沖擊噪聲,將其濾除。
3.2.2 周期噪聲
周期噪聲,顧名思義就是有規律的重復的噪聲,比如勻速運轉的風扇、發動機所發出的噪聲。一般可以利用高通或低通濾波器濾除。
3.2.3 寬帶噪聲
寬帶噪聲的頻率比較均衡,從低頻到高頻都有,因此比較難以消除。
3.3.1 濾波降噪
基于濾波的信號降噪法通常用來濾除信號中特定頻率的噪聲信號,或者在特定的頻率范圍內對信號的頻譜進行整形[6]。周期噪聲的頻率有一定規律,利用濾波器可以有效消除。如果可以精確估算出噪聲信號,那么濾波降噪效果將十分顯著。常用的濾波器有三個:固定濾波器、自適應濾波器和傅里葉變換濾波器。
3.3.2 小波降噪
對于混有復雜噪聲的信號,傳統的傅立葉變換局限性較大,而小波變換具有多尺度分辨率、選基靈活、時域和頻域局部化特性、去相關性等特點,對于信號,通過多層分解,使得噪聲在不同的層上可以有良好的區分[7]。
小波降噪的原理為:經過小波變換,原始信號的小波系數較噪聲的小波系數而言較大。只要能夠選取到合適的閥值,就能有效區分原始信號和噪聲,從而達到降噪的目的。
短時過零率就是一幀語音信號經過零電平的次數[8]。
由圖2 可知,噪聲相比于碰撞聲信號幅值較小,所以大豆碰撞聲信號的過零率反而明顯小于背景噪聲的過零率。與此同時,碰撞聲信號的起始點與噪聲區別不大,造成了過零率比較相近的結果,不能夠準確判別目標信號的起始點,因此基于過零率的端點檢測不適合含噪大豆碰撞聲信號端點的判斷。

圖2 基于短時過零率的端點檢測
通常,噪聲蘊含的能量遠遠不如碰撞聲信號蘊含的能量。高信噪高條件下,可以利用短時能量區分碰撞聲信號和噪聲。
定義碰撞聲信號x(n)的短時能量[9]為:


圖3 基于短時能量的端點檢測
從圖3 可以看出,在高信噪比的條件下,可利用短時能量對整段音頻信號進行端點檢測,得到碰撞聲信號。然而在實際應用中,不能夠完全保證較高的信噪比,這時往往需要結合其他特征對信號進行綜合檢測。
設碰撞聲信號時域波形為x(n),加窗分幀處理后得到的第i幀語音信號為xi(m),則xi(m)滿足

式中,ω (m)為窗函數;i = 0,1,2,···;N 為幀長;T 為幀移長度。
對xi(m)進行離散傅里葉變換可得頻譜[10]

定義均值為

頻帶方差為


圖4 基于頻帶方差的端點檢測
由計算公式可知,影響頻帶方差的因素有碰撞聲信號的短時能量和頻帶的幅度大小,而碰撞聲信號的能量和頻帶幅度大小比噪聲要大,因此碰撞聲信號的頻帶方差要更大些。由圖4可知,利用頻帶方差可以有效區分碰撞聲信號和噪聲。


式中,pi(k) 為第i 幀第k 個頻率分量fk對應的概率密度;N為FFT 長度。
每個分析語音幀的短時譜熵定義為

由圖5 所示,譜熵對大豆碰撞聲信號和噪聲的區分度不太明顯,因此不太適合碰撞聲信號的端點檢測。
從短時過零率、短時能量、頻帶方差和譜熵四個方面對碰撞聲信號的端點檢測進行驗證,初步得到了短時能量和頻帶方差可以用于大豆碰撞聲信號的端點檢測。

圖5 基于譜熵的端點檢測
本文對大豆碰撞聲信號的預處理方法進行了研究學習,主要包括信號的預加重、加窗、分幀、降噪和端點檢測,并得到了初步的結果。這為之后的大豆碰撞聲信號特征參數的選取和模型的識別奠定了基礎。但是,大豆碰撞聲信號的預處理過程仍然存在一些問題:一是錄制環境比較安靜,信噪比較高,但實際運用中可能沒這么理想;二是處理的效率還有待加強。