999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

非平穩強噪聲環境中的音頻信號端點檢測系統

2024-09-16 00:00:00郭凱麗王建英
現代電子技術 2024年10期
關鍵詞:特征信號檢測

摘" 要: 為提高音頻信號端點識別能力,設計一種非平穩強噪聲環境中的音頻信號端點檢測系統。構建音頻信號端點檢測硬件單元,利用預處理單元對音頻信號進行預加重、分幀以及加窗處理后,端點檢測單元在提取處理音頻信號的MFCC倒譜距離特征、頻帶方差特征的基礎上,依據動態閾值估計策略確定恰當閾值;通過雙特征參數雙門限法來實現對音頻信號起止點的確定以及語音幀和非語音幀的分離;利用包絡確定延時單元,防止噪聲段被錯誤識別為語音段,避免出現拖尾太長問題。實驗結果表明,所設計系統可實現非平穩強噪聲環境音頻信號端點檢測,檢測誤差滿足設定要求。

關鍵詞: 非平穩噪聲; 強噪聲; 音頻信號; 端點檢測; MFCC特征; 頻帶方差; 動態閾值估計; 雙門限法

中圖分類號: TN919?34; TP311" " " " " " " " " "文獻標識碼: A" " " " " " " " " " " 文章編號: 1004?373X(2024)10?0018?05

Audio signal endpoint detection system in non?stationary strong noise environment

Abstract: In order to improve the ability of audio signal endpoint recognition, an audio signal endpoint detection system is designed in non?stationary and strong noise environments. A hardware unit for audio signal endpoint detection is constructed, and a preprocessing unit is used to perform pre emphasis, framing, and windowing processing on the audio signal. On the basis of extracting the MFCC cepstral distance feature and frequency band variance feature of the audio signal, the endpoint detection unit can determine the appropriate threshold based on the dynamic threshold estimation strategy. The dual feature parameter and dual threshold method is used to determine the start and end points of the audio signal and separate the speech and non speech frames. The envelope is used to determine the delay unit to prevent the noise segment from being incorrectly recognized as a speech segment and to avoid the problem of too long trailing. The experimental results show that the designed system can reailze the endpoint detection of audio signals in non?stationary strong noise environments, and the detection error can meet the set requirements.

Keywords: non?stationary noise; strong noise; audio signal; endpoint detection; MFCC features; frequency band variance; dynamic threshold estimation; dual threshold method

0" 引" 言

音頻是一種包含聲音信息的媒體形式,可以呈現語言、音樂和其他聲音內容[1?2]。在實際生活中,無法保證音頻信號采集環境絕對安靜,因此,音頻信號采集質量大打折扣,導致大量有效信號淹沒在噪聲中難以分辨[3]。音頻信號端點檢測的目的是剔除采樣信號中的噪聲段信息,實現音頻起止點的分割[4]。高精度音頻信號端點檢測不僅可使音頻識別難度、處理時長得到降低,而且能夠實現音頻中噪聲以及無聲信號的剔除,避免給音頻的分析與處理帶來不利影響[5]。

肖思等在多通道空間特征提取的基礎上,采用雙門限閾值法判斷當前幀是否為語音幀,以實現其端點檢測[6]。但是該方法的檢測效果并不理想,這是因為僅通過這兩個特征很難在非平穩強噪聲環境下實現語音段的精準分辨。韓云霄等在此基礎上進行改進,通過將音頻信號的梅爾頻譜倒數系數距離與短時能量、過零率特征相結合,提高了音頻信號端點檢測效果,但因該系統所用閾值不具有時變性,導致難以在非平穩強噪聲環境下取得較好的端點檢測效果[7]。

鑒于以上研究存在的不足,本文設計一種非平穩強噪聲環境中的音頻信號端點檢測系統,改善端點檢測效果,提高音頻信號識別能力。實驗結果表明,所設計系統可實現非平穩強噪聲環境音頻信號端點檢測,檢測誤差滿足設定要求。

1" 音頻信號端點檢測系統設計

1.1" 音頻信號端點檢測硬件單元設計

圖1為音頻信號端點檢測系統硬件框架。

所設計系統共由三部分硬件單元構成,各部分具體功能如下。

1) 音頻信號預處理單元。該單元可實現原始音頻信號的預加重、分幀以及加窗處理,前者的作用是加強原始音頻信號高頻分量的辨識度,后者的作用是確保各幀音頻信號的起止端具有較好的連續性。通過對音頻信號作分幀處理,以獲得相對平穩的近似音頻信號,便于后續音頻信號端點檢測效果的提升。

2) 端點檢測單元。該單元可實現音頻信號MFCC倒譜距離特征以及頻帶方差特征的提取,在利用中值濾波對其進行平滑處理后,根據動態閾值修正策略,通過雙門限法實現非平穩強噪聲音頻信號的端點檢測。

3) 包絡確定延時單元。該單元的作用是防止噪聲段被錯誤識別為語音段,導致音頻信號端點檢測存在拖尾太長問題。

1.2" 多特征與動態閾值下的音頻信號端點檢測算法

1.2.1" 音頻信號MFCC倒譜距離特征的提取

式中:[En,k]為第[n]幀音頻信號第[k]條譜線能量值。

設定噪聲幀時長為0.2 s,即12幀,計算功率譜均值,并將其視為噪聲均值,公式為:

計算各幀功率譜值與噪聲功率譜均值之差,實現音頻信號的去噪,確定純凈語音功率譜值,計算公式為:

式中[a]、[b]均為固定常數。

利用Mel濾波器確定Mel子帶能量,多個[Hmk](其中[1lt;mlt;M])三角形帶通濾波器可構成一個Mel濾波器。對于第[n]幀音頻信號,其[m]子帶上的Mel子帶能量通過下式確定:

計算[Sn,m]的對數后,再作離散余弦變換,即可確定MFCC系數,公式為:

計算[MFCCn,j]均值,將其視為音頻信號噪聲倒譜系數預估結果后,通過下式即可完成信號[xin]的MFCC倒譜距離特征提取:

式中:[p]表示總階數;[j]表示第[j]階。

1.2.2" 音頻信號的頻帶方差特征提取

在提取音頻信號MFCC倒譜距離特征時,采用離散傅里葉變換對其進行預處理,但該步驟會導致音頻信號中的某些細節信息丟失或改變,從而降低了特征的準確性。

音頻信號的頻帶方差特征可實現語音段、噪聲段的有效辨識,因此,本文在提取音頻信號MFCC倒譜距離特征的基礎上,進一步提取音頻信號的頻帶方差特征。

設定[Xi(n)=Xi1,Xi2,…,Xin],通過計算第[i]幀音頻信號幅值的平均值[χi],可得其頻帶方差計算公式為:

通過[Di]可確定[Xin]對于各頻帶的改變程度,實現音頻信號能量特征的刻畫。

1.2.3" 音頻信號端點檢測流程

不同頻帶的方差值受到環境噪聲、音頻設備等因素的影響,導致不同頻帶之間的方差差異不明顯,使得區分噪聲和語音起始點難度較高。為此,本文采用雙門限法實現音頻信號端點檢測,即在選擇合適音頻信號特征的基礎上,依據動態閾值估計策略確定恰當閾值,通過雙特征參數雙門限法實現音頻信號起止點的確定,以及語音幀與非語音幀的分離。

圖2為基于多特征與動態閾值的音頻信號端點檢測流程。

端點檢測流程

1) 對非平穩強噪聲音頻信號進行預加重、加窗、分幀處理,設定幀長為200 ms。

2) 處理后的音頻信號作為譜減法的輸入,以抑制強噪聲對音頻信號特征提取效果的影響,得到處理后的音頻信號[xin];再采用功率倒譜分析方法獲得MFCC倒譜距離[dMFCCi]特征。

3) 對噪聲抑制后的音頻信號進行離散傅里葉變換,得到25個子帶,各子帶包含4條譜線,獲得各幀音頻信號的子帶方差計算結果[Di,1]。

4) 采用中值濾波算法分別對提取的[dMFCCi]、[Di,1]特征進行處理,以減少野點對音頻信號端點檢測效果的影響,提高特征的平滑度。

5) 動態閾值的修正。利用前導無話段音頻時間[NIS]確定該段幀數后,確定該段音頻的[dmi]、[Dm(i)]閾值分別為[dmth]和[Dmth],計算公式為:

式中:[t]表示音頻時間,[t∈NIS];[dmi]、[Dm(i)]為對應特征處理結果。通過對閾值的調整,可以達到音頻信號端點檢測效果提升的目的。調整公式為:

式中[α]、[θ]為常數。

6) 通過兩級判斷實現音頻信號端點檢測。首先,根據[dmth]篩選出高閾值[T2],實現音頻信號端點[11?13]的初次判斷,大于[T2]的即為語音段;反之,退回步驟5)進行門限值[T1]、[T2]的修正。再將[dmth]作為依據完成[T1]的篩選后,沿相交點兩側進行擴大檢索,確定[dmth]、[T1]相交之處,實現音頻信號起止點的粗檢測。然后,根據[Dmth]篩選出高門限值[T4],沿音頻信號的粗檢測起止點繼續向兩側進行擴大檢索,大于[T4]門限值的即為語音段;反之對[T3]、[T4]門限值進行修正,再次將[Dmth]作為依據完成[T3]的篩選后,繼續沿先前確定的起止點向兩側進行擴大檢索,確定[Dmth]、[T3]相交之處,實現音頻信號起止點的最后確定。

2" 實驗分析

以Intel 酷睿i5 8400為CPU,NVIDIA GTX 1060為GPU,在Linux操作系統下設計音頻信號端點檢測系統。以數據庫存儲的純凈音頻信號為實驗對象,將不同類型強干擾噪聲加入到純凈音頻信號中,構建包含0 dB、5 dB、15 dB、25 dB四種信噪比的音頻信號樣本數據集。設定采樣頻率、位數分別為8 kHz、16 bit,利用設計系統對樣本數據集中的音頻信號進行端點檢測,分析其檢測效果。

音頻信號的不平穩性會對其端點檢測效果產生不利影響,故本文對音頻信號樣本進行分幀等處理,確保音頻信號連續不間斷。設定各幀音頻信號時長為20 ms,該信號由320個采樣點構成,幀移為10 ms,大致包含160個采樣點。以樣本數據集中的bliesky1.wav音頻信號為例,其播放時長為10 s,純凈以及5 dB強噪聲下的bliesky1.wav音頻信號波形如圖3所示。

采用設計系統對該強噪聲音頻信號進行端點檢測,將文獻[6]系統、文獻[7]系統作為對比系統,通過對比分析各系統的音頻信號端點檢測結果,驗證設計系統的檢測性能。各系統的檢測結果如圖4~圖6所示,其中起始點用豎實線標記,終止點用豎虛線標記。

分析圖4~圖6可知:應用設計系統對5 dB信噪比下的強噪聲音頻信號進行端點檢測,可完成音頻信號起止點的檢測;文獻[6]系統存在語音段、噪聲段誤檢問題;文獻[7]系統未能成功檢測出5.7~6.2 s區間的語音段信號,存在語音漏檢問題。實驗結果表明,本文方法具有音頻信號端點檢測性能,檢測效果優于對比系統。

將不同類型噪聲注入到bliesky1.wav純凈音頻信號中,采用手工方式對音頻信號端點進行標注,并將其作為端點標記實際值,若檢測結果與實際標注結果誤差在3幀以內,則認為檢測結果正確。

通過對比分析不同系統檢測結果與實際標記結果差異,驗證本文系統的檢測效果,實驗結果如表1所示。

分析表1可知:對含有不同噪聲的音頻信號進行端點檢測,設計系統獲得的音頻端點檢測結果與實際手工標注結果誤差在3幀之內,可達到實驗設定要求,具有突出的檢測效果;文獻[6]系統和文獻[7]系統的音頻信號端點檢測結果誤差均高于允許值,前者檢測的音頻信號起止點均不夠準確,存在語音段、噪聲段錯誤檢測問題,后者只在終止點處存在錯誤分割。綜上可知,設計系統具有更優的音頻信號端點檢測性能,檢測效果顯著。

3" 結" 論

為提高音頻信號端點識別能力,設計一種非平穩強噪聲環境中的音頻信號端點檢測系統。構建音頻信號端點檢測硬件單元,利用預處理單元對音頻信號進行預加重、分幀以及加窗處理后,端點檢測單元在提取處理音頻信號的MFCC倒譜距離特征、頻帶方差特征的基礎上,依據動態閾值估計策略確定恰當閾值;通過雙特征參數雙門限法來實現對音頻信號起止點的確定以及語音幀和非語音幀的分離;利用包絡確定延時單元,防止噪聲段被錯誤識別為語音段,避免出現拖尾太長問題。在構建的音頻信號樣本數據集上,通過對比實驗分析所設計系統的音頻信號端點檢測效果,以驗證該系統的實際應用效果。實驗結果表明:所設計系統可實現音頻信號端點檢測并標記出起始位置,檢測誤差滿足設定條件,檢測效果較好。

參考文獻

[1] 羅思洋,龍華,邵玉斌,等.噪聲環境下多特征融合的語音端點檢測方法[J].云南大學學報(自然科學版),2021,43(4):671?680.

[2] 俞景彥,趙曉群.噪聲環境下應用于語音標注的端點檢測算法研究[J].南京郵電大學學報(自然科學版),2021,41(1):25?33.

[3] 陳錫鍛,張恪萊.一種低信噪比環境下的語音端點檢測算法[J].電聲技術,2023,47(4):66?68.

[4] 吳亞文,邵睿,李淼,等.基于改進EMD?TEO倒譜距離的生豬音頻信號端點檢測[J].中國農業大學學報,2021,26(4):104?116.

[5] 卜玉婷,曾慶寧,鄭展恒.一種低信噪比環境下的語音端點檢測算法[J].聲學技術,2020,39(5):592?602.

[6] 肖思,龔杰,李寶清.低信噪比環境下的多通道語音端點檢測算法[J].中國科學院大學學報,2023,40(5):687?693.

[7] 韓云霄,邵清,符玉襄,等.復雜噪聲中基于MFCC距離的語音端點檢測算法[J].計算機工程,2020,46(3):309?314.

[8] 馬宇飛,陳驍,王荔,等.一種基于Gammatone濾波器組的語音識別噪聲魯棒特征[J].電聲技術,2022,46(9):97?100.

[9] 羅勇江,楊騰飛,趙冬.色噪聲下基于白化頻譜重排魯棒主成分分析的語音增強算法[J].電子與信息學報,2021,43(12):3671?3679.

[10] 張添添,王婧.基于At?LSTM模型的音/視頻雙流語音識別算法仿真[J].計算機仿真,2023,40(1):251?254.

[11] 蔣學仕.基于噪聲估計的改進能量熵語音端點檢測算法[J].電訊技術,2021,61(8):1026?1033.

[12] 朱敏.基于改進語音信號雙門限法端點檢測算法的研究[J].湖南文理學院學報(自然科學版),2023,35(3):48?53.

[13] 王中正,王鑒,韓焱,等.一種艦載低信噪比環境下的音頻端點檢測算法[J].兵器裝備工程學報,2023,44(3):197?203.

[14] 林斌,胡國平,周豪,等.強干擾及非平穩噪聲復合背景下相干信源的DOA估計方法[J].現代雷達,2022,44(5):72?78.

[15] 馬世龍,徐雅南.一種非平穩噪聲背景下的線譜相干檢測方法[J].數字海洋與水下攻防,2021,4(3):188?194.

猜你喜歡
特征信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
抓住特征巧觀察
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 国产精品免费电影| 在线精品视频成人网| 欧美激情福利| 青青青国产视频| 亚洲另类第一页| 丁香综合在线| 色男人的天堂久久综合| 欧美狠狠干| 久久亚洲中文字幕精品一区| 美女亚洲一区| 成人夜夜嗨| 538国产视频| 日韩欧美国产成人| 免费jjzz在在线播放国产| 热99精品视频| 久久福利片| 日本高清免费不卡视频| 无码av免费不卡在线观看| 亚洲人人视频| 99re热精品视频国产免费| 在线a网站| 潮喷在线无码白浆| 亚洲香蕉伊综合在人在线| 国产99在线| 91po国产在线精品免费观看| 国产最新无码专区在线| 国产男女免费视频| 亚洲中文字幕在线观看| 欧美一区二区啪啪| 久久婷婷五月综合97色| 日韩精品免费在线视频| 色偷偷综合网| 久久综合五月婷婷| 久久99这里精品8国产| 凹凸国产分类在线观看| 在线国产综合一区二区三区| 在线免费看片a| 国产精品偷伦视频免费观看国产| 亚洲成人一区二区三区| 国产精品偷伦视频免费观看国产| 99久久精品无码专区免费| 一级毛片免费观看不卡视频| 亚洲av无码成人专区| 亚洲欧洲AV一区二区三区| 免费全部高H视频无码无遮掩| 精品久久蜜桃| 久久精品免费国产大片| 91啪在线| 少妇人妻无码首页| 国产成人免费| 国产精品分类视频分类一区| 久久久精品国产SM调教网站| 亚洲欧美自拍一区| 亚洲一区第一页| 四虎永久在线精品国产免费| 国产精品永久免费嫩草研究院| 精品国产福利在线| 国产丰满大乳无码免费播放| 免费jizz在线播放| 国产精品性| 波多野结衣在线se| 亚洲美女一级毛片| 香蕉久久永久视频| 91久久大香线蕉| 一区二区理伦视频| 毛片网站免费在线观看| 99热在线只有精品| 91福利免费| 国产青榴视频| 欧美精品亚洲精品日韩专区| 午夜精品国产自在| 丁香五月激情图片| 国产成人综合亚洲网址| 中文字幕无码制服中字| 色妞永久免费视频| 中文天堂在线视频| 国内自拍久第一页| 久久久久青草线综合超碰| a网站在线观看| 中文字幕波多野不卡一区| 亚洲日韩国产精品无码专区| 男女精品视频|