999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

飛機駕駛艙噪聲環境下的飛行員語音端點檢測

2018-01-19 00:53:56,,,
計算機工程 2018年1期
關鍵詞:信號檢測

, ,,

(上海交通大學 a.航空航天學院; b.電子信息與電氣工程學院,上海 200240)

0 概述

民用航空飛行安全是民用航空器有效運行的基礎[1]。當前,航空人為因素已經成為導致飛行事故最為主要的因素。飛機駕駛艙中的人為因素研究作為航空人為因素研究的重點,需要準確地識別和測量出飛行員的行為或動作,例如通信、導航、執行檢查單等,從而評價飛行員的工作負荷,對飛機駕駛艙的設計或飛行員操作流程進行改進,避免由于飛行員任務負荷過重導致的人為操作錯誤[2]。

飛行員語音信息是分析飛行員行為或動作的重要依據,利用語音端點檢測(Speech Endpoint Detection,SED)技術可以提取語音記錄中的飛行員語音[3]。然而飛機駕駛艙中的噪聲環境十分復雜,包括發動機噪聲、飛機飛行時外部氣流紊流聲、機艙內被操縱器件的活動聲、空調噪聲等,使得在低信噪比的情況下,基于線譜頻率、全帶寬信號能量、低頻帶信號能量或過零率的傳統語音端點檢測方法的檢測效果急劇下降[4]。

有研究表明,語音的共振峰頻率信息能更有效地體現語音信號的時變特性[5]。基于此結論,文獻[6]利用譜減法進行降噪,并將降噪后語音的子帶譜熵作為判決參數實現語音端點檢測。但是譜減法比較適用于噪聲平穩的條件,其對于非平穩的、復雜的航空背景噪聲抑制能力較弱,且在降噪過程中會產生音樂噪聲[7]。子帶譜熵能有效地區分語音和噪聲,但在有嘈雜人聲時性能較差,而此時語音與噪聲的能量仍是超過噪聲的,因此,文獻[8]引入一種結合熵與能量的判決參數,但該文獻方法在低信噪情況下性能不穩定。

針對飛機駕駛艙中的強噪聲環境,本文結合最優改進對數譜幅度估計(Optimally Modified Log-Spectral Amplitude Estimator,OM-LSA)語音增強算法與Teager能量算子(Teager Energy Operator,TEO),提出一種魯棒語音端點檢測方法。首先通過OM-LSA算法對含噪語音數據進行初步降噪處理;然后利用TEO對噪聲的抑制作用進一步濾除殘留的噪聲,降低其對語音端點判決的干擾;最后整合降噪后語音的能量值與譜熵得到端點檢測的判決參數,實現強航空背景噪聲環境下對飛行員語音端點的有效檢測。

1 檢測原理

1.1 OM-LSA算法

OM-LSA算法作為一種單通道頻域語音增強算法,能夠適應多種噪聲環境,在保護較弱語音信號分量的同時,可避免音樂噪聲的產生。該算法對于低輸入信噪比和非平穩噪聲尤其有效[7]。假設語音信號為s(n),疊加一個不相關的噪聲信號u(n),構成含噪語音信號y(n):

y(n)=s(n)+u(n)

(1)

其中,s(n)和u(n)是統計獨立的。

對含噪語音信號y(n)加窗分幀處理后,得到第i幀語音信號yi(m),通過短時傅里葉變換求yi(m)的傅里葉變換系數,如式(2)所示。

Y(k,i)=S(k,i)+U(k,i)

(2)

其中:k為頻率分量;i為幀數。

OM-LSA算法是基于最小均方誤差的對數幅度譜估計器,對于符合高斯分布的語音和噪聲信號,可以通過式(3)估計語音信號的傅里葉變換系數。

(3)

語音存在時的增益函數GH1可以根據下式估計得到:

(4)

其中,υξγ/(1+ξ)。

(5)

1.2 Teager能量算子

TEO是一個強大的非線性算子,可以跟蹤調制能量并識別瞬時幅度和頻率[10-11]。TEO對噪聲具有抑制作用,可以進一步濾除含噪語音信號經OM-LSA算法處理后殘留的噪聲[12]。

在離散時間條件下,s(n)的TEO定義如式(6)所示,含噪語音信號y(n)的TEO如式(7)所示。

Ψd[s(n)]=s(n)2-s(n+1)s(n-1)

(6)

Ψd[y(n)]=Ψd[s(n)]+Ψd[u(n)]+

(7)

從上述推導可以看出,TEO主要提取的是含噪語音信號中語音的能量。圖1顯示了含噪語音信號y(n)和Ψd[y(n)]的語譜圖,y(n)的信噪比為10 dB。

圖1 語譜圖對比

對比語譜圖可以看出,TEO不僅抑制了噪聲能量,并且在保留語音信號能量的同時,突出了語音的共振峰信息。

1.3 短時能量與子帶譜熵

設各幀語音信號yi(m)的幀長為N,短時能量指各語音幀的能量,其定義如下:

(8)

圖2為y(n)和Ψd[y(n)]的短時能量曲線。可以看出,y(n)的能量值是噪聲能量與語音能量的疊加,而Ψd[y(n)]的能量值曲線能較好地跟蹤純凈語音信號能量的變化,且在噪聲段更平滑。

圖2 短時能量曲線對比

譜熵反映了離散信源在頻域內幅值分布的無序性。將熵值作為特征參數進行端點檢測的實驗結果表明,語音的熵與噪聲的熵存在較大區別[13]。

子帶譜熵的提出是為了消除每一條譜線幅值受噪聲影響的問題,其將每幀語音信號的全頻帶均勻地分成Nb個子帶,語音信號第i幀的第w個子帶的能量譜為:

(9)

相應地,每幀各子帶的歸一化概率密度pb(w,i)和每幀的子帶譜熵Hb(i)分別為:

(10)

(11)

圖3為y(n)和Ψd[y(n)]的子帶譜熵曲線。可以看出,當語音信噪比下降時,子帶譜熵對語音和噪聲的區分性也相應下降。

圖3 子帶譜熵曲線對比

1.4 端點檢測方法

本文結合OM-LSA語音增強算法和TEO對飛行員語音記錄中的航空背景噪聲進行抑制,然后計算降噪后語音信號的短時能量與子帶譜熵。從圖2和圖3可以看出,在語音中的有話區間,短時能量曲線是向上凸起的,而子帶譜熵曲線卻相反,其在有話區間向下凹陷。若將兩者的比值作為雙門限判決的參數,則可以放大有話區間的判決參數值,從而實現強航空背景噪聲環境下的飛行員語音端點檢測。基于上述分析,本文方法的檢測過程如圖4所示。

圖4 語音端點檢測過程

(12)

圖5為y(n)和Ψd[y(n)]的歸一化能熵比曲線。可以看出,基于TEO的能熵比曲線增強了語音與噪聲段的區分性,且在噪聲段更平滑。

圖5 能熵比曲線對比

利用能熵比檢測語音端點的主要步驟如下[14]:

1)選取一個較高的閾值(門限)T2對EERTEO(i)進行一次粗判,高于T2的肯定是語音。

2)選取一個較低的閾值(門限)T1,從1)中的交匯點向兩旁擴展搜索,分別找到EERTEO(i)與T1相交的2個點,將其判定為語音的起止點。

2 實驗與結果分析

2.1 實驗場景及數據

實驗中的飛行員語音記錄采集自如圖6所示的駕駛艙中。

圖6 實驗場景

在飛行過程中,通過頭戴式麥克風采集飛行員語音,采樣率為8 kHz,采樣精度為16 bit,幀長選擇25 ms,幀移為10 ms。實驗對10段語音數據(總時長為48 min)進行檢測,計算檢測正確率與錯誤率的平均值。

2.2 實驗方法

首先利用OM-LSA語音增強算法對飛機駕駛艙中的語音記錄做增強處理,然后對基于短時能量與過零率比值的檢測算法(EZR)[15]、基于短時能量與譜熵比值的檢測方法(EER)以及本文方法進行比較,具體過程如圖7所示。

圖7 實驗過程

2.3 評價指標

對飛機駕駛艙中的飛行員語音記錄進行人工標定起止點,將算法檢測結果與手工標定的起止點進行比較,通過以下3個客觀評價指標來評價端點檢測方法的性能[5]:

1)語音幀檢測正確率,如式(13)所示。

PS=TS/frameS

(13)

其中:TS為語音信號中被正確判斷為語音幀的幀數;frameS為手動標定為語音幀的總數。

2)噪聲幀檢測正確率,如式(14)所示。

PN=TN/frameN

(14)

其中:TN為語音信號中被正確判斷為噪聲幀的幀數;frameN為手動標定為噪聲幀的總數。

3)檢測錯誤率,如式(15)所示。

PF=(FN+FS)/(frameS+frameN)

(15)

其中:FN為被錯誤判斷為語音幀的噪聲幀數;FS為被錯誤判斷為噪聲幀的語音幀數。

2.4 結果分析

圖8(a)和圖8(b)為一段原始飛行員語音數據及其語譜圖,在136 Hz~2 170 Hz的頻率范圍內,語音信號的頻譜被噪聲的頻譜遮掩,在2 170 Hz~4 000 Hz頻率范圍內,可見語音信號的頻譜。圖8(c)和圖8(d)為語音經過OM-LSA算法初步降噪后的語音數據及其語譜圖,其中中低頻的噪聲能量被濾除,可見語音信號的頻譜,但在2 170 Hz~4 000 Hz頻率范圍內仍有能量較小的噪聲殘留。利用TEO進一步降噪后的端點檢測結果標記在圖8(c)中。

圖8 語音端點檢測結果

對飛行員語音數據集進行測試,得到的平均檢測正確率和錯誤率如表1所示。可以看出,本文方法在對語音幀和噪聲幀檢測的平均正確率上,均高于EZR和EER方法。

表1 3種方法的檢測性能對比 %

3 結束語

提取飛行員語音記錄中的飛行員語音信息,對于分析飛行員的行為或動作起到關鍵的作用,也是駕駛艙人為因素研究的重點。針對飛機駕駛艙中的強噪聲環境,以及基于能量參數和基于頻譜熵參數方法在低信噪比情況下的局限性,本文提出一種結合OM-LSA語音增強算法與TEO的語音端點檢測方法。首先利用OM-LSA算法對飛行員語音數據初步降噪;然后通過TEO做進一步的噪聲濾除,減少其對端點檢測的干擾;最后將降噪后語音的能量與頻譜熵比值作為端點檢測的判決參數,實現強航空背景噪聲下的飛行員語音端點檢測。實驗結果表明,本文方法對語音幀和噪聲幀的平均檢測正確率可達95.6%和92%,能準確獲取飛行員語音信息。后續工作將改進端點檢測過程中所使用的判決參數,進一步提高檢測正確率。

[1] KRAUSE S.Aircraft Safety:Accident Investigations,Analyses,& Applications[M].[S.l.]:McGraw-Hill Professional,2003.

[2] SHAPPELL S A,WIEGMANN D A.A Human Error Approach to Aviation Accident Analysis:The Human Factors Analysis and Classification System[M].[S.l.]:Ashgate Publishing,Ltd.,2012.

[3] KOLA J,ESPY-WILSON C,PRUTHI T.Voice Activity Detection[EB/OL].[2016-10-10].http://ece.umd.edu/merit/archives/merit2011/merit_fair11_reports/report_Kola.pdf.

[4] BENYASSINE A,SHLOMOT E,SU H Y,et al.ITU-T Recommendation G.729 Annex B:A Silence Compression Scheme for Use with G.729 Optimized for V.70 Digital Simultaneous Voice and Data Applications[J].IEEE Communications Magazine,1997,35(9):64-73.

[5] WANG K C,TASI Y H.Voice Activity Detection Algorithm with Low Signal-to-Noise Ratios Based on Spectrum Entropy[C]//Proceedings of the 2nd Inter-national Symposium on Universal Communication.Washington D.C.,USA:IEEE Press,2008:423-428.

[6] JIN Li,CHENG Jiang.An Improved Speech Endpoint Detection Based on Spectral Subtraction and Adaptive Sub-band Spectral Entropy[C]//Proceedings of Inter-national Conference on Intelligent Computation Tech-nology and Automation.Washington D.C.,USA:IEEE Press,2010:591-594.

[7] COHEN I,BERDUGO B.Speech Enhancement for Non-stationary Noise Environments[J].Signal Processing,2001,81(11):2403-2418.

[8] HUANG L,YANG C.A Novel Approach to Robust Speech Endpoint Detection in Car Environments[C]//Proceedings of International Conference on Acoustics,Speech,and Signal Processing.Washington D.C.,USA:IEEE Press,2000:1751-1754.

[9] 劉鳳增,李國輝,李 博,等.OM-LSA和小波閾值去噪結合的語音增強[J].計算機科學與探索,2011,5(6):547-552.

[10] KAISER J F.On a Simple Algorithm to Calculate the Energy of a Signal[C]//Proceedings of International Conference on Acoustics,Speech,and Signal Processing.Washington D.C.,USA:IEEE Press,1990:381-384.

[11] 霍鋮宇,黃曉林,寧新寶,等.基于Teager算子的短時HRV樣本熵算法[J].計算機工程,2012,38(23):281-283.

[12] 李 杰,周 萍,杜志然.短時TEO能量在帶噪語音端點檢測中的應用[J].計算機工程與應用,2013,49(12):144-147.

[13] SHEN J,HUNG J,LEE L.Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments[C]//Proceedings of ICSLP’98.Sydney,Australia:Australian Speech Science and Technology Association,1998:232-235.

[14] LI X,LI G,LI X.Improved Voice Activity Detection Based on Iterative Spectral Subtraction and Double Thresholds for CVR[C]//Proceedings of 2008 Workshop on Power Elec-tronics & Intelligent Transportation System.Washington D.C.,USA:IEEE Press,2008:153-156.

[15] 張徽強.帶噪語音信號的端點檢測和聲韻分離[D].長沙:國防科學技術大學,2005.

猜你喜歡
信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
“幾何圖形”檢測題
“角”檢測題
完形填空二則
孩子停止長個的信號
小波變換在PCB缺陷檢測中的應用
基于LabVIEW的力加載信號采集與PID控制
主站蜘蛛池模板: 国产SUV精品一区二区6| 国产全黄a一级毛片| 自偷自拍三级全三级视频| 欧美va亚洲va香蕉在线| 欧美激情成人网| 制服丝袜一区| 欧美精品高清| 色综合综合网| 成人日韩精品| 夜夜爽免费视频| 伊伊人成亚洲综合人网7777| 91美女在线| JIZZ亚洲国产| 国产成人久久综合777777麻豆| 啦啦啦网站在线观看a毛片 | 99无码中文字幕视频| 免费在线播放毛片| 欧美天堂在线| 国产在线精品人成导航| 国产sm重味一区二区三区| 伊人国产无码高清视频| 日韩无码黄色网站| 在线视频精品一区| 欧美成a人片在线观看| 97免费在线观看视频| 成人精品亚洲| 激情在线网| 欧美中文字幕一区二区三区| 老司机午夜精品视频你懂的| 国产精品无码AV片在线观看播放| 国产亚洲欧美在线专区| 国产青青草视频| 欧美α片免费观看| 国产第四页| 国产欧美自拍视频| 青青热久麻豆精品视频在线观看| 欧美性天天| 久久国产乱子| 欧美中文字幕一区| 香蕉伊思人视频| 日本成人精品视频| 996免费视频国产在线播放| 伊人无码视屏| 国产精品免费电影| 国模视频一区二区| 久久精品无码一区二区国产区| 国产免费福利网站| 亚洲成在线观看 | 日韩无码白| 午夜综合网| 黄色三级毛片网站| 欧美在线视频不卡第一页| 国产理论一区| 日本亚洲成高清一区二区三区| 午夜a级毛片| 2020国产精品视频| 五月婷婷欧美| 40岁成熟女人牲交片免费| 欧美专区日韩专区| 一级毛片在线播放| 亚洲av无码久久无遮挡| 国产91熟女高潮一区二区| 亚洲中文字幕手机在线第一页| 天天干伊人| 亚洲精品无码在线播放网站| 丁香六月综合网| 亚洲精品久综合蜜| 国产一区二区三区在线观看视频| 国产精品香蕉| 国产精品自在在线午夜| 国产人成午夜免费看| 亚洲va视频| 97视频精品全国在线观看| 好紧太爽了视频免费无码| 亚洲美女一区二区三区| 欧美日韩国产综合视频在线观看| 亚洲一区二区三区香蕉| 亚洲日韩Av中文字幕无码 | 亚洲第一中文字幕| 国产全黄a一级毛片| 老司机久久99久久精品播放| P尤物久久99国产综合精品|