999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

雙麥克風(fēng)語音增強算法研究與實現(xiàn)

2022-05-24 11:44:06崔智恒焦繼業(yè)祝禛天
電子設(shè)計工程 2022年10期
關(guān)鍵詞:檢測

崔智恒,焦繼業(yè),祝禛天

(1.西安郵電大學(xué)計算機學(xué)院,陜西 西安 710121;2.西安郵電大學(xué)電子工程學(xué)院,陜西 西安 710121)

語音增強是語音識別的重要組成部分,目前已經(jīng)被廣泛應(yīng)用于電話語音撥號、家電遙控、汽車設(shè)備的語音控制、智能玩具等領(lǐng)域。此外,隨著IC技術(shù)和信號處理技術(shù)的不斷發(fā)展,電子設(shè)備的體積變得越來越小,這就要求在擁有良好增強效果的前提下,減少麥克風(fēng)的數(shù)量,壓縮體積,才能滿足設(shè)備的小型化需求[1]。語音增強主要分為單通道語音增強和多通道語音增強。單通道的算法中都有一個基本的假設(shè),即噪聲是平穩(wěn)的[5],因此對非平穩(wěn)噪聲的抑制能力有限。為了解決單通道語音增強系統(tǒng)存在的不足,提出了多通道的語音增強算法[8]。對于小型化的嵌入式設(shè)備語音增強,如何在保證陣列體積不能過大及系統(tǒng)實時性的前提下,提升語音增強的性能成為需要解決的問題。

針對這一問題,文中提出一種結(jié)合一階差分陣列與語音活動檢測的雙麥克風(fēng)語音增強算法,并給出了硬件實現(xiàn)方案。

1 原理分析

1.1 雙麥克風(fēng)陣列模型

在不考慮聲學(xué)反射的條件下,雙麥克風(fēng)陣列中每個麥克風(fēng)所接收到的信號可以表示為:

式中,xi(t)(i=1,2)為兩個麥克風(fēng)接收到的帶噪語音信號,s(t)為純凈語音信號,ni(t)(i=1,2)為兩個麥克風(fēng)接收到的噪聲信號,Δt為聲源到達兩個麥克風(fēng)之間的延遲時間。

對于遠場語音信號,聲音到達兩個麥克風(fēng)的傳播模型[11]如圖1所示,圖中d為麥克風(fēng)間距,由圖1可知,聲源到達兩個麥克風(fēng)之間的延遲時間Δt=(dcosθ)/c,c為聲速。

圖1 雙麥克風(fēng)陣列傳播模型

一階差分陣列的延遲相減實現(xiàn)框圖[12]如圖2 所示,延遲單元T=c/d,∑表示求和運算。

圖2 延遲相減實現(xiàn)框圖

由圖2 可得,一階差分陣列的輸出信號為:

一階差分陣列的期望聲源一般在陣列的沿線方向,即θ≈0°,所以式(4)可以近似為:

因此,y2(t)中只包括噪聲項,y1(t)不僅包括空間波束所增強的語音,還包括部分殘余噪聲,通過y2(t)通道中的參考噪聲來抵消y1(t)通道的殘余噪聲就可以進一步實現(xiàn)語音增強。

根據(jù)文獻[13]給出的具體設(shè)計方法,定義先驗信噪比:

1.2 語音活動檢測

上述雙麥克風(fēng)陣列語音增強方法需要首先估計先驗信噪比,而先驗信噪比的計算又依賴于參數(shù)β,即靜音段的比值,所以靜音段的估計決定著語音增強性能的好壞。傳統(tǒng)方法采用語音數(shù)據(jù)的前幾幀作為對靜音段的估計[14],這種方法易于實現(xiàn),可以在一定程度上實現(xiàn)噪聲的去除;但是對靜音段的估計過于粗略,當(dāng)估計不準(zhǔn)確時會大大降低語音增強的性能。語音活動檢測可以通過計算語音數(shù)據(jù)的特征參數(shù)實現(xiàn)有無聲段的判定。因此引入語音活動檢測來實現(xiàn)靜音段的準(zhǔn)確估計,由此可以進一步提升語音增強的性能。綜合考慮小型化嵌入式設(shè)備對計算量和實時性的要求,文中設(shè)計選擇基于短時幅度值和過零率的雙門限語音活動檢測方法[15]來實現(xiàn)對靜音段的估計。

短時幅度值主要用來區(qū)分清音和濁音,因為清音的能量相對于濁音要小的多,因此可以用它作為有無聲段的判定門限之一。其定義如式(8)所示:

式中,N為幀長,E為每一幀對應(yīng)的短時幅度值。短時過零率指信號在一幀時間內(nèi)通過零值的次數(shù),其定義如式(9):

式中,Z為每一幀對應(yīng)的過零率,sgn(x)是符號函數(shù)。

1.3 算法流程

圖3 給出了改進前增強算法的實現(xiàn)流程,采用語音數(shù)據(jù)的前幾幀作為靜音段的估計。圖4給出了引入語音活動檢測后增強算法的實現(xiàn)流程,使用語音活動檢測實現(xiàn)對靜音段的估計,VAD表示語音活動檢測。

圖3 改進前算法流程

圖4 改進后算法流程

2 FPGA實現(xiàn)

2.1 整體架構(gòu)

增強算法最初是在可以進行高精度浮點運算的Matlab 平臺開發(fā)的。在FPGA 實現(xiàn)時,需要考慮到數(shù)據(jù)精度的問題。全浮點運算無疑會占用較多的資源,不利于部署在資源有限的平臺。全定點計算雖然降低了資源的占用,但是由于數(shù)據(jù)精度不足,會導(dǎo)致系統(tǒng)中增加量化噪聲,影響語音增強的質(zhì)量。文中設(shè)計為了平衡硬件資源和性能,制定了定點—浮點分塊結(jié)構(gòu),分為定點計算部分和浮點計算部分,系統(tǒng)整體架構(gòu)如圖5 所示。

圖5 硬件實現(xiàn)架構(gòu)圖

2.2 語音預(yù)處理模塊

因為語音信號具有短時平穩(wěn)性,所以需要對其進行分幀操作。為了保證語音信號的連續(xù)性和完整性,每幀數(shù)據(jù)之間都會有重疊,即幀移。為了便于FPGA 實現(xiàn),設(shè)計中幀長選擇為256,幀移為128。

加窗處理可以避免傅里葉變換時發(fā)生頻譜泄漏。該設(shè)計中窗函數(shù)選擇升余窗中的漢寧窗,窗長為256。

圖6 所示是語音預(yù)處理模塊的FPGA 實現(xiàn)框圖,該模塊主要包括分幀、加窗、FFT、CORDIC 及去除鏡像緩存FIFO。為了實現(xiàn)更高效的開發(fā),F(xiàn)IFO、FFT 和CORDIC 均采用Xilinx 現(xiàn)有的IP 核。通過兩個FIFO作乒乓緩存實現(xiàn)分幀操作,這里參考時鐘頻率為50 MHz。分幀之后數(shù)據(jù)重疊一半,導(dǎo)致數(shù)據(jù)率增加一倍,而FFT 及CORDIC 模塊占用資源較多,所以將這部分計算模塊的時鐘頻率增加一倍來匹配數(shù)據(jù)率,參考時鐘頻率為100 MHz。數(shù)據(jù)分幀之后的加窗是利用LUT 查找表的方式提取漢寧窗函數(shù),再通過乘法器實現(xiàn)的。經(jīng)過FFT 處理后的數(shù)據(jù)有一半是鏡像頻率,只需要處理有效頻率,所以數(shù)據(jù)率降低了1/2,此時,同步時鐘頻率降為50 MHz。

圖6 語音預(yù)處理框圖

2.3 語音活動檢測模塊

語音活動檢測主要涉及短時幅度值和過零率兩個關(guān)鍵參數(shù)的計算。數(shù)據(jù)的絕對值可以通過判斷最高位進行計算,將一幀數(shù)據(jù)的絕對值進行累加就可以輸出這幀的短時幅度值,同時累加器清零開始下一幀的累加。在過零率的計算中,分幀后的數(shù)據(jù)被延遲一個時鐘,然后在每個時鐘周期中判斷延遲前每一幀和延遲后每一幀的最高位。如果數(shù)據(jù)的最高位不同,則判別結(jié)果為1,否則判別結(jié)果為0。最后,在一幀數(shù)據(jù)范圍內(nèi)對判別結(jié)果進行累加得到過零率。

對靜音段的估計采用有限狀態(tài)機實現(xiàn),門限閾值的設(shè)定基于背景噪聲,取前6 幀數(shù)據(jù)的短時幅度值和過零率,分別求取平均值來計算短時幅度值和過零率的門限閾值,如式(10)、(11)所示。

式中,amp_average、zero_average 分別為前6 幀數(shù)據(jù)短時幅度值和過零率均值,amp_th 為短時幅度值門限,zero_th 為過零率門限。狀態(tài)轉(zhuǎn)移如圖7 所示,包括4 個狀態(tài):S0(初始態(tài))、S1(靜音態(tài))、S2(過渡態(tài))、S3(語音態(tài))。frm_count表示幀計數(shù),voice_count表示語音幀計數(shù),voice_min 表示語音最小幀數(shù)。

圖7 靜音段估計狀態(tài)轉(zhuǎn)移圖

在初始態(tài)S0,復(fù)位voice_count,當(dāng)幀計數(shù)大于或等于1 時跳轉(zhuǎn)到靜音態(tài)S1。在靜音態(tài)S1,如果短時幅度值小于或等于amp_th 且過零率小于或等于zero_th,則繼續(xù)停留在S1 態(tài);如果短時幅度值大于amp_th 或過零率大于zero_th,則跳轉(zhuǎn)到過渡態(tài)S2,同時voice_count 加1。在過渡態(tài)S2,如果短時幅度值大于amp_th 或過零率大于zero_th 且語音幀計數(shù)小于voice_min,繼續(xù)停留在過渡態(tài),同時voice_count加1,這是為了消除能量比較大的突發(fā)噪聲所造成的影響。如果短時幅度值小于或等于amp_th 且過零率小于或等于zero_th,則跳轉(zhuǎn)到靜音態(tài)S1,同時voice_count 清零;如果短時幅度值大于amp_th 或過零率大于zero_th且語音幀計數(shù)大于或等于voice_min,則跳轉(zhuǎn)到語音態(tài)S3,此時靜音段的估計流程結(jié)束。

2.4 語音增強模塊

經(jīng)過化簡,增強之后的語音功率可以表示為:

根據(jù)上述所設(shè)計的開方及相位插入模塊如圖8所示。

圖8 開方及相位插入

得到增強語音的頻域輸出之后需要進行傅里葉逆變換,將頻域信號還原為時域信號。由于前面去除了鏡像頻率數(shù)據(jù),而IFFT 又做256 點,所以需要補零,這就導(dǎo)致數(shù)據(jù)率提高了一倍。為了節(jié)省資源,這里只使用一個IFFT IP,IFFT 處理時鐘也提高一倍,利用FIFO 進行跨時鐘域處理。IFFT 輸出的數(shù)據(jù)實部是分幀之后的語音數(shù)據(jù),需要通過重疊相加來進行幀還原,數(shù)據(jù)率降低1/2,與IFFT 之前輸入數(shù)據(jù)的數(shù)據(jù)率相同,這里也使用FIFO 進行跨時鐘域處理。IFFT 及幀還原如圖9 所示。

圖9 IFFT及幀還原

3 實驗與分析

3.1 實驗結(jié)果

文中設(shè)計在FPGA平臺Xilinx Artix-7(XC7A35TL1CSG324I)開發(fā)板進行驗證,驗證平臺如圖10所示。

圖10 驗證平臺

測試語音數(shù)據(jù)來自中文語音數(shù)據(jù)庫THCHS30,使用軟件模擬雙麥克風(fēng)陣列模型得到兩路語音數(shù)據(jù),并將兩路數(shù)據(jù)存儲到FPGA 的ROM 中作為語音輸入。為了數(shù)據(jù)的直觀顯示,通過邏輯分析儀ILA抓取硬件產(chǎn)生的輸出,并導(dǎo)入到Matlab 中與軟件端實現(xiàn)的結(jié)果進行比較,實驗結(jié)果如圖11 所示。

圖11 語音波形圖

通過對比波形可以看出,帶噪語音經(jīng)過處理后可以有效實現(xiàn)語音增強,引入語音活動檢測可以大大提高語音增強的質(zhì)量,并且FPGA 的實現(xiàn)也是有效的。

文中還使用多段語音進行客觀語音質(zhì)量評估(Perceptual Evaluation of Speech Quality),將PESQ 得分作為評價語音質(zhì)量的指標(biāo),PESQ 得分對比如表1。

表1 PESQ得分對比

由表1 可以看出,引入VAD 后,Matlab 輸出增強語音PESQ 得分平均提高了20.18%;FPGA 輸出的增強語音與Matlab 輸出相比,得分平均下降了1.83%,與帶噪語音相比,得分平均提高了45.61%,可見通過引入VAD 可以有效提高語音增強的性能,并且FPGA 的實現(xiàn)與Matlab 等效,證明了FPGA 實現(xiàn)的準(zhǔn)確性。

另外,對該設(shè)計進行了實時性評估,以處理1 s的16 kHz 語音的時間為評價指標(biāo),該設(shè)計僅需要1.92 ms 便可完成語音增強,可以滿足實時語音增強的需求。

3.2 資源利用率

表2 為該設(shè)計經(jīng)過Vivado 綜合布局布線之后的資源消耗情況。由表可知,該設(shè)計相對于文獻[16-17]中單通道語音增強設(shè)計,資源消耗有所增加,但是卻實現(xiàn)了雙通道語音增強,克服了單通道語音增強對非平穩(wěn)噪聲抑制效果不佳的缺點,并且占用的硬件資源適中,適合應(yīng)用于嵌入式設(shè)備[18]。

表2 資源利用對比

4 結(jié)論

文中面向小型化嵌入式設(shè)備提出一種基于一階差分陣列的雙麥克風(fēng)語音增強方案,針對現(xiàn)有算法容易因靜音段估計不準(zhǔn)確造成語音增強性能下降這一問題,提出了通過語音活動檢測對有無聲段進行判別,實現(xiàn)對靜音段準(zhǔn)確估計的改進方案。實驗結(jié)果表明,該方案相對于優(yōu)化前設(shè)計,語音PESQ 得分平均提高20.18%,并且基于FPGA 的實現(xiàn)與純浮點Matlab 平臺等效,可實現(xiàn)實時語音增強,為小型化嵌入式設(shè)備語音增強提供了方法。后續(xù)工作中還需要深入研究,使用更高效的語音活動檢測方法來提升語音增強的性能。

猜你喜歡
檢測
QC 檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
“有理數(shù)的乘除法”檢測題
“有理數(shù)”檢測題
“角”檢測題
“幾何圖形”檢測題
主站蜘蛛池模板: 亚洲国产成人精品一二区| 国产精品分类视频分类一区| 一本综合久久| 制服丝袜 91视频| 国产在线观看人成激情视频| 乱人伦中文视频在线观看免费| 国内精品小视频在线| 四虎永久在线视频| 国产小视频免费观看| 青草视频久久| 久久综合结合久久狠狠狠97色| 欧美日韩高清| 麻豆精品在线视频| 啊嗯不日本网站| 国产一级毛片yw| av色爱 天堂网| 国产福利一区在线| 国产欧美视频综合二区| 色综合狠狠操| 免费国产一级 片内射老| 午夜精品福利影院| 午夜日b视频| 青青草欧美| 男女男精品视频| 美女免费黄网站| 一级毛片在线免费看| 久久天天躁狠狠躁夜夜2020一| 青青极品在线| av在线手机播放| 国产精品白浆无码流出在线看| 青青草原国产一区二区| 亚洲成肉网| 色婷婷国产精品视频| 一级毛片在线播放免费| 色亚洲激情综合精品无码视频| 久久精品免费国产大片| 青青操视频免费观看| 亚洲人成在线精品| 欧美丝袜高跟鞋一区二区 | 最新日韩AV网址在线观看| 麻豆AV网站免费进入| 综合亚洲网| 亚洲综合天堂网| 国产成人AV综合久久| 欧美区一区| 51国产偷自视频区视频手机观看| 中国特黄美女一级视频| 亚洲成人免费看| 欧美一级片在线| 在线人成精品免费视频| www.91中文字幕| 毛片一级在线| 又大又硬又爽免费视频| 午夜激情福利视频| 少妇露出福利视频| 成人在线第一页| 伊人久久久久久久| 亚洲swag精品自拍一区| 91精品国产无线乱码在线| 国产精品亚欧美一区二区三区| 99re视频在线| 国产亚洲高清视频| 亚洲色成人www在线观看| 狼友视频一区二区三区| 在线不卡免费视频| 97青青青国产在线播放| 国产在线自乱拍播放| 福利视频久久| 久久久久亚洲AV成人网站软件| 欧美精品黑人粗大| 国产h视频在线观看视频| 欧美国产日韩在线播放| 一级毛片免费高清视频| 亚洲中文字幕av无码区| 少妇高潮惨叫久久久久久| 日本在线欧美在线| 亚洲精品成人片在线观看 | 欧美日韩成人| 国产日韩欧美精品区性色| 在线中文字幕网| 亚洲午夜天堂| 国产综合无码一区二区色蜜蜜|