999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于雙麥克風降噪技術的語音識別系統

2016-04-12 00:00:00潘麗杰徐本亮朱琪王利峰繆惠根
現代電子技術 2016年2期

摘 要: 語音控制是智能化設備的重要控制手段,而語音識別是實現語音控制的關鍵技術。為了設計一種可靠的、抗干擾性強的產品,提出了一種基于雙麥克風降噪技術的語音識別系統。該設計運用ROHM公司的BU8332KV芯片作為語音識別前端處理的核心,利用其雙麥克風降噪技術來解決語音識別中的噪聲問題,結合單片機和語音識別芯片,應用于按摩椅的語音控制系統中。經過非特定人的語音識別系統的靜態和噪聲環境下測試,結果表明在噪聲環境下,該系統有較高的識別率,適用于按摩椅的應用環境,也適合在其他有環境噪聲干擾的語音識別系統中推廣應用。

關鍵詞: 語音識別; 語音控制; 雙麥克風降噪; BU8332KV

中圖分類號: TN912?34 文獻標識碼: A 文章編號: 1004?373X(2016)02?0137?03

Speech recognition system based on dual?microphone noise reduction technology

PAN Lijie, XU Benliang, ZHU Qi, WANG Lifeng, MIAO Huigen

(Yangtze Delta Region Institute of Tsinghua University, Jiaxing 314000, China)

Abstract: With the speech control as an important control means of intelligent device, and speech recognition as a key technology to realize the speech control, a speech recognition system based on double?microphone noise reduction technology is proposed for the design of a reliable, strong anti?interference product. In the design of a voice control system in massage chair, BU8332KV chip of ROHM Company is taken as the core of speech recognition front?end processing, the dual?microphone noise reduction technology is adopted to solve the problem of noise in speech recognition, and MCU and speech recognition chip are combined. The testing result of speaker independent speech recognition system in static and noise environment test proves that the system has a high recognition rate, and is suitable for the application environment of massage chair. It is also suitable for popularization and application to other speech recognition systems working in environmental noise interference.

Keywords: speech recognition; speech control; dual?microphone noise reduction; BU8332KV

0 引 言

近年來,隨著語音識別技術的日益發展,語音輸入系統廣泛應用于以汽車導航儀及智能手機為首的移動設備上,今后還將要擴展到其他智能電氣產品。語言是人類傳遞信息的主要手段,語音識別技術是目前世界上最熱門和最具發展前景的新型信息技術之一[1?2]。采用語音識別作為人機接口的設備能夠具有簡便、快捷、靈活的優點,其在軍事、民用和商業領域都發揮了巨大的作用,在未來會成為新一代操作系統的接口[3?5]。

在語音識別過程中,不可避免會受到其他噪聲影響,比如周圍環境中的噪聲,別人講話的聲音等,這樣,最終接收到的已經不是純凈的語音信號,而是有干擾的帶噪語音,常規的做法就是通過增強、增大語音信號來解決,比如提高嗓門,或近距離說話,這樣極大地影響了使用效果。所以在前端對語音進行降噪處理非常必要,也是語音識別的最重要部分,能夠為整個語音識別系統提供可靠的穩定性,提高其識別率。

本文以ROHM公司的BU8332KV芯片作為語音識別前端處理的核心,利用其雙麥克風降噪技術來解決語音識別中的噪聲問題。

1 雙麥克風降噪技術

1.1 技術原理

BU8332KV芯片采用波束賦形技術形成指向性,因為將指向軸轉向聲源的方向,所以大大降低了環境噪音。這里的波束賦形技術是利用多個麥克風的相位差,降低目標方向以外的語音的技術。其降低了環境噪音,提高了目標聲源的清晰度。通過噪音抑制的功能,進一步降低殘留在指向軸方向的固定噪音。這個技術和僅僅使用噪音消除的技術不同,可以更加強調聲源。而且,由于它能夠在僅僅10 mm的窄間距上安裝2個麥克風,所以能夠內置于以智能手機為代表的各種小型設備上。通過最優化處理,波束賦形技術可以將使用時的處理延遲時間控制在10 ms以下,使得將其他應用程序的影響控制在最小限度內。通過這些措施,有助于提高各種設備的語音識別率和改善免提的通話質量,雙麥克風降噪工作示意圖如圖1所示。

圖1 雙麥克風降噪工作示意圖

使用兩個麥克風形成指向性的技術早已被應用,但現有技術為了提高指向性,必須拉長麥克風間距,所以不能適應小型便攜式設備的搭載要求。另外,數字信號處理的延遲時間及音質劣化,也是今后繼續要攻克的研究課題。而如今,利用波束賦形技術形成指向性,并且通過把指向軸轉向聲源方向,從而衰減了聲源以外的語音。在指向軸方向殘留的固定噪音通過噪音抑制的功能得以降低,因而使得聲源變得清晰。其結果是使得背面方向的衰減量較傳統的麥克風改善30 dB以上。

1.2 技術特點

(1) 敏銳指向性可以更加清晰地拾取聲源。獨有的信號處理技術與以往麥克風比較,實現了敏銳的指向性,進行聲音的清晰度處理。聲源方向(0°)對于背面方向(180°)的衰減量與以往的麥克風比較大幅度改善30 dB以上。此外,還可以實現10 mm安裝間距,如圖2所示。

圖2 BU8332KV?M與以往麥克風指向性特點的比較

(2) 大幅度提高語音識別率。可以使語音不劣化,能降低環境噪音。因此,提高在環境噪音條件下的語音識別率。通過檢測,在環境噪音等級55 dBSPL的環境下的語音識別精度從5%提高到90%。未使用時,噪音等級為55 dBSPL,識別率急劇下降;使用時,即使噪音等級為65 dBSPL,也可以實現45%的識別率。

圖3 使用BU8332KV?M時的語音識別精度

2 硬件電路設計

2.1 總體結構設計

整個系統的硬件電路主要包括語音處理和語音識別兩個模塊。語音處理模塊主要為BU8332KV芯片電路,語音識別模塊主要為STC10L08XE單片機和LD3320語音識別芯片電路。系統的實現方框圖如圖4所示。

圖4 系統總體結構框圖

2.2 語音處理部分

該部分采用ROHM公司的BU8332KV芯片。 該芯片采用波束賦形技術形成指向性,因為將指向軸轉向聲源的方向,所以大大降低了環境噪音。通過噪音抑制的功能,進一步降低殘留在指向軸方向的固定噪音。這個技術和僅僅使用噪音消除的技術不同,可以更加強調聲源,通過最優化處理,然后將降噪后的語音輸入到LD3320中。該技術的其他功能如下:使用波束賦形技術功能時的處理延遲時間為10 ms以下;搭載降低殘留在軸向指向方向的固定噪音的噪音抑制功能;模擬輸出(LINEOUT)或者數字輸出(PCM接口);可用3.3 V的單系統工作(內置核心電源調節器);內置有麥克風用偏壓、前置放大器的電路;雙線主機接口;可以單機工作(內置E2PROM用SPI接口)。

2.3 語音識別模塊

LD3320內部通過快速而穩定的優化算法,完成非特定人語音識別,不需要用戶事先訓練和錄音,不需要外接任何輔助的FLASH芯片,RAM芯片和A/D芯片[6?7],就可以完成語音識別功能;因此LD3320的語音識別率準確率比較高,也比較穩定。LD3320芯片內部的語音識別原理框圖[5?6]如圖5中的圓角矩形框內所示。

圖5 語音識別原理框圖

LD3320芯片與STC10L08XE單片機采用并行方式相接,單片機先將關鍵詞列表發送給LD3320。語音識別的過程也是語音識別芯片完成的工作:把通過語音處理模塊的語音流進行頻譜分析,提取其中的語音特征,再和列表中的關鍵詞語進行匹配,找出得分最高的關鍵詞語作為識別結果輸給單片機,單片機播放對應的提示音。

3 性能測試與應用

本文所設計的語音識別系統主要用在語音控制按摩椅,在應用中最主要關注的是識別率以及實時性。為了檢測識別效果,實驗中選取幾個不同音色的人在實驗室安靜環境下和加60 dB噪音環境下分別進行多組詞語測試,每個測試50遍。兩種環境下部分語音命令測試的正確識別數據比例如表1、表2所示。

由表1、表2可知在實驗室安靜環境下,對于測試的語音命令平均識別率可達91.5%,在噪音環境下可達68%。兩種環境下對單個語音命令處理后的波形如圖6、圖7所示。

4 結 語

噪聲環境中的語音識別是當前語音信號處理領域的研究難點。本設計運用ROHM公司的BU8332KV芯片作為語音識別前端處理的核心;利用其雙麥克風降噪技術來解決語音識別中的噪聲問題;運用單片機和非特定人語音識識別芯片LD3320,完成了語音控制系統的語音識別模塊的軟硬件設汁。實驗結果表明,基于雙麥克風降噪技術的語音識別系統,對于語音命令的平均識別率可達90%,在噪音干擾下也有著65%以上的識別率。本系統抗噪聲能力強,其雙麥克風可以近距離安裝,可以使系統小型化,通用化,隨著智能產品的普及,該系統將有廣泛的應用前景。

表1 安靜環境下正確識別數據表

表2 60 dB噪音環境下正確識別數據表

圖6 安靜環境下語音處理后輸出的語音波形

(上接第139頁)

圖7 60 dB噪音環境下語音處理后輸出的語音波形

參考文獻

[1] 劉幺和,宋庭新.語音識別與控制應用技術[M].北京:科學出版社,2008.

[2] 趙力.語音信號處理[M].2版.北京:機械工業出版社,2009.

[3] 張晨燕,孫成立.非特定人孤立詞語音識別系統的片上實現[J].計算機工程與應用,2007,43(13):194?196.

[4] 關勝平,何培宇,劉珂含,等.基于TMS320VC5509A的語音識別與控制系統[J].電子技術應用,2007,33(7):36?39.

[5] 孫兵.基于單片機的機械手聲控系統設計[J].機械工程與自動化,2007(6):113?114.

[6] 佚名.LD332X語音識別芯片[EB/OL].[2010?07?01].http://www.icroute.com/web_cn/LD332X.html.

[7] 佚名.LD3320芯片簡明調試步驟[EB/OL].[2010?07?01].http://www.icroute.com/web_cn/LD332X_DebugProcess.html.

主站蜘蛛池模板: 亚洲毛片在线看| 国产成人精品亚洲77美色| 91欧美在线| 无码综合天天久久综合网| 国产凹凸一区在线观看视频| 欧美亚洲综合免费精品高清在线观看| 毛片免费在线| 国产a v无码专区亚洲av| 日韩福利视频导航| 精品国产欧美精品v| 无码电影在线观看| 蜜桃臀无码内射一区二区三区 | 亚洲精品麻豆| 真实国产乱子伦视频| 日韩免费视频播播| 久久国产乱子伦视频无卡顿| 在线看片中文字幕| 四虎影视库国产精品一区| 国产精品自拍露脸视频 | 欧美成人怡春院在线激情| 精品国产Ⅴ无码大片在线观看81 | 日本色综合网| 国产精品亚洲一区二区三区z| 精品国产www| 性做久久久久久久免费看| 无码日韩人妻精品久久蜜桃| a级毛片视频免费观看| 亚洲国产欧美国产综合久久 | 青青操视频在线| 在线播放国产99re| 中文字幕啪啪| 久久久成年黄色视频| 欧美日韩免费观看| 国产成人综合在线观看| 国产高清在线丝袜精品一区| 国产乱人伦偷精品视频AAA| 欧美国产综合色视频| 免费在线不卡视频| 九色综合视频网| 久久频这里精品99香蕉久网址| AV熟女乱| 成人字幕网视频在线观看| 国产精品区视频中文字幕| 99热这里只有精品国产99| 麻豆国产精品视频| 中文字幕久久亚洲一区| 久久精品人妻中文系列| 成人精品午夜福利在线播放| 亚洲国产欧美自拍| 国产正在播放| 亚洲成人网在线观看| 丝袜国产一区| 国产精品自在线拍国产电影| 亚洲无码视频一区二区三区 | 欧美激情一区二区三区成人| 国产成人免费观看在线视频| 青青草原国产| 亚洲V日韩V无码一区二区| 中文字幕伦视频| 中国一级毛片免费观看| 激情亚洲天堂| 91精品国产无线乱码在线| 99热这里只有精品久久免费| 无码高潮喷水专区久久| 亚洲第一成年网| 成人在线视频一区| 中文国产成人精品久久一| 国产白浆视频| 国产精品美女自慰喷水| 久久婷婷色综合老司机| 免费亚洲成人| 美女视频黄又黄又免费高清| 亚洲天堂视频在线观看免费| 国产又爽又黄无遮挡免费观看| 国产无码精品在线播放 | 72种姿势欧美久久久大黄蕉| 2021国产精品自产拍在线观看| 亚洲美女视频一区| 中文精品久久久久国产网址| 国产综合无码一区二区色蜜蜜| 人妻丰满熟妇αv无码| 久久亚洲中文字幕精品一区|