999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于HTK的電臺粵語敏感詞檢測系統方法研究

2016-05-30 13:43:23楊俊
關鍵詞:檢測模型系統

楊俊

摘 要:粵語是中國七大方言之一,在全球有近1.2億使用人口。本文根據粵語的特點,針對電臺節目中出現的粵語敏感詞設計一套基于HTK的語音識別監控系統,提出基于LMS自適應降噪的語音預處理方案,并驗證該語音識別系統的識別率。通過實驗證明該系統對粵語具有較高的識別率。

關鍵詞:HTK;語音識別;粵語

1 概述

語音識別發展到現如今,在很多領域已經得到了應用,語音識別通過幾十年的發展,已經從孤立詞識別到連續語音識別,從小詞匯量到大詞匯量,但是,粵語連續語音識別還處在初始階段,粵語通行于兩廣、港澳地區,是唯一除了普通話外擁有完善文字系統的漢語,并且國內廣播電臺很少有用語音識別技術來對關鍵詞進行檢測,因此,如何設計一個能降低背景噪聲,識別率高的基于關鍵詞的語音識別軟件,是目前廣播電臺監播系統面臨的技術挑戰之一。

本文結合粵語的語音特點,使用現在流行的隱馬爾科夫建模工具HTK工具來設計一個電臺粵語敏感詞檢測系統。

2 電臺粵語敏感詞檢測系統的基本原理

基于HMM的粵語敏感詞檢測系統主要由語料庫,語音預處理模塊,特征提取模塊和語音標準模版等部分組成。具體的語音識別框圖如下圖1所示:

語音預處理模塊就是對輸入的原始語音信號進行處理,濾掉其中的不重要信息及背景噪聲等,并進行語音信號的端點檢測,即判定語音有效范圍的開始和結束位置,并進行分幀和預加重等處理工作。

在經過語音預處理模塊后,接下來的就是提取語音的特征參數。特征參數就是從語音信號中提取出有效的語音特征,去除語音信號的其他信息。在識別階段,將輸入語音的特征矢量參數和語音標準模版進行相似性度量比較,最后輸出識別結果。

3 建立語音材料庫

在進行語音識別前,建立語音材料庫,確定識別基本元。確定基本元后,標記識別基本元。標記基本元的工作,我使用的是WaveSurfer1.8的工具,用WaveSurfer1.8的工具打開用Adobe Audition CS6錄好的錄音材料,然后使用Label標記好每個字的起始和結束位,就完成了一個詞的標記工作。27個電臺敏感詞由15個男主持人和15個女主持人錄制,每個敏感詞錄制3遍。

4 基于HTK電臺新聞敏感詞檢測系統聲學建模

聲學建模是連續語音識別的關鍵步驟,其目的就是計算語音的特征矢量系列,為聲學單元建立一套聲學模型參數。HTK工具建立聲學模型步驟如圖2所示:

本系統識別用的是HTK中的HCopy模塊對語音進行特征的提取,然后用到Hinit模塊對HMM模型進行初始化,隨后用HRest和HERest庫模塊對HMM模型進行重估,形成準確的HMM模型,通過Hvite識別工具來對HMM模型進行解碼,其中使用HTK中的HParse使其由識別語法變成識別網絡,最后輸出識別的結果。

5 粵語連續語音識別實驗

5.1 更換訓練集實驗

實驗中的語料庫共有27個詞匯,由30位會說粵語的人,其中男15人,女15人,用標準的粵語朗讀一遍,其中語音信息是已知的,并且用WaveSurfer1.8的工具進行標注。其中從語料庫中選擇前20組語音作為訓練集,后10組語音作為測試集作為一個第一組實驗,然后用30組語音作為訓練集,后10組語音作為測試集來作為第二組實驗,識別結果用HTK中的HResults模塊進行輸出識別結果,第一組識別結果如圖3,第二組識別結果如圖4:

實驗結果表明,第二組正確率(82.51%)高于第一組的正確率(75.31%),證明訓練集的增加可以對非特定人識別的識別率有顯著的提高。

5.2 對大詞匯量連續語音的處理

對于大詞匯量連續語音的處理,可以采用深度學習的方法來代替GMM-HMM中的GMM,因為GMM模擬任意函數的功能取決于混合高斯函數的個數,所以具有一定的局限性,屬于淺層模型。而深度網絡可以模擬任意的函數,因而表達能力更強。所以使用深度學習的基于統計語音模型作為粵語的非特定人大詞匯量連續語音識別系統的語言模型,來實現大詞匯量的連續語音識別。

6 總結

為了提高廣播監播系統的智能化、高效性,減輕管理控制人員的工作壓力,將語音識別技術嵌入到廣播電臺監播系統當中。針對影響到安全播出的節目中出現的禁忌詞匯,或因播出信號受敵對勢力攻擊而出現的一些敏感詞匯,可利用語音識別技術,設計一套電臺廣播新聞敏感詞檢測系統,對播出信號進行實時監播。其最終研究成果和優化的系統對廣播電臺的安全播出具有典型的指導意義,并且具有在全國各大廣播電臺推廣的價值。

參考文獻:

[1]王海濤.廣播電視監播系統中音頻及語音數據處理技術研究[D].西北工業大學,2007:35-37.

[2]陳杰.基于語音識別的警報系統的設計及其在廣播中的應用[J].2014.04:121.

[3]孔婷.基于語音識別的廣告監播技術研究[D].南京理工大學,2013.7:1-2.

[4]張秋野,王力劭,丁鵬.連續語音識別網格技術在新聞制播平臺的應用[J].電視技術,2010.02:58.

[5]陳蓉.語音識別技術在廣播電臺的應用探討[J].廣播與電視技術,2008.10:134.

[6]劉洪斌.廣播電臺網絡音頻搜索系統初探[J].中國廣播,2011.06:47.

[7]布合力齊姑麗·瓦斯力.用MATLAB實現維吾爾語廣播新聞敏感詞檢索系統[J].計算機系統應用,2014.06:69.

猜你喜歡
檢測模型系統
一半模型
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主站蜘蛛池模板: 国产网友愉拍精品视频| 亚洲成a人在线播放www| 成人福利在线免费观看| 一本一道波多野结衣av黑人在线| 欧美区一区二区三| 在线观看av永久| 欧美日韩久久综合| 凹凸国产分类在线观看| lhav亚洲精品| 日韩精品免费一线在线观看| 国产精品视频系列专区| 国产va在线观看免费| 青青热久免费精品视频6| 91系列在线观看| 国产精品播放| 最新国产午夜精品视频成人| 国产SUV精品一区二区6| 国产欧美中文字幕| 亚洲自拍另类| 无码免费试看| 色综合激情网| 91视频区| 日本手机在线视频| 成人午夜天| a级毛片免费看| 亚洲中文无码av永久伊人| 91青草视频| 中文字幕人成乱码熟女免费| 亚洲热线99精品视频| 国产乱子精品一区二区在线观看| 国产欧美日韩免费| 狠狠色婷婷丁香综合久久韩国| 伊人久久精品亚洲午夜| 久久久久久久久亚洲精品| 国产乱子伦视频三区| 精品福利国产| 久无码久无码av无码| 成人免费视频一区| 三上悠亚精品二区在线观看| 特级毛片免费视频| 在线欧美a| 免费视频在线2021入口| 亚洲欧美成人影院| 99精品伊人久久久大香线蕉| av在线手机播放| 一区二区在线视频免费观看| 第九色区aⅴ天堂久久香| 日韩AV手机在线观看蜜芽| 久久人妻xunleige无码| 久草视频中文| 国产区人妖精品人妖精品视频| 亚洲91精品视频| 在线观看亚洲天堂| 免费女人18毛片a级毛片视频| 亚洲精品国产首次亮相| 小13箩利洗澡无码视频免费网站| 色偷偷综合网| 五月婷婷综合网| 中文字幕欧美日韩高清| 青青青草国产| 91探花在线观看国产最新| 国产在线视频导航| 国产va免费精品| 无码网站免费观看| 2021最新国产精品网站| 国产精品99一区不卡| 呦系列视频一区二区三区| 日韩一二三区视频精品| 国产中文一区a级毛片视频| 国产精品久久久久久影院| 2018日日摸夜夜添狠狠躁| 热re99久久精品国99热| swag国产精品| 免费又黄又爽又猛大片午夜| 美女扒开下面流白浆在线试听| 国产精品三级专区| 国产在线观看一区二区三区| 91福利国产成人精品导航| 伊人中文网| 在线精品视频成人网| 尤物国产在线| 日韩不卡高清视频|