999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡的語音識別技術應用研究

2018-04-12 10:06:04周春榮
中國科技縱橫 2018年6期

周春榮

摘 要:語音識別技術能夠實現人機對話,本文從神經網絡角度出發對語音識別技術的應用及優化進行探究。文章首先概述了神經網絡及語音識別技術的相關理論;其次對語音識別系統基本結構設計進行了分析,主要包括語音信號處理、BP算法、BP網絡結構的設計以及學習樣本的選取;最后對人工神經網絡語音識別的應用實例進行了論述,具體包括對于特定人的語音識別、對于非特定人的語音識別以及BP算法改進的進步一實驗三部分。

關鍵詞:神經網絡;語音識別技術;應用實踐

中圖分類號:TN912.34 文獻標識碼:A 文章編號:1671-2064(2018)06-0018-02

在當前信息時代之下,人們對計算機的智化要求日漸提升,語音識別技術便是計算機智化的重要表現之一,各學者對語音識別技術的研究也相當多,并提出較多的識別方法,如模板匹配法、統計模式識別法等,這些方法存在一定的劣勢,本文從神經網絡理論出發對語音識別技術進行探究,分析基于神經網絡的語音識別系統的構建與應用實踐,以期為相關研究人員提供一定的參考。

1 神經網絡及語音識別技術概述

1.1 神經網絡

神經網絡分為生物神經網絡及人工神經網絡,本文所探討的為人工神經網絡(ANNs,Artificial Neural Networks)。人工神經網絡是一種鏈接模型,依照生物神經網絡的特征所構建的一種算法模型,其中最常用的一種模型為BP網絡模型,該種網絡模型能學習和存貯大量的輸入-輸出模式映射關系,可以解決大量復雜的問題。

1.2 語音識別技術

語音識別技術(ASR,Automatic Speech Recognition)即使計算機讀寫人類語音中的詞匯內容的一種方式,通常通過將人類語音中的詞匯內容轉化為二進制編碼或者是按鍵再或者是字符序列,使計算機能夠識別這些內容,從而實現人機交互。在當前全球化的背景下,實現人機交互,則能夠使語言不通的人相互交流,故而研究語音識別技術極為重要。

2 語音識別系統基本結構設計

經理論分析及實踐研究,語音識別系統的基本結構應如圖1所示。

2.1 語音信號處理

語音信號處理質量直接影響著整個語音識別系統的質量,所以在語音信號預處理、時域分析、語音信號的斷電檢測及特征提取方面,必須要極為嚴謹。

(1)語音信號預處理及時域分析。對于語音信號的預處理,主要的步驟是采集語音,并將語音進行放大等增益控制,必要情況下可以采取反混疊濾波以及預加重等措施,以確保所收集的語音的質量。

(2)語音信號的端點檢測及特征提取。端點檢測主要的作用是對已經進行預處理的語音信號的進一步檢測,因為簡單的預處理之后語音信號仍有一定的背景噪音,可能會對后續的語音檢測產生影響,所以需要通過語音信號進行起點檢測以及末尾檢測,并進行分幀,從而確保檢測結果質量。

2.2 BP算法

因為語音信號轉化為計算機可識別的信息時會存在一定的誤差,而這種誤差又具有不規律性,所以需要應用BP算法,通過推理及逆向推理來調整輸出層與輸入層權矩陣。BP算法主要分為兩個階段,分別是向前傳播階段以及向后傳播階段,其中向后傳播階段又被成為“誤差傳播階段”。

(1)向前傳播階段。該階段主要是確定輸出層的誤差。其具體算法為:

首先,判定隱含層的第i個神經元的輸出,其輸出公式為:

其次,判定輸出層的低k個神經元的輸出,其輸出公式為:

最后,結合具體的情況判定誤差函數,其函數公式為:

(2)向后傳播階段。該階段主要是將輸出層的誤差沿著與輸入信號相反的方向逐漸傳遞到輸入端。這一階段主要的算法為:

首先,確定依據性能指標函數Ep,確定思路,具體為:

因為,故而若想使ω向著Ep減小方向移動時,△ω的取值在(-∞,0)之間,反之則應當取(0,+∞)。

其次,假設輸出層為r=2,得出公式:

再次,假設隱含層為r=1,再利用復合微分的相對規則,確定第j個隱層節點公式:

最后,得出誤差算法,其公式為:

2.3 BP網絡結構的設計

BP網絡結構設計中,通常需要考慮的有五個方面,確保這五個層面的合理性,則能夠確保語音識別的質量。

(1)網絡的層數。由以上公式可以看出一個線性輸出層與大于等于一個S型隱含層所構成的網絡,這一網絡中的數據與有理函數相似,所以可以用有理函數公式進行代替,在層數不斷增加的時候,誤差會極大的降低,但是網絡會更加復雜,故而需要進行判定,選擇最合理的網絡層數。

(2)隱含層的神經元數。為使數據進一步精確,還可以依據具體的情況來增加隱含層的神經元數,從理論上來講,隱含層的神經元數應當是越多越好。

(3)初始權值的選取。因為基于BP模型設計的系統結構并不是線性的,所以必須要合理確定初始權值,這樣方能確保每一個神經元的權值可以在激活函數變化最大處進行調節,使神經元的輸出值與0盡可能的接近,通常情況下,初始值會在-1到1之間。

(4)學習速率。學習速率影響著系統的質量以及效率,如果學習速率比較小,那么系統訓練的時間便會加強,使效率降低,但是學習速率過大,則可能會影響到系統的穩定性,從而使系統的質量受到影響,經過大量的實踐,筆者認為學習速率的值應當在0.01到0.8之間,這樣方能在保障系統穩定的基礎上確保其誤差值較小。

(5)期望誤差的選取。期望誤差的選擇應當依據具體的隱含層節點數確定,不過一般情況下是依靠調節隱含層節點以及調整學習時間兩種方式來確定。

2.4 學習樣本的選取

在確定了語音識別系統的整體結構之后,還應當選擇合適的樣本,以確保效果。通常情況下是選擇相對較佳的特定人的語音樣本進行基本分析,接著再選擇非特定人的語音樣本進行處理。

3 人工神經網絡語音識別的應用實例

依據以上系統,進行實踐,先確定特定人的語音識別,再確定非特定人的語音識別,最后應用BP算法進一步改進。

對于特定人的語音識別,主要是選擇某一個人的聲音,對其聲音樣本進行識別,通過調整神經元數目進一步調整識別率。在實驗中,設計神經元數為25、30、35、40時候,識別結果如表1所示。

接著對非特定人進行語音識別,所用的方法與對于特定人的語音識別方法一致,具體的測試數據如表2所示。

通過BP算法進行改進,最后的測試數據如表3所示。

由上可以得知,基于神經網絡的語音識別系統在語音識別方向作用較大,且有巨大的潛力。

4 結語

本文是對基于神經網絡的語音識別技術的應用進行的探究,文章在概述了神經網絡及語音識別技術的相關理論之后對語音識別系統的建構及應用實踐進行探究,以期為相應研究人員提供一定的參考,同時拋磚引玉,希望有更多的學者參與其中進行探究,從而優化語音識別技術,促進計算機的進一步智能化。

參考文獻

[1]朱錫祥.基于一維卷積神經網絡的車載語音識別技術研究[D].安徽大學,2017.

[2]蔡偉建.人工神經網絡理論在語音識別技術中的應用[A].2016:4.

[3]田麗.基于小波神經網絡的語音識別的研究[D].大慶石油學院,2015.

主站蜘蛛池模板: 毛片久久网站小视频| 国产丰满大乳无码免费播放| 99视频在线观看免费| 国产精品视频猛进猛出| 一本久道久久综合多人| 国产色图在线观看| 国产Av无码精品色午夜| 青青网在线国产| 成年人福利视频| www.av男人.com| 中国国产A一级毛片| 试看120秒男女啪啪免费| 国产精品思思热在线| 天天色天天操综合网| 亚洲一区二区三区国产精品| 国产精品网址你懂的| 欧美日韩91| 在线永久免费观看的毛片| 伊人蕉久影院| 欧美在线三级| 国产精品对白刺激| 亚洲激情区| 夜色爽爽影院18禁妓女影院| 国产高清国内精品福利| 欧美www在线观看| 亚洲av片在线免费观看| 色综合a怡红院怡红院首页| 国产综合色在线视频播放线视| 欧美视频免费一区二区三区| 国产在线观看91精品亚瑟| 亚洲第一区精品日韩在线播放| 久久精品嫩草研究院| 3344在线观看无码| 91成人免费观看在线观看| 亚洲人成网站色7799在线播放| 中文字幕日韩久久综合影院| 久久人人妻人人爽人人卡片av| 人妖无码第一页| 色婷婷丁香| 自拍亚洲欧美精品| 伊人成色综合网| 一级毛片无毒不卡直接观看| 国产成人8x视频一区二区| 国产毛片不卡| 亚洲欧洲国产成人综合不卡| 国产视频欧美| 欧美性精品| 麻豆国产精品一二三在线观看| 成人看片欧美一区二区| 91精品国产综合久久不国产大片| 亚洲精品中文字幕午夜| 亚洲高清中文字幕在线看不卡| 久久人人97超碰人人澡爱香蕉| 国产另类视频| 欧美一级在线| 香蕉视频国产精品人| 日韩免费毛片| 国产精品嫩草影院av| 国产精品美人久久久久久AV| 国产在线视频二区| 71pao成人国产永久免费视频 | 中文字幕乱码二三区免费| 日本www色视频| 91福利一区二区三区| 欧美国产视频| 99精品一区二区免费视频| 欧美一级高清片欧美国产欧美| 国产乱子伦精品视频| 六月婷婷综合| 一本综合久久| 日韩中文欧美| 中文字幕在线一区二区在线| 天天综合色天天综合网| 国产成人精品午夜视频'| 亚洲精品免费网站| 国产精品私拍在线爆乳| 99无码熟妇丰满人妻啪啪| 丰满少妇αⅴ无码区| 久久青草免费91观看| 男人天堂亚洲天堂| 欧美成人精品在线| 国产在线98福利播放视频免费|