999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隱馬爾科夫模型的語音識別技術實現

2019-12-17 03:32:08陳煥澤中南大學軟件學院
數碼世界 2019年12期
關鍵詞:百度文本智能

陳煥澤 中南大學軟件學院

關鍵字:語音識別 聲學模型 隱馬爾科夫模型

1. 引言

智能語音技術,是一種完成人機通過語言進行類似于人與人之間交互的技術,其中的核心技術包括語音識別技術和語音合成技術。20世紀50年代,智能語音技術已經在語音識別領域開展了研究。而在人機交互中,語音識別這一環節也處于第一個環節,也是核心環節。

2. 語音識別的相關基礎概念

2.1. 語音識別的定義和原理

2.1.1. 定義

語音識別技術即將語音轉化為有意義的文字內容的技術。

2.1.2. 基本實現原理

從原始語音信號中提取某次語音識別所要分析的信號后,利用特征處理將所提取的信號從時域轉變為頻域,從而為聲學模型提供適當的輸入向量,聲學模型根據其本身模型所訓練而得的參數,計算每一個輸入向量在其該模型上的得分;而語言模型則根據語言學相關的知識,計算出各種不同文本序列搭配的可能性;最后由已有的數據字典,對文本序列進行解碼操作,得到可能性最高的文本內容。

而該過程中,如何將每一幀中的音素對應于某個狀態是個難題,這里利用概率論的知識,通過訓練聲學模型,得到相應的概率分布,在其中選擇概率最高的,即所求幀對應的狀態。

輸入語音數據:o=o1...om

各種可能的文本序列組成的集合:W=w1,...,wk

語音識別:根據輸入語音數據o以及各種可能的文本序列集合W中找到最可能的那個文本序列:

其中,聲學模型負責獲得P[o|w],語言模型負責獲得P[w]。

3. 語音識別核心組件介紹

3.1. 聲學模型

3.1.1. 定義

給定語言學單元,計算輸入語音匹配的可能性,進行對P[o|w]的概率估計;

3.1.2. 發展歷史

表1:聲學模型的發展

3.1.3. 各個主要聲學模型優缺點比較

HMM-DNN聲學模型

優點:

①前后各自擴充n幀,從而利用幀的上下文信息

②與HMM-GMM相比,可以學習深度非線性特征轉換缺點:

無法利用歷史信息來進行操作

HMM-LSTM聲學模型

優點:

①是一個單向時序模型,具有長短時記憶能力

②更契合時序建模問題

③減輕了RNN的梯度消散和梯度爆炸的影響

缺點:

計算復雜度大幅增加,且由于遞歸鏈接的影響使得并行操作難度加大

HMM-BLSTM聲學模型

優點:

相比HMM-LSTM,增添了反向時序信息,使模型的建模能力更強缺點:

①計算復雜度加大

②GPU的顯存需求增大從而降低了并行度,最終導致模型訓練變慢

③實際應用中的實時性問題

3.2. 語言模型

3.2.1. 定義

由聲學模型提供的發音序列,計算各種不同文本序列搭配的可能性。

對于某一句話s:

其中wi是統計單元,可以是字、單詞、短語等。

則句子s的概率可以表示為:

但若按此方法計算句子的概率存在兩個缺陷:

②數據過于稀疏:在語料庫中沒有出現的多詞對組合,由最大似然估計得到概率將為0.

4. 語音識別發展現狀

4.1. 語音識別詞錯率的突破

2016年,Microsoft的語音識別技術在產業標準 Switchboard 語音識別基準測試中詞錯率已降低至5.9%,達到與專業速記員同等水平。而在2017年,詞錯率更是達到了驚人的5.1%。從90年代到2010年左右,由于上一代聲學模型發展碰到瓶頸,語音識別的詞錯率實際上沒有太大的變化。在2010年后,由于DNN的提出與深度網絡的提出與研究,語音識別的詞錯率開始大幅減小。

4.2. 語音助手上的暗戰

4.2.1 Apple Siri

2011年,在iPhone 4s的發布會上,以智能語音助手身份亮相的Apple Siri成為當時全場最大的亮點。但由于當時粗糙的技術,使得Siri反應慢,出錯率高,不被大眾看好。而如今,具備人工智能特性的Siri已經會說36個國家的21種語言。而在智能汽車方面,Siri目前已經整合進奧迪、寶馬、克萊斯勒等全球9家知名汽車中。

4.2.2 Mircrosoft Cortana

2014年7月30日,微軟在Windows Phone 8.1 Update中國區發布會上正式發布了中文版Cortana,其中文命名為“微軟小娜”。

2016年12月,微軟在舊金山宣布,開放Cortana,使其能夠集成到智能音響、智能汽車、智能家電等硬件平臺上。

2018年8月,亞馬遜與微軟雙方各自完成了語音助手Alex和Cortana的整合。

4.2.3 百度小度

2015年9月,百度官方在百度世界大會發布了語音助手度秘。

2017年3月,百度官方在百度世界大會發布小度系統1.0(DuerOS1.0)。

在與第三方合作上,百度已經與中興、小米、聯想、索尼、網易游戲、比亞迪、特斯拉等企業建立了長久的合作關系。

5. 結論

借助云計算和大數據的發展,人工智能近年來發展迅猛。而在語音識別領域,研究者們也已經取得了不少成果,其背后潛在的巨大經濟效益也吸引了各國互聯網企業的注意,如今的語音識別技術雖然日趨成熟與完善,但仍然存在一定的難題,這就需要相關科研人員的努力。在計算機計算能力的進一步提升和5G通信普及的趨勢下,未來智能語音識別技術將會有令人意想不到的表現。

猜你喜歡
百度文本智能
Robust adaptive UKF based on SVR for inertial based integrated navigation
在808DA上文本顯示的改善
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
百度遭投行下調評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
主站蜘蛛池模板: 国产真实乱子伦精品视手机观看| av免费在线观看美女叉开腿| 91久久精品日日躁夜夜躁欧美| 一本大道无码高清| 国产精品香蕉| 婷婷五月在线视频| 国产一区二区三区夜色| 亚洲日韩高清无码| 日韩在线中文| 欧美精品高清| 国产剧情一区二区| 视频二区亚洲精品| 欧美性精品不卡在线观看| 99热这里只有免费国产精品 | 国产男女XX00免费观看| 国产成人久久综合777777麻豆| 亚洲中文字幕无码爆乳| 欧美一级色视频| 国产黑丝视频在线观看| 久久永久视频| 亚洲精品在线影院| 久久a毛片| 男人天堂伊人网| 亚洲成aⅴ人片在线影院八| 四虎精品国产AV二区| 国产成人久久综合一区| 极品av一区二区| 色首页AV在线| 丁香婷婷综合激情| 亚洲精品无码AV电影在线播放| 综合网久久| 亚洲一级毛片| 欧美特黄一级大黄录像| 欧美国产日产一区二区| 国产69精品久久久久妇女| 亚洲第一成网站| 日韩精品专区免费无码aⅴ| 国产杨幂丝袜av在线播放| 无码免费的亚洲视频| 欧美日韩精品在线播放| 香蕉伊思人视频| 精品1区2区3区| 亚洲无码视频图片| 欧美综合在线观看| 亚洲成人网在线播放| 又污又黄又无遮挡网站| 99ri精品视频在线观看播放| yy6080理论大片一级久久| 制服丝袜 91视频| 久久久久中文字幕精品视频| 青青草91视频| 亚洲av无码牛牛影视在线二区| 综合人妻久久一区二区精品| 国产日韩丝袜一二三区| 91亚洲免费视频| 韩日无码在线不卡| 亚洲天堂网在线观看视频| AⅤ色综合久久天堂AV色综合| 中国丰满人妻无码束缚啪啪| 欧美一级99在线观看国产| 日韩天堂视频| 福利一区三区| 色网站免费在线观看| 日本不卡在线视频| 女人18毛片水真多国产| 国产在线观看精品| 久996视频精品免费观看| 波多野结衣中文字幕一区二区| 97国产成人无码精品久久久| 免费 国产 无码久久久| 亚洲三级网站| 国产午夜人做人免费视频中文| 欧美综合成人| 91在线丝袜| 国产亚洲视频中文字幕视频| 久久久91人妻无码精品蜜桃HD | 欧美性天天| 免费看的一级毛片| 国产高清不卡视频| 亚洲人成网站色7777| 91精品国产自产在线老师啪l| 欧美笫一页|