999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語音識別專利技術綜述

2019-09-10 07:22:44牛洪波王婉君劉華楠
河南科技 2019年24期

牛洪波 王婉君 劉華楠

摘要:語音識別作為一種輸入手段,應用范圍越來越廣,從手機輸入到車輛遠程控制都會使用語音識別。本文通過對語音識別相關的專利數(shù)據(jù)進行統(tǒng)計分析,梳理了語音識別相關技術成果,對申請量、主要申請人、關鍵專利技術進行了分析,以期為該領域的相關研究提供建議。

關鍵詞:語音識別;關鍵技術;專利分析

中圖分類號:TN912.34 文獻標識碼:A 文章編號:1003-5168(2019)24-0059-03

Overview of Patent Technology for Speech Recognition

NIU Hongbo? WANG Wanjun? LIU Huanan

(Patent Examination Cooperation Henan Center of the Patent Office,CNIPA,Zhengzhou Henan 450018)

Abstract: Speech recognition, as an input method, has been applied widely, eg, mobile phone input,vehicle remote control. Based on the statistical analysis of patent data related to speech recognition, this paper reviews the achievements of speech recognition technology from different perspectives, and analyses the application volume, main applicants and key patent technologies.

Key words: speech recognition; key technology; patent analysis

1 語音識別技術概述

語音識別是利用計算機識別人們所說的自然語言。由于方言、說話習慣的影響,高效、正確的識別語音是各個公司、高校研究的重點。1952年AT&T貝爾實驗室開發(fā)出來世界上第一個語音識別系統(tǒng)Audrey,雖然這個系統(tǒng)只能識別10個英文數(shù)字,但是它開啟了語音識別的先河;到了80年代,隱馬爾可夫鏈(HMM)以及人工神經(jīng)網(wǎng)絡(ANN)的引入,使得語音識別的準確性和效率有了大幅提升[1-2]。

現(xiàn)在我們身邊都有很多語音識別的應用,相比于其他輸入方式,語音識別可以解放人們的雙手,提高輸入效率,廣泛應用在汽車駕駛、家電控制、手機輸入等。經(jīng)過幾十年的發(fā)展,全球范圍內有大量語音識別的專利申請。本文對語音識別相關專利申請進行分析,梳理其發(fā)展脈絡、發(fā)現(xiàn)重要申請人的專利布局,以期為相關研究奠定基礎。

2 語音識別技術專利申請現(xiàn)狀

2.1 國內外申請量趨勢以及主要分布區(qū)域

本文在DWPI數(shù)據(jù)庫中利用語音識別關鍵詞以及分類號進行檢索,以檢索得到截止到2018年9月公開的專利文獻為樣本,分析了語音識別的年申請量、分布區(qū)域、主要申請人,并在CNABS中針對國內的申請人進行了分析。

圖1示出了語音識別在全球和中國申請量的趨勢,全球的申請量從1993年開始明顯增長,2001年已經(jīng)到達1200多件,雖然由于2008年金融危機的影響,2008、2009年申請量有所下降,但是此后,繼續(xù)保持增長的勢頭。

國內的申請最早起步于1985年,是由清華大學申請的公開號為CN85100083A、發(fā)明名稱為“一種語音特征的提取和識別方法”的申請。此后幾年,申請量維持在個位數(shù)。從2009年開始,國內申請有了顯著增加,2017年申請量已經(jīng)達到913件,占到全球申請量的65.6%,這和國內互聯(lián)網(wǎng)的發(fā)展趨勢相吻合。

圖2示出了語音識別全球申請分布情況。研究語音識別的公司主要分布在美國,包括谷歌、IBM、微軟在內的科技公司以及美國的科研院所申請了大量專利,到目前為止,語音識別相關的專利在美國的申請量位居世界首位。此外,日本的申請量也比較大,重要的申請人有索尼、松下等。檢索發(fā)現(xiàn),這些公司不僅在日本布局專利,還通過PCT或巴黎公約的方式向美國、歐洲以及中國提交了相關申請,積極利用專利布局海外市場。在語音識別發(fā)展前期,國內的申請量較少,但是隨著我國國力以及創(chuàng)新能力的發(fā)展,近年來,中國的專利申請量有了明顯提升,2017年的申請量已經(jīng)是2001年的近8倍,已經(jīng)達到了900多件。

2.2 國內外主要申請人

對語音識別技術相關的專利申請人進行統(tǒng)計分析,在全球范圍內,申請量最多的前十位如圖3所示。這些申請人集中在專業(yè)公司以及大型公司。例如,Nuance作為專業(yè)的語音識別研發(fā)公司,投入了大量的研發(fā)力量,研發(fā)了目前世界最先進的語音識別軟件。此外,國外的主要申請人還有微軟、NEC、松下、索尼、三菱、佳能、三星、西門子以及IBM等。

國內申請人主要有百度、聯(lián)想、科大訊飛、上海能感物聯(lián)網(wǎng)、中興、騰訊、歐珀、樂視等,其申請的專利大多和自己的業(yè)務相關,例如CN101441869A是聯(lián)想在2007年申請的利用語音驗證用戶身份進而實現(xiàn)開關機,CN102385619A是百度在2011年申請的以語音識別為基礎的信息搜索。

3 語音識別關鍵技術及專利

最初是利用與模板匹配進行語音識別,但是當語料太多時,不僅處理速度開始下降,而且準確率也達不到預期效果。基于模板的識別方式雖然在短時間內對語音識別有了突破,但是眾多缺點限制了其應用的發(fā)展。鑒于基于模板的識別方法缺陷顯著,人們開始從其他角度進行突破,AT&T貝爾實驗室將馬爾科夫鏈應用到了語音識別,而且隨著訓練樣本的增加,語音識別的準確度有了大幅提升。目前使用較多也最為有效的語音識別技術主要有基于時間規(guī)整的語音識別技術、基于隱馬爾科夫的語音識別技術以及基于人工神經(jīng)網(wǎng)絡的語音識別技術。

3.1 基于時間規(guī)整的語音識別技術(DTW)

時間規(guī)整的語音識別技術最早由來自RCA實驗室的Martin在20世紀60年代提出。后來,來自蘇聯(lián)的Vintsyuk進一步提出了采用動態(tài)規(guī)劃實現(xiàn)動態(tài)時間規(guī)整的方法。動態(tài)時間規(guī)整通常用于識別單獨的詞,一般聯(lián)合小量詞匯表使用。動態(tài)時間規(guī)整的原理是提取語音的特征矢量,通過歐幾里得距離計算和參考模板的距離,顯然,距離越近越有可能是用戶真實的語音。早期基于動態(tài)時間規(guī)整的語音識別專利申請有US4918733A、US5073939A等,現(xiàn)在基于動態(tài)時間規(guī)整的語音識別技術發(fā)展相對成熟。目前的研究主要集中在將動態(tài)時間規(guī)整和其他語言識別技術整合,例如高通公司申請的US2002143540A,該申請將時間規(guī)整和隱馬爾科夫模型結合,提供了一種語音識別精確度更高的方案。

3.2 基于隱馬爾科夫鏈的語音識別技術(HMM)

1982年AT&T貝爾實驗室申請了基于馬爾科夫鏈的語音識別專利US4587670A,并以此專利為基礎,陸續(xù)申請了語音識別相關的其他專利,如US5946656A、US5963906A。隨著隱含馬爾可夫鏈在人工智能等領域的應用,出現(xiàn)了很多以改進隱含馬爾可夫鏈為基礎的語音識別專利申請,例如為了克服由于噪聲變化導致語音識別精確度低的問題,JP2004279466A提出了一種根據(jù)噪聲選擇最優(yōu)語音識別模型的自適應語音識別系統(tǒng)。隱馬爾科夫模型是現(xiàn)在語音識別系統(tǒng)的基礎,主流語音識別系統(tǒng)基本都是基于隱馬爾科夫模型的,例如GMM-HMM、DNN-HMM。

3.3 基于人工神經(jīng)網(wǎng)絡的語音識別技術(ANN)

神經(jīng)網(wǎng)絡在語音識別中的研究應用起始于20世紀80年代,利用人工神經(jīng)網(wǎng)絡建立的語音識別模型,除了對輸入信號的改進外,更多的是對神經(jīng)網(wǎng)絡的學習過程的改善,例如JPH0962644A是對學習過程的改進。基于神經(jīng)網(wǎng)絡的語音識別技術起步相對基于時間規(guī)整和馬爾科夫鏈的語音識別技術較晚,但是發(fā)展迅速,在最近幾年的申請量已經(jīng)超過基于隱馬爾科夫鏈的語音識別的申請量。由于神經(jīng)網(wǎng)絡在語音識別中突出表現(xiàn),后來人們又將卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)以及深度神經(jīng)網(wǎng)絡(DNN)應用在了語音識別,例如US2018166067A1、CN107993651A等。

4 結語

語音識別正在逐步改變我們的生活,隨著人工智能的發(fā)展,語音識別在未來也會發(fā)揮更加重要的作用。本文從申請量、主要申請人以及關鍵專利等角度,對語音識別方面的專利進行了梳理,現(xiàn)在的專利申請主要集中在語音識別在各領域的應用,特別是隨著物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的發(fā)展,出現(xiàn)了很多通過語音控制設備的申請。語音識別已經(jīng)逐步成熟,但是語音識別還面臨著諸如模糊音的識別、噪聲干擾、說話者感情識別以及方言識別等問題,相關企業(yè)、高校可以考慮從這些方面對語音識別進行改進。

參考文獻:

[1] 于俊婷,劉伍穎,易綿竹,等.國內語音識別研究綜述[J].計算機光盤軟件與應用,2014.

[2] 息曉靜,林坤輝,周昌樂,等.語音識別關鍵技術研究[J].計算機工程與應用,2006.

主站蜘蛛池模板: 国产高清毛片| 国产午夜不卡| 久久久久88色偷偷| 毛片在线播放a| 亚洲天堂网在线视频| 久久伊人操| 免费va国产在线观看| 毛片免费观看视频| 日韩在线网址| 1769国产精品免费视频| 狠狠久久综合伊人不卡| 亚洲AV无码久久精品色欲| 色偷偷综合网| 一本一道波多野结衣一区二区| 97在线公开视频| 香蕉久久永久视频| 狂欢视频在线观看不卡| 国产成人高清精品免费| 亚洲码在线中文在线观看| 99热这里都是国产精品| 伊人成人在线视频| 久久无码av一区二区三区| 亚洲欧州色色免费AV| 她的性爱视频| 日本在线国产| 九九热视频精品在线| 国产精品白浆无码流出在线看| 九九热免费在线视频| 久久天天躁狠狠躁夜夜躁| 免费看a毛片| 22sihu国产精品视频影视资讯| 国产无码网站在线观看| 在线一级毛片| 一区二区三区成人| 综合色88| 欧美成在线视频| 国产乱子伦视频在线播放 | 无码精品国产dvd在线观看9久| 亚洲—日韩aV在线| 精品久久香蕉国产线看观看gif| 日韩在线视频网站| 国产成人欧美| 国产成人AV综合久久| 99视频在线看| 欧美一级大片在线观看| 中国特黄美女一级视频| 亚洲有无码中文网| 精品国产成人三级在线观看| 日本国产精品一区久久久| 一级毛片中文字幕| 国产人成在线视频| 黄色三级网站免费| 欧美亚洲国产视频| 国产成人成人一区二区| 欧美精品亚洲精品日韩专区| 国产在线八区| 午夜在线不卡| 九九久久99精品| 国产精品伦视频观看免费| 欧美在线中文字幕| 国产成人一区二区| 中文字幕永久在线观看| 久久国产亚洲欧美日韩精品| 亚洲乱码视频| 国产高清不卡| 国产精品露脸视频| 国产免费一级精品视频| 老司国产精品视频| 国产精品亚洲片在线va| 国产一级精品毛片基地| 国产91特黄特色A级毛片| 一本综合久久| 亚洲AV成人一区国产精品| 97超级碰碰碰碰精品| 露脸国产精品自产在线播| 婷婷综合在线观看丁香| 性网站在线观看| 成·人免费午夜无码视频在线观看 | 国产尤物在线播放| 国产无码高清视频不卡| 国产高潮流白浆视频| 午夜不卡视频|