李秀娟 孫劍鋒 韓虎 / 工業和信息化部電子知識產權中心
從專利視角看我國語音技術的發展
李秀娟孫劍鋒韓虎/工業和信息化部電子知識產權中心

摘要:移動互聯網和云計算的發展,語音技術得以發展和廣泛應用。中國作為全球語音技術的主要市場,受到各大公司的關注。通過專利數據分析,發現我國是全球領軍企業專利布局的重點地區,日本和美國企業布局了大量專利。國外領軍企業在全球主要地區都布局了大量專利,而我國領軍企業的專利布局主要集中在國內,全球競爭力較弱,如果產品出口可能面臨較大的知識產權風險。
語音技術的研究工作可以追溯到20 世紀50 年代AT&T 貝爾實驗室的Audry,它是第一個可以識別十個英文數字的語音系統。但真正取得實質性進展,則是在60年代末70年代初。計算機技術的發展提供了硬件和軟件的保障,線性預測編碼(LPC)技術和動態時間規整(DTW)技術的提出,有效的解決了語音信號的特征提取和不等長匹配問題。20 世紀90 年代前期,許多著名的大公司如IBM、蘋果、AT&T和NTT都對語音識別系統的實用化研究投以巨資。國外以Nuance公司為代表,Nuance占據了全球語音識別產品市場的70%左右。
中國的語音技術發展相對滯后。2008年之前,語音控制還停留在學術研究領域,主要研究單位包括清華大學、中科院聲學所和自動化所、中國科學技術大學等高校科研院所。從 2008年開始,伴隨移動互聯網的快速發展,語音識別才真正形成產業。同時,借助云計算的大力發展,語音技術迎來了前所未有的發展機遇和規模應用。
語音交互方式的專利申請起步較早,在2000年左右達到高峰,之后有所下降,最近幾年下降趨勢明顯。目前,語音交互技術比較成熟,識別率和準確率能日常應用的基本需求,近幾年和未來的研究重點集中在自然語言理解,技術創新點較少,相應地專利申請數量下降。(見圖1)

圖1 語音技術全球專利年度申請趨勢及中國專利年度申請趨勢
2011年,蘋果發布iPhone 4S,內置Siri語音系統,帶來了語音應用的熱潮。谷歌也在開發類似于Siri的語音系統,通過向安卓手機發出語音命令來控制機頂盒、智能手機和數字攝錄機等設備。三星在手機Galaxy III系列上應用的S Voice語音服務,能對8種語言進行識別。2013年微軟發布Xbox One,內置Kinect傳感器和麥克風,可實現語音功能,隨后索尼發布的PlayStation 4,也支持語音功能。這表明,經過長期的研究和積累,語音技術已走向市場,充分參與市場競爭。
相比全球申請,中國語音技術專利申請起步較晚,增長速度緩慢,1999年至2004年,是專利直線增長的時期。2005年到2011年,專利申請平穩發展。國內的語音控制產品從2011年開始出現。繼蘋果發布iPhone 4S之后,國內手機廠商也不甘人后。如,華為在高端機上采用“語音智能助手”功能,中興和Nuance通訊公司合作名為“駕駛助手”的車載應用。語音技術提供商科大訊飛自主研發語音云技術,并將其應用到智能電視中。
我國的語音技術研究和專利申請較早,但與國外相比仍然有若干年的滯后。從2005年開始到2011年相關產品才出現,技術的積攢與產品的出現時間相隔較長。2007年以后云計算技術的發展解決了語音控制技術的諸多技術瓶頸,從而使得基于大數據庫和深度神經網絡的語音識別迅速達到實用化水平。同時,在我國,由于中文語言與英文等西方語言的巨大差異,語音技術也有很大區別,因此一定程度的滯后是正常的。

全球申請量排名前20的申請人中,日本和美國申請人的專利實力較強,在申請人數量和專利申請數量方面都占據較大優勢。日本申請人有12位,美國申請人5位,申請人專利申請量都在100件以上,其中,索尼、松下和IBM的申請量都在700件以上,排名前三。如圖2所示,不同顏色圖柱對應不同國家的申請人。

圖 2全球語音控制領域專利申請人排名
以上排名反映了全球語音市場各申請人對語音技術的重視程度和專利實力。上述申請人在語音市場的競爭實力也不容小覷,在語音技術的研究過程中,不斷推出新產品。從市場反應來看,這些產品的占有率和口碑都得到了消費者的認可。2013年,索尼發布了可接受語音控制的自有品牌電視棒Bravia Smart Stick及具備語音功能的PlayStation 4游戲機,具備語音輸入和語音控制功能。松下的Viera 2012系列平板電視,IBM的ViaVoice,微軟的Speech SDK,摩托羅拉頭戴式顯示器,高通的PureVoice等產品都支持語音功能。值得注意的是,以上排名靠前的專利申請人中沒有中國申請人。
在中國語音控制專利中,美國和日本處于領先地位。日本有七位申請人入圍,,美國申請人有四位。在前二十名申請人中,中國申請人有五位,中科院排名第五,其余申請人排名較為靠后。從專利申請數量上看,中國申請人與國外申請人差距較大。(見圖3)

圖3 中國語音控制領域專利主要申請人排名
從上述兩幅圖可看出,全球領軍企業注重中國市場,在中國布局了大量專利。飛利浦和索尼處于領先地位,申請數量達到140件左右。兩家公司都在中國設立研究院,分別為飛利浦亞洲研究院和索尼中國研究院,為在中國申請專利創造了有利條件。飛利浦的語音技術主要應用在智能電視上,2013年,飛利浦推出支持普通話的語音控制智能電視,同年推出一款名為Surf(沖浪)的通用遙控器。索尼的語音技術主要應用于游戲機PS系列,由于2000年文化部聯合其它七部委下發通知,全面禁止中國內地的游戲機生產和銷售,因此索尼在中國的專利申請量與其全球申請量相比并不多。
進一步分析產業鏈特點,不難發現,美國領軍企業既有技術提供商、網絡運營商,也有產品制造商,產業鏈完整而強壯,日本的企業以下游廠商電視制造商為主,產業鏈以下游為重;我國的產業鏈部分環節缺失,參與企業的類型、數量都較少,企業的規模和產品競爭實力與國外相比也有較大差距。
具體而言,美國不僅擁有許多實力強勁的大公司,而且其更大的優勢在于這些公司較為合理地組成了完整而強壯的產業鏈。技術提供商以Nuance、微軟(研究院)、IBM、高通為代表,網絡運營商以AT&T為代表,產品制造商以微軟(產品)、蘋果為代表。這些企業不僅在專利申請中名列前茅,同時其技術輸出和產品在全球的影響力也是首屈一指。日本的應用廠商數量龐大,除以上提到的廠商外,NEC,東芝、佳能、富士通、三菱、雅馬哈等都參與其中,實現了通過下游影響整個產業的目的。
我國的領軍企業,中科院、華為和科大訊飛在專利申請數量方面與國外企業相比,差距較大。中科院作為科研機構,在語音技術方面研究較為深入,主要集中在算法等理論研究,目前為止還沒有相關產品問世,參與市場競爭較少。華為作為通信技術企業,在智能手機業務方面與國外企業抗衡的實力正在逐步形成,其語音技術領域的應用也主要集中在手機終端,業務領域待繼續擴展,專利實力也有待加強。科大訊飛是全球最大的中文智能語音技術和解決方案提供商,主要為智能電視、智能手機、家用電子設備等提供語音技術支持,其在中國市場的份額在50%以上,但專利申請嚴重不足,與龐大市場份額反差明顯。

圖4 各國領軍企業全球主要地區專利布局
從以上領軍企業中選擇各選擇一家企業作為中國、美國、日本、歐洲、韓國地區的代表企業,分析上述企業在以上五個地區的專利布局情況。圖中對角線的氣泡大小表示上述企業在本國的專利申請力度,除對角線之外的氣泡大小表示上述企業向國外申請力度的大小。可看出,歐洲企業飛利浦、日本企業索尼具有較強的全球布局意識,尤其注重中國和美國市場;美國企業IBM在美國國內申請專利較多,在全球專利布局較為均衡。韓國三星也較為注重中國和美國市場。中國企業科大訊飛,專利申請集中在國內,這與科大訊飛專注中文語音技術研究有關。(見圖4)
通過觀察對角線氣泡大小可看出,各國的領軍企業在其國內都有一定的專利實力。觀察對角線以外對應的氣泡,可看出,領軍企業注重中國、美國、歐洲這些主要國家和地區的專利布局。此外,除科大訊飛外的公司都注重企業的海外布局、企業合作和全球產品銷售。如上述公司都在中國成立的研究院;都與語音技術提供商nuance合作,將其成果應用到產品中;三星、索尼、飛利浦和IBM的產品及服務遍及全球,并享有良好聲譽。中國企業代表科大訊飛目前主要專注中文語音,業務范圍也局限與國內,在海外沒有專利申請,也沒有相應的分支機構或技術輸出。如果未來中國的語音產品出口海外,科大訊飛作為技術提供商將面臨較大風險。
語音技術經過較長時間的發展,在全球大部分市場已經較為成熟,技術性能達到實用化的要求,專利申請在2000年左右已達到高峰,未來研究的重點和熱點將集中于自然語言的理解。我國的語音技術相關研究和專利申請起步較國外有近10年的滯后。2007年以后,云計算技術的發展解決了語音技術的諸多技術瓶頸,基于大數據庫和深度神經網絡的語音技術迅速達到實用化水平,預計未來的專利申請還將持續快速增長。
在語音技術領域,美國擁有許多實力強勁的大公司,其產業鏈完整而強壯;日本產業鏈以下游為重。我國語音技術領域的產業鏈發展與國外相比有明顯差距,部分環節仍空缺或薄弱,例如網絡運營商沒有介入其中,使得產業鏈的知識產權保護存在明顯的短板和缺失。而科大訊飛作為最大的中文語音技術提供商,其專利申請仍嚴重不足,與其占有的龐大市場份額反差明顯。我國在企業參與數量和專利申請數量方面與國外企業相比還有一定差距。
國外領軍企業注重技術、市場和專利的全球化布局,部分企業如飛利浦,在中國的專利申請數量甚至超過了其在歐洲的數量,說明國外領軍企業的向外申請意愿和全球市場意識強烈。雖然國外企業進軍中文市場較為困難,但如果該領域的核心基礎技術在中國申請了專利,將對我國企業的發展構成一定威脅。我國以科大訊飛為代表的領軍企業專利申請集中在國內,在國外申請幾乎為零,未來產品出口將會面臨較大風險。鑒于我國的企業在國內的專利申請數量也不多,整合產業鏈上下游的專利資源,可增強抗擊風險的能力。
