肖志健 南京樂韻瑞信息技術有限公司 喬紅巖 無錫韻茵信息科技有限公司
目前國內的智能家電行業發展形態各異,有好有壞,普遍看到打著智能的稱號,并沒有帶來實際的用戶交互體驗的改善。因此行業內引進了語音助手技術,為智能家電行業帶來新的可能性。
語音助手是移動互聯網的一個配套功能,從手機、PC 為入口,慢慢延伸到各種弱電微系統中,將微機技術、網絡技術、通信技術、數字信號處理和云計算進行結合,可以為人民提供語音交互方式的人機互動系統,可以解放人們的雙手。由語音助手集成的智能家電能夠對居家環境帶來極大的便利,由此推動智能化的家居系統。
語音助手從性能上主要分為離線語音助手系統,在線語音助手系統。離線語音助手依靠本地單芯片支持預制的部分指令,一般用在特定的應用場景;在線語音助手依靠強大的云計算功能,一般用在復雜場景的交互上。
語音助手需要芯片和云計算的支持,在國內外這塊業務提供的芯片公司、云服務公司相對較少,未能形成類似于手機芯片一樣的豐富選擇空間。并且目前缺少軟件+硬件交鑰匙的方案商,沒有大量的方案商愿意加入到這個行業中,去推這些語音助手在各個行業中的應用,最終語音助手的落地會相對較困難。
語音助手的關鍵技術包含計算機科學和聲學,要想在智能家電里面加入進語音助手必須具備這2 項關鍵技術,聲學部分的入門門檻相對高,所以這就限制了大部分想要進入的行業公司。同時具備這2 項技術的公司又相對較少,并且聲學人才國內外缺少嚴重。并且聲學需要特殊的實驗室環境,實驗設備動則10 多萬、幾十萬,所以聲學人才的培養相對困難 。
傳統的家電系統是通過單片機進行控制,能做簡單的調節控制(例如:空調,冰箱,全自動洗衣機),或者直接就是機械式的控制,依靠簡單的機械和電來控制(例如:機械式電飯煲,雙筒洗衣機,機械式油煙機)。這些設備有他的弊端,要么不能進行定制式的修改,要么操作繁瑣,解放不了人們的雙手。而由語音助手技術進行搭建的家電系統則體現出了非常大的優勢,在人們一邊干活的時候只需要通過特定的指令就可以去觸發設備進行特定的動作,實現全新的家居生活體驗。
離線語音助手在功能上實現的相對較少,只能識別幾個到幾十個不等數量的關鍵字,語言上也只能用預制的一種或幾種語言,控制方式上也是固定的,識別環境要求相對比較嚴格。微電子部分硬件組成上一般是由麥克風、語音識別芯片、功放芯片、喇叭等構成,主要的費用和研發事件都集中在語音識別芯片上,前期研發過程中需要進行大量的關鍵詞的訓練,并且提前預制這些關鍵詞到芯片中。就是這樣功能相對單一的語言助手,它的系統構建成本較低,實現相對簡單,對于傳統的家電的生產企業來說,做一些簡單的技術改進就可以嘗試用到新興的潮流技術。[2]例如:語音控制燈,語音控制插座,語音控制油煙機。例如:傳統方式上我們盡量將臥室的燈開關設計為雙開關,并且一個開關還會盡量設計到床頭位置,對于一個睡覺來回翻滾的用戶,半夜起來找開關一定是特別痛苦的事情。如果使用離線語音燈控,只要設備供電狀態下,只要要簡單的來一句“XXX,開燈”就可以實現效果。因此離線語音助手在傳統家電的改善上起到很大的作用,對人們的生活便捷性進行了提升。
不同于離線語音助手,在線語音助手更多的是依靠隱藏在網絡后面的云計算--看不見的大腦。它更多的關注于用的交互和體驗上,它本身沒有關鍵詞的識別限制,可以說只要是能在搜索引擎里面找的內容都可以通過在線語音助手來進行互動交流。所以在最初設計的時候,在終端方面需要考慮聲學問題,要達到能正確識別用戶在講什么的效果;在云端方面需要有一套好的“大腦”能理解用戶的所講出來的詞并且思考后做出優化的反饋。[3]例如:在冰箱上的語音助手系統,用戶要吃水餃發現冰箱沒有肉了,用戶可以躺在沙發上對著冰箱說“XX,幫我在小區YY 店訂購1kg 五花肉送到家里來”,那么首先冰箱上的語音助手要準確識別出用戶所講內容,然后完整發給后臺“大腦”,由“大腦”連接用戶的賬號并安排下單。用戶只要等著接受賬單和五花肉。
我國目前的智能家電行業發展迅速,智能語音助手技術將會越來越多的應用到智能化家電行業當中來,在未來的系統集成方面具有非常重要的地位,智能家電也將為人們的生活帶來更多的便捷,但是目前語音助手技術的發展還存在著一些短板,因此更要不斷的對語音助手技術進行更加深入的研究,開發更加合理、優化便于應用的語音助手全套方案,并且進行產業生態鏈的完善,讓語音助手技術助力智能家電提升人們的生活質量。