馮一萌

在電影《2012》中,一個富翁坐在車上說了一句“engine start”就能把汽車啟動,這就是智能語音技術。車主與汽車之間能實現娛樂互動,無論是聽廣播、聽短信或是查天氣、查股票,一開口,系統就能幫你實現并完成所有過程?,F在,銀行的語音機器人客服也上崗了。
中國工商銀行是國內第一家使用語音云智能呼叫系統的銀行,現在撥打工行的貴賓用戶專線400695588,或者在大連,青島,寧波,廈門四個地區撥打95588,再也不用在深深的語音菜單中迷失方向了,只要接通后對著電話隨意說出你的想法,比如:“我要查詢余額”,系統就可以自動轉接。
緩解人工壓力
工行的電子銀行語音菜單層級比較深,每個層級隱藏的子菜單更多,大量不想來回按菜單尋找的用戶往往直接撥打人工服務,但與此同時,人工客席的服務壓力越來越大,成本越來越高,這讓工行電子銀行決定謀求改變。
2009年,隨著業務不斷開展和業務層級的不斷豐富,工行的這個需求日益迫切,他們希望通過提高自助語音服務使用率,緩解人工客席壓力。這時工行電子銀行部了解到,德意志銀行等幾家國外的銀行已經開始使用智能語音呼叫系統。
通過在海外的分支機構、外部的咨詢公司等渠道,工行最終了解到不少外國銀行都使用的是Nuance公司的技術,這是一個今天看來我們并不陌生的公司,因為蘋果公司的Siri使用的就是Nuance的技術,在Nuance的幫助下,這些國外的銀行自助語音服務使用率大大提升。
2010年初,在經過復雜的項目技術可行性評測,若干次細化產品設計流程設計之后,工行決定開始智能語音呼叫系統項目,項目初期外包商集中采購階段,包括Nuance在內的幾家行業內領先的公司都在備選之列,而在綜合考慮之后,工行并沒有選擇Nuance,而是選擇了一家總部在安徽合肥,靠給華為、中興、移動運營商和教育部門提供語音技術的本土公司——科大訊飛。
“語音識別比較復雜,國外公司對中國語音不了解,語音服務上線后還有一個持續優化的過程,優化一次需要至少4個月的時間,這就考驗公司的本地化服務能力?!笨拼笥嶏w平臺與嵌入式事業部產品線經理李釗輝認為,這正是科大訊飛最終勝出的關鍵因素。
克服方言阻礙
語音是人類最自然的溝通方式,人們一旦用語音開始跟對方交流了,就會把對方當作一個人,工行正是期望這個系統最終能達到人的水平,但這給科大訊飛帶來的挑戰也顯而易見——用戶會喜歡怎么說就怎么說,機器必須要跟人做得一樣好。
其中,最難克服的就是口音問題。英文發音腔調口音的問題還算容易解決,但中文的口音問題卻是個相當棘手的難題,很多地區的方言簡直就跟中文不像一種語系,尤其是一些南方省份的方言識別起來難度非常大,工行要求智能語音系統識別率至少達到80%才能上線,這在當時幾乎是個不可能完成的任務。
科大訊飛投入50個員工專門服務工行這個項目,加上工行總行科技部的相關人員,組成了一支龐大的研發隊伍,整個系統搭建用時7個月。“科技部研發的人員都來自中國各個省份,他們故意用自己的家鄉的方言說話做產品評測,大家聚在一起反復測試?!惫ば须娮鱼y行產品開發二處高級經理李琳說,工行那時非常擔心語音識別率不高會引起人工投訴。
單憑這些人收集語料顯然不夠,科大訊飛還有一個200人的團隊負責收集全國各地的語音語調,這個部門在科大訊飛公司被稱為語音資源部,這個部門通過科大訊飛的APP等渠道收集全國各地的語音識別特征,并不保留原始的語言信息,甚至他們為了攻克某個地區的方言還會在當地找一些學生用方言錄音進行后期分析。科大訊飛計劃建立4000萬用戶的個人音庫,科大訊飛要把這些聲音特征儲存在云端。不管用戶在大眾點評還是攜程上進行語音操作,云那端都知道你說的“撒發”其實是“沙發”。
在金融業的應用中,科大訊飛則要仔細收集用戶說各種各樣金融詞匯的預料,比如:第三方存款等等,還有各種各樣用戶的說法,比如在用戶說“我要轉帳、我想轉帳、轉個賬”等各式各樣的固定說法都能識別出來。
更智能地交互
李釗輝發現,以前工行雖然提供了很多業務,但用戶真正用的集中在余額,明細,密碼,轉賬4個業務中?!霸谡Z音導航系統中找到需要的業務更容易,項目上線后工行進入導航系統后轉人工的比例相對按鍵轉人工比例相對下降10%?!崩钺撦x說。
現在,工行的智能語音系統平均識別率已經從80%提升到90%,導航涵蓋的業務:達到工行80%以上的業務,之前用戶按鍵系統中需要按鍵交互7-8次的業務,現在只需要語音交互2-3次即可,平均交互次數較之前大幅縮短,語音導航系統中用戶的自助服務使用率相對按鍵提升20%。
2011年7月底,工行智能語音系統正式投產上線,工行并不確定用戶是否接受這種聽起來有點酷的電話銀行服務方式,95588在大連、青島這兩個普通話相對較好的地區做了首批試點。
但問題也隨之而來,工行電子銀行發現這個項目運行一段時間后用戶首次使用后二次使用率并不高。“我們的歡迎語好像有點問題?!崩盍照f,比如400695588 貴賓用戶專線的歡迎語是:“我行推出語音識別服務,歡迎您按#進行體驗?!斑@可能讓用戶覺得我們這是一個試驗性質的服務,不是正式上線的東西,我們最近正在研究怎么調整這句歡迎語?!崩盍照f。
目前,運用科大訊飛智能語音系統的銀行不只工行一家,中信銀行的系統今年3月在95558客戶服務呼叫中心正式上線,中信稱之為“智能機器人客服代表CC”,定位為人工助手,性格年輕、活潑、有朝氣。中信銀行稱,與傳統手工按鍵方式相比,這種智能交互方式更貼近人工客戶服務??蛻敉ㄟ^簡單對話,就能完成信息查詢、業務受理等訴求,縮短了現有的菜單路徑,減少業務辦理時間。通過實現語音菜單扁平化,解決了因輸入瓶頸導致的自助服務使用難題,有效地提高了系統的自動化服務能力。
科大訊飛更愿意稱自己給銀行提供的這項服務為“語音云”,顧名思義,是采用云計算的方式來執行語音操作。在傳統通信計算模式下,語音的處理方式多是通過單個通信終端完成,例如我們熟悉的手機等通信終端;在云計算技術背景下,語音的格式轉換、辨別等操作完全在“云”端執行。通俗來說,就是不用鍵盤,不用手寫,只要說話就可以進行網絡搜索、發短信、發微博,筆記本電腦、手機等各類信息終端產品都具備了“能聽會說”的功能。
李琳透露,語音云在銀行的應用現在只是一個開始,未來工行會繼續提高語音識別率,把語音菜單應用到手機銀行用戶辦理業務中。“請選擇幣種,輸入轉賬金額都能通過語音,還能通過語音識別完全覆蓋按鍵,就像一個真實的人一樣?!?/p>