摘 要:服務質檢是熱線服務運營過程中非常重要的一個品質管控環節。傳統的客服質檢主要依托人工抽檢的方式開展,人工抽檢模式耗時、費力,質檢效率和抽檢覆蓋面低,且難以迅速發現短板加以改善,難以全面準確把握客戶需求抓住商機。智能語音技術應用將客服質檢工作變“聽”為“看”,有效提升質檢工作效率、擴大質檢覆蓋范圍、有效了解客戶真正的來電意圖,及時洞悉存在的業務及服務問題、發現客戶需求與商機,在降低運營成本的同時提升服務質量。
關鍵詞:智能語音分析;熱線服務;質檢
2011年10月,蘋果公司發布了iphone 4S,其中最大的亮點是一個智能語音搜索軟件Siri。Siri是應用在蘋果IOS平臺上的個人應用助理,其技術核心是智能語音處理技術+云計算。Siri的流行讓語音智能語音處理技術再次進入視野。一時間,基于智能語音處理技術的應用也進入了井噴期。智能語音技術主要研究人機質檢語音信息的處理,按機器在其中發揮的作用不同,可分為語音合成和語音識別兩大類。本文重點探討語音識別技術在熱線服務質檢領域的應用。
1 語音識別技術原理
語音識別是解決機器“聽懂”人類語言的一項技術。語音識別技術按照識別內容可分為語意識別和聲學識別。語意識別,其識別目的是將人類語音中的詞匯內容轉換為計算機可處理的輸入。聲學識別主要指聲紋識別技術,通過語音信號提取說話人獨有的聲學特征,進而識別出說話人身份的技術。[1-2]
語音識別系統構建過程整體上包括兩大部分:訓練和識別。訓練通常是離線完成的,對預先收集好的海量語音、語言數據庫進行信號處理和知識挖掘,獲取語音識別系統所需要的“聲學模型”和“語言模型”;而識別過程通常是在線完成的,對用戶實時的語音進行自動識別。識別過程通常又可以分為“前端”和“后端”兩大模塊:“前端”模塊主要的作用是進行端點檢測(去除多余的靜音和非說話聲)、降噪、特征提取等;“后端”模塊的作用是利用訓練好的“聲學模型”和“語言模型”對用戶說話的特征向量進行統計模式識別(又稱“解碼”),得到其包含的文字信息,此外,后端模塊還存在一個“自適應”的反饋模塊,可以對用戶的語音進行自學習,從而對“聲學模型”和“語音模型”進行必要的“校正”,進一步提高識別的準確率。[3]
語音識別的目的就是讓機器“聽懂”人類口述的語言,包括了兩方面的含義:其一是逐字逐句聽懂非轉化成書面語言文字;其二是對口述語言中所包含的要求或詢問加以理解,做出正確響應,而不拘泥于所有詞的正確轉換。[1-2]
2 智能語音分析系統功能架構
語音分析系統(ISA)是基于科大訊飛語音識別及語音分析技術,采用B/S架構,面向語音應用業務終端客戶的一套語音分析應用系統。系統核心技術架構應用圖如下:
其中藍色區域都屬于ISA產品的核心功能模塊,白色區域是和ISA產品有密切關系的第三方角色或組件。ISA產品分為應用接口(ISR Programming Interface)、識別引擎(Recognizer Engine)和操作系統適配(OS Adpters)三層架構:應用接口是ISA產品提供的用戶開發接口,是系統最重要的對外應用集成功能;語音分析引擎是開發接口的功能實現者,同時還提供了多種工具和方法用于支持開發;操作系統適配層屏蔽了多操作系統的復雜性,為識別引擎提供操作系統相關的底層支持。
2.1 語音轉寫
語音轉寫是語音分析中最重要的步驟,是建立文本索引,將非結構化的語音文件轉換為結構化的文本信息的核心功能。
語音分析系統首先將分離后的語音通過聲學模型轉換為對應的漢語音標符號,音標信息再通過超大詞匯網絡的語言模型識別出最終對應的文本內容。這個過程中,需結合各地、各區域地方口音適配,來優化聲學模型使其能夠廣泛覆蓋中國地方口音,還需要結合移動業務知識和熱線服務范圍,進行語言模型優化以提升語音轉寫準確率。
2.2 建立索引
語音分析系統可以檢測一通電話錄音中某一段音頻中基頻、音高等變化幅度,提供錄音中可能出現情緒波動的預測,并可以定位到情緒波動的音頻在整條語音的位置信息;檢測和分析出整個電話錄音中平均語速以及某段錄音中語速的變化;檢測出錄音文件中用戶及熱線服務人員都沒有說話的靜音時間等,這些信息最終生成標準XML格式的索引文件,索引文件的內容通常包括:
⑴用戶語音和話務員語音的文字轉寫結果;
⑵如是雙聲道語音,需要給出聲道信息(關鍵詞位于哪個聲道)和話務員情緒數據;
⑶短時語速數據;
⑷通話的語音端點、語速等信息;主要包括:
1)用戶和話務員各自的每次說話的起止時間、語速(字/秒);
2)用戶和話務員各自的平均語速(字/秒);
2.3 語音檢索
語音檢索主要針對10086系統中需要分析和檢測的關鍵詞信息、情緒檢測信息和長時靜音信息,從所有的索引文件中進行快速篩選,并返回所關注的語音。由系統對關注的信息進行自動的統計,從而返回出海量錄音文件中包含的統計信息。語音檢索核心檢索主要包含:
⑴實現關鍵詞檢出功能,對指定的關鍵詞列表,得到包含該關鍵詞列表中任意一個或多個關鍵詞的數據列表,以及關鍵詞在對應數據中的出現位置(時間起止點);
⑵實現異常情緒檢出功能,得到包含發音人情緒異常的數據列表,給出對應的異常產生位置及可信度,用戶可預先設置報警門限(基頻相對變化程度、語速門限、變化持續時間);
⑶實現長時靜音檢出功能,得到有長時間靜音的數據列表,給出對應的起止時間,用戶可預先設置門限;
不同的查詢要求都可以通過分解成以上核心功能進行查找。如圖3所示,語音分析系統可自動處理錄音文件,檢測出指定的關鍵詞,同時返回該關鍵詞在整條語音中的位置。系統支持同時檢索多個關鍵詞,并支持關鍵詞的邏輯組合功能,如查找:包含“手機上網”,同時包含“開通”關鍵詞的語音。
2.4 場景分割
在目前的熱線平臺錄音中,記錄了客服人員和用戶的全部對話,并按照錄音流水進行存儲,同一個錄音中同事包含了用戶和客服的錄音。在語音分析應用中,我們需要對兩方的通話內容進行分離,進而針對性的對客服人員服務質量進行監控,以提升熱線整體服務水平;而對用戶語音內容進行熱點問題分析、主要意見/建議、知識挖掘等應用。
2.5 集群服務
10086服務熱線每天將產生大量錄音數據,單臺服務器無法對海量語音進行及時處理,為了滿足應用需求,語音分析系統需要支持集群服務。當呼叫量增加時,通過添加服務器即可實現整體服務能力的提升。
索引建立服務器支持多條語音同時建索引,索引文件通過分布式的方式進行存儲,提供統一的索引訪問接口,而檢索服務器通過分段檢索索引的方式快速的查找。從而實現整個系統的集群服務。
支持災備功能,通過負載均衡的方式防止某臺服務器出現故障而導致整個服務中斷,從而保證語音分析系統可以提供7*24小時不間斷服務能力。
3 智能語音分析系統在熱線服務質檢中的應用
3.1 熱線服務質檢工作模式變化
傳統的客服質檢主要依托人工抽檢的方式開展,人工抽檢模式耗時、費力,質檢效率和抽檢覆蓋面低,且難以迅速發現短板加以改善,難以全面準確把握客戶需求抓住商機。
在現有客服質檢體系的基礎上探索應用語音智能分析技術,變“聽”為“看”,將有效提升質檢工作效率、擴大質檢覆蓋范圍、有效了解客戶真正的來電意圖,及時洞悉存在的業務及服務問題、發現客戶需求與商機,在降低運營成本的同時提升服務質量,使服務營銷水平實現質的飛躍。
通過語音分析系統全面變革現有質檢體系,實現語音分析系統與現有質檢系統、人工質檢與系統質檢的全面融合,建立常規質檢+專項質檢相結合的質量管控體系,如下圖所示,左邊為傳統的人工質檢體系,采用的是全面的人工參與判斷、測評的整個流程,右邊為語音質檢體系,先通過智能語音分析技術進行判斷過濾,再通過人工進行歸類選擇質檢。
整體模式上的變革體現在下面兩點:
⑴質檢模式由人工質檢向系統質檢+人工干預轉變
⑵錄音分析方式由“先測聽-后歸類”的隨機型向“先聚類-后測聽”的精準型轉變
3.2 應用情況
智能語音分析系統是從2013年1月開始試點用于熱線質檢工作,期間經過四次優化歷程,目前關鍵詞準確率達90.9%,質檢準確率達91.36%,已開始規模使用。具體應用如下:
⑴自主配置服務質檢模型。根據熱線質檢的情況,通過關鍵字采集及質檢策略設置共建立了五類服務質檢違規模型,分別是“話務結束未及時掛機”、“服務忌語”、“話務空白”、“無聲違規”、“急于掛機”。質檢模型實現自主配置,后期可根據話務實際情況總結建立新的質檢模型。
⑵兩套系統的無縫銜接,實現統一登陸界面,統一結果輸出。將智能語音分析系統的分析結果通過接口傳輸共享至10086客服質檢系統中,質檢人員只需要和日常工作一樣登陸質檢系統即可對智能語音系統拋出錄音進行人工二次復核,復核的結果與其它常態化質檢結果一樣通過質檢相關報表進行統一輸出。
⑶擴大質檢覆蓋面50倍。采用常態化的質檢手段,日均質檢量僅能占總話務量3‰,而智能語音分析系統可分析的錄音量日均約35000條,約占總話務量的15%,智能語音質檢的覆蓋面是原質檢手段的50倍。
⑷提升質檢工效近一倍。根據服務質檢模型對五個服務質檢違規項進行分析,每日拋出約200條目標錄音,再由人工對拋出的錄音進行二次復核。經二次復核的質檢差錯率達到54.24%,是常規質檢手段質檢差錯率的兩倍。即在發現同等數量問題方面,使用智能語音質檢系統+人工二次復核的方式較原傳統人工質檢手段工效提升近一倍。
⑸智能語音質檢助力員工服務規范的標準執行。智能語音質檢項目實施后,通過在服務規范上的應用,極大程度減少了前臺的非規范行為,員工對服務規范的關注度得到了提升,同時也提升了客戶滿意度。智能語音質檢項目實施后,月均服務規范違規行為得到了較好的控制,從實施前的月均1268例,降至實施后的497例,降幅達到61%。
4 實際應用過程存在的問題
語音識別技術目前的識別率距離真正的全智能還有一定距離,對用戶問題的識別有限,還需要很漫長的技術變革。并不是所有的用戶的問題都是“您好,請幫我查一下這個月的賬單”、“您好,請幫我取消彩信業務”、“您好,我這個月的流量怎么會這么快就用完了”。用戶對于運營商人工問答的需求是不盡相同的,若有用戶用蹩腳的普通話向運營商客服人員咨詢問題,機器人遠不具備這種強悍的功能。中國不僅只是文字博大精深,語言上面也是百花爭鳴,大到省市、小到各村之間,都存在著語音差異??偛荒茏屵\營商只服務普通話說得好的人,普通話不好的人就只能再回到人工服務上面,在全國普及標準普通話,也是需要長期的普通話教育才能實現。
5 結束語
應該說語音智能技術的應用,為開展熱線話務數據分析、應用打開了一扇門。要用好熱線話務數據,個人認為未來可以從以下三個方向進行探索,從中挖掘出更多的“寶貝”,支撐市場精細化運營:
⑴聚焦客戶代表服務缺陷,實施質檢分析,側重質檢和服務方面。
⑵聚焦客戶來電原因,實施需求基礎分析,側重營銷和推廣方面。
⑶聚焦產品流程問題,實施專題分析建模,側重產品和粘性方面。
[參考文獻]
[1]易克初.語音信號處理[M].北京:國防工業出版社,2002.
[2]趙力.語音信號處理[M].北京:機械工業出版社,2005.
[3]張永剛,余玉平.基于ARM的孤立語音識別系統的研究[J].廣東工業大學學報,2013年6月,第30卷,第2期:97 -98.
[4]安徽科大訊飛信息科技股份有限公司.訊飛語音平臺[EB/OL].http://open.voicecloud.cn/platform.php?category=cGxhdGZvcm0%3Dcolumn=d2hhdA%3D%3D.