陳海燕, 喬麟, 蘇立偉
(廣東電網有限責任公司 客戶服務中心, 廣州 528000)
目前,廣東電網95598服務熱線采取19個地市局集約運營模式,高峰期日均排班320席,日均人工業務2萬宗。由此可見,95598客戶服務熱線是公司與客戶接觸的重要渠道,但95598客戶服務熱線當前普遍存在服務質量檢測失實、來電原因數據失真、客戶需求缺失等短板問題。呼叫中心作為企業用戶信息及服務信息的主要入口,采用傳統的數據采集、數據整理和分析的方法,效率低,成本高,無法從海量信息中精準提取有效信息,受到傳統數據采集限制,數據采集多采用隔壁樣本化,無法實現大數據篩選及精準分析[1]。
通過計算機網絡形成的管理系統已經成為信息生產和管理,客服人員每天處理數萬通電話,而質檢人員對這些通話錄音只能通過人工測聽的方式進行抽查,測聽抽檢比率低,質檢工作量大,效率低且覆蓋低,難以有效評價整體服務質量[2]。有時可能是一種很模糊的錄音,不一定都是存在重大的問題,可能是一些表達的方式不好,表達中出現了不該出現的用語,這些都是通過人工不斷都去檢測,可能要不斷地重復地收聽一段錄音,現有的語音手動抽檢測聽的方式效率低下并且覆蓋率低,這樣手動人為地檢測受到人為因素影響很大,可能在某一時間段漏掉一些關鍵的詞,無法準確地檢測不良的錄音[3]。針對客戶心聲,隱藏著大量的價值信息,如何收集、分析客戶心聲為深入剖析業務流程,系統及產品等存在的問題,協助決策領導針對性的問題解決[4]。
隨著信息技術的不斷發展,新的應用技術不斷涌現,新興的業務需求的也不斷出現。為了跟上時代的步伐,為客戶提供更加優質的服務,滿足更多客戶的要求,95598熱線需要有效的方法、技術手段和工具支撐,積極采用新技術,不斷的對客服工作進行升級補充,實現對客戶精細化服務的全面支撐。通過自然語言處理對錄音文本進行處理,自然語言處理(NLP, Natural Language Processing) 是人工智能和計算機科學的重要研究方向,主要包括文本分類,語音識別,中文自動分詞,機器翻譯,文本校對、信息抽取等方面的技術[5]。
針對上述現有技術中存在的問題,本設計提供了一種基于語音分析的智能評分方法,可以進行全量覆蓋質檢,質檢效率高,節約了質檢工作人員的工作量,并提高質檢質量。
將這種基于語音分析得智能客服評分方法應用于95598客戶服務熱線的智能質檢系統中,對全量95598錄音及工單數據進行語音分析,結合質檢模型實現全自動化的質檢評分流程。并且實現錄音轉文本后,還對語音數據進行更深層的數據挖掘與跟蹤分析,通過對熱點分析技術、語音關鍵詞聯想技術、客戶數據跟蹤分析研究等,得到的結果可以應用于便捷地開展業務和用于模型配置,有利于對95598熱線進行有效的監控和對異常事件的響應,同時也可較全面的刻畫出客戶的特征,挖掘隱藏在大量通話錄音中的信息,大大提升95598客戶服務的精益化管理水平[6]。
系統架構如圖1所示。

圖1 系統架構圖
通過使用語音轉寫引擎與自然語音處理算法作為系統支撐工具,結合95598服務熱線錄音及客服工單數據,進行全面的質檢工作。語音轉譯可將非結構化的語音信號轉換為結構化的文本信息, 是建立文本索引的基礎。然而在95598話務中轉譯難度較大, 原因一是話音差異, 必須以場景分割實現分離;二是受限于方言;三是囿于復雜的漢語同音詞及聲調, 混淆性大幅提升[7]。以自動化代替現有人工的質檢工作,質檢人員只需要看結果即可[8]。從而使質檢更具有針對性,大大提升質檢的覆蓋范圍及質檢效率。且本系統還具備分析能力,有效針對各種重復來電進行重復來電分析,及時發現客戶的不滿需求,有效提升95598客戶服務的精益化管理水平。并且使用語音分析技術,將非結構化錄音數據轉化為文本數據,為大數據分析應用和后續智能客服體系的搭建夯實基礎。
系統功能架構如圖2所示。

圖2 系統功能架構圖
呼叫中心錄音通過網絡傳輸至索引建立服務器集群中,索引服務器對送入的語音進行識別等過程后生成相應的索引文件,索引文件中包含了語音中的所有信息,并存儲至檢索服務器集群中,當用戶需要進行檢索時候,通過連接檢索服務器進行查詢。檢索服務器根據用戶的需求對從生成的索引文件中進行快速的查找,并將查詢結果返回至用戶,同時針對索引及轉寫結果進行相關質檢和分析應用的開展。
語音分析錄音數據工作流程如圖3所示。

圖3 語音分析工作流程
1)語音轉寫
語音轉寫是語音分析中最重要的步驟,是建立文本索引,將非結構化的語音文件轉換為結構化的文本信息的核心功能。
首先將分離后的語音通過聲學模型轉換為對應的漢語音標符號,音標信息再通過超大詞匯網絡的語言模型識別出最終對應的文本內容。這個過程中,需結合業務中涉及的各地、各區域地方口音適配,來優化聲學模型使其能夠廣泛覆蓋中國地方口音,還需要結合業務知識和熱線服務范圍,進行語言模型優化以提升語音轉寫準確率[9]。如圖4所示。

圖4 語音轉寫示例
2)場景分割
在目前的熱線平臺錄音中,記錄了客服人員和客戶的全部對話,并按照錄音流水進行存儲,同一個錄音中同事包含了客戶和客服的錄音[10]。在語音分析應用中,我們需要對兩方的通話內容進行分離,進而針對性的對客服人員服務質量進行監控,以提升熱線整體服務水平;而對客戶語音內容進行熱點問題分析、主要意見/建議、知識挖掘等應用,如圖5所示。

圖5 場景分割示例
3)索引建立
語音分析系統可以檢測出錄音文件中用戶及熱線服務人員都沒有說話的靜音時間等,這些信息最終生成標準XML格式的索引文件,索引文件的內容通常包括:
轉譯文本內容;
聲道信息;
工單內容;
4)關鍵詞檢索
實現關鍵詞檢索功能,對指定的關鍵詞列表,得到包含該關鍵詞列表中任意一個或多個關鍵詞的數據列表,以及關鍵詞在對應數據中的出現位置(時間起止點)[11]。
5)熱點分析技術
通過引入一種候選短語獲取的語音熱點分析技術,對海量錄音中一定時期熱度高的那些短語,比如人名、地名、業務名稱、投訴等,進行自動的篩查,展示當前錄音的熱點詞和熱點行為等,有利于對95598熱線進行有效的監控和對異常事件的響應[12]。
6)便捷測聽技術
提供嵌入一種便捷測聽技術,在對錄音中非結構化的語音文件轉換為結構化的文本信息后,通過提供多種便捷測聽的方式[3]。實現對文字化的錄音進行拖動、跳轉、關鍵詞附近和全文測聽等操作支持,供質檢人員使用,從而提升質檢效率[14]。
本設計提供了一種語音系統預質檢評分方法,用于對坐席服務人員的通話錄音進行預質檢評分。所述方法包括:
1)向呼叫中心獲取錄音音頻數據;
2)將獲取的錄音音頻數據轉化為文本格式的數據;所述文本格式的數據中包括坐席文本數據和客戶文本數據;
3)采用預設的質檢匹配算法對所述坐席文本數據進行評分,得到所述錄音音頻數據的服務質量分值;
4)將所述服務質量分值與所述文本格式的數據對應進行存儲。
本設計提供了一種語音人工質檢評分方法,用于對坐席服務人員的通話錄音進行人工質檢評分。所述方法包括:
1)從存儲系統中獲取已經過系統預質檢評分的錄音音頻數據與轉譯文本數據;
2)按業務需求由人工對錄音進行篩選與分配;
3)質檢員按質檢評分標準對分配的錄音進行人工質檢;
4)將人工質檢評分后的錄音音頻數據與轉譯文本數據對應進行存儲。
本設計提供了一種語音人工復檢評分方法,用于對坐席服務人員的通話錄音進行人工復檢評分。所述方法包括:
1)從存儲系統中獲取已經過人工質檢評分且由人工提出復檢申請的錄音音頻數據;
2)由質檢值長與質檢主管復檢人工復檢評分;
3)將人工復檢評分后的錄音音頻數據與轉譯文本數據對飲進行存儲。
系統整體質檢流程如圖6所示。
具體流程描述如下:
(1)首先,系統自動將全量錄音根據評分項進行語音預質檢;
(2)人工分配已預質檢的錄音給人員進行人工質檢。
(3)坐席對經過人工質檢的錄音提出復檢申請,由坐席值長進行初次審核,是否同意該復檢申請。如同意則流轉到值班經理處理,如不同意將結束復檢申請。
(4)復檢申請流轉到值班經理處進行二次審核,如值班經理同意則將復檢申請流轉到質檢值長進行人工復檢評分,如不同意將結束復檢申請。
(5)坐席查看二次質檢結果后,仍然對質檢結果不滿,線下找到值班經理,說明理由情況,如值班經理同意,可由值班經理發起終審申請,由仲裁小組進行第終審復檢評分,結束整個過程。如不同意也結束復檢申請。

圖6 語音評分流程
本次設計基于語音的智能客服評分方法應用于智能語音質檢系統中,將95598錄音文件轉譯為結構化的文本,改變傳統的人工抽檢,采用預設的質檢匹配算法對全量文本數據進行預質檢評分后,再進行指定分配人工質檢。這種方法大大提高了質檢的效率與覆蓋面積。同時由主管負責指定分配錄音的類型,使得人工質檢的的效果更具備公平性與針對性。構建基于語言智能處理技術的新一代智能客服,形成跨語言、全流程、深層次的客服智能化理解、處理與服務能力[15],同時對全量錄音數據、人工質檢錄音數據分別進行數據挖掘與分析,準確獲取客戶意圖與需求,為精準營銷服務提供有效的數據支撐。
目前基于語音分析的智能客服評分方法應用在95598服務熱線錄音的智能質檢系統中,在應用效果日趨成熟后,可將其推廣至電力行業的其他客服渠道中如統一服務平臺的各遠程渠道、營業廳的客服渠道等,力求能對所有渠道的客戶服務內容進行收集與分析,獲取具備業務價值的數據,并持續提升南方電網的客戶服務水平。