蘇立偉, 劉振華, 陳海燕
(廣東電網(wǎng)有限責(zé)任公司 客戶服務(wù)中心, 廣州 528000)
隨著電力改革發(fā)展,電力企業(yè)與客戶的溝通交流越來(lái)越多,95598客戶服務(wù)熱線仍是電力企業(yè)與客戶之間進(jìn)行溝通交流使用頻率最頻繁的服務(wù)渠道。盡管電力企業(yè)與客戶之間的互動(dòng)渠道日益增多,但相較于其他溝通方式,語(yǔ)音交流具有交互便捷、蘊(yùn)含豐富信息等優(yōu)點(diǎn)[1],對(duì)于客服而言,能更直接明了地了解到客戶意圖。調(diào)查發(fā)現(xiàn):一個(gè)具有10個(gè)坐席的呼叫中心一天的話務(wù)量是5 000通電話,話音量約為500個(gè)小時(shí)[2]。
電力企業(yè)的運(yùn)營(yíng)管理中,客服人員與客戶的對(duì)話質(zhì)量將直接影響客戶的用電體驗(yàn),客服人員的服務(wù)質(zhì)量在電力企業(yè)的發(fā)展進(jìn)程中有著至關(guān)重要的作用[3]。絕大部分隱藏在語(yǔ)音文件中的價(jià)值信息未被有效挖掘。運(yùn)營(yíng)商針對(duì)目前大量錄音數(shù)據(jù)暫無(wú)系統(tǒng)化的分析、質(zhì)檢、運(yùn)營(yíng)解決方案。如何通過(guò)智能語(yǔ)音分析的技術(shù)應(yīng)用,實(shí)現(xiàn)基于智能語(yǔ)音分析的客服智慧運(yùn)營(yíng)管理解決方案, 從而有效提升智能化運(yùn)營(yíng)手段、強(qiáng)化內(nèi)部管理、聚焦客戶服務(wù)心聲,提高客戶服務(wù)滿意度,有效降低客戶投訴率[4]。客服中心對(duì)通話音頻進(jìn)行質(zhì)檢,就是對(duì)95598服務(wù)熱線的客服人員的話務(wù)質(zhì)量進(jìn)行監(jiān)測(cè)與評(píng)分,通過(guò)監(jiān)測(cè)客服人員的服務(wù)水平,以考核結(jié)果來(lái)定量評(píng)價(jià)客服人員的工作質(zhì)量,依據(jù)公平客觀的結(jié)果來(lái)評(píng)估客服中心的運(yùn)行情況[5],以確保客服人員的總體服務(wù)水平,提高客戶的滿意度。
傳統(tǒng)的質(zhì)檢方法以人工抽樣質(zhì)檢錄音,客服人員每天處理數(shù)萬(wàn)通電話,而質(zhì)檢人員對(duì)所有的通話錄音只能通過(guò)隨機(jī)抽樣的方式進(jìn)行人工測(cè)聽,這種方法不僅工作量大、覆蓋面窄、抽檢率低,同時(shí)由于質(zhì)檢人員的判斷具備主觀性,難以有效客觀地對(duì)整體服務(wù)質(zhì)量進(jìn)行合理評(píng)價(jià)。一通錄音平均時(shí)長(zhǎng)為120秒, 通過(guò)語(yǔ)音質(zhì)檢可以直接定位到問(wèn)題工單, 每通約節(jié)約66秒, 每天將節(jié)約23.8小時(shí)[6]。
問(wèn)題語(yǔ)音檢出方法設(shè)計(jì)方案
針對(duì)傳統(tǒng)的質(zhì)檢方法所存在的缺陷,本設(shè)計(jì)提供一種問(wèn)題語(yǔ)音檢出方法和裝置,屬于呼叫系統(tǒng)技術(shù)領(lǐng)域。其中,問(wèn)題語(yǔ)音檢出方法包括:向呼叫中心獲取錄音音頻數(shù)據(jù);將獲取的錄音音頻數(shù)據(jù)轉(zhuǎn)化為文本格式的數(shù)據(jù);所述文本格式的數(shù)據(jù)中包括坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù);采用預(yù)設(shè)的質(zhì)檢匹配算法對(duì)坐席文本數(shù)據(jù)進(jìn)行評(píng)分,得到錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值;如果所述服務(wù)質(zhì)量分值小于設(shè)定閾值,發(fā)出問(wèn)題提示,以提示用戶對(duì)所述錄音音頻數(shù)據(jù)進(jìn)行人工質(zhì)檢[7]。通過(guò)對(duì)錄音數(shù)據(jù)的監(jiān)測(cè)、提煉, 定期整理出涉及公司業(yè)務(wù)流程、管理漏洞、產(chǎn)品缺陷、服務(wù)短板等方面的問(wèn)題, 為提高公司整體服務(wù)能力、減少服務(wù)短板提供依據(jù)[8]。本發(fā)明實(shí)施例提供的問(wèn)題語(yǔ)音檢出方法和裝置,對(duì)錄音音頻數(shù)據(jù)自動(dòng)進(jìn)行識(shí)別和評(píng)分,可以實(shí)現(xiàn)全面覆蓋,檢出問(wèn)題通話錄音,提示用戶對(duì)問(wèn)題通話錄音進(jìn)行人工質(zhì)檢,大大減少了質(zhì)檢工作人員的工作量。
1) 向呼叫中心獲取錄音音頻數(shù)據(jù)
與95598呼叫平臺(tái)錄音數(shù)據(jù)庫(kù)實(shí)現(xiàn)無(wú)縫對(duì)接和交互,根據(jù)錄音編號(hào)信息,查詢?cè)撲浺粼诤艚衅脚_(tái)的存儲(chǔ)路徑信息。根據(jù)錄音存儲(chǔ)路徑,獲取錄音文件及對(duì)應(yīng)XML文件(包含用戶來(lái)電信息)[9]。并將所有錄音文件進(jìn)行轉(zhuǎn)碼(8K 16bit編碼格式),使用SFTP傳輸方式上傳至語(yǔ)音分析引擎作保存及語(yǔ)音識(shí)別。
2) 轉(zhuǎn)譯錄音音頻數(shù)據(jù)
通過(guò)語(yǔ)音轉(zhuǎn)譯引擎將獲取的錄音音頻數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的文本格式數(shù)據(jù);所述文本格式的數(shù)據(jù)中包括坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)[10]。將非結(jié)構(gòu)化的錄音音頻數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的文本信息數(shù)據(jù)是實(shí)現(xiàn)該問(wèn)題語(yǔ)音檢出方法的一項(xiàng)核心功能,轉(zhuǎn)譯成結(jié)構(gòu)化文本信息數(shù)據(jù)后,有利于錄音定位、問(wèn)題檢出、便捷檢索等[11]。
3) 錄音預(yù)質(zhì)檢
采用預(yù)設(shè)的質(zhì)檢匹配算法對(duì)所述坐席文本數(shù)據(jù)進(jìn)行預(yù)質(zhì)檢評(píng)分,并檢出錄音存在的差錯(cuò)問(wèn)題,得到所述錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值;如果所述服務(wù)質(zhì)量分值小于設(shè)定閾值,發(fā)出問(wèn)題提示,以提示用戶對(duì)所述錄音音頻數(shù)據(jù)進(jìn)行人工質(zhì)檢。
通過(guò)上述三步,將對(duì)從呼叫中心所獲取的全量錄音音頻數(shù)據(jù)進(jìn)行全自動(dòng)質(zhì)檢,保證錄音覆蓋面廣、質(zhì)檢客觀,并有效檢出錄音中存在的差錯(cuò)問(wèn)題,同時(shí)在轉(zhuǎn)譯文本數(shù)據(jù)中標(biāo)記差錯(cuò)位置,有利于后期進(jìn)行人工質(zhì)檢時(shí)進(jìn)行定位與質(zhì)檢,保證其準(zhǔn)確性與工作效率。
本設(shè)計(jì)提供了一種問(wèn)題語(yǔ)音檢出方法。當(dāng)成功從呼叫中心獲取所需錄音音頻數(shù)據(jù),則需要后續(xù)一系列適當(dāng)?shù)牟僮鲗?wèn)題錄音成功檢出。
2.1.1 語(yǔ)音轉(zhuǎn)文本方式一
根據(jù)所述錄音音頻數(shù)據(jù)中包含的不同語(yǔ)音的音色、音調(diào)及用語(yǔ),將所述錄音音頻數(shù)據(jù)區(qū)分為坐席音頻數(shù)據(jù)和客戶音頻數(shù)據(jù);
將所述坐席音頻數(shù)據(jù)轉(zhuǎn)化為坐席文本數(shù)據(jù);
將所述客戶音頻數(shù)據(jù)轉(zhuǎn)化為客戶文本數(shù)據(jù)[12]。
2.1.2 語(yǔ)音轉(zhuǎn)文本方式二
將獲取的錄音音頻數(shù)據(jù)整體轉(zhuǎn)化為文本格式的數(shù)據(jù);
對(duì)所述文本格式的數(shù)據(jù)進(jìn)行語(yǔ)義識(shí)別和上下文匹配,將所述文本格式的數(shù)據(jù)區(qū)分為坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)。
2.2.1 錄音預(yù)質(zhì)檢方式一
采用余弦相似性算法和/或漢明距離算法對(duì)所述坐席文本數(shù)據(jù)進(jìn)行評(píng)分,得到所述錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值。
2.2.2 錄音預(yù)質(zhì)檢方式二
采用余弦相似性算法判斷所述坐席文本數(shù)據(jù)中所包含的預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)的數(shù)量;
根據(jù)所述標(biāo)準(zhǔn)用語(yǔ)的數(shù)量,確定所述錄音音頻數(shù)據(jù)的服務(wù)態(tài)度分值;
采用漢明距離算法判斷所述坐席文本數(shù)據(jù)中所包含的客戶信息是否正確,確定所述錄音音頻數(shù)據(jù)的服務(wù)有效性分值;
根據(jù)所述服務(wù)態(tài)度分值和所述服務(wù)有效性分值,得到所述錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值[13]。
2.2.3 錄音預(yù)質(zhì)檢方式三
對(duì)所述服務(wù)態(tài)度分值和所述服務(wù)有效性分值進(jìn)行加權(quán)處理,得到所述錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值。
2.2.4 錄音預(yù)質(zhì)檢方式四
采用關(guān)鍵詞匹配算法,判斷所述坐席文本數(shù)據(jù)中是否包含預(yù)設(shè)的服務(wù)禁語(yǔ);
如果是,從所得的服務(wù)質(zhì)量分值中扣除設(shè)定的第一分值。
2.2.5 錄音預(yù)質(zhì)檢方式五
當(dāng)采用關(guān)鍵詞匹配算法,判斷所述坐席文本數(shù)據(jù)中不包含預(yù)設(shè)的服務(wù)禁語(yǔ)時(shí),采用同義詞匹配算法,判斷所述坐席文本數(shù)據(jù)中是否包含預(yù)設(shè)的服務(wù)禁語(yǔ);
如果是,從所得的服務(wù)質(zhì)量分值中扣除設(shè)定的第一分值。
以提示框的形式,顯示包含所述錄音音頻數(shù)據(jù)編號(hào)的問(wèn)題提示信息。
本設(shè)計(jì)提供了一種問(wèn)題語(yǔ)音檢出裝置。該裝置包含問(wèn)題語(yǔ)音檢出的流程中各模塊功能,能有效將問(wèn)題語(yǔ)音檢出。
用于向呼叫中心獲取錄音音頻數(shù)據(jù)。該方法可以在計(jì)算機(jī)中通過(guò)執(zhí)行應(yīng)用程序?qū)崿F(xiàn),該應(yīng)用程序自動(dòng)向呼叫中心獲取錄音音頻數(shù)據(jù)。呼叫中心可以是與各個(gè)坐席通話終端連接的中心服務(wù)器或存儲(chǔ)器。
獲取的錄音音頻數(shù)據(jù)中包括通話時(shí)間、通話終端號(hào)及通話錄音,還可以包括坐席服務(wù)人員的工號(hào)。
用于將獲取的錄音音頻數(shù)據(jù)轉(zhuǎn)化為文本格式的數(shù)據(jù);所述文本格式的數(shù)據(jù)中包括坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)。
具體可以根據(jù)錄音音頻數(shù)據(jù)中包含的不同語(yǔ)音的音色、音調(diào)及用語(yǔ),將錄音音頻數(shù)據(jù)區(qū)分為坐席音頻數(shù)據(jù)和客戶音頻數(shù)據(jù),然后將坐席音頻數(shù)據(jù)對(duì)應(yīng)轉(zhuǎn)化為坐席文本數(shù)據(jù),將客戶音頻數(shù)據(jù)轉(zhuǎn)化為客戶文本數(shù)據(jù)。或者,可以將獲取的錄音音頻數(shù)據(jù)先整體轉(zhuǎn)化為文本格式的數(shù)據(jù),然后對(duì)文本格式的數(shù)據(jù)進(jìn)行語(yǔ)義識(shí)別和上下文匹配,將文本格式的數(shù)據(jù)區(qū)分為坐席文本數(shù)據(jù)和客戶文本數(shù)據(jù)。
用于采用預(yù)設(shè)的質(zhì)檢匹配算法對(duì)所述坐席文本數(shù)據(jù)進(jìn)行評(píng)分,得到所述錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值。
可以采用余弦相似性算法或者漢明距離算法對(duì)坐席文本數(shù)據(jù)進(jìn)行評(píng)分,得到錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值。也可以采用余弦相似性算法判斷坐席文本數(shù)據(jù)中所包含的預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)的數(shù)量;根據(jù)標(biāo)準(zhǔn)用語(yǔ)的數(shù)量,確定錄音音頻數(shù)據(jù)的服務(wù)態(tài)度分值;采用漢明距離算法判斷坐席文本數(shù)據(jù)中所包含的客戶信息是否正確,確定錄音音頻數(shù)據(jù)的服務(wù)有效性分值;根據(jù)服務(wù)態(tài)度分值和服務(wù)有效性分值,得到錄音音頻數(shù)據(jù)的服務(wù)質(zhì)量分值。
3.3.1 余弦相似性算法
采用余弦相似性算法判斷坐席文本數(shù)據(jù)中所包含的預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)的數(shù)量,即采用余弦相似性算法將坐席文本數(shù)據(jù)中的詞句與預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)進(jìn)行比對(duì)。
將坐席文本數(shù)據(jù)中的詞句作為第一向量,將預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)作為第二向量,通過(guò)計(jì)算兩個(gè)向量的夾角余弦值來(lái)評(píng)估二者的相似度。具體來(lái)說(shuō),余弦函數(shù)是三角函數(shù)的一種,在Rt△ABC(直角三角形)中,∠C=90°,∠A的余弦是它的鄰邊比三角形的斜邊,即cosA=b/c,也可寫為cosA=AC/AB。余弦函數(shù):f(x)=cosx(x∈R)。
對(duì)于二維空間,根據(jù)向量點(diǎn)積公式,可以得知 ,假設(shè)向量a、b的坐標(biāo)分別為(x1,y1)、(x2,y2),則。
設(shè)向量A=(A1,A2,…,An),B=(B1,B2,…,Bn),則,其中,Ai、Bi指詞頻。
如果坐席文本數(shù)據(jù)中的語(yǔ)句與某個(gè)預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)的余弦相似度達(dá)到0.75,則認(rèn)為坐席文本數(shù)據(jù)中包含該預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)。統(tǒng)計(jì)坐席文本數(shù)據(jù)中所包含的預(yù)設(shè)的標(biāo)準(zhǔn)用語(yǔ)的數(shù)量,數(shù)量每增加一個(gè),服務(wù)態(tài)度分值就增加一個(gè)設(shè)定值。數(shù)量越多,錄音音頻數(shù)據(jù)的服務(wù)態(tài)度分值越高。
3.3.2 漢明距離算法
漢明距離算法判斷坐席文本數(shù)據(jù)中所包含的客戶信息是否正確。SimHash(漢明距離)算法將一個(gè)文檔轉(zhuǎn)換成64位的字節(jié),然后通過(guò)判斷兩個(gè)字節(jié)的漢明距離確定相似度。通過(guò)simhash算法可以分別計(jì)算出坐席文本數(shù)據(jù)中所包含的客戶信息的simhash值和預(yù)存的客戶信息的simhash值,通過(guò)計(jì)算出的兩個(gè)simhash值來(lái)計(jì)算兩者之間的漢明距離,根據(jù)漢明距離來(lái)比較兩者之間的相似度。漢明距離是指兩個(gè)相同長(zhǎng)度的字符串相同位置上不同的字符的個(gè)數(shù)。
漢明距離算法主要包括分詞、hash(哈希算法)、加權(quán)、合并和降維五個(gè)步驟。首先針對(duì)坐席文本數(shù)據(jù)中的一段語(yǔ)句,進(jìn)行分詞,得到有效的特征向量,然后為每一個(gè)特征向量設(shè)置1-5等5個(gè)級(jí)別的權(quán)重(如果是給定一個(gè)文本,那么特征向量可以是文本中的詞,其權(quán)重可以是這個(gè)詞出現(xiàn)的次數(shù))。
用于如果所述服務(wù)質(zhì)量分值小于設(shè)定閾值,發(fā)出問(wèn)題提示,以提示用戶對(duì)所述錄音音頻數(shù)據(jù)進(jìn)行人工質(zhì)檢。
判斷服務(wù)質(zhì)量分值是否小于設(shè)定閾值;如果是,發(fā)出問(wèn)題提示,以提示用戶對(duì)錄音音頻數(shù)據(jù)進(jìn)行人工質(zhì)檢,以提示框的形式,顯示包含錄音音頻數(shù)據(jù)編號(hào)的問(wèn)題提示信息。
本次設(shè)計(jì)研究應(yīng)用于95598電力客服智能質(zhì)檢系統(tǒng)的問(wèn)題語(yǔ)音檢出方法,構(gòu)建基于語(yǔ)言智能處理技術(shù)的新一代智能客服,形成跨語(yǔ)言、全流程、深層次的客服智能化理解、處理與服務(wù)能力[14]優(yōu)化傳統(tǒng)以人工抽樣質(zhì)檢錄音的質(zhì)檢方法,避免質(zhì)檢覆蓋面窄、抽檢率低、問(wèn)題檢出率低的情況,通過(guò)全量自動(dòng)質(zhì)檢錄音,能夠有效自動(dòng)檢出全量錄音中存在問(wèn)題,發(fā)出問(wèn)題提示,以提示用戶對(duì)所述錄音音頻數(shù)據(jù)進(jìn)行人工質(zhì)檢。通過(guò)這種方法,能夠避免質(zhì)檢人員隨機(jī)抽檢的主觀性與隨機(jī)性,有效對(duì)整體的客服服務(wù)質(zhì)量進(jìn)行客觀合理的評(píng)價(jià)。
利用設(shè)計(jì)的問(wèn)題語(yǔ)音檢出裝置將問(wèn)題語(yǔ)音檢出方法實(shí)施,通過(guò)將95598錄音文件轉(zhuǎn)譯為結(jié)構(gòu)化的文本,改變傳統(tǒng)的人工抽檢,采用預(yù)設(shè)的質(zhì)檢匹配算法對(duì)全量文本數(shù)據(jù)進(jìn)行預(yù)質(zhì)檢并檢出存在問(wèn)題的錄音并提示用戶,便于后續(xù)的人工質(zhì)檢工作。經(jīng)由智能質(zhì)檢系統(tǒng), 同時(shí)結(jié)合業(yè)務(wù)模型, 對(duì)全量錄音將被篩選分析, 此時(shí)研究將傳統(tǒng)的隨機(jī)抽樣方式轉(zhuǎn)變成程序進(jìn)行, 然后篩選出可能有問(wèn)題的通話記錄再交由人工進(jìn)行質(zhì)檢大大提高了質(zhì)檢的覆蓋面積, 根據(jù)系統(tǒng)詞語(yǔ)庫(kù)設(shè)定敏感用詞以及抽樣方法的篩選, 使得每個(gè)客服的質(zhì)檢范圍都是一致的, 使質(zhì)檢更加具備公平性與針對(duì)性, 為市場(chǎng)需求以及傾聽用戶需求提供有效的數(shù)據(jù)[15]。
目前問(wèn)題語(yǔ)音檢出方法主要應(yīng)用于95598電力客服智能質(zhì)檢系統(tǒng)中,在應(yīng)用效果日趨成熟后,可將其推廣至電力行業(yè)的其他客服渠道中如統(tǒng)一服務(wù)平臺(tái)的各遠(yuǎn)程渠道、營(yíng)業(yè)廳的客服渠道等,力求能對(duì)所有渠道的客戶服務(wù)內(nèi)容進(jìn)行收集與分析,獲取具備業(yè)務(wù)價(jià)值的數(shù)據(jù),并持續(xù)提升南方電網(wǎng)的客戶服務(wù)水平。