崔文迪



摘要:本文通過對自然語言技術的研究及開發,利用微信平臺搭建了移動通信服務智能化集中的應用程序。通過自然語言處理、機器學習、大數據計算等技術創新手段,重點攻克利用在線機器人識別理解客戶問題,及時反饋客戶需求。
關鍵詞:自然語言技術;微信平臺;移動通信服務智能化
中圖分類號:TP391.1 文獻標識碼:A 文章編號:1007-9416(2017)11-0085-03
在信息更加透明、資訊獲取更加簡易快捷的移動互聯網時代,傳統的人工語音客服在“信息獲取便捷性和服務響應及時性”等方面的局限性日趨突顯。一方面,隨著移動通訊用戶規模不斷增長、基于微信的各類物聯網活動也日益增加,用戶對業務咨詢、售后服務申訴等方面的服務支撐需求不僅僅限于傳統10086以及營業廳咨詢;而企業由于用工成本提高、傳統客服人員流動性加快,現有的人工服務已無法“快速響應”各類型用戶的各種營銷及服務支撐需要。另一方面,移動互聯網快速發展,客戶獲取服務支持和營銷資訊的行為模式也發生了劇烈變化,特別是年輕群體更加青睞隨時、隨地、隨心的即時性互動交流式的服務獲取方式。因此,順應互聯網時代變遷,迎合客戶行為模式,滿足廣大用戶群體隨時隨地便捷獲取服務支持和營銷資訊的需求,已成為當前客戶服務工作需要考量的一項重要思路。
綜上所述,傳統的客服模式為:(1)坐席一對一語音服務;(2)多個路口的工單系統;(3)郵箱留言解決,明顯已經無法適應增長迅猛的業務需求。因此,我們亟需一種新的解決方案,提高客服響應效率及客戶滿意度,以積極應對客服模式轉型,故本文課題設定為“新一代智能客服系統的研究”。
1 基于自然語言處理的知識庫
移動信息化知識包括了移動的業務模型、數據模型等,因此具有大量的業務數據,平時在營業員給客戶推薦相關業務的時候,需要對這些知識進行培訓,牢記相關要求,由于數據量巨大,無法將所有的知識信息通過人腦記憶下來,需要將這些知識符號化和形式化。通過這種數據結構把移動業務領域的各種知結合到計算機系統的程序設計過程[1]。數據結構的方式,將知識進行歸納和總結,便于營業員能夠快速檢索使得移動業務知識,并且通過語義、語境的關聯、分析和融合,我們把移動業務知識進行數據化分析,從而搭建移動業務知識庫。
自然語言處理的智能客服系統是接受用戶以自然語言形式描述的提問,并從移動知識庫平臺中查找出能回答該提問的準確、簡潔答案的信息檢索系統。即在智能客服系統中,用戶在在交互界面提出相關的業務咨詢、話單查詢等問題,智能客服系統能從移動知識庫中尋找相應的解釋口徑,通過算法將知識融合并且將答案推送到用戶頁面上 ,用戶可以根據答案繼續提問或者點擊業務辦理鏈接直接辦理[2]。
以智能人機交互為核心,依托強大的智能知識庫,致力于為客戶提供智能信息自動交互、智能客戶服務和關聯業務查詢、辦理等智能服務平臺,并可滿足行業客戶的個性化需求。同時,可結合人工服務,進一步提高客戶服務滿意度。
1.1 基于統計的分詞方法
從形式上看,詞是穩定的字的組合,因此在上下文中,相鄰的字同時出現的次數越多,就越有可能構成一個詞。因此字與字相鄰共現的頻率或概率能夠較好的反映成詞的可信度。基于統計的方法理解一句話,就是要從一句話的每個位置全部候選字中選擇一個最可能的句子,我們假定一個字只與前面的N-1個字有關,若沒有N-1個音就補以空音。這種N-1階的馬爾可夫模型,在語音理解中又特別地被稱為N元文法模型(N-gramModel)。互現信息體現了漢字之間結合關系的緊密程度。當緊密程度高于某一個閾值時,便可認為此字組可能構成了一個詞。這種方法只需對語料中的字組頻度進行統計,不需要切分詞典,因而又叫做無詞典分詞法或統計取詞方法。但這種方法也有一定的局限性,會經常抽出一些共現頻度高、但并不是詞的常用字組,例如“這一”、“之一”、“有的”、“我的”、“許多的”等,并且對常用詞的識別精度差,時空開銷大。實際應用的統計分詞系統都要使用一部基本的分詞詞典(常用詞詞典)進行串匹配分詞,同時使用統計方法識別一些新的詞,即將串頻統計和串匹配結合起來,既發揮匹配分詞切分速度快、效率高的特點,又利用了無詞典分詞結合上下文識別生詞、自動消除歧義的優點[3-4]。智能客服系統結構圖1所示。
1.2 自然語言處理模型設計
自然語言處理模型圖2所示,本模型主要由兩個相對獨立的部分組成:知識庫部分和在線咨詢處理部分。其中,知識庫理部分主要為搭建移動知識庫,目的是進行移動業務知識庫的搜集,比如營銷案簡介、產品信息情況、各類套餐沖突說明、計費優先情況等、對這些知識信息建立和對原始信息的加工處理等,最終得到有移動知識庫信息的語義索引庫。在線咨詢部分主要包括獲取用戶的查詢內容、請求查詢條件編碼、通過用戶的輸入內容進行分詞分析,根據關鍵詞進行引擎查詢語義查詢索引庫、對檢索結果集進行最有算法選擇排序并將將最優的最終結果通過界面返回給用戶[5]。
我們引入查全率和查準率指標,對本系統進行分析[6]。查全率和查準率查準率圖3所示,(精度)是衡量某一檢索系統的信號噪聲比的一種指標,即檢出的相關文獻量與檢出的文獻總量的百分比。普遍表示為:查準率=(檢索出的相關信息量/檢索出的信息總量)x100%。使用泛指性較強的檢索語言(如上位類、上位主題詞)能提高查全率,但查準率下降。查全率(召回率),是衡量某一檢索系統從文獻集合中檢出相關文獻成功度的一項指標,即檢出的相關文獻量與檢索系統中相關文獻總量的百分比。普遍表示為:查全率=(檢索出的相關信息量/系統中的相關信息總量)x100%。使用泛指性較強的檢索語言(如上位類、上位主題詞)能提高查全率,但查準率下降。
通過對智能客服進行查詢測試,得到結論,查全率和查準率都處于較高水平,且能隨著查詢次數增加而提高。說明這個信息系統是有效的。查詢測試如表1所示。endprint
2 利用微信未載體搭建智能客服平臺
通過微信渠道,將人工智能技術與移動互聯網結合,依托廈門移動知識庫,實現為行業客戶提供智能信息自動交互、智能客戶服務,賦予廈門移動公眾平臺賬號強大智能交互能力,凝聚并提升平臺價值。
微信客服機器人可最大程度簡化人工坐席工作,提高客戶服務水平,減少人工資源投入。新用戶關注微信公眾號后,系統會自動推送廈門移動智能機器人主要功能菜單供用戶選擇,采用人性化文字讓用戶及時了解廈門移動智能機器人主要功能,并簡單快捷的明確如何使用智能機器人功能菜單。客服機器人主要功能菜單有業務咨詢,人工客服,業務辦理和活動。用戶輸入簡單關鍵字后,智能機器人依據知識庫的強大智能搜索引擎自動并快速匹配出相關信息,并提供給客戶一系列可選擇的菜單,讓用戶明確下一步操作步驟,簡化用戶獲取業務套餐的過程。
3 效果確認
壓力測試下系統承受情況圖4所示,效果一:壓力測試。使用HP公司專業在線測試工具LoadRunner,采用錄制\回放的方法,錄制發送 ML數據包,然后采用多線程的方式模擬大量客戶端向服務器方發送業務請求,達到壓力測試的目的。測試環境模擬現實使用中的帶寬和服務器計算能力。最多可容納5萬虛擬用戶同時在線,平均業務響應時間為1.34秒,能夠滿足廈門市需求。效果二:客戶滿意程度確認。系統上線后,我們對客戶滿意程度進行再次調查,達到84.5%,已達到預期目標。
4 結語
“智能客服”作為傳統人工語音服務的一種補強,是移動互聯網時代下所必備的一種服務模式。對于業務發展不斷更新的移動運營商來說,智能客服不僅滿足了移動互聯網時代下,用戶“隨時、隨地、隨心”獲取服務支持的心理預期,對企業來說還可實現營銷資訊 “快、準、精”傳遞,從而達到壓成本降及增進效益的目的。
參考文獻
[1]袁磊,張浩.基于本體化知識模型的知識庫構建模式研究[J].計算機工程與應用,2006,(30):65-68.
[2]姜倩盼.自然語言處理的挑戰與未來[J].信息與電腦:理論版,2013,(7):227-229.
[3]王小捷,常小寶.自然語言處理技術基礎[M].北京:北京郵電大學出版社,2002.
[4]徐延勇,周獻中,等.基于最大熵模型的漢語句子分析[J].電子學報,2003,(11):31.
[5]胡小華.基于用戶的智能問答系統的設計與研究[D].天津師范大學,2012.
[6]Yang Bingru, Xiong Fanlun. KD(D&K)and double--bases coperating mechanism[J].Journal of System Engineering and Electronics,1999,(2):48-55.
Abstract:In this paper, through the research and development of natural language technology, this paper uses the WeChat platform to set up an intelligent and centralized application of mobile communication services. Through natural language processing, machine learning, big data computing and other technological innovations, focusing on the use of online robot recognition to understand customer issues, timely feedback customer needs.
Key Words:natural language technology; WeChat platform; intelligent mobile communication servicesendprint