盧致亮 匡先進 曾趙錦
【摘要】? ? 自然語言處理是IT技術重要的創新之一,本文針對電力客服系統的需求,結合自然語言處理技術討論了一種電力客服系統設計與實現過程。討論了系統構建過程中涉及的實現模式、系統組件、核心算法等內容。該系統以電力服務為知識庫數據源,利用自然語言處理技術進行分詞及詞向量轉換,利用知識庫訓練并構建模型,最終完成電力智能客服系統的構建,其運行效果良好。
【關鍵詞】? ?自然語言處理? ? 智能問答? ? 電力服務
引言:
人工智能技術在飛速發展,并迅速應用于各行各業。電力系統關系到國計民生,人工智能在電力系統中的應用必將有效提升電力運維的效率與安全。人工智能系統與電力系統的融合體現在諸多方面,本文以電力智能客服系統的設計與實現為切入點,將自然語言處理技術應用于電力系統的自動運維,使電力系統的運維向自動化、智能化方向發展。
智能手機的普及讓用戶希望擁有更便捷的信息獲取方式和更人性化的人機交互體驗。此背景下,我們進行了電力客服系統的研究與開發,在工單大數據技術的助力下,構建了一個能夠快速吸收和利用已有知識的對話理解模型,對用戶的問題通過自然語言處理技術進行分析,采用機器學習方法構建和優化問答模型,構建出一個高效、準確的智能問答系統。
本文組織如下,首先介紹了電力客服系統的研究意義,并對當前國內外研究現狀進行了分析;然后討論了相關系統組件、核心算法、自然語言處理方法;最后給出了電力智能客服系統模型的構建流程。
一、研究現狀
智能問答系統可以定義為能與人進行對話的應用程序,即采用文字、語音來與計算機進行交互的問答系統。問答系統的發展經歷了漫長的歷史。
1988年,Berkeley研發了聊天機器人UC[1],該系統通過自然語言交互界面為用戶使用系統提供幫助。此后延伸出多種類似系統,如 YAP[2]用于電話信息查詢,CSIEC[2]則用于學習輔助。
國內,中科院于1998年構建了第一個人機對話系統[3]。初期的問答系統常限定于某特定領域,結合知識庫和推理機而形成專家系統(ES)[5]。
在電力系統運維方面,目前應用于電力系統的方法有神經網絡[4]、模糊集理論[6]等。神經網絡具有良好分類性,被廣泛應用于電力系統的監測、診斷、實時控制、符合預測以及狀態評估等不同的領域[7]。模糊集則可完成傳統數學方法難以描述的模糊計算問題,目前已應用于電力系統的系統規劃、模糊控制等方面[8],這些方法在構建智能問答系統方面也具有較大的潛力。
當前,越來越多的公司、研究機構在進行智能問答技術的研發,如微軟、蘋果、劍橋大學等,工業界和學術界已產出一些比較成熟的智能問答系統。實際中,電力客服系統因其友好、便捷和及時的特點而迅速受到客戶的認可。
三、系統架構
電力客服系統是智能問答系統中的一種特殊應用,該系統涉及自然語言處理、工單數據分析以及問答模型構建,其關鍵算法涉及NLP的語義分析和情感分析。
3.1電力客服系統實現模式
問答模型分為兩類,一類通過遵循特定規則來生成答案;另一類則使用人工智能方法生成答案。
3.1.1基于規則的系統
該模式的標準結構由人工智能標記語言(AIML)構建,其局限是只能理解其編碼范圍內的問題,預定義的問答規則定義了客戶與系統對話的范圍,答案僅出現于匹配模式中。基于規則的系統更易構建,因其使用簡單的算法來理解用戶輸入并查詢相應的答案,適用于系統中基礎知識的問答。
3.1.2基于機器學習的系統
該模型使用機器學習算法進行訓練,通過自然語言處理技術來理解特定問題并生成相應的答案。系統開發時采用知識庫來存儲并描述系統的角色,用對話記錄進行模型的反復訓練,算法結合模型與新收到的話語自動生成匹配答案。其特點是能理解自然語言,并可在對話過程中持續學習以提升其智能化水平。
3.2電力客服系統的組件
整個系統因涉及不同的異構組件而變得復雜,其系統結構取決于多種因素,如問答內容的用例、領域以及系統類型等,系統的關鍵組件如下:
3.2.1問答系統
問答系統負責回答客戶的常見問題。客戶的問題由問答系統進行解釋,答案則來自知識庫的匹配,知識庫的構建可用手工訓練或自動訓練方式。手動訓練需要領域專家編制常見問題列表并描述其答案,系統基于此列表來匹配近似問題并查詢得到相應答案。自動化訓練則需要向系統傳遞訓練數據,如工單,知識庫由訓練得到,問答引擎生成問題和答案的對應列表并據此對問題自動匹配其答案。
3.2.2自然語言處理
自然語言處理技術將用戶的消息上下文化,其作用是理解用戶表述的內容,并將其轉換為計算機能識別和處理的信息。
NLP涵兩個部件,即意圖分類器和實體提取器。意圖分類器在輸入內容和回答內容之間構建映射關系;實體提取器負責從用戶的輸入中識別關鍵字,幫助確定用戶的操作意圖。
NLP引擎還包含反饋機制和學習策略。反饋機制是用戶為系統提供的反饋信息,它可納入評價系統中,即用戶在對話結束時對交互系統進行評分,以此激勵系統進行改進。學習策略是一種泛型學習框架,系統經訓練后可以在對話中創建更為通用的網絡模型。
3.2.3前端系統
前端系統是用戶與電力客服系統交互的系統,它是面向客戶的系統,如微信、門戶網站或移動APP等。
3.2.4節點服務器/流量服務器
服務器接收用戶請求并將它路由至相應組件,內部組件的響應通常流量服務器路由至前端系統。
3.2.5后端集成
電力客服系統可與現有的后端系統(CRM、數據庫、支付系統等)集成,以增強電力客服系統的整體功能。
3.3電力客服系統核心算法
電力客服系統可采用不同分類模型來工作,核心模塊包括自然語言理解和自然語言處理。
3.3.1算法模式
算法用于構建分類器和創建問答模型,復雜結構由多個問答模型組合迭代而成。神經網絡用權重向量來連接輸入與輸出,如前所述,NLP處理輸入時每個句子都會被分解為單詞,每個單詞都會用作神經網絡的輸入,通過訓練數據的多次迭代計算其加權連接,每次計算都使答案更準確。對于新輸入的句子,它的分詞會被計算頻次和特征,進而進行推斷,得分高者最有可能與輸入相關聯,即為答案。
3.3.2自然語言理解
自然語言理解(NLU)通過分解查詢信息來幫助系統理解用戶請求。它有實體、意圖和上下文三方面內容。
實體是系統從用戶查詢中提取的關鍵字,用以了解用戶的需求。意圖則有助于系統識別用戶輸入所對應的操作。上下文用于關聯提問意圖,而舍棄對問題本身的分析和記錄。上下文對于NLU算法而言極其重要,若分析對話的歷史則需存儲對話中所有的問題,隨著數量的增加,分析過程變得異常復雜,使用上下文則可拋棄對對話歷史的存儲轉而記錄對話狀態。
3.3.3自然語言處理
自然語言處理(NLP)是將客戶的文本、語音轉換為結構化數據以篩選相關答案的過程。該過程涉及情感分析、標記化、規范化和依賴解析等。
情感分析算法通過讀入實體來理解用戶的情感。標記化是將一組單詞分成片段的過程,使其在語言上具有極強的語義征性。實體識別是模型需要查找的單詞類別,如產品名、用戶名或地址等。規范化是處理用戶輸入中常見錯誤的過程,它使系統不會因為用戶的誤輸入而誤導整個服務流程。依賴解析是在用戶輸入的文本中查找對象的主語、動詞、名詞和常用短語的過程,由此找到用戶意圖的依賴關系。綜上,NLP將自然語言翻譯成特定模式的文本組合,通過該組合來映射最優答案。
四、結束語
本文討論了基于自然語言處理的電力客服系統的設計與實現方法。該系統從運維的實際需求出發,以提供良好的服務為目的,將自然語言處理技術應用于電力運維系統中客服問答系統的構建。
實際中,電力客服系統為無限量的用戶提供大規模的實時連接并像人一樣與客戶交互,使客戶輕松獲得優質的服務和良好的體驗。企業通過該系統可以高效地完成自動運維工作,從而節約資源和成本,其經濟效益顯著。
參? 考? 文? 獻
[1] Robert Wilensky, David N. Chin, Marc Luria, James Martin, James Mayfield, and Dekai Wu. The Berkeley Unix Consultant project.Computational Linguistics, 14(4), 1988.
[2] Lovis C Wagner J Griesser V Michel PA Scherrer JR. Baud RH, Rassinoux AM. Knowledge sources for natural language processing.Proc AMIA Annu Fall Symp, 70(4), 1996.
[3]初敏. 人機對話系統工程. 中國科協青年學術年會, 1998.
[4] Computing Machinery. Computing machinery and intelligence-am turing. Mind, 59(236):433, 1950.
[5] Buchanan B. G. and Heuristic DENDRAL. A program for generating expiator hypotheses in organic chemistry: Machine intelligence.Edinburgh: Edinburgh University Press, page 209, 1969.
[6] Lotfi A Zadeh. Fuzzy sets. In Fuzzy sets, fuzzy logic, and fuzzy systems: selected papers by Lotfi A Zadeh, pages 394–432. World Scientific, 1996.
[7]劉秀玉, 劉嶠, 王日見, 張少華. 一種基于模糊邏輯和神經網絡的電力負荷預測方法. 上海大學學報(自然科學版), 2001(01).
[8]嚴華, 吳捷, 馬志強, 吳列鑫. 模糊集理論在電力系統短期負荷預測中的應. 電力系統自動化, 2000(11).
通信作者:盧致亮,(1985.6- ),男,漢,江西省南康,大學本科,工程師,主要研究方向為電子信息。