王海峰,蘇 瑩,李 棟,劉文君,許 斌
(1.長慶油田通信處信息網絡技術研究所,西安 710000;2.長慶油田通信處銀川總站,銀川 750000)
長慶油田科技創新管理平臺上線后,由于平臺功能點多,業務較復雜,實際使用人員在項目申報、項目立項、科技成果申報、權限分配功能點的操作中提出了各種問題,例如權限該如何分配,項目指標如何使用,科技成果附件上傳如何使用等各種問題。系統管理人員與維護人員會花費大量的時間來解答問題。由于先前的配套幫助文檔與幫助視頻已無法高效、實時地解答客戶在使用中遇到的各種疑問,為了減輕科技創新管理系統運維人員的工作負擔,避免重復回答。現需借助通信處智能客服系統,搭建長慶油田科技創新管理平臺智能客服知識庫,將簡單、重復性高的操作問題交由系統自動回答,減輕維護人員工作量,提高運維工作效率。
為滿足科技創新管理平臺運維服務服務需求,考慮系統功能特性要求如下。建立邏輯機器人并掛接根據預先設定完成的QA 知識庫模塊、場景模塊、知識圖譜模塊等功能模塊,快速構建智能客服。
智能客服應用形式被稱為渠道,本次采用將以下兩種渠道構筑智能客服。
網頁版智能客服:通過網頁問答形式在線及時解答使用者提出的問題。
電話版智能客服:類似于10086 以語音客服方式解答客戶問題。
創建“科技創新管理平臺”機器人領域?!邦I域”是對知識點在業務上的整體劃分,“類別”是對知識點進行更細的分類,類別支持多層級。另外領域屬性包含“業務”和“聊天”。在機器人的處理上,聊天類有問答次數的限制(默認8 次),業務類沒有該限制。類別創建:類別為系統功能的分類,類別可以建立多級類別,不同領域下類別名稱可以重復,但同一領域下不能有相同類別。
本次智能客服業務針對“科技創新管理平臺概要”系統功能分類:項目管理、科研項目管理、科技成果管理、專家管理、外協單位管理、系統管理、基礎資料管理、流程管理。
針對科技創新管理系統,本次將設計多種對話場景來使用,對接用戶實際使用所遇到的各種問題。主要構建方式如下。
構建場景:場景基本系統構建,例如場景名稱,場景描述等。高級參數等信息的構筑。例如,該場景是否允許返回入口,是否保留上下文,閾值設定等。“是否允許返回入口”來控制對話進行到場景中間時,是否允許從頭開始該場景的對話(從頭開始將清除在該場景中獲取到的普通變量信息)。“是否允許保留上下文”來控制跳轉到其他場景后,是否保留該場景的上下文信息。“無法理解閾值”用來控制用戶問題的打分高于設定的閾值時,才算命中場景。
構建流程視圖:在場景構建完成后,在場景內添加流程視圖,構筑方案如下。
構筑節點卡片:卡片中有四種狀態:①信息提取的編輯狀態;②觸發條件的編輯狀態;③反問話術的編輯狀態;④默認回復的編輯狀態。
信息提取。當交互過程中,需要提取用戶話術中的信息?!疤砑犹崛 北硎緝H在進入該節點時提取變量;“在本場景所有節點提取”表示在場景的任何節點都會提取變量。
觸發條件—意圖判斷:對于用戶意圖,提供三種類型的判斷構筑,以便準確無遺留地回復用戶的各種問題。
2.3.1 命中問題
“命中問題”是用戶使用中提出的問題命中了意圖管理中的某一個意圖時,可以進入該節點并回答用戶問題。
2.3.2 無法理解
“無法理解”是當用戶提出問題沒有命中任何意圖或者命中的意圖沒有在當前節點的平行節點中作為觸發條件時,則命中該節點并回答用戶問題。
2.3.3 任何話
“無法理解”是不管用戶任何問題都可以進入該節點并回答用戶問題。
用作多輪對話中的用戶針對科技創新管理平臺智能客服提出問題的語義理解。針對用戶提問科技創新管理平臺智能客服將根據用戶,編輯各類擴展問題并引入加入正則表達式,以RE 開頭,寫法如下:“RE:(不是|不對|不正確)”,以便高效命中用戶在系統中使用中所提出的問題并加以回答。
實體是指具有共同屬性的一類事物,例如“項目審批”實體,該實體下有“局級項目審批”和“廠處級項目審批”等實例,該實體有“審批通過”“審批駁回”等屬性。這些實體與屬性之間的關系構成了系統的圖譜類型知識。
問題意圖:針對系統中的項目過程管理與成果申報管理,進行問題構筑。
編輯答案:在意圖答案中,可以給不同的渠道設置不同的回復內容。
導入圖譜:導入意圖,按照一定格式記入設計好的意圖。
導入意圖文本答案,文本答案對意圖增加不同實體詞在不同渠道的文本答案。導入意圖圖文知識,按照一定格式記入設計好的意圖圖文知識。
針對科技創新管理平臺已運行的數據字典數據,完成“實體詞、敏感詞、同義詞、停用詞”的構筑。實體詞是指具有共同屬性的一類事物,比如“賬票”可以作為一個實體,“長慶油田分公司科學技術獎推薦書、長慶油田公司科技項目開題報告”等具體的賬票都屬于這一實體,“長慶油田分公司科學技術獎推薦書、長慶油田公司科技項目開題報告”就是“賬票”這個實體的實例。敏感詞配置的作用是,當用戶的問題中含有一些敏感詞匯的時候,機器人會委婉地拒絕回答。同義詞可以讓智能客服引擎更加準確地理解用戶的知識。例如,類別中有問題“我要編輯項目開題”。而用戶的提問是“我要修改項目開題具體內容”。如果同義詞中有“修改”和“編輯”的配置,那么用戶的提問和類別中的問題就可以景區匹配,用戶就可以得到答案。停用詞配置的作用是,當詞匯被設置為停用詞后,機器人不再識別這些詞匯,用于減少某些詞語對機器人理解的影響。
靜態頁面是用于圖文的答案中用戶通過點擊跳轉的超鏈接所在的頁面。本次為科技創新管理系統智能客服的可用性,對兩大類核心功能進行靜態幫助頁面的開發與配置,具體靜態幫助頁面如下,科研項目管理模塊中的項目立項,項目開題,項目中期調整,項目中期驗收,項目驗收??萍汲晒芾砟K中的技術發明獎申請,科技進步獎申請,科技成果網評,成果查重,成果評獎等。
科技創新管理系統中機器人被定位為一個虛擬客服,系統同時支持多個機器人并行工作。一個機器人可以回答不同領域中的問題,只需要將該領域知識庫與機器人進行掛接,待系統將知識同步到該機器人中即可生效。建立機器人:建立機器人并向機器人添加需要問答的領域、場景、圖譜或者敏感詞。掛接推薦問題:“推薦問題”用于當機器人智能客服連續多次無法回答或者連續多次問到聊天知識時,可以通過“推薦問題”引導客戶進行業務問答?!皥鼍皡怠敝挥迷谝恍┨厥獾那闆r下,比如機器人客服無法理解、聊天過頻時機器人設置通用的回復內容。場景參數、每個渠道的參數值都獨立設置。
利用已建成的智能客服機器人,對機器人的安全性、實用性、知識完整性性、知識正確性等方面進行覆蓋性測試。
即時測試:模擬用戶提問問題,驗證機器人分析處理后的返回答案和匹配詳情。
批量測試:本次智能客服對機器人的測試方案分成兩種測試種類:“問答測試”和“場景測試”。問答測試用于測試一問一答式的單輪問答,場景測試用于測試有上下文交互的多輪對話。測試完成后,統計與分析實際知識的匹配情況,內容包括“匹配到的標準問、匹配到的擴展問、答案、響應時間、響應狀態、匹配情況、意圖結果”。“響應狀態”包括“系統錯誤、答案缺失、無法回答、有敏感詞、推薦回答、直接回答、模式匹配、命中圖譜、命中場景、聊天過頻”?!跋到y錯誤”:系統出現問題?!按鸢溉笔А保何刺顚憜栴}。
測試中測試內容將覆蓋以下核心點:
“無法回答”的問題:命中的意圖打分過低,將會適當調整;
“有敏感詞”測試:測試問題中包含敏感詞;
“推薦回答”測試:推薦了幾個問題;
“直接回答”測試:命中了標準問題;
“模式匹配”:命中了模式碼;
“命中圖譜”:命中了知識圖譜;
“命中場景”:命中了場景;
“聊天過頻”:連續多次命中聊天知識。
“匹配情況”包括:“匹配、不匹配、推薦、無預期問題、答案匹配”。
“匹配”:預期問題和匹配到的標準問題相同。
“不匹配”:沒有匹配到標準問題、匹配到的標準問題跟預期不一致。
“推薦”:預期問題在推薦問答中。
“無預期問題”:沒有寫預期。
“答案匹配”:預期問題的答案和匹配到的答案相同。
目前,系統經過兩年的使用及問題梳理歸納,現已入庫標準問題78 項,擴展問題230 項,問題經過縝密的邏輯設計,問答可深入到5 輪問答,可以文本形式回答問題,亦可以圖文形式回答問題。通過智能客服在科技平臺的應用,極大地降低了平臺運維人員的工作強度,提高了工作效率,也為下一步在油田各業務系統運維方面的應用提供了方向。