朱哲人 劉敏 陳鵬
[摘? ? 要]銀行業是典型的知識密集領域,各部門因業務規則及系統的持續更新、各層級人員流動等因素產生了對業務答疑的知識復用需求。隨著深度學習、機器學習在自然語言處理(NLP)、智能圖像分析等領域的發展,郵儲銀行正研究開發一種基于多人對話的“U星”學習型智能答疑機器人。通過運用AI應用能力框架,引入“@”、“引用”等多人對話機制,實現了線上答疑流程創新,減少重復答疑并持續提高答疑準確性,結合智能交互、實時交互、圖文交互,不斷強化答疑能力,助力業務發展。
[關鍵詞]多人對話;答疑;自然語言處理
[中圖分類號]TP242.6 [文獻標志碼]A [文章編號]2095–6487(2021)11–0–02
Research and Develop a Learning Intelligent Answering
Robot Based on Multi-Person Dialogue
Zhu Zhe-ren, Liu Min, Chen Peng
[Abstract]The banking industry is a typical knowledge-intensive field. Due to factors such as the continuous updating of business rules and systems, and the flow of personnel at all levels, various departments have generated the need for knowledge reuse for business answering. With the development of deep learning and machine learning in natural language processing (NLP), intelligent image analysis and other fields, Postal Savings Bank is researching and developing a "U-star" learning intelligent answering robot based on multi-person dialogue. Through the use of the AI application capability framework and the introduction of multi-person dialogue mechanisms such as “@” and “quotation”, the innovation of online Q&A process is realized, repeated Q&A is reduced and the accuracy of Q&A is continuously improved, combined with intelligent interaction, real-time interaction, and image-text interaction, Continuously strengthen the ability to answer questions and help business development.
[Keywords]multi-person dialogue; question answering; natural language processing
1 將機器人引入多人對話答疑的背景
銀行業是典型的知識密集領域,大型商業銀行往往具有龐大的組織結構、復雜的系統功能以及豐富的業務產品種類。同時,各級機構人員時常進行崗位輪換,需要學習各項業務、產品或系統應用。隨著行內各項業務規則及系統功能不斷更新,銀行業從業人員內部的知識共享、復用等需要知識服務的場景極為多見。根據調研反饋,為增強業務學習能力,郵儲銀行總行業務專家需要在即時通信軟件建立各種溝通群,花費大量時間精力為各級分支機構提供答疑,溝通效率和效果亟待提升。
近年來,以深度學習為代表的新一代人工智能技術極大地推進了產業界技術革新,同時重塑了銀行業的業務模式。深度學習、機器學習方法在自然語言處理、智能圖像分析等領域取得了長足進步,進而也帶動了信息技術的發展。
在此背景下,郵儲銀行正探索開發學習型智能答疑機器人“U星”,將模塊化、原子化的NLP能力與結構化、流程化的銀行業務相結合,通過即時通信軟件以多人對話、問答的形式提供不同業務領域的知識服務。
2 “U星”機器人的應用方法
2.1 建群
在企業即時通信軟件中(以郵E聯為例),根據需要建立總分行專項業務溝通群,并將“U星”作為一個“虛擬人”植入群中。
2.2 拉人
將總行及各級分支行該業務條線的相關員工拉入群中,并將總行特定業務專家設為系統角色“老師”,其他群內成員默認為“學生”角色。
2.3 提問
當學生有問題需咨詢時,可在群內@“U星”觸發其回答具體問題,“U星”通過索引知識庫及時解答。
2.4 訓練
老師通過觀察群聊,可監督“U星”答疑情況。如“U星”解答失敗或解答錯誤,老師可通過群聊中的“引用”機制,對“U星”的解答進行補充或糾正。
2.5 迭代
通過日常工作中的反復問答,自動完善擴充語料庫、知識庫,對“U星”進行大量訓練,使“U星”在持續迭代的過程中變得越來越智能。隨著“U星”回答問題的準確性不斷提升,老師可逐步減少答疑工作量,投入更多時間精力到更重要的工作中去。
3 技術實現要點
3.1 場景構建與知識維護
在設計完善“U星”的過程中,邀請了郵儲銀行總行業務專家及分行從業經驗豐富的業務人員,按照條線板塊、業務邏輯抽象服務場景。如設置個人儲蓄、手機銀行、公司業務等一級主題,并可針對公司業務等一級主題,設置國內保理、融資租賃、電子簽章等二級主題。由于“U星”主要面向細分領域的答疑工作,其場景構建與高質量知識的積累、維護過程更為復雜。
在初始階段,需根據應用場景與業務主題,確定聊天群的設置。本階段知識庫的主要內容為前期積累的問題庫與業務文檔。“U星”設計了易用的導航菜單,用于知識庫的冷啟動與預置答案推送。初步階段,“答疑群”里的“學生”以提問形式為“U星”積累形式多樣的問題及問句,“老師”則以回答、糾正問題的形式補全知識庫。答疑群積累的語料由“老師”與“學生”相互協作,定期篩選、積累維護,將高質量問答補充至知識庫中。
初始運行后,語料、知識的積累趨于完善,經過恰當訓練的“U星”可被進一步推廣到不同的多人對話場景中,針對不同的業務流程,完成可信答疑與知識服務。“U星”以“眾包”形式,通過多人對話積累語料,完成知識積累、更新與維護的過程。
3.2 算法適配與模型開發
“U星”的開發主要針對細分領域的答疑場景。在對話過程中,可能涉及主題分類、意圖識別、實體識別、問句匹配、答案檢索、答案生成等多種復雜的自然語言處理任務。“U星”的設計與實現,需結合業務場景,選取恰當的自然語言處理模型,并進行適配、改良、調優。
在冷啟動階段,“U星”采用基于規則與模板的對話策略,通過關鍵字和主題詞的提取、導航菜單等形式,為多人對話參與方提供準確但形式較為固定的答疑服務。
隨著多人對話的持續進行,“U星”可積累豐富、形式多樣的對話語料,這些語料可用于訓練深度學習模型。在算法選擇方面,“U星”核心算法將重點參考文本分類模型如TextCNN[1]、預訓練語言模型如ERNIE[2]等形式,進行契合業務場景的算法設計與定制化開發,搭建自然語言處理產線,將模型拼裝為服務。在模型結構方面,“U星”可采用問句匹配、文本相似度計算等形式,將學生的問題引導至標準答案。在此基礎上,還可進一步設計開發編碼器-解碼器(Encoder-Decoder)結構[3]與文本生成方法[4],根據問句生成答案。
在模型開發與實現方面,“U星”擬與郵儲銀行在建“郵儲大腦”機器學習平臺對接,實現模型訓練、驗證與開發。“郵儲大腦”定位為企業級的機器學習建模集成及人工智能能力輸出平臺,支持深度學習、機器學習建模。以平臺為核心,輸出語言語音、生物識別、智能圖像、智能文本、知識圖譜等能力。依托“郵儲大腦”機器學習平臺,“U星”可快速實現算法設計、模型訓練與迭代。
3.3 服務編排與統一管理
在系統落地方面,“U星”擬采用微服務的設計理念與基本架構,結合具體的對話場景,將模型進行拼裝與統一管理,并以服務的形式發布上線。
在探索開發階段,“U星”主要采用vue+webpack 搭建vue項目以實現前端界面,同時采用Nodejs+WebSocket創建后臺服務器功能。
在服務應用階段,“U星”擬采用Docker容器技術將模型服務落地實現,依托“郵儲大腦”機器學習平臺,實現部署和服務管理。“U星”擬采用Kubernetes服務編排框架,在Docker技術的基礎上,管理容器化的應用,實現高效部署實施、運行、服務輸出。
3.4 知識圖譜
知識圖譜為“U星”的附加功能。在與“U星”配套的主題圖譜、業務圖譜、共性知識圖譜的設計與實現方面,可依托郵儲銀行在建“郵儲大腦知識圖譜”系統,實現問句主題詞映射、匹配與查詢、基于知識庫的問答及知識可視化等功能。
4 “U星”機器人的主要創新點
4.1 框架先進性
運用AI應用能力框架,將智能問答系統的能力,分為基礎能力、業務積累及智能技術三部分。基礎能力是指智能問答系統中,相對基礎的通用自然語言處理能力;業務積累主要是指針對具體的問答領域,在業務上所需積累的經驗,如業務流程的梳理、問題的細粒度分析,答案的置信度評價等;智能技術主要為面向復雜應用的技術,如問句匹配、知識圖譜映射、文本生成、多輪對話等,這也是本項目的創新點。
4.2 技術創新性
該項目主要基于認知、自然語言處理的解決方案,設計開放域問答、意圖識別、智能問答、知識積累、模型訓練、知識可視化等功能模塊,結合知識圖譜和深度學習的技術優勢,可實現對特定領域銀行業務及產品問題的解答功能。在算法層面,“U星”擬采用基于深度學習的NLP技術。在服務落地實現層面,“U星”在探索開發階段擬采用vue + webpack 搭建vue項目以實現前端界面,同時采用Nodejs+WebSocket創建后臺服務器功能。在服務應用階段,“U星”擬采用容器技術,依托“郵儲大腦”機器學習平臺進行模型開發與服務管理。
4.3 業務前瞻性
通過多人對話、學生向U星提問、老師回答校正、答案積累、自學習訓練的全流程:①可在模型設計角度進行改良,汲取專業老師的經驗和知識;②可為深度學習模型積累可觀的學習樣本,豐富不同形式的問題—答案集合。這種學生老師群體參與的“眾包”模式,有望緩解深度學習模型訓練所面臨的數據瓶頸,彌合知識密集領域智能對話模型實施落地過程中,由數據到知識、由知識到業務服務的鴻溝。
5 結束語
郵儲銀行根據內部知識服務現狀及業務答疑中的痛點問題,充分運用AI應用能力框架,采用NLP、知識圖譜等創新技術,創造性地提出基于多人對話的學習型智能答疑機器人概念。“U星”可以分擔答疑工作,普及新的業務知識,解決反復答疑、無法及時響應等現實問題。通過引入多人對話機制,可使業務人員在內部即時通信工具方便快捷地提問、補充和糾正“U星”的答復,讓模型訓練簡單易行。下一步,郵儲銀行將繼續研究、探索知識服務領域的創新設計,切實提高內部答疑服務體驗,支撐郵儲銀行信息化建設再上新臺階。
參考文獻
[1] Kim Y.Convolutional Neural Networks for Sentence Classification[C].In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP),2014.
[2] Sun Y,Wang S,Li Y,et al.ERNIE:Enhanced Representation through Knowledge Integration[J].2019(4):19.
[3] Cho,K.,Merrienboer,B.V.,Gulcehre,et al. Learning phrase representations using rnn encoder-decoder for statistical machine translation[C].In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP),2014.
[4] 徐聰,李擎,張德政,等.文本生成領域的深度強化學習研究進展[J].工程科學學報,2020,42(4):399-411.