張正普,王曉冬,郭奕聰
(1.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081;2.中國(guó)鐵路網(wǎng)絡(luò)有限公司,北京 100038)
目前,鐵路企業(yè)規(guī)章制度繁多,制度條例冗細(xì),不易管理和學(xué)習(xí)解讀。制度之間存在較強(qiáng)關(guān)聯(lián)性,需對(duì)各項(xiàng)制度進(jìn)行系統(tǒng)地學(xué)習(xí),才不會(huì)造成工作審批流程、審批單等的缺失或錯(cuò)誤;制度及工作審批流程經(jīng)常隨著上級(jí)單位的管理需求變更而進(jìn)行改變,易造成員工對(duì)制度更新的信息接收滯后,從而影響工作效率;各項(xiàng)制度分管管理部門不同,管理較分散,無(wú)統(tǒng)一問(wèn)詢、解答出口。鐵路企業(yè)智能問(wèn)詢平臺(tái)旨在采用人工智能技術(shù)為企業(yè)的客戶及內(nèi)部管理提供便捷、準(zhǔn)確和高質(zhì)量的服務(wù),拓展服務(wù)渠道,提高員工工作效率,增強(qiáng)企業(yè)效能,提高客戶滿意度。
智能語(yǔ)義語(yǔ)音作為智能問(wèn)詢平臺(tái)的核心技術(shù),又稱為機(jī)器人智能語(yǔ)音交互技術(shù),是以語(yǔ)音作為載體,使機(jī)器具備能說(shuō)會(huì)聽(tīng)、學(xué)習(xí)思考的能力,從而實(shí)現(xiàn)人類與機(jī)器之間類似人類交互之間的自然語(yǔ)音交互過(guò)程。通過(guò)智能語(yǔ)音交互技術(shù)建設(shè)智能問(wèn)詢平臺(tái)具有重要意義[1,2]。
鐵路企業(yè)業(yè)務(wù)部門向管理部門咨詢政策主要通過(guò)現(xiàn)場(chǎng)問(wèn)詢和電話咨詢2種方式實(shí)現(xiàn),均靠人工完成,存在著工作量大、服務(wù)質(zhì)量難以控制等問(wèn)題。通過(guò)企業(yè)內(nèi)部管理部門人工解讀規(guī)章制度以及制度條例方式,為業(yè)務(wù)部門提供釋疑工作,總結(jié)與業(yè)務(wù)部門溝通模式分為問(wèn)答型多輪對(duì)話、預(yù)知型問(wèn)題引導(dǎo);根據(jù)服務(wù)內(nèi)容,可分為咨詢、求助和建議等3類。
(1)咨詢類。業(yè)務(wù)部門詢問(wèn)條例及規(guī)章制度信息,包括企業(yè)管理?xiàng)l例。
(2)求助類。業(yè)務(wù)部門向管理部門尋求幫助,包括需要管理部門配合、助力業(yè)務(wù)工作的進(jìn)展。
(3)建議類。業(yè)務(wù)部門提出管理建議,包括服務(wù)質(zhì)量的改善、管理水平的提升等。
梳理企業(yè)內(nèi)部管理要求,結(jié)合鐵路企業(yè)管理特點(diǎn),總結(jié)分析平臺(tái)功能需求,需實(shí)現(xiàn)系統(tǒng)統(tǒng)一前端入口,基于智能服務(wù)引擎及統(tǒng)一管理后臺(tái),實(shí)現(xiàn)鐵路企業(yè)智能問(wèn)詢平臺(tái)的整體功能。
鐵路企業(yè)智能問(wèn)詢平臺(tái)的總體框架,如圖1所示。

圖1 鐵路企業(yè)智能問(wèn)詢平臺(tái)總體框架
(1)基礎(chǔ)硬件設(shè)備支撐:為平臺(tái)的開(kāi)發(fā)及運(yùn)行提供服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)等基礎(chǔ)的硬件支撐,可兼容互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC,Internet Data Center)或第三方基礎(chǔ)設(shè)施即服務(wù)(IAAS,Infrastructure as a Service)平臺(tái)。
(2)開(kāi)發(fā)支撐:為系統(tǒng)研發(fā)提供研發(fā)平臺(tái),二次開(kāi)發(fā)接口、測(cè)試工具及預(yù)發(fā)布環(huán)境。
(3)語(yǔ)義引擎集群:引擎集群部署,為不同管理部門提供相應(yīng)服務(wù),以滿足語(yǔ)義引擎使用的高可用性。統(tǒng)一形成處理自然語(yǔ)言和集成各種專業(yè)處理引擎的基礎(chǔ)平臺(tái)。
(4)業(yè)務(wù)邏輯:基于語(yǔ)義引擎集群式的部署方式,為業(yè)務(wù)部門提供業(yè)務(wù)功能,如自然語(yǔ)義識(shí)別、推薦語(yǔ)義、通用領(lǐng)域語(yǔ)料和數(shù)據(jù)報(bào)表等。
(5)用戶管理臺(tái):為系統(tǒng)管理員提供相關(guān)功能,包括機(jī)器人管理、知識(shí)管理、應(yīng)用管理和素材管理[3]。
(6)接入渠道:支持全渠道服務(wù)應(yīng)用接入,并支持第三方服務(wù)應(yīng)用的接入。
鐵路企業(yè)智能問(wèn)詢平臺(tái)自終端到后臺(tái)分用戶平臺(tái)層、公共服務(wù)層和基礎(chǔ)支撐層3個(gè)層面,為企業(yè)管理提供的功能,如圖2所示。

圖2 鐵路企業(yè)智能問(wèn)詢平臺(tái)功能框架
(1)用戶平臺(tái)層面主要涵蓋智能問(wèn)詢、智能服務(wù)熱線及系統(tǒng)管理功能,為企業(yè)管理提供高效率、高質(zhì)量的服務(wù)。
(2)公共服務(wù)層主要涉及推送服務(wù)、渠道接入推送服務(wù)、等服務(wù)內(nèi)容。
(3)基礎(chǔ)支撐層由接口平臺(tái)、統(tǒng)一管理后臺(tái)模塊、語(yǔ)義引擎等業(yè)務(wù)功能模塊組成。
接口平臺(tái)實(shí)現(xiàn)智能問(wèn)詢平臺(tái)與各渠道終端的業(yè)務(wù)邏輯開(kāi)發(fā)和展現(xiàn),支持全渠道服務(wù)應(yīng)用接入,并支持第三方服務(wù)應(yīng)用的接入。
統(tǒng)一管理后臺(tái)可以管理和維護(hù)引擎的運(yùn)行,配置引擎運(yùn)行所需系統(tǒng)參數(shù),管理和配置知識(shí)庫(kù),以及對(duì)終端用戶交互日志信息的統(tǒng)計(jì)分析。
語(yǔ)義引擎主要為分詞引擎、語(yǔ)義分析引擎及搜索引擎結(jié)合超大規(guī)模的詞典,統(tǒng)一形成處理自然語(yǔ)言和集成各種專業(yè)處理引擎的基礎(chǔ)平臺(tái),綜合了多種學(xué)科的知識(shí),進(jìn)行高度智能化的語(yǔ)意分析,準(zhǔn)確定位知識(shí)庫(kù)內(nèi)對(duì)應(yīng)業(yè)務(wù)答案。
鐵路企業(yè)智能問(wèn)詢平臺(tái)的核心技術(shù)是智能語(yǔ)義分析模型的搭建,用以提供對(duì)非結(jié)構(gòu)化大數(shù)據(jù)智能理解與自動(dòng)化處理能力,實(shí)現(xiàn)文本知識(shí)多維度的業(yè)務(wù)標(biāo)簽標(biāo)記,將無(wú)序的非結(jié)構(gòu)化信息轉(zhuǎn)換為滿足企業(yè)管理業(yè)務(wù)需求的結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)上下文語(yǔ)義分析、關(guān)鍵詞識(shí)別、模糊問(wèn)題識(shí)別,進(jìn)而提供語(yǔ)義識(shí)別、智能語(yǔ)音等平臺(tái)業(yè)務(wù)邏輯。
語(yǔ)音識(shí)別利用信號(hào)處理方法對(duì)說(shuō)話人的語(yǔ)音進(jìn)行檢測(cè)、特征提取、降噪等預(yù)先處理,從而獲取最合適識(shí)別引擎處理的語(yǔ)音[4],如圖3所示。圖中,IVR為互動(dòng)式語(yǔ)音應(yīng)答(Interactive Voice Response);ASP為自動(dòng)語(yǔ)言識(shí)別(Automatic Speech Recognition)。

圖3 智能語(yǔ)音實(shí)現(xiàn)流程
在實(shí)際應(yīng)用中,語(yǔ)音信號(hào)的壓縮率介于10~100之間。語(yǔ)音信號(hào)包含了大量不同的信息,提取哪些信息,用哪種方式提取,需要綜合考慮各方面的因素,如成本、性能、響應(yīng)時(shí)間和計(jì)算量等。語(yǔ)音訓(xùn)練模型[5]是通過(guò)輸入大量的語(yǔ)音語(yǔ)料構(gòu)建聲學(xué)模型,從而完成語(yǔ)音到音節(jié)的分節(jié)計(jì)算。當(dāng)語(yǔ)音經(jīng)過(guò)前端處理及特征提取后,將獲取的特征向量與聲學(xué)模型及發(fā)音詞典進(jìn)行比對(duì)搜索。
語(yǔ)音合成技術(shù)將文字序列轉(zhuǎn)換成音韻序列,由語(yǔ)音合成系統(tǒng)根據(jù)音韻序列生成語(yǔ)音波形,對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理,去掉與語(yǔ)音識(shí)別無(wú)關(guān)的冗余信息,獲得影響語(yǔ)音識(shí)別的重要信息,同時(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮,將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音。
通過(guò)語(yǔ)音識(shí)別獲取的音頻信號(hào)輸入,完成特征提取,聲學(xué)模型提取有代表的特征向量,語(yǔ)音解碼搜索對(duì)特征向量,語(yǔ)言模型分?jǐn)?shù)、若干字詞在字典得分,最后輸出得分高的作為識(shí)別結(jié)果。在問(wèn)答庫(kù)中選出與輸入問(wèn)題相似度最高的問(wèn)題,返回相似度最高的問(wèn)題所對(duì)應(yīng)的答案[6],智能語(yǔ)音識(shí)別流程圖,如圖4所示。

圖4 智能語(yǔ)音識(shí)別流程
傳統(tǒng)文本匹配技術(shù)有詞袋(BOW,Bag-of-Word)模型、向量空間模型(VSM,Vector Space Model)、詞頻—逆向文件頻率(TF-IDF,Term Frequency-Inverse Document Frequency)、BM25、Jaccord、SimHash 等,主要解決字面相似度問(wèn)題,由于中文含義的豐富性,通常很難直接根據(jù)關(guān)鍵字匹配或者基于機(jī)器學(xué)習(xí)的淺層模型來(lái)確定2個(gè)句子之間的語(yǔ)義相似度。
為此采用深度學(xué)習(xí)文本匹配模式進(jìn)行語(yǔ)義表示,能夠節(jié)省人工特征提取的成本。從大量的樣本中自動(dòng)提取出詞語(yǔ)之間的關(guān)系,并能結(jié)合短語(yǔ)匹配中的結(jié)構(gòu)信息和文本匹配的層次化特性,發(fā)掘出隱含在大量數(shù)據(jù)中含義不明顯的特征。
在已知輸入序列的情況下,采用RNN-T(RNNT,Recurrent Neural Network Transducer)模型進(jìn)行語(yǔ)義識(shí)別輸出標(biāo)簽的概率分布[7]。RNN-T的結(jié)構(gòu)將前饋網(wǎng)絡(luò)和 softmax通過(guò) audio encoder的輸出和 label encoder的輸出結(jié)合起來(lái),從而在每一個(gè)時(shí)間節(jié)點(diǎn)得到一個(gè)在輸出標(biāo)簽上的概率分布。
智能問(wèn)詢語(yǔ)音平臺(tái)目前已在中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司等多個(gè)鐵路企業(yè)機(jī)構(gòu)使用。結(jié)合鐵路網(wǎng)絡(luò)環(huán)境及網(wǎng)絡(luò)安全[8],鐵路企業(yè)智能問(wèn)詢平臺(tái)項(xiàng)目的部署方案,如圖5所示。

圖5 平臺(tái)部署架構(gòu)
該部署方案全部服務(wù)器集中部署在鐵路各企業(yè)數(shù)據(jù)中心,前端交互應(yīng)用服務(wù)器放置在鐵路網(wǎng)絡(luò)隔離區(qū)(DMZ,Demilitarized Zone),將核心引擎及管理后臺(tái)服務(wù)器放置在鐵路數(shù)據(jù)通信網(wǎng)絡(luò)(DCN,Data Communication Network)區(qū),對(duì)前端交互應(yīng)用服務(wù)器開(kāi)通基于TCP協(xié)議的公網(wǎng)訪問(wèn)權(quán)限,以保證對(duì)APP、Web渠道服務(wù)器的正常訪問(wèn)。
前端用戶通過(guò)3G/4G網(wǎng)絡(luò)或有線接入方式,經(jīng)過(guò)常規(guī)的F5硬件負(fù)載均衡服務(wù)器后,訪問(wèn)前端業(yè)務(wù)通信服務(wù)器,參照100/S并發(fā)訪問(wèn)量計(jì)算,搭配前端業(yè)務(wù)通信服務(wù)器,同時(shí)配備核心引擎服務(wù)器。前端業(yè)務(wù)通信服務(wù)器可訪問(wèn)數(shù)據(jù)庫(kù)環(huán)境,數(shù)據(jù)庫(kù)服務(wù)器利舊,安裝于各企業(yè)數(shù)據(jù)中心現(xiàn)有存儲(chǔ)環(huán)境中。另外,配備管理后臺(tái)服務(wù)器(本項(xiàng)目集成部署在前端交互應(yīng)用服務(wù)器中)。管理后臺(tái)服務(wù)器與前端業(yè)務(wù)通信服務(wù)器、數(shù)據(jù)庫(kù)、核心引擎服務(wù)器之間進(jìn)行通信控制。數(shù)據(jù)庫(kù)與核心引擎服務(wù)器之間不產(chǎn)生通信關(guān)系。
本智能問(wèn)詢平臺(tái)針對(duì)數(shù)據(jù)高效檢索及分析能力進(jìn)行測(cè)試,平臺(tái)在并發(fā)性、實(shí)時(shí)查詢能力、可靠性等滿足日常業(yè)務(wù)需求。實(shí)際使用過(guò)程有著良好的效率,2 000用戶級(jí)的高并行處理能力,秒級(jí)的查詢返回速度,7x24 h的可靠服務(wù),支撐問(wèn)詢智能化輔助。
針對(duì)企業(yè)制度中的一個(gè)知識(shí)點(diǎn),用戶通過(guò)不同的問(wèn)法提問(wèn),平臺(tái)識(shí)別用戶的真實(shí)意圖。用戶輸入的問(wèn)題中主語(yǔ)、賓語(yǔ)、謂語(yǔ)缺失一項(xiàng)等情況下,平臺(tái)通過(guò)自然語(yǔ)言技術(shù)中的句法依存分析發(fā)現(xiàn)缺失關(guān)鍵信息,則根據(jù)上輪交互的信息對(duì)本輪交互進(jìn)行實(shí)體補(bǔ)全,再給出正確答案。當(dāng)用戶咨詢某個(gè)問(wèn)題,并且該問(wèn)題有一個(gè)或多個(gè)必要條件是關(guān)鍵信息時(shí),如果用戶在輸入的過(guò)程中缺失必要條件,平臺(tái)通過(guò)特征提取技術(shù)不能獲得關(guān)鍵的信息,就會(huì)通過(guò)反問(wèn)機(jī)制與用戶再次交互,獲取必要條件,直到所有必要條都滿足的情況下,才會(huì)給出正確答案。
平臺(tái)在識(shí)別用戶意圖時(shí),可通過(guò)對(duì)用戶話術(shù)的分析,進(jìn)行知識(shí)展現(xiàn),包括針對(duì)性的圖文營(yíng)銷內(nèi)容、問(wèn)題答案、所需操作快捷鏈接、建議問(wèn)列表等。用戶的輸入中含有多個(gè)關(guān)鍵詞,識(shí)別并理解句子的真實(shí)意圖。平臺(tái)在識(shí)別用戶真實(shí)意圖時(shí),需要依賴自然語(yǔ)言中的特征(關(guān)鍵字)來(lái)識(shí)別,通過(guò)機(jī)器學(xué)習(xí)的算法,支持無(wú)特征識(shí)別用戶意圖。當(dāng)無(wú)法確定具體用戶問(wèn)題時(shí)會(huì)自動(dòng)給出建議問(wèn),引導(dǎo)用戶鎖定問(wèn)題,進(jìn)而鎖定答案。
本文討論了智能語(yǔ)音語(yǔ)義在鐵路企業(yè)智能問(wèn)詢平臺(tái)的實(shí)現(xiàn)邏輯。人工智能技術(shù)為企業(yè)的客戶及內(nèi)部管理提供便捷、準(zhǔn)確和高質(zhì)量的服務(wù),拓展服務(wù)渠道。鐵路企業(yè)智能問(wèn)詢平臺(tái)的研究與使用,提高了員工工作效率,增強(qiáng)企業(yè)效能,提高客戶滿意度。未來(lái),將持續(xù)推進(jìn)鐵路企業(yè)智能問(wèn)詢平臺(tái)在企業(yè)管理服務(wù)上的深度應(yīng)用。