梅巧玲,王思宇,馬 杰
(中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
隨著人工智能及機器學習等技術的不斷進步,智能應答和智能推送技術及系統日臻成熟,達到了商用的水平。微軟、阿里巴巴、騰訊、移動、小i、蘋果、谷歌等國內外的公司都對該領域進行了深入的研究,發展了自己的產品線,逐步向個人助理方向演進[1-3]。中國高鐵正處于一個發展關鍵期,隨著高速鐵路“四縱四橫”規劃基本實現,高速鐵路的發展影響并改變著人們的生活節奏和出行方式,廣大旅客對鐵路業務咨詢的需求也日益增長。
目前,鐵路12306互聯網售票系統(簡稱:12306)客服熱線客服人員1 232人,日均服務量7.25萬人次,節假日日均服務量8.9萬人次,寒暑假和節假日服務需求突增。隨著客票業務種類的增多,客服工作遇到了很多問題,比如客服人員與服務需求嚴重失衡,熱線一對一服務效率低,常見性問題占比大,人力耗費過多,制度類變更需及時讓全體客服人員重新學習,整理回復模板,確??头藛T回復口徑一致,回復模板、規章制度檢索效率低等。微信公眾號和小程序雖然提供了部分自動應答的功能,但只能解決少量的咨詢問題。鐵路12306線上智能客服系統的引入可以顯著增加旅客服務的承載量,輔助客服人員快速準確地處理應答,在提高客服人員并發處理能力的同時替代部分客服人員,減輕人工客服的壓力,為旅客提供更優質、更完善的體驗和個性化服務。
隨著信息系統智能化水平的不斷提高,以及傳感技術、智能技術、網絡技術和云計算技術的持續突破,智能客服系統逐漸興起。在應用場景、應用模式方面更為多元便捷,已成為智能時代客服發展的新趨勢。鐵路12306線上智能客服系統較傳統的客服系統而言,具有更為靈活的智能化特征和服務特性,能夠實現感知、決策、執行等系列功能,是一種新型的智能信息系統。該系統的架構層級主要分為接入層、應用層和數據層3部分,如圖1所示。

圖1 系統架構圖
接入層主要包括基礎構件和接入管理2部分:基礎構件主要由語義識別引擎和需求預測引擎組成;接入管理的作用是對請求進行分類、排隊,并根據當前的系統情況進行合理請求分發,主要包括智能排隊、分發策略和負載均衡3個子模塊。
應用層主要包括后臺管理和智能客服應用2部分:后臺管理包括知識庫管理、數據采集及分析和問題庫管理;智能客服應用包含客服機器人、定制服務、智能規則引擎、營銷推送、需求預測和語音語義識別等子模塊,各子模塊的具體功能如下。
(1)客服機器人:通過搭建知識庫,形成智能問答系統,解決用戶的問題。系統支持文字和語音信息類型,滿足不同用戶的需求[4-5]。
(2)定制服務:收集用戶需求(如感興趣的主題、喜好等),根據歷史記錄數據深入分析挖掘,為用戶提供全方位、全行程定制化服務。
(3)智能規則引擎:常見問題可以在線申請反饋,處理問題。后臺引擎對出現的問題進行歸類統計分析,輔助客票系統升級優化問題答案。
(4)營銷推送:根據旅客行程信息,給旅客推送相關城市的天氣、酒店、熱點新聞、景點、當地特產等信息。
(5)需求預測:通過對歷史出行記錄、最新搜索目的地等信息的大數據分析,結合地域、年齡、出行成員等信息,分析用戶的出行需求,實現主動服務。
(6)語音語義識別:支持對語音語義的高準確率識別,從問題庫中快速匹配出相應的問題。
數據層包含知識庫、問題庫和知識索引3部分,同時提供與客票業務系統、外部系統的數據接口。
知識庫和問題庫涵蓋全路、全渠道的多媒體應答,包含規章制度、通告等知識,基于預采編的知識數據,自動生成語義標簽,可快速對知識進行結構化組織。數據層和客票業務系統交互的數據包括列車基礎數據和旅客出行軌跡等;與外部系統交互的數據包括天氣、美食、旅游、航空等。
鐵路12306線上智能客服系統以自然語言處理技術為基礎,通過多媒體網關統一接入電話、郵件、短信、微信、支付寶等多種渠道,處理語音、文本、視頻、圖片等信息。多媒體網關通過媒體適配器屏蔽和卸載各種接口、加密串、協議等,并進行信息過濾篩選和預處理,統一傳送到集中的排隊服務器中;同時,與后臺機器人引擎相結合,通過擬人化的方式與用戶進行實時交互,為用戶提供智能化的應答服務。
系統以用戶屬性數據、歷史提問內容、業務數據為基礎,自動采用結構化與非結構化分析方法。用戶在各渠道(網站、微信、手機APP、支付寶)獲取在線服務時,系統自動對接各業務接口,發現用戶關注點,依據條件觸發營銷推送,主動向用戶推送營銷信息,如:天氣、景點、土特產、列車最新正晚點信息、列車停運通知、失物招領、突發事件公告等,讓旅客第一時間了解最新資訊,獲取更好的服務。
該功能模塊對用戶交互數據進行業務分類、聚類、熱詞統計并提供報表,利用語義解析功能識別用戶意圖,將關鍵信息傳遞給業務系統,用于支撐完善知識庫,對客票系統的業務優化具有參考意義。
智能應答最早應用于電話的語音、短信增值業務,后來發展到在線客服接入網站等。現在無論是網站還是移動APP,例如微信、支付寶等各類有服務咨詢功能的應用,均采用統一的在線客服智能應答服務引擎。智能應答服務引擎提供多種形式的接口,例如,SDK、API、嵌入頁面等,并根據不同的渠道進行適配改造,實現接入。
智能應答流程有3個環節:開始環節,包括觸發場景條件、場景開始提取信息規則;動態環節,包括進入環節條件、如何詢問用戶、環節內提取信息規則;結束環節,包括退出場景條件、成功時系統動作、失敗時系統動作。系統對已有的大量數據進行特征提取,分析得出表示具有情感傾向性的特征詞,再通過機器學習方法,對大量數據進行建模,判斷當前用戶的情感傾向性,再對用戶進行針對性的回答,從而實現智能應答。系統還提供驗證集回歸測試機制,可以直觀體現系統升級優化對應答的影響情況。該功能需要事先定義好由模擬問題和目標知識組成的驗證集,在系統版本升級和知識變化后或定期巡查過程中,由系統自動模擬測試,得到準確率優化建議,這樣可以不斷優化智能應答的結果。
鐵路12306線上智能客服系統是12306與用戶之間重要的溝通渠道,通過信息交流完成業務服務。自然語言信息的非結構化特點造成大量問題不能及時反饋處理,不能有效提高用戶體驗度,要解決這一問題,需要實現對語言信息的智能化和自動化處理,將原來主要由人工完成的工作交給系統自動完成,人工只需要進行輔助處理,這樣既能減少人力資源的投入,又能提高客服處理效率和智能化水平,改善客戶體驗。
語義識別技術可以分析網頁、文件、社交媒體中的大量數據,通過接口技術應用于機器人、智能家居、智能語音交互等領域,涉及醫療、教育、金融、交通等行業[6-7]。在鐵路12306線上智能客服系統中,語義識別作為接入層的重要組成部分,承擔著與用戶交互的工作。
語義識別可以分為自然語言處理(NLP,Natural Language Processing)技術層和底層數據層。NLP技術層主要分為詞法句法分析和語義分析2部分,用于從給定數據中抽取重要信息。底層數據層是語義識別算法模型的基礎,包括詞典、數據集、語料庫、知識圖譜以及外部世界常識性知識等。本系統利用知識庫和問題庫提供底層數據,建立語義識別算法模型[8-9]。
準確地掌握旅客出行特征是獲取鐵路出行需求,優化鐵路運行圖,構建市場化鐵路運營體系的基礎,有助于規劃管理部門制定科學決策。同時隨著鐵路交通網絡規模的不斷擴大和延伸,數據采集的深度和廣度也不斷增加。鐵路系統在運營過程中積累了海量的數據,這為提取旅客的出行鏈和出行規律奠定了數據基礎,為進行旅客出行特征分析提供了新的思路。大數據分析技術在數據量大、數據迭代快的場景下,對鐵路系統在運營過程中積累的海量數據進行管理和分析,充分挖掘數據潛藏的價值。
知識圖譜又稱為科學知識圖譜,主要以知識抽取、知識表示、知識融合、知識推理技術為基礎。知識圖譜是知識的元素組合和邏輯聯系結構,每一個知識圖譜包括對象、條件、屬性、參數4個元素。其中,對象與屬性可以決定一個知識圖譜的結構,條件和參數可決定一個知識圖譜的實例化。一個知識圖譜可以有多個實例化結果,實例化結果與傳統知識庫的知識概念相似,每個實例化結果對應一個標準答案,這就將各個實體進行了關聯。
傳統的客服系統以中文分詞和關鍵詞為核心,通過語句相似度計算來實現自動問答,這種系統雖然在客戶服務中起到不錯的效果,但是存在準確率低、效率低、維護難等問題。在大數據、機器學習等新技術的影響下,鐵路12306線上智能客服系統利用知識圖譜技術構建一個龐大而精細的知識庫,為每條知識設計足夠多的相似問法,并完成關鍵詞重要性標記,通過對海量數據的分析、標記,不斷完善、優化知識庫,使其成為智能客服的最強大腦。
鐵路12306線上智能客服系統的智能搜索技術通過使用數據挖掘、機器學習等技術對列車運行數據、鐵路出行數據、用戶個性化數據進行綜合分析建模,針對每一名旅客分別建立個性化的數據模型。系統在接收到旅客提出的問題時,會結合問題庫中當前熱點問題,智能分析旅客的真實意圖,返回個性化的智能搜索結果,提高返回結果的相關性和正確性。智能搜索實現的具體流程如下:
(1)將鐵路旅客多維特征(如年齡、出行規律、地域)進行抽取和統計;
(2)對出行數據進行聚類分析,按出行特征將旅客分為不同類型的旅客群體,屬于一個類型的用戶群體具有相似的屬性,對鐵路出行有相似的關注主題;
(3)系統分析計算各旅客群體對每個主題的關注度,獲得用戶群體和各信息主題相關性;
(4)根據問題類別、參與人數對當前旅客關注的熱點進行動態計算,提取熱度較高的主題形成熱點主題,利用關聯規則挖掘,將熱點主題相關的熱點問題提取出來,顯著提高系統準確率。
本文結合當前鐵路客票服務的現狀,提出了鐵路12306線上智能客服系統方案,系統以自然語言處理技術為基礎,接入方式由單一接入向集電話、短信、微信、支付寶等多種方式接入轉變,搭建了具有多方式接入、多渠道協同、多方位智能化應用的智能客服系統??蛻裟茈S時隨地、便捷快速地獲得豐富的產品信息和全面的業務指導,真正做到用用戶喜歡的方式為用戶進行服務。鐵路12306線上智能客服系統方案的研究滿足了移動互聯網環境下用戶和企業變革的需求,統一了服務內容和服務流程,提高了客服人員工作效率,為后續系統功能的進一步深化研究奠定了基礎。