李 強
(中國鐵路北京局集團有限公司 北京鐵路客戶服務中心,北京 100860)
客戶服務中心承擔著企業維護客戶關系,分析客戶需求,發現市場趨勢,提升服務質量的重要職能。鐵路客戶服務中心自2011年運營至今,系統規模不斷發展,如何提升效率、保證質量,利用客戶服務平臺為運輸主營業務提供更多支持,成為當前客戶服務中心管理能力提升的重要方向。
隨著大數據技術的發展和成熟,應用大數據技術對客戶文本、語音等信息進行綜合分析,實現客戶服務質量關鍵指標數字化,已經是當前各行業客戶服務中心信息技術發展的重要方向[1],運用大數據技術對客戶服務質量進行科學量化的評估,評估的準確性和完整性將會得到顯著提升。國內外學者對如何在呼叫中心領域應用大數據技術進行了廣泛的探討,電信運營領域是大數據支持客戶管理的領先行業,張戩等人提出了充分利用大數據技術的客戶服務管理分析思路[2],論證了對呼叫中心各類數據進行綜合分析應用的可行性。眾多專家也對鐵路新一代客戶服務中心應用大數據技術、推動客戶服務質量的精益化管理進行了研究[3],王馳鈞在對國內外呼叫中心數據分析算法研究的基礎上,提出了一種高效的K-means聚類算法,設計出符合呼叫中心業務數據特點的數據分析系統,驗證了數據分析在呼叫中心應用的效果[4]。國外的很多研究也證明了大數據分析應用對呼叫中心服務管理提升的可行性,開源大數據技術在客服中心應用效果顯著[5]。眾多專家通過案例分析,研究了國外大規模客戶服務中心通過Web方式進行數據采集和整合的方法,論證了技術的可行性和有效性[6]。這些研究,為大數據技術在鐵路客戶服務中心的應用奠定了可靠的基礎。
本文在分析和研究其它行業呼叫中心技術發展和服務理念的基礎上,提出研究和設計基于大數據技術的鐵路客戶服務中心服務質量分析平臺,具體內容為:
(1)規劃建設基于大數據技術的數據存儲和分析平臺,對多種類型的數據進行統一管理,能夠與既有系統實現數據傳輸接口。
(2)設計關鍵的分析場景和相關數據處理模型,建立服務質量關鍵績效指標(KPI)中典型指標的分析框架,實現基于驗證環境數據的KPI自動生成。
(3)結合語音轉換技術,實現驗證性錄音信息的文本化轉換,并利用歷史數據進行轉換驗證,提出針對鐵路客戶服務業務的語音轉換優化方案,為未來持續提升轉換準確率提供參考。
(4)利用鐵路客戶服務中心大屏展示系統,實現綜合數據展示,改變原有簡單的數據展示模式,支持更多樣的圖形結果。
(5)規劃總體技術方案,進行關鍵技術環節驗證,設計鐵路客戶服務中心大數據技術平臺總體框架,指導后續建設。
遵循大數據技術平臺框架,設計鐵路客戶服務中心服務質量分析平臺總體架構[7-8],如圖1所示。

圖1 客戶服務質量分析平臺總體架構
實現數據源從原始系統向客戶服務質量分析數據整合平臺(數據倉庫)的采集,技術上實現數據同步、數據采集、數據清洗、數據加載和數據格式轉換等功能。通過部署數據采集工具,主要實現質檢數據、員工工作量統計和語音錄音數據的導入。
構建支持海量數據存儲,支持復雜數據分析計算、存儲和數據處理的技術平臺,主要包括數據模型體系的設計和實施。以邏輯數據模型為核心組織數據,是客戶服務質量分析平臺數據管理的關鍵環節,需要從客戶服務質量分析的業務視角對數據模型進行全面規劃設計,保證服務質量KPI分析相關數據的融合,支持全面的智能分析,包括必要的數據管理和數據質量管理能力。
在數據整合環境的基礎上,實現面向不同業務需求的分析場景(如:接聽回答完成率趨勢分析),設計針對性的數據集市,部署所需的數據分析引擎和分析工具,支持業務和數據分析專家完成相關數據分析,分析結果可以直接應用于客戶服務業務管理,也為應用展現交互提供支持。
基于數據分析層的結果,開發豐富的圖形化展示界面,形成多種可定義的數據展示模式,同時,考慮數據應用場景,展現結果可在移動終端等不同環境進行自適應的圖形化處理,例如:圖形能夠在微信社交工具中有效展現和交互。
平臺實現獲取、轉換、加載(ETL)相關功能,能夠從既有的桌面輔助系統、精細化管理平臺和交互式語音平臺等系統提取數據,功能開發實現中考慮采集數據的多樣性,設計了高性能的處理框架,保證數據采集功能可以靈活適應各類處理算法,以開源Hadoop框架下的組件為基礎,實現對多類數據的采集,包括客戶基本信息、客戶服務過程記錄以及語音信息等。數據采集過程中,要對鐵路客戶服務中心既有系統中的數據進行清洗,解決重復記錄選擇問題,進行一致性檢驗等,如圖2所示。

圖2 數據采集功能實現
為實現客戶服務數據的綜合分析,需要在平臺上實現各類數據整合,數據整合管理功能是平臺核心功能之一[9],從開發技術路線上,選擇Hadoop框架構建基礎數據管理環境,考慮對高性能計算要求,定制部署相應的技術組件,包括實時處理組件、并行計算組件、流式計算組件等。從性能角度出發,針對分析型數據倉庫,選擇合理的性能設計方式,設計合理的基礎數據模型,以適應復雜分析的應用場景,按照分層數據架構進行規范的數據整合管理,如圖3所示。

圖3 數據整合管理實現
對于存在的大量客服語音等信息,適合直接在Hadoop分布式文件系統(HDFS)環境上,進行分布式存儲和管理,有效控制存儲規模和成本[10]。數據整合層將考慮從技術上引入內存計算的能力,對于數據處理性能要求高的分析場景,可直接加載到內存中,不再由I/O系統從硬盤讀取,能夠顯著提升實時分析的響應能力,極大地加速聯機事務處理過程(OLTP,On-Line Transaction Processing)數據處理速度,實現后臺在線分析,為鐵路客戶服務中心提供更加及時的分析服務,例如:在座席與客戶交互過程中,實時提供客戶綜合情況的分析,為座席做出合理的應對,提供準確有效的輔助性支持。
數據分析是客戶服務質量分析平臺產生業務價值的關鍵功能,各類數據通過數據分析功能模塊相關的分析工具和模式算法,產生出符合業務需求的KPI,統計報表、趨勢預測等各類分析結果。主要實現智能分析、數據挖掘等相關功能,通過聚類、決策樹、神經網絡等方法對數據的深層分析和挖掘模型予以支撐。通過對大量歷史數據的處理,在排除異常數據的基礎上,構建指標計算的數學模型,在約束條件的限制下,對未來一段時間內的指標進行預測。
其中,語音數據的處理分析是客戶服務質量分析平臺的重要子功能,語音識別技術所涉及的領域包括信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等。具體實施中將真實場景引入訓練客戶服務過程模型,進行場景訓練建模。在完成聲學模型建模后,基于聲學模型對未知語音幀序列進行語音識別,根據語法、字典,應用馬爾科夫模型進行優化,進行連接后的搜索網絡,在所有可能的搜索路徑中選擇一條或多條最優路徑作為識別結果。
數據展現交互功能是服務分析應用最終結果的提交界面,為用戶和相關系統提供處理交互的用戶界面(UI)環境和數據交互接口。通過設計多渠道、多類型圖形展示能力,為客戶服務質量分析平臺構建更加友好、便捷、靈活的數據展現界面,為各類需要有分析結果的系統提供數據交換接口。
選擇基于開源技術Echarts 的可視化技術,采用MVC(Model - View - Controller)3層架構,如圖4所示。Echarts是商業級數據圖表,基于純Javascript的圖表庫,可以流暢地運行在PC和移動設備上,兼容當前大部分瀏覽器,底層依賴輕量級的Canvas類庫ZRender,提供直接、生動、可交互及可高度個性化定制的數據可視化圖表。具備拖拽重計算、數據視圖、值域漫游等特性。

圖4 展示交互功能實現
各類數據在平臺上進行整合,最終以圖形等方式展現出來,平臺實現了基于大數據技術的圖形展示,能夠支持傳統基礎報表和統計工作的完成,提供話務量分析、分時段統計、工作績效分析等。平臺對傳統分析數據的展現效果和響應速度能夠超過原有架構的效果,在實際應用中實現本班績效的實時圖形化展示,圖形展示的效果也更加精細化,相關指標維度可以拖曳定義,部分圖形展示示例如圖5所示。

圖5 話務量分析
在完成基礎功能的基礎上,平臺借助大數據技術和圖形化工具,能夠為不同類型用戶提供多維度、多指標、動態化的數據展示,具備自定義和調整能力,典型場景展示效果如圖6所示。

圖6 通話時段分析
平臺從技術上實現了客戶服務中心全部歷史客戶訪問信息的綜合管理,并完成客戶服務記錄信息的識別和語義轉換,構建支持綜合分析的數據倉庫,具備綜合數據管理、數據分析的功能,能夠支持對座席人員服務過程的綜合分析,根據需求為服務質量管理者提供各類管理報表,實現精益化的服務質量管理。
本文以鐵路客戶服務中心業務需求為核心,提出了基于大數據技術的鐵路客戶服務中心服務質量分析平臺的總體架構,同時,應用了語音轉換技術,針對鐵路客戶服務用語進行了效果優化,為鐵路客戶語音分析技術應用提出了優化方向。開發了數據展示交互界面,通過實踐驗證了大數據技術在客戶服務中心的應用思路,能夠為未來全面推進客戶服務中心大數據分析平臺建設提供技術參考。