范晨 邢竟 王文靜 龐朝曦 陳偉杰
【摘 要】論文主要研究利用大數據挖掘技術及最優化算法,為實現既保證呼叫中心服務質量的同時,又能保證人力資源最優的配置提供預測數據,供95598坐席排班參考,并通過與實際值的對比進行驗證,結果顯示該項研究具有較高的推廣和應用價值。
【Abstract】The paper mainly studies the use of big data mining technology and optimization algorithm to provide predictive data for the realization of not only guaranteeing the service quality of call center, but also guaranteeing the optimal allocation of human resources. It can provide some reference for the seats scheduling of 95598. Through comparing with the actual value, the results show that the research has high popularization and application value.
【關鍵詞】時間序列;線性回歸;話務預測
【Keywords】time series; linear regression; traffic forecast
【中圖分類號】TN929.5? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2019)01-0160-02
1 引言
在電改的大環境下,隨著人們對電力服務質量的要求不斷提高,南方電網已經把提供優質的供電服務提升到了發展戰略的新高度[1]。但隨著業務類型的不斷增加,運營規模的壯大,排班問題變成了日常生產管理者頭痛的問題。話務量是呼叫中心進行客服坐席安排的依據,根據不同話務量需求以及固定的坐席數量,安排相應的坐席人員,才能實現既保證呼叫中心服務質量的同時,又能保證人力資源最優的配置。傳統的排班模式,需要經驗豐富的排班師對話務量進行提前估計,人為主觀因素影響比較大、工作量較大,且無法確保話務量預測準確度,無法滿足實際生產需求。因此,如何對話務量進行科學準確的預測早已成為一個亟待解決的問題。
話務量是一種隨機的、動態的時間序列變化過程,受天氣、季節、節假日、電力業務特點等因素的影響,呈現復雜的變化趨勢[2]。目前,已有一些預測工具被應用于話務量預測中,比如,自回歸移動平均模型、多元線性回歸模型、Kalman濾波估計、BP神經網絡等,都取得了一定的成果。但所有的模型都是針對常規的話務量進行預測,并未考察和分析異常情況下的話務量預測,在建模過程中只是將話務量異常數據進行剔除或者平滑,并未對異常的話務量數據進行單獨建模。
針對以上不足以及話務量自身的特點,我們提出一種基于異常話務量分塊建模的分析思路。將話務量分為異常話務量和正常話務量,再根據各自的規律分別建模。最后為了驗證模型的有效性,利用相同的方法對總話務量直接建模,以驗證異常話務量分開模型的準確性。
2 模型建立
2.1 模型思路
建模的主要思想是通過異常因子相關性建模方法將總話務量分為異常話務量和正常話務量兩個部分。并根據各自的發展趨勢和規律,建立不同的預測模型,進而得到異常話務量預測值和正常話務量預測值。異常話務量分塊建模的基本步驟:首先,找出異常話務量,確定異常因子。從統計分析和建模角度利用多種異常值檢驗方法、從呼叫中心話單特征角度利用業務探索方法、從外部學習角度利用文獻綜述法找出引起異常話務量的原因[3]。其次,確定可分析的異常因子。根據影響因子影響力大小、影響因子數據可得性、影響因子是否可預見、影響因子是否存在特定規律等特征篩選出可進行數據分析和建模的話務量影響因子。第三,拆分話務量并分別進行預測。利用相關性分析和建模,從總話務量中分離出異常因子引起的話務量(異常話務量)和正常話務量兩類,再分別利用自回歸移動平均模型、支持向量機和BP神經網絡模型對異常話務量、正常話務量進行分別建模和預測,總話務量預測值=異常話務量+正常話務量。最后,對比驗證。
2.2 話務量影響因素分析
從整體來看,可以將話務量影響因素分為以下四大類:一是臨時擾動事件。臨時擾動因素指的是可以預見但不存在特定規律的事件,比較典型的是不定期的檢修活動、臨時停電活動、異常惡劣天氣等[4]。如果能夠預見到類似事件,則一定要預估其作用時間及幅度,并相應的修正話務量。二是特定擾動事件。特定擾動因素是指在可以預見且在一定時間內存在一定規律的異常事件,主要包括以下幾類,季度檢修引起的計劃停電、涉及周末和節假日的特定日期因素、夏季電壓負荷相關的特殊時節因素以及自身業務特點相關的電費通知發布、欠費通知發布、停電通知發布、執行停電通知發布等因素。三是臨時特定事件。臨時特定因素是指不可預見但存在一定規律的異常事件,主要包括以下幾類,電網設備衰老、用戶計電設備老化、電網運行管理等[5]。四是隨機事件。此類事件不可預見也不存在規律,如系統故障、意外故障等隨機因素。
根據異常話務量數據分析和建模的要求,按照異常影響因子對話務量的影響程度大小、異常影響因子的數據可得性、數據時間前后統一性等要求,將所有影響因子進行排查,最后確定影響話務量的2類因子:業務特點、異常天氣。
利用各類短信通知數與各業務類型每天的話務量做相關分析,找出與短信通知有顯著相關的業務類型,將此業務類型的話務量定義為通知類的異常話務量,剩下的業務類型定義為其他話務量。
2.3 模型建立
支持向量機和神經網絡建模的基本步驟一樣,但其中運用的函數不同[6]。支持向量機是以訓練誤差作為優化問題的約束條件,以置信范圍值最小值作為優化目標。即SVM是一種基于結構風險最小化準則的學習方法,其推廣能力明顯優于一些傳統的學習方法。SVM在解決小樣本、非線性及高維模式識別問題中表現出許多特有的優勢,并能推廣應用到函數擬合等其他機器學習問題中[7]。
3 模型結果
本次話務預測課題研究共分為兩個預測小組,兩個預測組根據各自的預測方法,分別對2016年11月14日~12月2日連續三周每周的話務量情況進行預測,并將最終的預測結果進行比對,進一步研究下一步的話務工作的優化提升方案。
在為期三周的話務量預測中,經計算得出設計院三周的預測精度平均為12.75%,原排班組預測系統的平均預測精度為34.08%。原排班組預測系統的最低預測誤差為1.7%, 最高預測誤差為105.41%,而設計院預測最高預測誤差為52.09%, 最低預測誤差為0.17%。由三周話務預測誤差對比可知,設計院的話務量預測較為平穩,波動不是很大,且與真實值更接近。
4 結語
為驗證模型有效性,直接利用自回歸模型對總話務量進行建模和預測,將預測結果與分塊建模預測結果進行對比[8],同時為了驗證模型的實用性,與95598呼叫中心的排班組進行為期三周的預測結果對比。實踐證明,異常話務量分塊建模比傳統話務量預測結果精度更好,且異常話務量分塊建模為期三周的預測精度均比目前南方電網排班組的預測結果精度更高,未來可進一步落地實現,具有較高的推廣和應用價值。
【參考文獻】
【1】胡憲華,吳捷. 基于時間序列的移動通信話務預測[D].廣州:華南理工大學,2006.
【2】張昊.電力調度自動化系統及電力負荷智能化預測方法的研究[D].廣州:華南理工大學,1997.
【3】胡波,李磊.含野值的中長期話務數據分析方法研究[J].武漢水利電力大學學報,2000(6):33.
【4】程偉.基于季節變動模型的話務量預測[J].電信技術,2000(10):25-27.
【5】胡毅,李磊.改進自回歸算法在電信話務量預測中的應用[J].計算機工程與應用,2001(3):79-82.
【6】鄧聚龍.灰色預測預決策[M].武漢:華中理工大學出版社,1986.
【7】謝開貴,周家啟.變權組合預測模型研究[J].系統工程理論與實踐,2000(27):7.
【8】任君明.基于數據挖掘技術的移動通信話務預測模型[J].電信工程技術與標準化,2015(6):79-82.