張伯駒
(中國鐵路總公司 運輸局, 北京 100844)
鐵路運輸企業呼叫中心話務量預測方法研究
張伯駒
(中國鐵路總公司 運輸局, 北京 100844)
本文結合概率論與數理統計理論,運用抽樣統計的手段,采用對數正態分布擬合,對呼叫中心的話務量進行預測。這種方法可計算出呼叫中心話務量的概率分布,從而得知話務量在某區間內的概率。論文使用的研究方法與已有的呼叫中心話務量預測方法的區別是引入了概率特性,它為鐵路運輸企業呼叫中心實際運營管理提供了理論與參考價值。
呼叫中心;話務量預測;對數正態分布;抽樣統計
為滿足人民群眾和企業客戶對鐵路運輸服務質量越來越高的要求,各鐵路局和專業運輸公司需要進一步提高呼叫中心的運營管理水平,其中一項基礎工作就是如何在現有條件下合理安排人力、優化現場管理,確保客戶服務水平。而話務量預測是呼叫中心座席排班的前提,呼叫中心可以針對不同的話務量安排對應的座席班組,在滿足呼叫中心服務水平的前提下,實現其人力資源的最優配置。
本文通過對呼叫中心話務量特征的研究,采用對數正態擬合思路,以中鐵快運“95572”呼叫中心為例,提出了一種鐵路運輸企業呼叫中心話務量預測的方法。
呼叫中心話務量特征研究是預測的基礎,沒有對話務量特征的詳細研究,很容易導致預測值不準,造成預測結果的不穩定。對呼叫中心話務量的研究要基于一定長度歷史統計數據,同時去除歷史數據中由各種原因而產生的異常點,使取得的樣本為普通樣本。為保證預測方法和結果更適用于實際運營情況,本文所用的業務數據樣本均采用中鐵快運“95572”呼叫中心某地區話務量的實際數據。
1.1 模式研究
為研究呼叫中心話務量規律,選取2010年3月~2011年7月期間的17個月的歷史統計數據,做折線圖如圖1所示。
根據折線圖可以獲得該呼叫中心話務量如下特征:
(1)具有明顯的周期性。該呼叫中心話務量以一周為一個循環周期,周一話務量較高,周二~周五話務量較為平穩,雙休日話務量呈下降趨勢。
(2)具有異常點。異常點包含兩類:a.隨機異常,這種異常數據通常無法預測,不能確定造成這種異常的主要原因;b.可預料異常,這種異常通常由某種明顯原因造成,例如節假日、新品上市、產品促銷等。

圖1 呼叫中心話務量歷史數據折線圖
(3)不具有明顯的上升趨勢。根據折線圖可以看出,該呼叫中心在這17個月中不具有明顯的上升趨勢,對于短期預測來說,可以忽視這種上升趨勢,認為該呼叫中心的話務量是穩定的。
1.2 抽樣統計
統計抽樣法又稱“隨機抽樣法”、“數理抽樣法”,是應用概率論與數理統計的原理,遵循隨機原則,從被查總體中抽出樣本進行檢查,并根據對樣本的檢查結果推斷總體的一種抽樣檢查方法。隨機性(即等可能性)原則是抽樣推斷正確性的一個重要前提條件,隨機抽樣排除了人的主觀影響,使樣本總體具有充分的代表性。
呼叫中心話務量問題是一個總體未知,通過總體的一部分來推斷總體分布的問題,因此采用抽樣統計的方式分析呼叫中心話務量分布是適當的。
抽樣要遵循兩個原則:
(1)抽樣具有代表性,每一個個體應當以同等的機會被抽到,樣本(X1, X2, …, Xn)中每個分量 的分布應當與總體分布相同。
(2)抽樣具有獨立性,樣本(X1, X2, …, Xn)中每個分量X1, …, Xn應是相互獨立的隨機變量。
1.3 異常點分析
依據話務量折線圖分析,對于第1類異常點,由于隨機異常屬于小概率事件,因此在對總體分布進行推斷時,可以將這些隨機異常點剔除。
對于第2類異常點,話務量明顯受到某一種或幾種因素的影響,此時的樣本不符合一般時間話務量總體分布,即違背抽樣要具有代表性的原則,因此將這一類異常點也剔除。同時,這類異常點也具有統計研究的價值,即研究在某一種或幾種主要影響因素下,呼叫中心話務量特征。
2.1 對數正態分布及其擬合
2.1.1 對數正態分布
對數正態分布定義:設X是取值為正數的隨機變量,若lnX~N(μ, δ2),則稱X服從對數正態分布,并記作X~ln(μ, δ2) 。
設ln(μ, δ2)的密度函數是P(X) ,則有

2.1.2 對數正態分布擬合方法
根據公式(1)可知,對數正態分布的概率密度函數具有兩個參數:μ決定了位置, δ2決定分布的幅度。
由最大似然估計法可得:

2.1.3 參數計算
由于極大似然估計是無偏的,因此利用極大似然估計值對參數進行估計:

2.2 模型的應用研究
2.2.1 樣本選擇
根據抽樣的代表性和獨立性原則,同時考慮數據更接近真實值,選擇2010年3月~2011年7月的數據。剔除異常數據,包括2011年1月~2月以及節日放假,共得樣本419個,由于呼叫中心話務量具有很強的周期性,因此將周期內數據分開預測,取得樣本數量如表1所示。

表1 呼叫中心話務量樣本抽樣統計數量
2.2.2 確定參數
根據樣本值,由公式(2)和(3)計算對數正態分布的兩個參數,如表2所示。

表2 擬合參數
由位置參數μ可知,星期一的話務量可能最大,而星期日的話務量可能最小。
2.2.3 曲線擬合
根據參數值確定對數正態分布曲線,擬合函數如表3所示。

表3 概率密度函數
根據擬合函數作圖如圖2所示。

圖2 概率密度函數圖像
由于概率密度函數圖像與x軸圍成的面積為概率值,因此對于對數正態分布作為概率密度函數來說,圖像越高聳,則說明在等長度范圍的情況下出現在峰值附近的概率越高。
因此由圖2可以看出:
(1)根據峰值位置可知,星期一的話務量最大在2 500左右,星期二~星期五的話務量呈平穩態勢,星期五稍微偏高,雙休日話務量則明顯下降。
(2)根據圖像形態可知,星期日的話務量分布更為集中,其次為星期五,星期一和星期二分布相對分散。
2.2.4 預測分析
根據擬合結果,可得對數正態分布峰值如表4所示。

表4 對數正態分布峰值
從表4中可以看出,該呼叫中心星期一的話務量最高,在2 400上下,星期二~星期五的話務量基本持平,維持在2 000上下,雙休日話務量下降趨勢明顯,分別維持在1 600和1 400上下。
根據概率密度函數特性,如圖3所示,星期一的話務量在2 200~2 600的可能性為42%,而在2 000~2 800之間的可能性達73%。星期二~星期五的話務量在1 800~2 200的可能性分別為41%、45%、47%、50%,在1 600~2 400之間的可能性為72%、77%、79%、81%。星期六的話務量在1 250~2 050的可能性達81%。星期日話務量維持在1 438上下的可能性最大,話務量在1 200~1 600之間的可能為55%,在1 000~1 800之間的可能為85%,而在1 000~2 000的可能高達94%。

圖3 星期一~星期日話務量峰值示意圖
本文運用概率論和數理統計理論與方法,提出了基于統計抽樣和對數正態分布擬合的呼叫中心話務量預測方法,建立了擬合模型,應用該模型對呼叫中心話務量進行了實證研究。結果表明該方法取得的預測值比較合理,符合呼叫中心的實際情況,為鐵路運輸企業呼叫中心進一步做好話務量預測提供了理論和案例參考。
[1]張幗奮.概率論數理統計與隨機過程[M].浙江:浙江大學出版社,2011.
[2]扎庫拉?戈文達拉玉盧.抽樣理論與方法[M].北京:機械工業出版社,2005.
[3]牟 穎,王俊峰,謝傳柳,夏正洪.大型呼叫中心話務量預測[J].計算機工程與設計,2010,31(21).
[4] 董哈微,葉先一.基于時間序列的呼叫中心話務量預測[J].閩江學院學報,2008,29(5):27-30.
[5]張志國,曹 洋,孫 平.對數正態分布參數的精確估計及其應用[J].遼寧科技大學學報,2008(Z1).
責任編輯 陳 蓉
Method of forecasting traff i c for call center of railway transport enterprise
ZHANG Boju
( Transport Administration, China Railway, Beijing 100844, China )
This paper combined probability theory and mathematical statistics theory, and used the statistical sampling methods and lognormal distribution fi tted to the call center traff i c forecasting. The paper also used a new research method which was different from the existing method by introducing probabilistic characteristics, and this was expected to provide a more comprehensive theoretical and case reference for the actual operations management of call center.
call center; forecast on traff i c; logarithmic normal distribution; sampling statistics
U285∶TP39
A
1005-8451(2014)10-0001-04
2014-05-07
鐵道部2011年度科研計劃課題(2011X019-I)。
張伯駒,高級工程師。