999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹的呼叫中心分時段話務量預測模型

2017-07-12 09:15:08王三軍楊厚新王向英
軟件導刊 2017年6期

王三軍+楊厚新+王向英

摘要:為解決交通服務熱線12328呼叫中心坐席安排難的問題,提高坐席人員工作效率,針對呼叫中心分時段話務量特性,提出了由預測分時段話務量占當日總話務量比例間接得出分時段話務量的思路,并以比例向量作為葉節點構建決策樹模型。應用分類和回歸樹算法構建決策樹時,考慮到分時段話務量樣本間的相關性,引入馬氏距離對算法中度量切分誤差的方法進行改進。結合實際需求,對常用的誤差衡量標準進行了修改,以更好地反映分時段話務量預測效果。實驗證明,相比于直接預測分時段話務量,該方法預測誤差降低了8%,提升了預測準確性。

關鍵詞:呼叫中心;分時段話務量;分類和回歸樹算法;決策樹;預測誤差

DOIDOI:10.11907/rjdk.171968

中圖分類號:TP319

文獻標識碼:A 文章編號:1672-7800(2017)006-0138-04

0 引言

為了暢通群眾交通運輸服務監督渠道,建立交通運輸服務監督業務協同處理工作機制,提升交通運輸行業科學決策水平,交通運輸部自2013年開通全國服務監督電話,建設部、省、市三級聯網運行的交通運輸服務監督電話系統[1-2]。服務監督電話系統要達到提高服務監督質量、建立協同工作機制、提升科學決策水平的目的,必須實現呼叫中心坐席的科學安排。而話務量數據是坐席安排的關鍵依據,針對不同的話務量安排對應的坐席,使得在滿足呼叫中心服務水平的前提下,實現人力資源最優配置。

話務量具有高度的非線性和時變特性[3],傳統的經驗排班模式難以準確預知話務量大小,無法滿足實際生產需求。話務量分析旨在對未來話務量進行預測,以此來合理分配資源,從而進行科學的呼叫中心坐席安排。因此準確有效的話務量預測,對交通運輸服務監督電話系統建設有重要意義。

現階段,國內外很多研究機構都設計有話務量的預測模型,并且取得了豐富成果,主要有自回歸移動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[4-5]、神經網絡[6-8]、灰色模型[9]、支持向量機[10]、k近鄰算法[11-13]以及一些組合模型[14-15]。日話務量的預測準確度基本上可以滿足實際需求,但每半小時的分時段話務量預測卻缺乏相應研究,而后者在實際排班應用中具有非常重要的指導價值。針對分時段問題,本文提出一種先預測分時段話務量占當日話務量的比例,再得到分時段話務量值的間接預測思路,并以比例組成的向量作為決策樹葉節點進行建模。在構建決策樹過程中,考慮到話務量樣本間的相關性,改進了分類和回歸樹(Classification and Regression Tree,CART)算法中度量劃分數據集誤差的方法。實驗證明,應用這種思路和改進的方法進行預測相比于直接預測各時段話務量值,預測誤差降低了8%。

1 決策樹模型

1.1 決策樹

決策樹是機器學習中用于分類和回歸的一種主要預測模型,代表對象屬性與對象值之間的映射關系[16]。它從一組表面上看似無序的數據集中學習出決策規則,采用自頂而下的遞歸方式,構建出決策樹模型。因此,決策樹本身就是由IF-THEN組成的規則集合,從根節點到葉節點的路徑對應著一條決策規則。在決策樹算法中,分類和回歸樹是一種通用的算法,采用簡潔的二叉樹結構,既可用于分類,也可用于回歸,目前已得到廣泛研究和應用。本文將CART算法用于構建分時段話務量預測模型,并針對話務量數據的特性,對其中劃分誤差的度量標準進行討論和改進。

1.2 改進的CART算法

根據實際情況,選取季節、日期類型(1工作日、2周末、3節假日)、最高溫、最低溫、平均溫、降雨、降雪、風力等因素作為影響話務量的特征,按圖1所示的流程圖判斷是否進行二元切分以及如何確定最佳切分條件。

在構建決策樹時,根據特征及特征值對數據集進行二元切分。通過遍歷所有的特征及其可能的取值,找到使誤差最小化的切分點,確定最佳的切分特征以及在該特征上切分的最佳位置。如果節點的特征值大于對應的切分特征值,那么該節點被劃分為左子樹節點,否則該節點被劃分為右子樹節點。然后再分別對左、右子樹的數據集執行上述二元切分的操作。為了反映一次切分效果,采用式(4)的形式度量切分誤差。

為了控制構建決策樹過程中的切分終止條件,在決策樹模型中引入兩個參數,α和β。其中,參數α是容許的總方差減少量閾值,如果一次切分后,數據集的總方差減少量小于該閾值,則停止切分,否則繼續切分。參數β是切分后節點中的最少樣本數。如果一次切分之后,某一個節點中的樣本數小于該參數,則說明該節點中的樣本數量達到了設定的下限,為了防止葉子節點中的樣本數量過少,停止切分。這兩個參數的取值可以通過可視化視圖,觀察在不同取值組合下決策樹模型對訓練集數據的預測值與訓練集中實際值的擬合情況確定。構建出決策樹之后,對每個葉節點的話務量比例取均值得到該葉節點的值。因此,構建出的決策樹葉節點都是1×48的向量。

1.4 決策樹優化

如果決策樹模型中節點過多,可能出現過擬合問題,可通過交叉驗證[18]的方法來判斷。在構建決策樹時,已經通過參數α和β來為決策樹的切分設定了終止條件,這實際上是對決策樹進行了預剪枝操作。但是,在實驗中發現構建出的決策樹對這兩個參數十分敏感。如果輸入的參數過于嚴格,則構建出的決策樹葉節點很少,甚至只有一個;反之,如果設定的參數不夠嚴格,則構建出的決策樹結構非常復雜。可見單一的預剪枝操作并不足以優化決策樹,因此,進行后剪枝操作是必要的。

所謂后剪枝,就是用測試集數據驗證已構建的決策樹結構的合理性,如果有不合理的劃分則采取相應的方法調整樹結構。具體方法是從上至下遍歷樹中每個節點,計算將當前兩個節點合并后的誤差,并與合并前的誤差相比較。若誤差減小,則合并;否則保留原結構。將預剪枝與后剪枝操作結合使用能夠有效地優化決策樹的結構,解決過擬合問題。

2 分時話務量預測

2.1 歷史話務量分析

呼叫中心主要承擔了業務咨詢、故障報修、投訴等職責[19],顯然,這些業務受天氣、季節、節假日以及資費政策等不確定性因素的影響,因此每天的話務量也隨之變化,而各時段話務量的特性還需要進一步分析。以某省2014年12月24日至2016年11月30日的話務量為例進行分析,圖2展示了這段時期內每半小時話務量占當日總話務量比例的平均值,在48個時段中出現了兩個峰值,兩個谷值,在某些時段內話務量占比非常小。一般在第19~22時段(上午9時~11時)達到一個峰值,通常稱為早忙時,然后出現一個谷值,在第30~32時段(下午3時~4時)達到另一個峰值,通常稱為晚忙時,而在第6~10時段(凌晨3時~5時)達到最低點。

以yij,j=1,2,...,48表示各個時段的話務量,yi表示日話務量,則滿足yij<0.5%*yi的時段有13個,即第1~13時段。表1顯示了這13個時段的話務量占當日話務量的百分比,可以看出各些時段占日話務量的百分比值最大不超過3%,最小為0,平均值在0.1%左右,分布穩定,波動范圍較小。進一步分析原始數據得出,第1~13時段內的話務量之和占日話務量的平均百分比為1.6%,最大值不超過10%,且這些時段內的話務量均值都不超過50。

2.2 數據預處理

分析話務量數據時發現其中出現了一些離群點。形成離群點的原因是多種多樣的,可能是在采樣過程中發生的誤差,如記錄過程中出現筆誤、計算錯誤等,也可能是偶然發生突發事件導致的。無論何種原因,這些離群點均會對研究整個數據集的規律產生一定影響。因此,在進行預測之前,對數據進行預處理是必要的,這個過程包括異常數據的識別和處理。

通過對日話務量的分析發現,每月的日話務量序列Z服從正態分布,記作Z~N(μ,δ2),其中,μ和δ分別為當月日話務量數據的平均值和標準差,故用[μ-2δ,μ+2δ]的區間作為判斷日話務量數據是否正常的標準,落在這個區間內的數據看作是正常數據,超出這個區間的數據看作是異常數據。為了避免異常數據對構建預測模型的干擾,若識別出某天的日話務量數據為異常數據,則將當天的話務量數據剔除。

2.3 評價方法

通過2.1節對分時段話務量數據的分析,發現一天之中第1~13時段話務量相對較少,最高不到總話務量的10%,而且每天這些時段話務量分布規律非常穩定,僅在極小的誤差范圍內波動,所以這些時段的話務量預測絕對誤差很小。而第14~48時段集中了一天中絕大部分的話務量,所以在對分時段話務量預測效果進行評價時,用這35個時段的話務量預測平均誤差來反映該天分時段話務量預測的效果。誤差采用常用的平均絕對相對誤差(Mean Absolute Percentage Error, MAPE)[20]來衡量,則評價分時段話務量預測誤差(Component Mean Absolute Percentage Error, CMAPE)的方法的形式如下:

3 實驗結果及分析

使用Python編寫程序實現上文提出的分時段話務量預測思路和建模方法,以某省分時段話務量數據為例進行實驗。實驗中所采用的數據集包括了每天的總話務量、對應的48個時段的話務量以及話務量特征。以2014年12月24日至2016年11月10日的數據為訓練集,以2016年11月11日至2016年11月30日的數據為測試集,預測2016年12月1日至2016年12月15日期間的分時段話務量,并用CMAPE的形式對預測效果進行評價。使用訓練集數據學習決策樹模型,再用測試集數據對模型進行剪枝,最終得到的決策樹模型如圖3所示。可以看出,構建的決策樹模型為7層二叉樹,結構簡單,容易理解。溫度、日期類型、星期(一周中的第幾天)對話務量有很大影響。可以根據決策樹模型對應的規則集推理出理論上的分時段話務量比例大小。

模型中共有7個葉節點,如圖4所示,每個葉節點表示48時段占全天話務量比例的向量。從圖中可以看出,在前18個時段,7個葉節點的值都很接近,接著在后面時段中出現第一個峰值時,各節點出現峰值的時段略有不同且峰值的高低也有較大的差別,接下來各節點值都有所降低,并出現一個短暫的谷值,26時段之后各節點表現出不一樣的大小和變化趨勢,尤其是第7個葉節點。

同時,采用直接預測分時段話務量的思路,同樣使用決策樹模型對相同時間段內的話務量進行預測,作為第一組對比實驗。直接預測的方法是,首先將分時段話務量按照不同時段進行分類,這樣就得到48個不同時段的數據集,然后再分別對每個時段的話務量進行預測。另外,采用間接預測分時段話務量的思路和改進CART算法構建決策樹模型對相同時間段內的話務量進行預測,作為第二組對比實驗。三種方法得到的預測誤差情況如表2所示。

統計得出直接預測這15天話務量的平均誤差是0.184,間接預測的平均誤差是0.124,間接預測且采用改進CART算法的平均誤差是0.100。間接預測的誤差相比于直接預測有所降低,預測準確性提高了6%,改進CART算法后,預測準確性達到90%。

4 結語

根據分時段話務量特性,本文提出了由預測分時段話務量比例間接得到分時段話務量的思路,并用分時段話務量比例組成的向量作為葉節點構建決策樹模型。在運用CART算法生成決策樹時,解決了算法在度量劃分誤差時未考慮樣本間相關性的問題。考慮到分時段話務量的分布特性以及呼叫中心的實際需求,修改了計算預測誤差的方法,以更好地評價預測效果。最后通過實驗驗證了這種思路與改進建模方法的可行性和有效性。相比于直接預測,間接預測和改進CART算法預測分時段話務量準確性有所提高,但仍出現了個別預測準確性不理想的情況,這是下一步研究需要解決的問題。

參考文獻:

[1]中華人民共和國交通運輸部.交通運輸部關于改進提升交通運輸服務的若干指導意見[Z].中華人民共和國交通運輸部,2013.

[2]李泓波,彭三城,勁波,等.一類決策樹ID3改進算法探究[J].2016,15(2):30-32.

[3]鄧波,李健,孫濤,等.基于神經網絡的話務量預測[J].成都信息工程學院學報,2008,23(5):518-521

[4]SHULAN LI,HONGQIONG HUANG,DAQI ZHU,et al.The application of space-time ARIMA model on traffic flow forecasting[C].Proceedings of the 2009 International Conference on Machine Learning and Cybernetics.Piscataway,NJ:IEEE,2009:3408-3412.

[5]KAMARIANAKIS Y,SHEN W,WYNTER L,et al.Rejoinder:real-time road traffic forecasting using regime-switching space-time models and adaptive lasso[J].Applied Stochastic Models in Business and Industry,2012,28(4):297-315.

[6]SARDHAN,SSATSRI,VCHUTCHAVONG,et al.Improved model for traffic fluctuation prediction by neural network[C].Proceedings of the 2007 International Conference on Control,Automation and Systems.Piscataway,NJ :IEEE,2007:122-125.

[7]DANG X C,HAO Z J,LI Y,et al.Network traffic forecasting combination model based on wavelet transform and chaos algorithm[J].International Journal of Wavelets,Multiresolution and Information Processing,2014,12(03)..

[8]LONG H,YAN G.Forecasting import and export volume with a combined model based on wavelet filtering[J].International Journal of Wavelets,Multiresolution and Information Processing,2016,14(3):19-25.

[9]樂可爭.基于灰色預測模型的移動話務量預測研究[D].上海:東華大學,2014.

[10]陳電波,徐福倉,吳敏.基于聚類和支持向量機的話務量預測模型[J].控制工程,2009,16(2):195-198.

[11]SHUANGSHUANG LI,ZHEN SHEN.A k_nearest neighbor locally weighted regression method for short-term traffic flow forecasting[C].//Proceedings of the 2012 IEEE International Conference on Intelligent Transportation Systems.Piscataway,NJ:IEEE,2012:1596-1601.

[12]BERNAS M,PLACZEK B,PORWIK P,et al.Segmentation of vehicle detector data for improved k-nearest neighbours-based traffic flow prediction[J].Iet Intelligent Transport Systems,2015,9(3):264-274.

[13]DELLACQUA P,BELLOTTI F,BERTA R,et al.Time-aware multivariate nearest neighbor regression methods for traffic flow prediction[J].IEEE Transactions on Intelligent Transportation Systems,2015,16(6):3393-3402.

[14]SHEN DONG,LIGUANG SUN,TANGHSIEN CHANG,et al.Combined short-term traffic flow forecast model for beijing traffic forecast system[C].Proceedings of the 2011 International IEEE Conference on Intelligent Transportation Systems.Piscataway,NJ:IEEE,2011:638-643.

[15]何瑋珊,覃錫忠,賈振紅,等.基于小波變換和ARMA-LSSVM的忙時話務量預測[J].計算機工程與設計,2014,35(12):4105-4108.

[16]徐鵬,張巖江,蘇森.PaaS云資源調度技術研究[J].華中科技大學學報:自然科學版,2013,41(S2):52-56.

[17]張翔,王士同.一種基于馬氏距離的可能性聚類方法[J].數據采集與處理,2011,26(1):101-105.

[18]BAI JING,YANG LIHONG,ZHANG XUEYING.Parameter optimization and application of support vector machine based on parallel artificial fish swarm algorithm[J].Journal of Software,2013,8(3):673-679.

[19]夏正洪,潘衛軍.呼叫中心智能排班系統關鍵技術[J].計算機工程與設計,2015,36(5):1332-1336.

[20]劉童,孫吉貴,張永剛.用周期模型和近鄰算法預測話務量時間序列[J].吉林大學學報:信息科學版,2007,25(3):239-245.

(責任編輯:陳福時)

主站蜘蛛池模板: 二级毛片免费观看全程| 欧美在线视频不卡第一页| 激情无码视频在线看| 国产极品美女在线观看| 午夜a级毛片| 熟女日韩精品2区| 无码'专区第一页| 青青青伊人色综合久久| 波多野结衣中文字幕久久| 四虎精品国产AV二区| 成年女人18毛片毛片免费| 国产在线精品网址你懂的| 天天色天天综合| 极品性荡少妇一区二区色欲| www.日韩三级| 亚洲AⅤ综合在线欧美一区 | 久久国语对白| 日韩色图区| 777国产精品永久免费观看| 国产第八页| 精品欧美视频| 欧美日本在线观看| 久久亚洲美女精品国产精品| 亚洲精品成人片在线观看| 日韩中文无码av超清| 五月天久久婷婷| 国产91在线|中文| 婷婷成人综合| 国产在线第二页| 亚洲精品黄| 狠狠做深爱婷婷久久一区| 在线日本国产成人免费的| 欧美午夜视频| 久久精品国产精品青草app| 亚洲福利片无码最新在线播放| 欧美日韩国产成人高清视频| 真实国产乱子伦高清| 无码国内精品人妻少妇蜜桃视频| 美女一级毛片无遮挡内谢| 国产精品网址在线观看你懂的| 69国产精品视频免费| 国产美女一级毛片| 免费看av在线网站网址| a级免费视频| 成人午夜久久| 久久精品无码一区二区日韩免费| 国产欧美中文字幕| 国产高清在线丝袜精品一区| 国产成人精品第一区二区| 爱做久久久久久| 香蕉视频在线观看www| 东京热高清无码精品| 欧美日韩另类在线| 欧美午夜精品| 国产成人亚洲精品无码电影| 热九九精品| 久久a毛片| 欧洲一区二区三区无码| 午夜a级毛片| 丰满人妻久久中文字幕| 日本欧美视频在线观看| a级毛片免费网站| 国产男女免费完整版视频| 人人看人人鲁狠狠高清| 国产精品久久国产精麻豆99网站| 亚洲免费黄色网| 波多野结衣AV无码久久一区| 精品综合久久久久久97| 好紧好深好大乳无码中文字幕| 操国产美女| 色噜噜久久| 九九视频免费看| 免费国产不卡午夜福在线观看| 欧美午夜在线观看| 亚洲首页在线观看| 日韩一区二区三免费高清| 欧美激情第一欧美在线| 日韩小视频在线播放| 欧美激情成人网| 午夜少妇精品视频小电影| 国内精品小视频在线| 日韩国产 在线|