韋金香, 張建同
(同濟大學 經濟與管理學院,上海 200092)
銀行ATM設備業務總量的時序特征分析及預測
韋金香, 張建同
(同濟大學 經濟與管理學院,上海 200092)
本文旨在分析銀行ATM設備業務總量的時序特征,并據此對其進行預測。首先,本文以十分鐘為間隔,繪制了銀行ATM設備業務總量的30天趨勢圖,發現其以日為單位,呈現出顯著的周期性、擾動性和多峰性,因此本文建立了以日為周期的ATM設備業務總量時序分布模型。在求解模型的過程中,本文利用模擬退火算法將每日銀行系統ATM設備業務總量按其特征分為八段,消除了業務總量時間序列的多峰性。在此基礎上,建立了Holt-Winters模型對業務總量進行預測,最后用第一時段進行驗證,得到95%置信區間內的預測值。本文的研究結果為銀行數據監控中心判斷設備運行狀態提供了依據。
時序分布模型;模擬退火;Holt-Winters模型;運行狀態
關于時間序列應用問題,多用于以下方面:(1)降維,尋找序列特點;(2)聚類,在聚類結果上進行分析;(3)預測。銀行ATM設備業務總量數據具有時間序列特點,序列形狀復雜但具有規律,本文運用時間序列的思考方式對銀行ATM設備業務總量的特征進行分析,并預測其正常狀態下的數值,從而對各行自助設備運行情況進行判定。
因為銀行ATM設備業務量是時間序列,因此,首先應判斷該序列是否能夠進行預測,才能夠進一步通過建立模型判定設備運行狀態。因此本文建立業務量的時間序列自回歸方程,利用MATLAB進行平穩性檢驗,得到其顯著水平為0.1%,因此通過5%的顯著性水平檢驗,判定業務量時間序列符合平穩性的特征。
隨后,利用R軟件初步畫出樣本數據的趨勢圖,由此判斷業務量時間序列的趨勢性和周期性,如圖1所示。
其中第一行為原業務量圖,第二行為幅值表征趨勢變化圖,第三行為周期性,第四行為隨機擾動。從圖1中可以清晰看到數據以天為周期,呈現明顯的周期性和趨勢性,擾動分布規律不明顯。
確定ATM設備業務量以天為周期,本文進一步畫出以天為單位周期的圖像,如圖2所示。

圖1 ATM設備業務量趨勢圖

圖2 ATM設備每天變化趨勢圖
從圖2中可以看出,ATM設備業務量在時序上呈現非均質特征,業務量所構成的時間序列具有多峰值和周期性。因此,需針對業務總量的時序特征,階段性、周期性地建立準確的ATM設備業務訪問預測模型。
上文提及ATM設備業務總量具有以天為周期的性質,但一天內業務總量具有多峰性,因此應當進一步將其以天為周期,探究其階段性特征。而分行上傳的每個時刻的業務量是一個根據時間變化的源源不斷的隨機過程,所以在對其進行階段性研究時應當將業務量作為一個時間序列進行分析,考慮業務量變化及正常范圍時不應該將其與時間分離。對于ATM應用系統,將一個周期T(天)內的時間分為n等長時段L(s,t)={S(t1),S(t2),…,S(tn)},其中S,t分別為分行業務量的業務量因子和時間因子。
本文研究其在不同時間段的特征,就是在研究按序(時間排列)將全部樣品(業務量)截成幾段,同類樣品(業務量)次序互相銜接的問題,即可以歸納為有序分類問題,符合Fisher最優分割思想。
本文研究需要從ATM應用系統業務量時間序列L(s,t)={S(t1),S(t2),…,S(tn)}中發現分行ATM應用系統業務量的模式T={T1,T2,…,Tk},其中Ti(1≤i≤k)在時間上相連接。其中,由于以天作為周期,而不同日期具有不同特征,所以本文將樣本數據研究天數(共p天)作為指標,記為S(tm)=(dm1,…,dmp),1≤m≤n。
得到一天ATM應用系統業務交易量的時間區間特征:
(1)
利用Fisher最優分割算法劃分區間的模型構建是基于算法思想建立的,方法步驟如下:
(1)類的直徑
假定分割區間為K類,某一類i業務量區間模式包含時序{S(i),S(i+1),…,S(j)}(j>i),記為G={i,i+1,…,j}。那么該業務量模式的向量均值為:
(2)
設模式內業務量的直徑為業務量集的利差平方和D(i,j),則有:

(3)
(2)分類的損失函數

(4)
式中分點1=i1 (5) (6) 則通過求解式(6)得到p(n,k)對應的式(4)解,即可得到Fisher最優分割思想下的最優分割點。從而得到式(1)解。 由于ATM應用系統業務量時間序列周期內具有144個時間點,筆者利用求解精確解的思路在計算k=4及以上時,無法計算得到結果。由于業務量以天為周期進行階段性的分析,對于階段個數沒有精確要求,因此本文采用啟發式算法進行求解。由于模擬退火算法(SA)數學模型的描述:在給定鄰域結構后,模擬退火過程是從一個狀態到另一狀態不斷隨機游動,因此選擇SA算法進行求解。 求解過程中,分割階段數的確定依據Fisher原理:在Fisher最優分割過程中,最小損失函數值隨分割k的增加而減少。而當分割數增加到某一數值后,最小損失函數值曲線將急劇變緩,達到一定的平衡,此時的k值為最佳分割值。 訓練實驗中,對訓練樣本中業務量數據進行3~12次最優分割,利用MATLAB軟件分別得到各次分割下SA算法求得的最小損失函數值,如圖3所示。 圖3 基于SA算法求解的最小損失函數值變化圖 所以,由圖3可以得到k=7時為最佳分割取值,并且得到P(n,7)下的ATM應用系統業務量模式所在時間區間,如表1所示。表1顯示k值為7時各訪問模式的離差平方和值較小。 表1 各業務量模式所在時間區間的集合 表1結果顯示,可以將一天內銀行系統ATM設備業務總量分為八段,在此基礎上進一步預測銀行ATM設備業務特征。 上文將一天內的業務總量分為八段,進一步觀察分段之后業務總量具有的特點,如圖4所示。 圖4 00:00~06:39時段業務量月變化趨勢 從趨勢圖中看到,業務量變化具有很強周期性,基于其具有的整體趨勢變動性和周期性的二重變化特點,采用加性Holt-Winters模型進行預測(HW模型)。 沙川認為HW模型的基本思想是把具有線性趨勢、周期變動和隨機變動的時間序列進行分解研究,與指數平滑法相結合,分別對水平項Ut(level)、趨勢項bt(trend)和周期項Ft(seasonal component)做出估計,HW模型由以下三個基本公式組成: (7) bt=β(Ut-Ut-1)+(1-β)bt-1 (8) (9) 其中,di為該時段中的觀測值,L為該時段周期長度,α,β,γ為對水平、趨勢和周期項的平滑參數,取值在[0,1]上,并且使得歷史數據滿足: (10) 以該月前十五天第一時段數據作為實驗數據、后十五天的作為測試數據進行預測,檢驗HW模型對于ATM業務總量的預測效果。 得到α=0.147,意味著當前預測基于較遠的觀測值;β=0表明趨勢部分的斜率在整個時間序列上是不變的,等于初始值,符合圖像的直觀感受;γ=0.199表明當天該時段的預測基于較遠的觀測值。 如圖5所示,黑色部分為觀測數據,紅色部分為HW模型求解得到的前15天實驗數據,可見HW算法成功預測了ATM設備業務總量的峰值。于是預測未來2天數據進行比較。 圖5 前15天HW模型求解結果 圖6 時段1內ATM業務總量預測 其中,圖6中藍色線條表示預測值,深灰色部分表示80%的置信區間,淺灰色表示95%的置信區間。對比實際數據,發現99%實際數據在95%置信區間內,結果合理。因此,可以利用HW模型進行預測,判斷未來時段1~8內ATM設備業務總量是否合理,進而判斷是否發生故障,及時進行調整。 銀行ATM設備總業務量具有周期性和時序性,利用該特征能夠判斷銀行ATM設備運行狀況,保證設備正常運行。本文建立銀行ATM設備業務總量的時序分布特點,建立時序分布模型,隨后利用模擬退火算法對模型進行求解,將業務總量時序分布分為8個時段,進而體現出業務總量分布的多峰值特征;在此基礎之上建立簡單的加性Holt-Winters模型進行業務量預測,得到95%置信區間內業務總量,當實際數據低于該區間或者高于該區間,說明銀行ATM設備存在故障的可能,能夠給予銀行維護人員警示,保障銀行ATM設備交易的正常運行。 現有網絡故障診斷方法一般都采用模糊邏輯或概率分析的方法,能夠完成不確定性條件下的推理決策,但對于銀行網絡交易數據而言,其具有較強的時序特征, 因此利用常規的網絡診斷方法缺乏針對性。本文通過對ATM設備業務總量時間序列進行建模,按照序列特點采集其特征,并進行業務量預測,從時序特征的角度完成了銀行ATM業務總量狀態的診斷問題。 在未來研究中,首先,由于模擬退火算法求解結果的精確度較低,因此探究如何準確求解時序模型,將更有利于尋找時序特征。其次,因為數據內容的限制,本文沒有考慮ATM設備的狀態和地域設置對業務總量的影響,所以未來可集合ATM設備業務總量的時序性和地域性,從而進一步探究銀行ATM設備業務總量精確的時空規律,建立更加高效的ATM設備資源時空分配策略。 [1] 馮崢. 基于粗糙集理論的銀行卡故障診斷系統研究與實現[D].上海:上海交通大學,2008. [2] 徐定杰,鄭笑天. 基于CMDB的銀行故障管理優化實現[J]. 黑龍江科技信息,2010(6):70. [3] ESLING P, AGON C. Time-series data mining[J]. ACM Computing Surveys,2012, 45(1):12. [4] 張俊,殷坤龍,王佳佳,等. 基于時間序列與PSO-SVR耦合模型的白水河滑坡位移預測研究[J/OL]. 巖石力學與工程學報,2015,34(2):382-391. [5] BAGNALL A, DAVIS L, HILLS J, et al. Transformation based ensembles for time series classification[C]//Proceedings of the 2012SIAM International Conference on Data Mining (SDM 2012),2012:307-318. [6] BRANDMAIER A M. pdc: permutation distribution clustering[J]. Psychological Methods, 2015, 18(1):71-86. [7] RAKTHANMANON T, KEOGH E. Fast shapelets: a scalable algorithm for discovering time series shapelets. // Proceedings of the13th SIAM International Conference on Data Mining (SDM 2013) .Austin, USA.2013:668-676. [8] 吳華意,李銳,周振,等. 公共地圖服務的群體用戶訪問行為時序特征模型及預測[J/OL]. 武漢大學學報(信息科學版),2015,40(10):1279-1286+1316. [9] 杜濤,熊立華,江聰. 渭河流域降雨時間序列非一致性頻率分析[J]. 干旱區地理,2014,37(3):468-479. [10] 鐘錦源,張巖,文福拴,等. 基于時間序列相似性匹配的輸電系統故障診斷方法[J]. 電力系統自動化,2015,39(6):60-67. [11] 沙川. Holt-Winters時間序列模型參數估計和預測[D].南京:南京大學,2011. ResearchandPredictiononTime-SequenceCharacteristicsoftheTotalBankingAutomaticTellerMachineBusiness (WEIJinxiang,ZHANGJiantong (School of Economics and Management, Tongji University, Shanghai 200092, China) This paper aims to analyze the time-sequence characteristics of the total banking ATM equipment business and predict the number of the business. Firstly, we map the banking ATM equipment 30 days of total trend diagram by taking the data of ten minutes interval. It is found that it has a significant periodicity, perturbation and multi-peak. Then we set up a time-sequence distribution model of total ATM equipment business base on the data of day interval and solve the mode by simulated annealing algorithm (SA). We divided the total amount of ATM equipment of the daily banking system into eight segments according to its characteristics, and eliminating the multi-peak of the total time series of the total business. Finally we forecast the total volume of the business through the Holt-Winters model and use the first period data for verification. And we get the 95% confidence interval of the first period business. The results of this paper provide a basis for judging the operation status of the equipment in the bank data monitoring center. time-sequence distribution model; SA; Holt-Winters model; operation status 2017-10-12 韋金香(1993—),女,廣西人,碩士研究生,研究方向為數據挖掘;張建同(1966—),教授,博士生導師,研究方向為應用統計。 E-mail: zhangjiant@163.com。 1005-9679(2017)06-0025-04 F 832 A

2 基于SA算法的ATM設備業務總量的時序模型求解


3 基于Holtwinters時間序列的業務量預測模型





4 總結