王亞男 雷英杰 王 毅 鄭寇全
?
一種啟發(fā)式變階直覺模糊時間序列預測模型
王亞男*①雷英杰①王 毅①鄭寇全②
①(空軍工程大學防空反導學院 西安 710051)②(西安通信學院 西安 710106)
論文針對已有高階模糊時間序列模型在預測精度和預測范圍上的限制,結(jié)合直覺模糊集理論,提出一種啟發(fā)式變階直覺模糊時間序列預測模型。模型首先應用直接模糊聚類算法對論域進行非等分劃分;然后,針對直覺模糊時間序列的數(shù)據(jù)特性,改進現(xiàn)有直覺模糊集隸屬度和非隸屬度函數(shù)的建立方法;最后,采用階數(shù)隨序列實時變化的高階預測規(guī)則進行預測,并將歷史數(shù)據(jù)發(fā)展趨勢的啟發(fā)知識引入解模糊過程,使模型的預測范圍得到擴展。在Alabama大學入學人數(shù)和北京市日均氣溫兩組數(shù)據(jù)集上分別與典型方法進行對比實驗,結(jié)果表明該模型有效克服了傳統(tǒng)模型的缺點,擁有較高的預測精度,證明了模型的有效性和優(yōu)越性。
直覺模糊集;時間序列預測;啟發(fā)式;變階
模糊時間序列(Fuzzy Time Series, FTS)預測理論由文獻[1-3]在1993年首次提出并應用于Alabama大學招生人數(shù)預測,取得了較好的預測效果。進而該理論在預測領域得到了廣泛研究與發(fā)展,尤其在不精確數(shù)據(jù)或模糊數(shù)據(jù)等問題中預測效果優(yōu)良,例如城市用電負荷預測[4]、股指交易量預測[5]、景點游客量預測[6]等。對FTS預測模型的改良主要集中在4個方面:論域的劃分;模糊關(guān)系和預測規(guī)則的建立;多元模型;高階模型。FTS模型中對歷史數(shù)據(jù)模糊化時采用了傳統(tǒng)的Zadeh模糊集概念,與直覺模糊集相比,對語言值隸屬性質(zhì)的度量既不夠客觀也不夠全面,這從根本上限制了預測精度的提升。而直覺模糊時間序列(Intuitionistic Fuzzy Time Series, IFTS)預測模型將直覺模糊集理論引入FTS模型,極大地擴展了時間序列對不確定、不完備等模糊信息的處理能力,有效提升了FTS模型的預測效果。
文獻[19,21]相繼提出了多種高階FTS模型,但這些模型都有一個共同的特點:模型的階數(shù)固定,即雖然模型可以取不同的階數(shù),但當階數(shù)取定后,在整個預測過程中都不能改變。我們將這種模型叫做“定階模型”。對定階模型的實驗結(jié)果進行分析發(fā)現(xiàn),它們存在一個缺陷:每個歷史數(shù)據(jù)的最優(yōu)預測值對應的模型階數(shù)并不相同,即無論模型取何種階數(shù),得到的預測效果都不是最優(yōu)的。此外,傳統(tǒng)FTS和IFTS模型存在一個共同的缺陷:預測范圍固定,即預測值始終位于由歷史數(shù)據(jù)確定的論域之中,這就使得模型永遠無法得到歷史數(shù)據(jù)范圍之外的預測值。這種缺陷嚴重影響了模型的預測精度。
鑒于以上分析,本文結(jié)合直覺模糊集理論,對階數(shù)可變的高階模型進行研究,同時通過對歷史數(shù)據(jù)發(fā)展趨勢的分析,將趨勢先驗知識引入模型,建立了一個啟發(fā)式變階IFTS預測模型。對比實驗證明所建模型有效克服了傳統(tǒng)模型的缺陷,使預測更貼近實際需求,取得了較好的效果。
定義1[27]設是一給定論域,則上的一個直覺模糊集為





IFTS預測模型可以概括為4個主要步驟:(1)確定論域大小,并對論域進行劃分;(2)建立直覺模糊集,將歷史數(shù)據(jù)直覺模糊化;(3)確定預測規(guī)則,求得預測值;(4)預測結(jié)果去模糊化輸出。本節(jié)首先介紹論域劃分和直覺模糊集的建立方法,然后給出模型的完整步驟。
3.1基于模糊聚類的非等分論域劃分
文獻[7]的研究已表明,在FTS模型中使用非等分劃分方法會產(chǎn)生比等分方法更好的預測結(jié)果。本文采取較遺傳算法等優(yōu)化算法更簡捷的基于最大生成樹的直接模糊聚類算法[27]。設是待分類對象的全體,聚類得到的類數(shù)據(jù)可記為其中,,,,表示第類數(shù)據(jù)所含對象個數(shù)。記

3.2建立直覺模糊集

3.3模型步驟
為了使預測過程更符合實際需求,首先需要建立以下3條規(guī)則:

表1 模型中的變量及含義
步驟1 確定模型的初始階數(shù)。由于在實際計算中,模型階數(shù)過高會帶來很大的計算量[19,20],因此為保證模型的實時性,本文限制模型的階數(shù)最大取9。算法1(表2)以序列初始的10個歷史數(shù)據(jù)為訓練數(shù)據(jù)集來確定模型的初始階數(shù),即當模型階數(shù)依次取時,分別用預測,選取其中預測誤差最小的階數(shù)作為。
表2確定初始階數(shù)算法

算法1 確定初始階數(shù)輸入:輸出:(1) (2) (3) for to 9(4) 按步驟2 -步驟9計算(5) (6) if(7) (8) (9) end if(10) end for(11) (12) return
步驟5 直覺模糊化歷史數(shù)據(jù)差值。計算所有歷史數(shù)據(jù)對每個直覺模糊集的隸屬度、非隸屬度和直覺指數(shù),歷史數(shù)據(jù)的直覺模糊化值可以用以一對向量表示。





對標準向量和操作矩陣進行運算,得到一對關(guān)系矩陣:
表3尋找最優(yōu)預測階數(shù)算法

算法2 尋找最優(yōu)預測階數(shù)輸入:輸出:(1) (2) (3) (4) if(5) for to 9(6) (7) while (8) 按步驟7-步驟 9計算(9) (10) if(11) (12) break(13) end if(14) end while(15) end for(16) while(17) for to 9(18) (19) while (20) 按步驟7-步驟9計算(21) (22) if(23) (24) break(25) end if(26) end while(27) end for(28) end while(29) end if(30) return





其中,

步驟9 預測結(jié)果去直覺模糊化。將式(16)中的最大值個數(shù)記為,每個最大值對應的直覺模糊集和區(qū)間分別記為和,。將趨勢先驗知識作用到上,得到新的區(qū)間為
4.1 Alabama大學入學人數(shù)實驗
Alabama大學入學人數(shù)數(shù)據(jù)集是文獻[2]首次提出FTS模型時使用的一組實驗數(shù)據(jù),此后該數(shù)據(jù)集常作為FTS和IFTS模型的測試集,用以檢驗模型的可行性。將本文的IFTS模型應用在該數(shù)據(jù)集上,得到各年入學人數(shù)預測結(jié)果如表4所示。
將文獻[2],文獻[9],文獻[19],文獻[24],文獻[26]的模型分別應用在Alabama大學入學人數(shù)數(shù)據(jù)集上,利用均方誤差(Root Mean Square Error, RMSE)和平均預測誤差(Average Forecasting Error, AFE)兩項指標將本文的預測結(jié)果同其它5種模型的預測結(jié)果進行比較。兩項指標的計算為


表5列出了各模型的預測結(jié)果和預測性能及算法復雜度。其中,文獻[2]為傳統(tǒng)FTS模型,文獻[11]和文獻[20]為啟發(fā)式FTS模型,文獻[24]和文獻[26]為傳統(tǒng)IFTS模型。在文獻[19]和文獻[26]中,不同的取值對應了不同的預測結(jié)果,本文選取其中的最優(yōu)結(jié)果用于比較。代表算法中(直覺)模糊邏輯關(guān)系個數(shù),代表歷史數(shù)據(jù)個數(shù),代表(直覺)模糊邏輯關(guān)系組個數(shù),代表窗口長度或算法的階數(shù)。
從表5可以看出,與傳統(tǒng)模型(即文獻[2],文獻[24]和文獻[26])相比,本文模型擴展了預測值的取值范圍,而不是僅僅局限于歷史數(shù)據(jù)范圍內(nèi)。例如,當預測1990年的數(shù)據(jù)時,歷史數(shù)據(jù)的取值范圍是[13000, 19000],而1990年的數(shù)據(jù)為19328,不在歷史數(shù)據(jù)范圍內(nèi)。文獻[2],文獻[24]和文獻[26]的預測值分別為19000, 18961和19000,由于模型算法的制約它們的預測值始終只能位于區(qū)間[13000, 19000]內(nèi)。而本文模型的預測值為19600,沒有受到歷史數(shù)據(jù)取值范圍的制約。結(jié)合表4和表5的結(jié)果可以看出,與啟發(fā)式模型(即文獻[10]和文獻[19])相比,本文模型的預測階數(shù)不是固定不變的,而是通過階數(shù)的自適應變化使每一年的預測數(shù)據(jù)都盡可能接近真實數(shù)據(jù),從而得到了更小的平均預測誤差。從時間復雜度上看,本文模型的時間復雜度較其它模型相比雖有一定增加,但依然控制在()數(shù)量級內(nèi),相較其預測結(jié)果的提升,這種程度的復雜度犧牲是可以接受的。與其它5種模型相比,本文模型的預測結(jié)果有所提升,從而證明該模型不僅是可行的而且預測結(jié)果是優(yōu)良的。

表4 Alabama大學入學人數(shù)預測值
表5各模型對Alabama大學入學人數(shù)的預測性能

年份真實值預測值 文獻[2]模型文獻[10]模型文獻[19]模型文獻[24]模型文獻[26]模型本文模型 197113055–––––– 1972135631400014279–14250–– 1973138671400014279–14246–– 1974146961400014279–14246–– 1975154601550015392–15491–– 1976153111600015392–1549115451– 1977156031600015392–1549115530– 1978158611600016467–1634516002– 1979168071600016467–1634516750– 1980169191681317161–1585017321– 198116388168131716116919158501701216986 198215433167891491616188158501622315830 198315497160001539214833154501556015693 198415145160001539215497154501511215329 198515163160001539214745154911511215201 198615984160001547015163154911556415394 198716859160001646716784163451615016780 198818150168131716117659179501742017674 198918970190001925719150189611863419308 199019328190001925719770189611900019600 199119337190001925719728189611957819733 199218876190001925719337189611963019321 RMSE635440508433439377 AFE(%)3.102.282.792.242.031.94 T(n)
4.2 日均氣溫數(shù)據(jù)集實驗
北京市日均氣溫數(shù)據(jù)集是由中國氣象信息中心提供的以天為單位對北京市氣溫進行的統(tǒng)計,本文只選取從2014年6月1日至2014年7月1日的數(shù)據(jù)作為實驗數(shù)據(jù)集,如表6所示。
在該數(shù)據(jù)集上應用文獻[2],文獻[19],文獻[24],文獻[26]中的模型及本文模型進行預測,預測值及實際值如圖1所示。
各模型預測性能的對比如表7所示。由表7可以看出,本文所建IFTS模型能夠有效預測通用數(shù)據(jù)集中的數(shù)據(jù),預測效果較現(xiàn)有模型有了較大提升。

表6 2014.6.1-2014.7.1北京市日均氣溫(℃)
表7各模型對日均氣溫數(shù)據(jù)集的預測性能

指標文獻[2]模型文獻[19]模型文獻[24]模型文獻[26]模型本文模型 RMSE1.701.531.291.191.00 AFE(%)5.304.593.923.513.35

圖1 各模型對日均氣溫數(shù)據(jù)集的預測值
本文針對傳統(tǒng)模糊時間序列預測模型的不足,利用直覺模糊集理論在處理不確定數(shù)據(jù)上的優(yōu)勢,建立了一個啟發(fā)式變階直覺模糊時間序列模型。采用階數(shù)可變的高階模型建立預測規(guī)則,實時地根據(jù)序列數(shù)據(jù)的發(fā)展趨勢改變模型的階數(shù),使得每一次預測都盡可能地接近實際值,從而提升模型的整體預測精度。同時在解模糊階段,從歷史數(shù)據(jù)中得到數(shù)據(jù)發(fā)展趨勢的啟發(fā)知識,利用其擴展或縮小模型的預測范圍,使得模型的預測值不受論域的束縛,更加準確。在兩類數(shù)據(jù)集上與經(jīng)典算法的對比試驗表明模型具有較好的預測性能。但是模型依然存在幾點缺陷,需要后續(xù)繼續(xù)研究解決:(1)算法1的模型階次選擇是在一個較小的范圍內(nèi)尋優(yōu)的,如果不加范圍限制,怎樣解決算法的收斂問題?(2)如何克服模型中可能存在過擬合的問題?此外,如何建立多元變階直覺模糊時間序列,進一步提高預測性能,也將是下一步研究的重點。
[1] SONG Q and CHISSOM B S. Fuzzy time series and its models[J]., 1993, 54(1): 269-277. doi: 10.1016/0165-0114(93)90372-O.
[2] SONG Q and CHISSOM B S. Forecasting enrollments with fuzzy time series-Part I[J]., 1993, 54(1): 1-9. doi: 10.1016/0165-0114(93)90355-L.
[3] SONG Q and CHISSOM B S. Forecasting enrollments with fuzzy time seriesPart II[J]., 1994, 62(1): 1-8. doi: 10.1016/0165-0114(94)90067-1.
[4] EFENDI R, ISMAIL Z, and DERIS M M. A new linguistic out-sample approach of fuzzy time series for daily forecasting of Malaysian electricity load demand[J]., 2015, 28(3): 422-430. doi: 10.1016/j.asoc.2014.11.043.
[5] SUN Baiqing, GUO Haifeng, KARIMI H R,. Prediction of stock index futures prices based on fuzzy sets and multivariate fuzzy time series[J]., 2015, 151(3): 1528-1536. doi: 10.1016/j.neucom.2014.09.018.
[6] TSAUR R C and KUO T C. Tourism demand forecasting using a novel high-precision fuzzy time series model[J].,, 2014, 10(2): 695-701.
[7] HUANG K and YU T H-K. Ratio-based lengths of intervals to improve fuzzy time series forecasting[J].,,:, 2006, 36(2): 328-340.doi: 10.1109/TSMCB.2005.857093.
[8] CAI Qisen, ZHANG Defu, ZHENG Wei,. A new fuzzy time series forecasting model combined with ant colony optimization and auto-regression[J]., 2015, 74(1): 61-68. doi: 10.1016/j.knosys.2014.11.003.
[9] IZAKIAN H, PEDRYCZ W, and JAMAL I. Fuzzy clustering of time series data using dynamic time warping distance[J]., 2015, 39(3): 235-244. doi: 10.1016/j.engappai.2014.12.015.
[10] LU Wei, CHEN Xueyan, PEDRYCZ W,. Using interval information granules to improve forecasting in fuzzy time series[J]., 2015, 57(2): 1-18. doi: 10.1016/j.ijar.2014.11.002.
[11] ABDOLLAHZADE M, MIRANIAN A, HASSANI H,. A new hybrid enhanced local linear neuro-fuzzy model basedon the optimized singular spectrum analysis and its applicationfor nonlinear and chaotic time series forecasting[J]., 2015, 295(2): 107-125. doi: 10.1016/ j.ins.2014.09.002.
[12] CHENG S H, CHEN S M, and JIAN W S. Fuzzy time series forecasting based on fuzzy logical relationships and similarity measures[J]., 2016, 327(1): 272-287. doi: 10.1016/j.ins.2015.08.024.
[13] PENG Hungwen, WU Shenfu, WEI Chiaching,. Time series forecasting with a neuro-fuzzy modeling scheme[J].,2015, 32(7): 481-493. doi: 10.1016/ j.asoc.2015.03.059.
[14] CHEN M Y and CHEN B T. Online fuzzy time series analysis based on entropy discretization and a fast Fourier transform[J]., 2014, 14(1): 156-166. doi: 10.1016/j.asoc.2013.07.024.
[15] DENG W, WANG G, and ZHANG X. A novel hybrid water quality time series prediction method based on cloud model and fuzzy forecasting[J]., 2015, 149(12): 39-49. doi: 10.1016/ j.chemolab.2015.09.017.
[16] PEREIRA C M, ALMEIDA N N, and VELLOSO M. Fuzzy modeling to forecast an electric load time series[J]., 2015, 55: 395-404. doi: 10.1016/j.procs. 2015.07.089.
[17] SINGH P and BORAH B. Forecasting stock index price based on M-factors fuzzy time series and particle swarm optimization[J]., 2014, 55(3): 812-833. doi: 10.1016/j.ijar.2013. 09.014.
[18] CHEN S M and CHEN S W. Fuzzy forecasting based on two-factor second-order fuzzy-trend logical relationship groups and the probabilities of trends of fuzzy logical relationships[J]., 2015, 45(3): 405-417.doi: 10.1109/TCYB.2014.2326888.
[19] HWANG J R, CHEN S M, and LEE C H. Handling forecasting problems using fuzzy time series[J]., 1998, 100(1): 217-228. doi: 10.1016/S0165-0114(97)00121-8.
[20] LIU Haotien and WEI Maolen. An improved fuzzy forecasting method for seasonal time series[J]., 2010, 37(9): 6310-6318. doi: 10.1016/ j.eswa.2010.02.090.
[21] SINGH P and BORACH B. High-order fuzzy-neuro expert system for time series forecasting[J]., 2013, 46(7): 12-21. doi: 10.1016/j.knosys.2013. 01.030.
[22] ASKARI S and MONTAZERIN N. A high-order multi-variable fuzzy time series forecasting algorithm based on fuzzy clustering[J]., 2015, 42(4): 2121-2135. doi: 10.1016/j.eswa.2014.09.036.
[23] CASTILLO O, ALANIS A, GARCIA M,. An intuitionistic fuzzy system for time series analysis in plant monitoring and diagnosis[J]., 2007, 7(4): 1227-1233. doi: 10.1016/j.asoc.2006.01.010.
[24] JOSHI B P and KUMAR S. Intuitionistic fuzzy sets based method for fuzzy time series forecasting[J]., 2012, 43(1): 34-47.doi: 10.1080/01969722.2012.637014.
[25] 鄭寇全, 雷英杰, 王睿, 等. 直覺模糊時間序列建模及應用[J]. 控制與決策, 2013, 28(10): 1525-1530.
ZHENG Kouquan, LEI Yingjie, WANG Rui,. Modeling and application of IFTS[J]., 2013, 28(10): 1525-1530.
[26] 鄭寇全, 雷英杰, 王睿, 等.參數(shù)自適應的長期IFTS預測算法[J]. 系統(tǒng)工程與電子技術(shù), 2014, 36(1): 99-104. doi: 10.3969/ j.issn.1001-506X.2014.01.16.
ZHENG Kouquan, LEI Yingjie, WANG Rui,. Method of long-term IFTS forecasting based on parameter adaption[J]., 2014, 36(1): 99-104. doi: 10.3969/j.issn.1001-506X.2014.01.16.
[27] 梁保松, 曹殿立. 模糊數(shù)學極其應用[M]. 北京: 科學出版社, 2007: 65-85.
LIANG Baosong and CAO Dianli. Fuzzy Mathematics and Applications[M]. Beijing: Science Press, 2007: 65-85.
[28] 雷英杰, 趙杰, 路艷麗, 等. 直覺模糊集理論及應用[M]. 北京: 科學出版社, 2014: 28-189.
LEI Yingjie, ZHAO Jie, LU Yanli,. Theories and Applications of Intuitionistic Fuzzy Set[M]. Beijing: Science Press, 2014: 28-189.
[29] WANG Yanan, LEI Yingjie, FAN Xiaoshi,. Intuitionistic fuzzy time series forecasting model based on intuitionistic fuzzy reasoning[J]., 2016(2016): 1-12. doi: 10.1155/2016/5035160.
A Heuristic Adaptive-order Intuitionistic Fuzzy Time Series Forecasting Model
WANG Yanan①LEI Yingjie①WANG Yi①ZHENG Kouquan②
①(,,’710051,)②(’,’710106,)
Considering that the existing high-order models have limitations in forecast range and accuracy, a heuristic adaptive-order intuitionistic fuzzy time series forecasting model is built with the combination of the intuitionistic fuzzy sets theory. In this model, a direct fuzzy clustering algorithm is used to partition the universe of discourse into unequal intervals. The traditional method of ascertaining the membership and non-membership functions of intuitionistic fuzzy set are also modified to fit the intuitionistic fuzzy time series data. On these basis, variable high-order forecasting rules are established and the prior knowledge of tendency is used in defuzzification to extend the forecasting range. At last, contrast experiments on the enrollments of the University of Alabama and the daily average temperature of Beijing are carried out. The results show that the new model has a clear advantage of improving the forecast accuracy.
Intuitionistic fuzzy set; Time series forecast; Heuristic; Adaptive order
TP391
A
1009-5896(2016)11-2795-08
10.11999/JEIT160013
2016-01-04;改回日期:2016-05-26;
2016-07-19
王亞男 wyn1988814@163.com
國家自然科學青年基金項目(61402517)
The National Natural Science Foundation of China (61402517)
王亞男: 女,1988年生,博士生,研究方向為網(wǎng)絡信息安全.
雷英杰: 男,1956年生,教授,博士生導師,研究方向為網(wǎng)絡信息安全、智能信息處理.
王 毅: 男,1979年生,講師,博士,研究方向為智能信息處理.
鄭寇全: 男,1983年生,講師,博士,研究方向為智能信息處理.