黃晟
(西安財經大學,陜西 西安 710100)
傳統模糊時間序列模型的不足在于只考慮隸屬度最大的模糊子集,而忽略其他隸屬度所對應的模糊子集,從而導致數據的信息丟失,使得最終的預測結果缺乏可靠性和準確性。在本節中,我們提出一種基于高階和廣義模糊關系的新模型GTS(M,N)。GTS(M,N)是指第N主模糊邏輯關系的M階模糊時間序列模型。
廣義(多元高階)模糊時間序列預測模型的建模步驟如下:
步驟1 定義論域和提取時間間隔的規則。論域可以定義為U=[開始,結束]。例如,U={u1,u2,…,un},mi是ui的中點,其對應的模糊集為Ai=(i=1,2,…,n)。
步驟2 定義模糊集,模糊化歷史數據。模糊集Ai可表示為Ai=(ai1,ai2,…,ain),其中aij∈[0,1],uj表示Ai中的隸屬度。如果aij={ai1,ai2,…,ain},則時間t的數據應該分為第j類。在本文中,定義模糊集如公式(1)所示。
(1)
公式(1)定義了在Ai=(i=1,2,…,n)中的時間i的值xi的隸屬度。

(2)
其中xi是在時間i的觀測值,lin是間隔長度。
步驟3 本文選擇了LEE提出的方法創建模糊邏輯關系。例如,模型的模糊邏輯關系GTS(M,N)可以分為M×N階關系矩陣,表示為R(k,l)(k=1,2,…,M,l=1,2,…,N)。

那么,對于給定的M,時間t的預測值可以通過以下公式獲得:
(3)
其中,第k次預測的調整參數ωk(k=1,2,…,M)也可以通過最小化訓練數據集的均方根誤差或其他評估標準來獲得。至此,建立了一種廣義(多元高階)模糊時間序列預測模型。
本模型以合肥市1995年到2016年的氣溫數據作為訓練集,選取三月的平均氣溫用于預測作為測試集。實驗選取三月氣溫數據利于體現建模過程。用于預測時間序列數據的方法的步進過程,其中M=3和N=2。

表1 平均氣溫模糊集的隸屬度

續表
步驟1 將論域分為七個區間,分別為u1,u2,u3,u4,u5,u6,u7,其中u1=[15,16],u2=[16,17],u3=[17,18],u4=[18,19],u5=[19,20],u6=[20,21],u7=[21,22];它們的中點分別為15.5,16.5,17.5,18.5,19.5,20.5和21.5。
步驟2 令A1=(不是很熱),A2=(不是特別熱),A3=(一般),A4=(熱),A5=(非常熱),A6=(特別熱),A7=(很熱)對應于“氣溫”的語言值的模糊集合。通過公式(2)定義的三角隸屬函數,給出由公式(1)定義的模糊集和所有觀測值。
步驟3 基于模糊邏輯關系將推導得到的模糊關系劃分成組。在本文中,我們使用Lee的方法來構造模糊邏輯關系矩陣。例如,令k=1和l=1。模糊邏輯關系集合被列為
A1→A1,A1→A1,A1→A2,A2→A3,A3→A3,A3→A3,A3→A3,A3→A4,
A4→A4,A4→A4,A4→A3,A3→A3,A3→A3,A3→A3,A3→A3,A3→A4,
A4→A6,A6→A6,A6→A7,A7→A7,A7→A6
并且它們將被分組并且由復現的模糊關系加權如下:
第1組:A1→A1,權重為2,A1→A2,權重為1;
第2組:A2→A3,權重為1;
第3組:A3→A3,權重為7,A3→A4,權重為2;
第4組:A4→A4,權重為2,A4→A3,權重為1,A4→A6,權重為1;
第5組:A6→A6,權重為1,A6→A7,權重為1;
第6組:A7→A7,權重為7,A7→A6,權重為1。
步驟4 通過計算提出的方法,我們說明了2001年平均氣溫的預測過程如下:1999年平均氣溫的模糊集是(0.02,0.52,0.98,0.48,0,0,0)。兩個最大的隸屬度是第三個和第二個。




表2 本模型與Chen的模型的RMSE比較
在表2中,本文比較了所提出方法和Chen[6,15]的模型的RMSE預測值與真實值。可以看出,本文所提出模型的RMSE小于2011年的Chen[6,15]的模型。圖1顯示了合肥市平均氣溫對應的三個三角隸屬函數。

圖1 2000年合肥平均氣溫預測的隸屬函數
可見,在隸屬函數中,當M增加越明顯獲得的預測精度差異越大。還有另一個結論,第三隸屬函數的預測并不總是優于第一函數的預測。階數和主模糊邏輯關系略微影響預測結果。階數越高,預測結果越好,模糊邏輯關系層次越多,預測誤差越小,但不會無限遞減。圖2和圖3為2000年溫度的實際值和預測值的一些示例。

圖2 相同長度時間隔的2000年溫度真實值和預測值的比較
由圖2可知在相同的時間間隔即L=300中GTS(3,1)具有比GTS(1,1)更好的性能。

圖3 不同長度間隔的2000年溫度真實值和預測值的比較
圖3說明當區間長度較小時,GTS(1,1)得到更好的預測。
本研究使用1979年到2004年的黃山游客數量數據作為訓練集,選取游客總量用于預測。廣義高階模糊時間序列在黃山風景區游客流量的應用步驟與上述氣溫預測類似,重點研究了不同階數、不同長度間隔對模型預測的結果,在此便不做詳細闡述了。模型建立的步驟如下:
步驟1 將論域劃分。
步驟2 定義模糊集。
步驟3 將模糊邏輯關系劃分成組。
步驟4 計算預測。
模型的預測結果和分析如下:
本節將在圖4和圖5中進一步描述一些性質,圖4和圖5描繪了1994年以后十年的平均預測誤差,圖4顯示了RMSE和不同階數間隔長度之間的關系。

圖4 RMSE和不同階數間隔長度之間的關系
從圖4中可以看出,間隔長度越長,RMSE越大,高階模型優于低階模型。

圖5 RMSE和具有不同長度間隔的階數之間的關系
從圖5中可以看出,即間隔的長度越短導致穩定的預測。圖5顯示了RMSE和具有不同長度間隔的階數之間的關系。
通過使用合肥市的氣溫和黃山風景區的游客流量作為評估模型的數據集,得出以下結論:該模型的預測結果比Chen先前提出的常規模糊時間序列預測模型的精確性要高。階數和主模糊關系略微影響預測結果。階數越高,預測結果越好,模糊邏輯關系層次越多,預測結果越精確。