[摘 要]針對目前銷售量預測不能很好地滿足商場管理需求的現狀,分析銷售量數據內在混沌特性,主要包括時間延遲、嵌入維數、關聯維數及Lyapunov指數的計算,并將此分析耦合人工神經網絡模型進行預測,最后給出某商場銷售量預測的實例,結果顯示基于混沌時間序列分析的神經網絡銷售量預測在數據動力特征刻畫及誤差控制上有顯著優勢。
[關鍵詞]混沌;神經網絡;銷售量;預測
實時、準確的銷售量預測是實現商場利潤最大化的前提和基礎,目前應用廣泛的人工神經網絡具有非線性描述、自學習與自適應、擅長處理多變量系統,以及具有一定的容錯性等特點,通過實測數據仿真實驗顯示神經網絡可獲得較好的數據預測效果。但BP網絡有很多固有缺陷,比如結構難確定、初始權值選擇的盲目性導致訓練速度慢等。針對上述缺陷,本文結合銷售量數據的混沌特征分析,并基于此計算關聯維數,以及Lyapunov指數判別出銷售量時間序列具有混沌現象,進一步計算重構相空間的時間延遲、嵌入維數,并將它們作為預測因子,以及設定已知的銷售量為被預測量,決定商場的進貨和銷售,進而決定神經網絡的結構。通過實際銷售量算例,基于混沌網絡銷售量時間序列的神經網絡預測精度高于一般的神經網絡預測方法,能更好地滿足智能商場管理的需求。
一、銷售量時間序列的混沌判別
商場管理系統是否存在混沌,作為商場管理系統中銷售量的觀測值,銷售量時間序列是否為混沌時間序列是研究混沌首先需要解決的問題。
Lyapunov指數用于量度在相空間中初始條件不同的兩條相鄰軌跡隨時間按指數律吸引或分離的程度,這種軌跡收斂或發散的比率稱Lyapunov指數。對于系統,
其Lyapunov指數λ為
(1)
Lyapunov指數實際上就是系統在各次迭代點處導數絕對值的對數平均,在混沌的診斷中λ起著非常重要的作用:若λ<0,系統收斂于不動點;若λ>0且有限,系統既不會穩定在不動點,也不存在穩定的周期解,同時也不會發散,表明系統進入混沌。按照A.Wolf等在文獻中提出的計算由觀測獲得的混沌時間序列的最大Lyapunov指數的一種方法。但是為了求得一個好的最大Lyapunov指數的估計值,必須要求觀測時間序列具有足夠的長度,而作為判斷存在混沌的鑒別方法,最大Lyapunov指數方法是適用的。
二、重構相空間
混沌時間序列重構相空間的工作始于Packard等人,Packard等人建議用原始系統中的某變量的延遲坐標重構相空間。坐標延遲相空間重構技術有2個關鍵的地方,即嵌入維數m和時間延遲τ的確定。關于時間延遲τ和嵌入維數m的選取,主要有兩種觀點:一種認為兩者是互不相關的,即τ和m的選取是獨立進行的,包括序列相關法、相空間擴展法、復自相關法和去偏復自相關法;另一種方法認為兩者是相關的,即τ和m的選取是互相依賴的。如時間窗口法、C-C方法可同時計算時間延遲和時間窗口。
1. C-C方法求延遲。常用的方法是自相關函數法和互信息法,盡管前者計算簡便但是不適合非線性問題,后者雖然能有效地估計非線性問題重構相空間的延遲,但是計算不方便,因此,針對上述判別為非線性的網絡流量時間序列,應該采取能有效減少計算量的C-C算法。理論證明該方法得出的延遲τ相比其他方法能更好地估計維數。
則嵌入時間序列的關聯積分定義為
r>0 (2)
式中m是嵌入維數;M=N-(m-1)τ;Yi為相空間中的相點;r為給定的距離;H為heaviside函數。對于一般的時間序列t將其分成若干個不相交的子序列,然后定義每一個子序列的s(m,N,r,t)為:
m=2,3,… (3)
令,且選擇對應值最大和最小兩個半徑r,定義差量為
m=2,3,… (4)
根據BDS的統計結論計算
(5)
依據上述計算結果作圖,其中的第一個極小值時間為該時間序列的延遲。
2. Cao方法求嵌入維數。該方法是改進的虛假零點法,對于
,n=N0,N0+1,…,N定義
記所有的a(n,m)關于n的均值為
E(m)只依賴于嵌入維數m和延遲時間間隔τ,為了研究嵌入維數從m變為m+1時相空間的變化情況,定義E1(m):
如果當m大于某個m0時,El(m)停止變化,則m0就是重構相空間的最小嵌入維數。
三、神經網絡法預測銷售量時間序列
神經網絡是由并行的、高度相關的計算處理單元——神經元按照某種方式聯結而成的自適應的非線性系統。雖然單個神經元的結構十分簡單,但由大量神經元相互連接構成的神經元系統所能實現的行為是十分豐富的。因此,神經網絡具有強大的非線性映射能力,鑒于神經網絡的并行處理及強大的非線性映射能力,即它可以把許多非線性信號的處理方法及工具集成起來,對于未知的動力系統,可以通過它來學習混沌時間序列,然后進行預測。
四、預測實例
預測實例所采用的銷售量數據來自某商場1985年至2006年的銷售數據,以旬為時間單位共792個數據,下面用基于混沌時間序列的預測方法來對其進行預測分析:
1.判別混沌的存在。經過Matlab編程計算研究的銷售量時間序列最大Lyapunov指數A=O.0738>O,同時通過G-P算法計算出關聯維數為4>2;因此,判別該時間序列為混沌時間序列,以銷售量為狀態量的商場管理系統存在混沌。
2.重構相空間。在應用中,Brock等人所做的關于幾種重要的漸進分布的數學統計結果表明:當2≤m≤5,σ/2≤r≤2σ,N≥500時,漸進分布可以通過有限時間序列很好地近似,并且S(m,N,r,1)能代表序列的相關性,這里σ指時間序列的均方差或標準差。因此,在編程中令2≤m≤8,N=22×12×3=792>500,計算時間延遲:通過分析當t=4可取到△s(t)的第一個極小值,加大t的取值范圍至[1,10],發現t=4時函數值近似為Scor(t)的最小值,因此,取t=4,延遲r=4×采樣間隔=4×10=40(天)。
1986年,Broomhead和King在實際計算中首先提出了先選定(m-1) r值,在增加m的同時減少r的值,使乘積為常數來選取最佳的m和r的方法。經過Matlab編程計算在延遲選取40天時,相應嵌入維數優應取6,因為此時El(m)停止變化。
3.混沌理論與神經網絡耦合預測。首先建立網絡,根據上述計算得出的嵌入維數m(本文中為6)作為網絡輸入個數,并設定N為包含訓練樣本和測試樣本的總個數,n為預測的數據個數,本文預測的銷售量個數為最后的12個;然后將個數值序列順序輸入數據學習過程;最后將末尾的12個數值輸入神經網絡中,此時的輸出就是該序列的預測值。為了評估預測值的精度,可以假設末尾n個銷售量缺失,用序列中作為訓練樣本來預測,再將預測值與真實值對比可以計算絕對誤差、相對誤差等作為評價預測精度的指標,見下表:
由表可以看出,預測的最大誤差為0.96%,這一誤差完全能夠滿足商場管理需要,說明基于混沌理論和神經網絡對銷售量進行預測是可行的。
五、結論與展望
本文依托混沌理論研究銷售量關于時間的演變行為,并與啟發式的神經網絡預測相耦合,統計指標顯示了初步優化的效果;而進一步的研究將圍繞商場管理系統內多變量的時間序列分析方法展開討論,并應該深入探討包括神經網絡方法在內的多種預測方法與混沌動力系統分析耦合的可行性和適用性,以期得到更精確的預測效果。
參考文獻:
[1]張立明.人工神經網絡的模型及其應用[M].上海:復旦大學出版社,1993.
[2]王海燕,盧山.非線性時間序列分析及其應用[M].北京:科學出版社,2006.
[3]Wolf,A.,Swift,J.B.,13.,Swinney,H.L. et a1.Determining Lyapunov exponents from a time series[J].Physical D,1985,16:285-317.
[4]Packard,N.H.,Crutchfield,J.P.,Farmer,J.D.et a1.Geometry from a Time Series[J].Phys. Rev.Letter,1980,43(9):712-715.
[5]呂金虎,陸君安,陳士華.混沌時間序列分析及其應用[M].武漢:武漢大學出版社,2002.
[6]丁士圻,郭麗華.人工神經網絡基礎(研究生用教材)[M].哈爾濱:哈爾濱工程大學出版社,2008