劉娜



摘要:現運用ARIMA模型、BP神經網絡模型以及構建的組合預測模型,對1985-2018年我國社會消費品零售總額進行分析。研究發現預測誤差平方和倒數模型預測為最優模型,預測精度高達98.65%,預測結果顯示2019-2021年我國社會消費品零售總額分別為405106.5653、426571.6308、446393.2806億元,總體呈現增長趨勢。
關鍵詞:社會消費品零售總額;ARIMA模型;BP神經網絡模型;組合預測
中圖分類號:F740? ? 文獻標識碼:A
文章編號:1005-913X(2020)05-0036-03
社會消費品零售總額是指企業或者單位,通過交易售給個人、社會集團,非生產、非經營用的實物商品金額,以及提供餐飲服務所取得的收入金額。2018年我國社會消費品零售總額380 986.9億元,相比2017年增長4.2% ,截止2019年12月,全國社會消費品零售總額同比增長8.0% 。社會消費品零售總額大小直觀地反映居民消費水平以及零售業經濟發展狀況,其精準分析與預測對于有關部門相關政策的制定以及重大事件決策具有一定的參考價值。
一、模型介紹
(一)ARIMA模型理論
ARIMA模型又稱單整自回歸移動平均模型,屬時間序列短期預測分析方法之一。時間序列分析主要是根據已有的歷史數據對未來年份進行預測。本文采用圖示法和單位根檢驗相結合檢驗;數據平穩化處理,對于非平穩并且含指數趨勢的時間序列,需先取對再進行差分處理;模型建立,確定參數跑(p,d,q)建立時間序列模型;模型檢驗,做殘差檢驗診斷殘差序列是否為白噪聲序列;模型預測,使用R中的forecast包對擬合的ARIMA(p,d,q)模型進行預測。
(二)BP神經網絡模型理論
BP神經網絡是一種多層前饋神經網絡,它是模仿人類大腦神經元的一種模型,它的運行路線是信號向前傳遞,誤差則是反向傳遞。在向前傳遞時,將數據錄入到輸入層,經過隱含層的處理,經輸出層輸出。如果輸出結果不是期望值,則進入反向傳遞過程,通過不斷地調整權值和閾值從而進一步優化輸出值,使其接近或等于期望值。BP神經網絡分為訓練和測試兩個過程,訓練過程是讓模型具有記憶和預測的能力。神經網絡流程如圖1所示,其中為X輸入值,Y為預測值,W為權值。
(三)ARIMA與BP神經網絡組合模型
單個預測模型在預測的過程中不可避免的會出現誤差,組合模型的建立能夠有效減少誤差。其基本思想就是充分利用單個預測方法所包含的獨立的信息,對單個模型的預測結果進行加權處理。
等權法:通過給需要組合的各個模型結果,給予相同的權重。等權法可以有效避免精度大權重小、精度小權重大,并且計算簡單操作方便。
預測誤差平方和倒數法:預測模型誤差平方和越小,表明該項預測模型的精度越高,它在組合模型中的重要性越高,公式如下,其中Dj為第j個模型的誤差平方和:
誤差方差均方倒數法:它是對預測誤差平方和法的改進兩者原理基本一樣其公式如下,其中Ej為第j個模型的誤差方差:
預測精度,其中Ei是相對誤差:
二、實證分析
本研究數據來自國家統計局官網公布的1985-2018年社會消費品零售總額數據。文章保留2016-2018年的數據作為檢驗模型數據,1985-2015各年數據作為樣本數據,所用軟件為Matlab 2016a和R 軟件3.6.2。
(一)建立ARIMA模型預測
1.模型建立
平穩的時間序列是建立時間序列模型的基礎,如果時間序列圖像有明顯的趨勢性或者規律性,此時序列平穩,反之則非平穩。如圖2所示為1985至2015年社會消費品零售總額時間序列圖,從圖中可知在1985-2010年有上升趨勢但是總體較為平緩。而2010年之后則以十分明顯的呈指數趨勢上升,序列不平穩。取對后的數據,消除了指數上升趨勢,但其序列仍然不平穩,對于非平穩的數據進一步做差分處理,利用R軟件中的ndiffs()函數可知需進行二階差分處理,結果如圖3所示,序列在某一常數附近上下波動,并無明顯上升或者下降趨勢,此時序列平穩可以建立模型。
圖示判斷簡單直觀,但往往帶有一定的主觀性,基于此本文采用ADF檢驗法,對時間序列平穩性進行檢驗。用R軟件做單位根檢驗,結果顯示p-value = 0.01<0.05,此時拒絕原假設即序列平穩,可以構建ARIMA模型。為確定擬合情況最好的ARIMA模型階數,通過自相關函數和偏自相關函數圖確定的模型階數 、R軟件中的auto.arima( )包自動確定ARIMA模型的階數一致,即文章最終確定模型ARIMA(0,2,0)。
2.模型檢驗、預測
為了檢驗ARIMA模型顯著性,進行Ljung-Box法做殘差檢驗,經檢驗p-value = 0.7718> 0.05,不能拒絕原假設認為模型顯著有效。對保留的2016-2018年數據進行模型驗證,模型預測結果顯示2016-2018年我國社會消費品零售總額分別為333041.30、365877.90、399543.50億元,同實際值相比,預測誤差的方差2.82%,預測精度97.18%,說明模型預測效果較為可靠,ARIMA(0,2,0)可以擬合模型。
(二)建立BP神經網絡模型進行預測
1.數據預處理
現將1985-2015年社會消費品零售總額指標作為輸入,將2019-2021年社會消費品零售總額指標作為輸出。對于原始數據進行預處理,能夠將模型擬合的精度提高,為了讓網絡快速收斂,本文所選的是S型函數,歸一化公式如下:
2.模型訓練
輸入輸出層的設計,本文采用含有一個隱含層的單輸出的BP網絡建立預測模型。目前,對于隱含層中神經元數目的確定目前并沒有明確的公式,本文在選取隱含層神經元個數時,采用學者通常采用的經驗公式:l=+a,其中n為輸入層中神經元的個數,m為輸出層中神經元的個數,a為1-10之間的常數。根據公式(1.14)可以計算出神經元個數在2-11個之間,經過大量反復試驗,本文最終選取隱含層神經元個數為4。根據社會消費品零售總額的數據特征,本文選擇輸入層為2,輸出層為1,即構建一個輸入層、隱含層、輸出層節點數為 2-4-1 的三層網絡結構。
本文選擇S型函數作為隱含層神經元的激勵函數,將用來訓練樣本的數據先進行歸一化處理,歸一化后輸入網絡,并且設定網絡參數,網絡迭代次數epochs=5000次,期望誤差goal=0.00065,學習速率lr=0.0354,設定完參數后開始訓練網絡。
3.模型預測
通過網絡訓練,得到2016-2018預測值分別為329667.20、350160.87、367478.81億元。經計算,實際值與預測值相對誤差為2.92%,預測精度為96.71%,預測誤差的方差3.29%,結果在可接受范圍內,但是比ARIMA模型預測精度低了0.47%。
(三)ARIMA模型與BP神經網絡模型預測
為了充分利用兩種模型各自的優勢,對于ARIMA模型、BP網絡模型分別提取不同數據信息,數據的線性部分由ARIMA 模型提取,非線性部分由神經網絡提取。其基本思想就是對ARIMA模型、BP神經網絡模型通過科學賦權重的方法,給定兩個模型不同的權重,通過加權計算得出最終的預測結果。常見的確定權重的方法眾多,但是符合本文數據特征的方法有:等權法、預測誤差平方和倒數法、誤差方差均方倒數法。
誤差方差均方倒數模型:根據公式(1.10),利用EXCEL計算得知,給定ARIMA、BP網絡分別0.409、0.591的權重,依據誤差方差均方倒數模型,對預測2016-2018年數據進行擬合,計算預測相對誤差計算結果如表1所示,從結果看出等權法的預測誤差的方差為1.54%,預測精度為98.46%,比ARIMA模型的預測精度高了1.28%,比BP網絡模型預測精度提高了1.75%,擬合情況較好。
等權組合預測模型:給定ARIMA和BP神經網絡分別相同的權重得到組合模型,再根據組合模型對2016-2018年數據進行預測,計算預測相對誤差如表2所示,從結果看出等權法的預測誤差的方差為1.36%,通過公式計算預測精度為98.64%,相比于誤差方差均方倒數模型預測精度提高了0.18%,擬合情況更優。
預測誤差平方和倒數模型:根據公式(1.9)借助EXCEL計算得知, ARIMA和BP神經網絡權重分別為0.578、0.422,利用得到的組合模型預測結果如表3所示,從結果看出預測誤差平方和倒數法的預測誤差的方差為1.35%比其他模型都小,預測精度提高到98.65%。
對模型進行組合時權重計算方式的不同會導致其組合模型精度也不同,所以在對單一模型進行組合時要結合數據本身的特征且從不同方面考慮其得到最優模型。根據對比幾種預測模型的預測精度以及預測誤差方差的大小,得到本文最優的組合模型為預測誤差平方和倒數模型,幾種模型具體對比結果如下表。
[表4 幾種模型分析結果][模型 預測精度 預測誤差的方差 ARIMA模型 97.18% 2.82% BP神經網絡模型 96.71% 3.29% 誤差方差均方倒數模型 98.46% 1.54% 等權組合預測模型 98.64% 1.36% 預測誤差平方和倒數模型 98.65% 1.35% ]
3.基于組合模型預測
文章借助最優擬合模型預測誤差平方和倒數模型,對2019-2021年我國社會消費品零售總額進行預測,2019-2021年社會消費品零售總額分別為405106.5653、426571.6308、446393.2806億元,我國社會消費品零售總額在不斷增長。
三、結論
本文運用預測誤差平方和倒數模型進行預測,預測誤差較小、精度較高、擬合情況較好,預測結果顯示,2019-2021年我國社會消費品零售總額有增長趨勢,鑒于文章是根據歷史數據做預測,對于外生不可抗因素的干擾無法應對。
參考文獻:
[1] 李庭輝,許滌龍.基于匹配性的社會消費品零售總額數據質量評估研究[J].統計與決策,2012(8):24-27.
[2] 呂艷麗,陳兵建.基于ARMA模型的城鄉居民收入差距分析與預測——以甘肅為例[J].區域經濟,2017(2):204-206.
[3] 肖學培.季節性ARIMA模型對社會消費品零售總額的建模和預報[J].經濟研究,2019(4):63-65.
[4] 王冬冬.基于ARIMA和BP神經網絡模型的重慶市GDP實證分析[D].桂林:廣西師范大學,2019.
[5] 劉海萍,王海濤,王洪利,等.基于BP神經網絡的CPI預測模型[J].山東交通學院學報,2009,17(3):83-86.
[6] 崔 博.神經網絡在GDP預測中的應用[J].信息技術,2011(2):103-105.
[7] 桂 梅,劉蓮花.基于ARIMA模型對海南省社會消費品零售總額的預測[J].2017,2(3).
[責任編輯:龐 林]