李嘉諾, 程毛林
(蘇州科技大學 數學科學學院,江蘇 蘇州 215009)
如今隨著時代和科學技術的發展,信息化時代如約而至,信息的變化也是日新月異。 通過對現有的信息數據進行分析模擬可以有效的對未來的發展趨勢做出推測和預估。 目前研究者使用到的統計預測模型有很多,比如多元線性回歸、時間序列預測等。 在1982 年3 月,我國學者鄧聚龍教授在國際上首先提出了灰色系統理論,該系統理論不需要大量的樣本,樣本也不需要規律性分布,預測準確度高。 由于其顯著的優點,從此至今,灰色系統理論被廣泛應用于經濟預測、能源預測、環境評估等多個方面。
灰色GM(1,1)模型作為灰色系統理論的最重要的模型之一,受到無數人的推崇。 近年來,有越來越多的專家學者對GM(1,1)模型進行研究和優化改進。 其中,徐進軍等人提出了一種新的基于一次累加序列約束和基于原始序列約束條件下積分參數的確定方法[1];徐華鋒等人將灰色作用量b 改進為動態的b1+b2k 從而優化了GM(1,1)模型[2];何文章等人運用線性規劃來代替最小二乘法對模型參數進行了求解[3];劉斌等人利用最小二乘法確定白化權函數的時間響應函數中的常數C,來構建GM(1,1)的時間響應函數的最優模型[4];羅黨等人通過用指數數列對x(1)的鄰值生成數z(1)k 進行替換來達到對GM(1,1)模型的優化,并且使模型在短期、中期及長期預測中擴大了適用范圍[5];彭正明等人用積分優化、二次擬合優化等優化方法分步對GM(1,1)模型進行了改進[6];盧懿等人通過加入調節因子λ 來優化背景值的公式[7];楊華龍等人使用自動尋優定權對背景值進行選擇,并且基于最小二乘法原理對GM(1,1)模型的初始值進行改進[8];許秀莉等人用序列算子和影響因子對原始序列的數據進行一定的處理,提高了GM(1,1)模型的精度[9];原玉昌等人對背景值重構和用等維遞補原理對GM(1,1)模型進行改進,建立了等維遞補模型[10];豆紅磊等人用Lagrange 插值法對原始序列進行修正,然后用修正后的數據建立GM(1,1)模型,改善了誤差和遺漏數據導致預測精度低、殘差大等問題[11];邱利軍等人通過對原始數據進行函數ln(x(0)(i)+c)變換使建模數據序列光滑度提高,進而提高所建模型的預測精度[12];張振超等人通過引入線性時間項的灰色作用量和廣義加權構造最優背景值相結合的方法,構建了優化背景值的GM(1,1)模型從而減少了預測的偏差[13];袁磊等人利用殘差尾段對模型進行修正,建立了精度更高的模型[14];史國軍、程毛林通過構建一個新的GM(1,1)拓展模型GM(1,1,dt)對GDP數據進行模擬和預測,結果與傳統模型相比精度大大提高[15];程毛林通過直接對時間響應函數優化并通過三和法和三點法優化函數初始值的方法大大提高了模型的精度[16];程媛媛、周漢磊等人通過建立灰色預測模型對蘇州市的ESV 進行有效的預測并且從中得到有效的結論[17]。
筆者通過借鑒其他專家學者的思想方法,通過對GM(1,1)模型的白化方程進行拓展,旨在能夠更加貼合原始數據的非線性變化趨勢,能夠更好地提高預測精度。
傳統的灰色GM(1,1)模型基本形式為

x(0)=(x(0)(1),x(0)(2),…,x(0)(n))為原始時間序列,對其進行累和則得到x(0)的AGO 生成數列x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),x(1)的鄰值生成數為z(1)(k)。
對應的灰色GM(1,1)模型的白化方程為

其中a 和b 分別是發展系數和灰作用量。
用求微分方程的方法可求得傳統的灰色GM(1,1)模型的時間相應方程為

對其進行累減得到原始數據的預測值為

通過對傳統模型的學習發現原始數列為指數變化且模擬和預測的精度和數據的增長速率有關。 為了緩和數據增長速率過快導致的精度變化,文中對傳統灰色模型進行拓展,以此解決這類問題。設拓展的GM(1,1)灰色模型基本形式為

稱其為拓展模型2。
拓展的灰色模型的白化方程為



第三產業增加值能夠直觀的反應科技、信息、金融三大行業的發展水平,因此,預測并分析第三產業增加值對我國快速發展有著重要的意義。 文中選取了2000 到2019 年這20 年間中國第三產業增加值的數據(所有數據都來自于國家統計局的《中國統計年鑒》)為基礎來進行實例說明。 以2000 年到2016 年這17 年間的數據進行擬合,以2017 年到2019 年這3 年的數據進行預測。 中國第三產業增加值的實際值記為x(0)(t)(單位:億元),有關資料見表1。
若建立傳統灰色模型GM(1,1),計算得

由a,b 傳統模型的時間響應方程得

由x^(0)(t)=x^(1)(t)-x^(1)(t-1)計算出原始序列的模擬值和預測值,見表1。 各期相對誤差和平均相對誤差見表1。
若建立拓展模型1,計算得

由x^(0)(t)=x^(1)(t)-x^(1)(t-1)計算出原始序列的模擬值和預測值,見表1。 各期相對誤差和平均相對誤差見表1。

表1 中國第三產業增加值數據以及有關計算結果

若建立拓展模型2,計算得代入拓展模型的時間響應方程得

由x^(0)(t)=x^(1)(t)-x^(1)(t-1)計算出原始序列的模擬值和預測值,見表2。 各期相對誤差和平均相對誤差見表2。

表2 拓展模型2 有關計算結果
為了更好的比較各模型誤差,對各模型的擬合誤差、預測誤差、平均誤差作直方圖,如圖1 所示。

圖1 三種模型的誤差對比直方圖
從圖1 可以看出,文中給出的2 種拓展模型的平均模擬相對誤差、平均預測相對誤差和平均相對誤差相比于傳統模型來說明顯減小,精度明顯提高,表明文中給出的建模方法有很高的可靠性和有效性,可以適用于第三產業增加值的相對預測。 相比較而言拓展模型2 的精度最高。
筆者對GM(1,1)模型做了簡單的介紹,通過傳統的GM(1,1)模型引申出其拓展模型GM(1,1,beck)。 同時文中給出等權和不等權拓展模型的白化方程、灰微分方程、時間響應方程的公式并且給出估算參數的方法。通過對2000 到2019 年的中國第三產業增加值數據進行模擬和預測,由數據顯示發現等權的拓展模型和不等權的拓展模型相比于傳統的GM(1,1)模型來說,在對第三產業增加值這個數據的模擬和預測方面的精度都有很大的提高,再對兩者進行比較發現,不等權的GM(1,1,beck)模型的精度最高。 通過用不等權的GM(1,1,beck)模型對2020、2021 年中國第三產業增加值進行預測得到670 599.42 億元和856 876.06 億元這兩組數據。 盡管文中涉及的不等權的GM(1,1,beck)模型預測精度比傳統GM(1,1)模型高,但仍然存在著一些問題,比如此拓展模型不一定適應所有的數據,再者文中的誤差還有提高的可能,可以通過優化背景值的方法來進一步降低預測的誤差,這也是未來的一個研究方向。