張思琪



摘 要:【目的】在交通強國建設(shè)背景下,交通發(fā)展由依靠傳統(tǒng)要素驅(qū)動向注重創(chuàng)新驅(qū)動轉(zhuǎn)變,前瞻規(guī)劃、科學(xué)預(yù)測成為國家交通建設(shè)的前提和基礎(chǔ)?!痉椒ā恳?006—2020年國家統(tǒng)計局發(fā)布的公路里程為基礎(chǔ)數(shù)據(jù),運用指數(shù)法、對數(shù)法、多項式法、冪函數(shù)法建立預(yù)測模型?!窘Y(jié)果】經(jīng)過對比與檢驗,結(jié)果表明,6次多項式擬合預(yù)測模型最優(yōu),通過增加新增年度數(shù)據(jù)可對其進行優(yōu)化?!窘Y(jié)論】添加年度新增數(shù)據(jù)的6次多項式預(yù)測模型可以為國家公路建設(shè)規(guī)劃提供參考。
關(guān)鍵詞:公路里程;多項式;預(yù)測;模型
中圖分類號:U412.1? ? ?文獻標志碼:A? ? ?文章編號:1003-5168(2024)04-0071-04
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.04.013
Establishment and Research of National Highway Mileage Prediction Model
ZHANG Siqi
(Chang'an Dublin International College of Transportation at Chang'an University, Xi'an 710086, China)
Abstract: [Purposes] Under the background of building a powerful transportation country, the transportation development has changed from relying on traditional factors to focusing on innovation. Forward-looking planning and scientific forecasting have become the premise and foundation of national transportation construction. [Methods] Based on the data of highway mileage published by the National Bureau of Statistics from 2006 to 2020,the prediction models are established by index method, linear method, logarithmic method, polynomial method and power function method. [Findings] After comparison and testing, the results show that the 6-degree polynomial fitting prediction model is the best, and it is optimized by adding new annual data.[Conclusions] The 6-degree polynomial prediction model with added annual new data can providereferencefor national highway construction planning.
Keywords: highway mileage; polynomial; forecast; model
0 引言
2019年9月19日,中共中央、國務(wù)院印發(fā)了《交通強國建設(shè)綱要》,對我國新時期交通建設(shè)與發(fā)展提出了兩個階段的發(fā)展目標,并指明了方向。在這一背景下,我國交通建設(shè)由追求速度規(guī)模向注重質(zhì)量效益轉(zhuǎn)變,由各種交通方式相對獨立發(fā)展向更加注重一體化融合發(fā)展轉(zhuǎn)變[1]。公路交通具有快捷、方便、地域適應(yīng)性強等顯著特點,在物資短途運輸、民眾生產(chǎn)生活、帶動與刺激經(jīng)濟發(fā)展等領(lǐng)域發(fā)揮著重要作用。但現(xiàn)實中也存在規(guī)劃建設(shè)中路線重復(fù)、過度占用浪費土地資源等現(xiàn)象。構(gòu)建安全、便捷、高效、綠色、經(jīng)濟的現(xiàn)代化綜合交通體系,科學(xué)規(guī)劃和預(yù)測是其重要前提,公路建設(shè)的規(guī)劃和預(yù)測也是其重要組成部分。本研究利用已有數(shù)據(jù)建立預(yù)測模型,對國家未來公路建設(shè)里程進行科學(xué)預(yù)測,以期為國家公路建設(shè)規(guī)劃提供參考。
1 概念界定與國家公路里程2006—2020年統(tǒng)計數(shù)據(jù)
國家統(tǒng)計局網(wǎng)站對公路里程的解釋為:報告期末公路的實際長度,統(tǒng)計范圍包括城際、城鄉(xiāng)間、鄉(xiāng)(村)間能行駛汽車的公共道路,公路通過城鎮(zhèn)街道的里程,公路橋梁長度,隧道長度,渡口寬度。公路里程不包括城市街道里程、斷頭路里程、農(nóng)(林)業(yè)生產(chǎn)用道路里程、工(礦)企業(yè)等內(nèi)部道路里程。統(tǒng)計原則是按已竣工驗收或交付使用的實際里程計算,兩條或多條公路共同經(jīng)由同一路段的重復(fù)里程,只計算一次[2]。根據(jù)國家統(tǒng)計局網(wǎng)站公布的數(shù)據(jù)顯示,2006—2020年國家公路里程統(tǒng)計數(shù)據(jù)見表1。
2 預(yù)測模型建立與篩選
公路里程的預(yù)測與確定是公路網(wǎng)規(guī)劃的重要內(nèi)容。本研究以國家統(tǒng)計局發(fā)布的2006—2015年公路里程為基礎(chǔ)數(shù)據(jù),運用指數(shù)法、對數(shù)法、多項式法、冪函數(shù)法等4種方法進行對比研究,以獲得國家公路里程較為準確的預(yù)測模型[3],其對應(yīng)的預(yù)測公式及R?值見表2。
統(tǒng)計學(xué)中對變量進行回歸分析,在采用最小二乘法進行參數(shù)估計時,R?為回歸平方和與總離差平方和的比值,表示總離差平方和中可以由回歸平方和解釋的比例,這一比例越大,所建立的模型就越精確,回歸效果越顯著。R?介于0~1之間,越接近于1,擬合效果越好,一般認為超過0.8的模型,其擬合度較好[4]。由表2可知,4種預(yù)測模型的R?均大于0.9,上述方法所建立的模型均符合理論要求。但不難看出,4種預(yù)測模型仍有優(yōu)劣之分。其中多項式模型最優(yōu),其R?為0.999 6,指數(shù)模型、冪函數(shù)模型次之,對數(shù)模型最差。為了更好地建立國家公路里程的預(yù)測模型,選取多項式模型作為研究方法,并采用進一步的數(shù)據(jù)處理方案,以獲得更高精度的模型。
3 國家公路里程預(yù)測模型的建立
3.1 多項式擬合基本原理
曲線擬合是根據(jù)一組已有數(shù)據(jù)擬合出一條曲線或者函數(shù)的過程,是求近似函數(shù)的一種數(shù)值方法,該方法不要求近似函數(shù)在每個節(jié)點處與函數(shù)值相同,只要求盡可能地反映給定數(shù)據(jù)點的基本趨勢和某種意義上的無限逼近。通過曲線擬合方式擬合出的函數(shù)曲線,可以將沒有出現(xiàn)的點代入函數(shù)中獲得該點對應(yīng)的值,也可以反映該數(shù)據(jù)集數(shù)據(jù)的趨勢或者數(shù)據(jù)之間的關(guān)系。
最常用的曲線擬合方法是最小二乘法,即通過求取最小的誤差平方和獲得某一函數(shù),使之求得的數(shù)值與原始值的誤差平方和最小。給定序列觀測值{(xi,yi), x=0,1,2,…,n},在這些觀測值的基礎(chǔ)上,通過最小二乘原理,求得變量x和y之間的關(guān)系f(x,A),使函數(shù)f符合數(shù)據(jù)集合的特性。其中f(x,A)是擬合函數(shù),A=(a0,a1,…,an)是將要獲得的擬合函數(shù)的最佳參數(shù)。最小二乘法的原理是在無限多組A=(a0,a1,…,an)參數(shù)組中,利用誤差平方和衡量原始觀測值與擬合函數(shù)求出擬合值之間的差值,該差值反映了該擬合函數(shù)和理想函數(shù)的差值。找出一組參數(shù)組A,根據(jù)擬合函數(shù)求出y值,使其與真實y值的誤差平方和最小。對所有候選函數(shù)均計算差值,取其中差值最小的函數(shù)為最終擬合函數(shù)[5]。其計算公式見式(1)。
[i=0mωxi][f'(xi)-yi2=]
[mini=0mωxif(xi)-yi2] (1)
函數(shù)[f'](xi)是期望求得的擬合函數(shù),在數(shù)據(jù)集中,每一個觀測x值都對應(yīng)一個觀測y值,而根據(jù)函數(shù)[f'](xi),可以求得每一個x值對應(yīng)函數(shù)的y值y′。
擬合函數(shù)公式有的是一次方程,有的是多次方程,一次方程的稱為線性擬合,多次方程的稱為多項式擬合,多項式擬合的公式見式(2)。
[y=a0+a1x+a2x2+…+anxn] (2)
對于多項式擬合,最終的參數(shù)組合(a0,a1,…,an)也是由最小二乘法確定的,其公式見式(3)。
[RSS=i=0m(y'i-yi)2=]
[i=0m(a0+a1xi+a2x2i+…+anxni-yi)2] (3)
殘差平方和RSS可以看作是參數(shù)組合(a0,a1,…,an)的函數(shù)[?](a0,a1,…,an),則令每一個參數(shù)的一階偏導(dǎo)數(shù)為0,則有式(4)。
[?φ?aj=2i=0m(a0+a1xi+a2x2i+…+anxni-yi)]=
[0( j=0,1,2,…,n)] (4)
根據(jù)此公式可得矩陣方程見式(5)。
[m+1i=0mxi…i=0mxnii=0mxn+1ii=0mx2i…i=0mxn+1i…………i=0mxnii=0mxn+1i…i=0mx2ni×a0a1…an=i=0myii=0mxiyi…i=0mxniyi] (5)
把此矩陣方程簡化為XA=Y,則矩陣A的算法為A=X?1Y。
根據(jù)最小二乘法,求出誤差平方和最小的一組多項式擬合的系數(shù),從而獲得擬合方程。
3.2 模型建立
同一組數(shù)據(jù),不同次多項式擬合結(jié)果也會有區(qū)別,為獲取理想的預(yù)測模型,需要對不同次多項式擬合模型的預(yù)測精度進行統(tǒng)計。本研究仍以2006—2015年國家公路里程數(shù)據(jù)為實測數(shù)據(jù)建立模型(其中自變量[x]為自2006年為起點1,時間間隔為1年的年度數(shù),2007—2015年分別對應(yīng)2—7,依次類推。),各不同次多項式擬合模型的預(yù)測公式及R?值見表3。
由表3可知,2—6次多項式預(yù)測模型的模型精度結(jié)果都較好,其中6次模型精度最優(yōu),考慮到預(yù)測值與實際觀測值的統(tǒng)計差值小于萬分之三,本研究以6次多項式預(yù)測模型作為最終的預(yù)測模型。
3.3 模型預(yù)測與驗證
采用6次多項式預(yù)測模型對國家公路里程2016—2020年數(shù)據(jù)進行預(yù)測,其預(yù)測公式及R?見表3。預(yù)測獲得的數(shù)據(jù)結(jié)果統(tǒng)計見表4。
由表4可知,利用國家公路里程2006—2015年數(shù)據(jù)對后續(xù)2016—2020年數(shù)據(jù)進行預(yù)測,2016年的預(yù)測值與實際值偏差很?。?.30%)。但是隨著時間的推移,二者的差值越來越大,2020年時差值竟超過50%,這說明該模型對于短時間內(nèi)的預(yù)測適用,隨著時間延長,模型的精度快速下降。
在實際應(yīng)用中,為了克服上述因素帶來的影響,嘗試將每年新增的實際統(tǒng)計數(shù)據(jù)加入模型建立過程中,不斷增加模型數(shù)據(jù)的時間序列,能夠提高模型滾動預(yù)測精度。本研究模擬將2016—2020年每年獲得的統(tǒng)計數(shù)據(jù)加入模型中,對后續(xù)年度進行滾動預(yù)測,其預(yù)測公式及R?值見表5。
由表5可知,隨著實際數(shù)據(jù)的獲取,并添加到模型中,采用6次多項式擬合建立的模型,其精度良好。添加每年度新增數(shù)據(jù)后,得到預(yù)測模型獲取的預(yù)測值、預(yù)測值與實際值的差值統(tǒng)計見表6。
由表6可知,添加年度新增數(shù)據(jù)后,滾動預(yù)測獲得的預(yù)測值與實際值的差值在可控范圍內(nèi),連續(xù)5個模型最近一年的預(yù)測值與實際值的差值最小為1.39萬km、最大為15.26萬km,其差值的百分比分別為0.30%、2.94%,都在3%以內(nèi),由此可見,采用該方式,可以獲得較高精度的預(yù)測結(jié)果。最終的模型預(yù)測值與實際值的曲線如圖1所示。
4 結(jié)語
建設(shè)交通強國是國家的重大戰(zhàn)略決策,是建設(shè)現(xiàn)代化經(jīng)濟體系的先行領(lǐng)域。隨著國家交通建設(shè)事業(yè)的全面推進,公路作為立體交通網(wǎng)絡(luò)中重要的基礎(chǔ)設(shè)施,在經(jīng)濟發(fā)展中起著至關(guān)重要的作用,必須把路網(wǎng)規(guī)劃納入國家總體規(guī)劃之中。本研究采用指數(shù)法、對數(shù)法、多項式法、冪函數(shù)法等4種預(yù)測方法建立國家公路里程預(yù)測模型,獲得各模型精度,確定多項式法建立的模型最優(yōu)。運用多項式擬合模型原理,對比不同次多項式模型,本研究發(fā)現(xiàn)6次多項式擬合模型更適合國家公路里程的預(yù)測。針對6次多項式擬合模型時間序列精度不足的問題,通過運用滾動加入新增年度數(shù)據(jù)模型的手段,提高了后續(xù)年度數(shù)據(jù)預(yù)測精度。公路里程作為路網(wǎng)規(guī)劃的重要參數(shù),應(yīng)該對其進行科學(xué)研究與預(yù)測,本研究提出的添加年度新增數(shù)據(jù)的6次多項式預(yù)測模型,可以為持續(xù)性路網(wǎng)規(guī)劃提供基礎(chǔ)數(shù)據(jù)支撐。
參考文獻:
[1]中共中央、國務(wù)院.交通強國建設(shè)綱要[M].北京:人民出版社,2019.
[2]國家統(tǒng)計局.公路里程[EB/OL](2021-05-09)[2022-04-10]. http://data.stats.gov.cn/easyquery.htm.
[3]李夢婉,沙秀艷.基于GM(1,1)灰色預(yù)測模型的改進與應(yīng)用[J].計算機工程與應(yīng)用,2016,52(4):24-30.
[4]陳健勛.城市供水管網(wǎng)漏失特性模擬及評價[D].哈爾濱:哈爾濱工業(yè)大學(xué),2020.
[5]何岸青.基于多項式擬合與支持向量機的股票關(guān)鍵拐點預(yù)測[D].長春:吉林大學(xué),2016.