孫涵莆,胡鑫澤,張琪虹,王嘉寧
(1.遼寧工程技術大學 電子與信息工程學院,遼寧 興城125100;2.遼寧工程技術大學 軟件學院,遼寧 興城125100;3.遼寧工程技術大學 電控學院,遼寧 興城125100)
公路運量分為公路的客運量和公路的貨運量兩個方面,公路運量的數據對交通治理、管理和更新交通系統有著重要意義,掌握公路運量的發展趨勢和規律對國家發展公路基礎設施有著極大幫助,因此對交通運量的預測顯得十分重要。
目前應用于公路運量預測的代表性方法有多元回歸、BP神經網絡、灰色關聯、時間序列預測等,其各具特色各有優缺點,如指數平滑、混沌加速遺傳、灰色G,已在預測公路運量這個問題上取得了巨大突破,但仍未達到完美。比如定性分析易受人的主觀因素影響,時間序列分析需要大量的數據,且精度程度不高,不適合長期預測,此外其不能研究多個因子的關聯性,預測效果并不理想。剩下的方法如灰色關聯等也在預測整體性客運量問題上出現了問題,無法把握運量的整體變化。文中將定性分析與定量計算相結合,首先通過資料定性分析與公路運量有關的因素以及社會指標,然后采用結合BP 神經網絡和灰色關聯分析法的方法,建立灰色神經網絡模型,計算公路運量與各個指標屬性之間的關聯程度,找到其影響因素,將兩種方法的優勢相融合,并且巧妙地避開了單一模型下準確率偏低的缺點。
模型因素的數量與預測精確度、模型復雜度和計算難度正相關,且各個因素間存在相關性,因此需要在與公路運量有關的許多因素下進行篩選,在保證構建模型時輸入的因素不能過多的前提下,充分發揮每個因素的影響占比,并保證各個因素間具有強獨立性。
影響公路運量的因素有很多且復雜多變,從定性的角度選取了部分對需求增速水平有重要意義的基本因素,再從定量角度進行篩選,獲得了重要的影響因素有汽車保有量、國民總收入、公路面積、機動車數量、人口數量、人均GDP、城市化率這七個因素。查詢中國統計年鑒網站獲取了1990—2018 年的公路客運量和公路貨運量以及相關因素的數據,部分如表1 所示(1990—2005 年)。
針對影響因素不完全和數據樣本不足情況下,常規分析方法難以準確判別影響因子權重的問題,采用灰關聯分析方法來做因素間的序量化和關聯分析,找出與公路客運量和公路貨運量有較強關聯度的因素,具體計算步驟如下。
將樣本所有數據均除以第一個數據,得到一個新的數列。這個新的數列,即是各個時刻的數值相當于第一個時刻的數值的倍數的數列,以此來消除量綱。
設有序列x=[x(1),x(2),…,x(n)],則稱映射f:x→y,f[x(k)]=x(k)/x(1)為數據初值化變換。
式(1)中:?ji為Yi與Pji之差的絕對值;Yi為參考序列中的第i 組值;Pji為比較序列中第j 個因素在第i 組的值。
式(2)中:εji為第j 個影響因素在i 組的取值與第i 組公路運量的關聯系數;?min和?max分別為數據中取值的最小、最大值;分辨系數ρ=0.5。
表1 統計數據(部分)
關聯度記ri,其表達式為:
式(3)中:ri為第j 個因子與公路運量y 之間的灰色關聯度;k=1,2,…,n;i=1,2,…,m。
經過計算,求得公路運量與各個因子間關聯度,如表2所示。
根據表2 可以看出,城市化率、人口數量、人均GDP、汽車保有量和機動車數量的關聯度都大于0.80,即他們與公路運量有較強的關聯性,因此采用這些因素作為模型的最終預測指標。
表2 關聯度結果
BP 神經網絡是一種誤差反向傳播的多層神經網絡,其主要特點是信號前向傳遞,誤差反向傳播。BP 算法是利用輸出層的誤差來估計輸出層的直接前導層的誤差,再用這個誤差估計更前一層的誤差。逐層迭代,修正每層網絡權值,直到誤差滿足要求,達到所需輸出精度。
隨機設置輸出層神經元之間的連接權值ω,然后進行隱含層的輸出計算,計算公式如下:
式(4)中:f 為隱含層激勵函數,l 為隱含層的節點個數。
選取的Sigmoid 激勵函數公式如下:
輸出層輸入計算:
根據隱含層輸出H、連接權值Wjk、閾值b 計算BP 神經網絡的預測值Y。
由網絡預測輸出Y 和期望輸出O,計算誤差:
ek=Ok-Yk,k=1,2,…,m
權值更新以及閾值更新,其中η為學習速率:
式(5)中:i=1,2,…,n;j=1,2,…,l。
式(6)中:j=1,2,…,n;k=1,2,…,m。
式(7)中:j=1,2,…,l;bk=bk+ek,k=1,2,…,m。
若迭代結束則繼續,若迭代算法未結束則返回重復該訓練過程。
為了解決原始數據突變問題并防止一些神經元飽和,將隨機選取的15 組樣本數據進行歸一化。歸一化采用的方法是平均數方差法,其函數公式如下:
模型采用了只含有一個隱含層的簡單三層BP 神經網絡模型,選取logsig 函數作為隱含層的轉移函數,選取purelin函數作為輸出層的轉移函數,將學習率設為0.1,目標值的誤差設為0.001 在100 次迭代后在隱含層節點數為2、3、5、7、8 的不同模型中進行比較,選取誤差最小的一組模型,確定最佳的隱含層節點數應為5,即誤差最小的網絡結構輸入層節點數為8,隱含層節點數為5,輸出層節點數為1。訓練過程中產生的收斂曲線及誤差曲線如圖1、圖2 所示。
圖1 收斂曲線
圖2 誤差曲線
使用訓練模型過程中沒有被選取的數據作為模型的預測測試數據進行輸入,得到模型預測結果如圖3 所示。
由圖3 可知,根據該模型預測的未來公路運量匹配準確,誤差逐漸減小且滿足精度要求,吻合度較高,可以應用于實際。
圖3 模型預測結果
采用BP 神經網絡模型和灰色神經網絡準確地擬合了樣本數據,成功對公路運量做出預測,得到的預測結果誤差較小。實驗進一步表明采用BP 神經網絡的預測可行性很高,但由于只采用了單隱含層的模型而使得實驗結果仍存在擬合程度和多屬性方面的缺失。