景志勇,李祖賀,趙進超
(鄭州輕工業大學計算機與通信工程學院,河南 鄭州 450002)
軌道交通是城市發展中的重要環節,能夠有效疏解人口增長給地面交通帶來的壓力。軌道交通網伴隨城市發展而同步擴展,在此過程中,交通站點積累了大量流量數據,這些數據可以反映客流的變化規律、交通站點的負載情況,以及未來發展趨勢等[1-2]。對交通站點流量數據進行分析預測,有利于指導軌道交通調度策略,提高交通資源利用率和站點運營效率。因此,軌道交通站點流量預測對于城市規劃發展具有重要意義[3]。
針對交通流量的預測,當前已經取得了一些研究成果。在現有研究中,交通站點流量預測一部分采用非線性理論,如文獻[4],在狀態向量的基礎上引入卡爾曼預測模型。還有一部分采用線性理論,如文獻[5],引入混沌思想對站點流量進行局域預測。此外,還有一部分通過融合人工智能算法,來進一步解決單模型存在的缺陷。文獻[6]充分考慮了卡爾曼模型存在的問題,設計了融合SVM的優化模型。卡爾曼作為線性模型,在處理非線性交通站點流量數據時,通常存在估計值偏差增大的問題,而SVM具有預見性,可以對卡爾曼誤差進行調整。文獻[7]將站點流量數據采取成分分析,確定對應的加權信息,并采取RF回歸處理。該方法在非線性理論基礎上引入了RF算法,獲得了較好的流量預測精度。文獻[8]引入CNN增強流量數據特征提取的精細程度,同時融合LSTM改善時間跨度問題,該方法的缺點是沒有充分考慮差異性特征間的相互影響。文獻[9]針對站點流量表現出的時空屬性,利用深度學習實現流量預測。基于現有研究,本文首先從時間序列出發,對站點流量數據采取模態分解,得到相應尺度特征。然后考慮到軌道交通站點流量數據具有的小樣本特性,為得到精確的預測結果,本文引入SVM預測模型。SVM預測模型對流量預測的整體性能進行綜合考量,在平衡精度和效率時采用遺傳算法對其模型參數進行尋優計算,從而保證SVM預測模型的合理性。
由于軌道交通站點流量受時間影響,因此可以將其看做具有時間信息的數據集。通過時間變化能夠分析站點流量的規律,從而對流量預測提供數據特征依據。根據時間屬性將站點流量的采集數據點定義為(t,d),參數t用來描述時間,參數d用來描述數據。于是,站點流量的數據集可表示為{(t1,d1),(t2,d2),…,(tn,dn)},ti (1) 其中,m是站點數量;di,j是站點i在時間段j內的流量。 (2) (3) 其中,l代表分解得到的IMF數量。 h(di)=WK(d)+e (4) 式中,W代表核加權,W=(w1,w2,…,wk)T;K(·)是徑向基核函數,用于實現低維數據的升維操作,該過程中,K(·)會對特征映射的計算量產生影響;e代表誤差;h(di)代表預測結果。 為了使超平面滿足最小距離的要求,需要令核加權向量的范數盡可能小,同時需要對預測誤差進行控制。于是,SVR模型可以描述如下 (5) 模型中,ρ表示損失因子,它能夠對擬合誤差進行控制。考慮到站點流量數據的非平穩性,一些數據在擬合時可能產生較大的偏差。為了避免由此導致的預測誤差,這里采用懲罰因子和松弛因子把擬合過程轉變成尋優計算,此時SVR模型描述如下 (6) 式中,ηi、η′i代表松弛因子;p代表懲罰因子,它能夠調劑模型的偏差和計算量。當p變小,模型的學習性能下降,計算量也隨之降低;當p變大,模型的學習性能增強,同時計算量也隨之升高。懲罰因子的確定,會對SVR模型性的能造成一定影響。為了求解約束優化模型,引入對偶思想構造Lagrange函數 (7) (8) 南通要想大力發展集裝箱多式聯運,必須提供“及時、經濟、安全、個性”的聯運服務,具體可以從以下幾個方面進行建設。 (9) 為了提高超平面的性能,SVR模型引入了損失因子ρ、懲罰因子p,以及核函數K(·)。如果它們的取值不合適,會導致預測結果的不可靠,或者預測效率的下降。因此,本文引入遺傳算法,將引入參數采取優化處理,從而使預測模型達到整體最優性能。基于遺傳算法的參數優化過程如下: 1)樣本初始化。利用隨機方式從原始站點流量數據中生成訓練集。 2)參數與種群初始化。將損失因子ρ、懲罰因子p,以及核函數K(·)采取編碼操作。編碼選擇16位二進制方式,這樣既能防止二進制編碼長度不夠的情況發生,又能防止其它編碼導致的計算復雜度升高。 3)迭代處理與適應度評價。迭代過程中,對樣本采取選擇、交叉及變異處理,同時依據均方根誤差來判斷樣本適應度。適應度強的樣本將會繼續迭代,參與后輪交叉。在進行交叉處理時,采用如下規則 (10) 其中,a1與a2代表需要交叉的染色體;P代表交叉概率。 4)迭代結束,獲得最優SVR模型參數。 基于上述流程描述,SVR模型參數優化的流程如圖1所示。 圖1 遺傳算法優化SVR模型參數流程圖 1)均方根誤差(RMSE)。該指標可以反映預測結果與實際值的偏差。假定原始數據集為D={(x1,y1),(x2,y2),…,(xn,yn)},xi代表模型輸入參數,yi代表與xi相應的實際值,那么RMSE公式描述為 (11) 2)平均絕對誤差(MAE)。該指標用于描述結果絕對誤差。MAE公式描述為 (12) 3)平均相對誤差(MAPE)。該指標用于描述結果準確度。MAPE公式描述為 (13) RMSE、MAE和MAPE指標,都是值越小對應的性能越好。 通過仿真得到SVR模型參數尋優效果。由于遺傳算法根據RMSE來判斷樣本適應度,所以在迭代計算過程中,得到RMSE的變化情況,結果如圖2所示。從SVR模型參數尋優曲線可以看出,在初始階段,隨機設置參數對應的RMSE值較大。經過遺傳算法對參數進行尋優之后,RMSE值開始迅速下降,參數的適應度越來越好。初始化時給定的迭代次數是100,實際計算到40代時最優值即趨于平穩。于是,在實驗過程中,設定最大迭代次數為40,避免過多無效迭代影響預測模型構建效率。 圖2 模型參數尋優曲線 仿真得到站點流量預測結果如圖3和圖4所示。對比周一與周日的預測曲線可以得出,周日的預測效果稍微優于周一,這是由于周一站點流量變化較為復雜,非平穩特性更顯著,從而影響預測精度。根據站點流量預測結果,基于SVR與成分分解的預測結果基本上與真實數據重疊,表明能夠很好的擬合真實數據。 圖3 周一站點流量預測曲線 圖4 周日站點流量預測曲線 對軌道交通站點流量預測精度進行定量分析,仿真得到預測結果的RMSE、MAE和MAPE指標,并與文獻[7]和文獻[8]方法進行比較,結果如圖5和圖6所示。從RMSE、MAE和MAPE指標來看,基于SVR與成分分解的預測結果顯著優于對比方法。模態分解能夠對非平穩站點流量數據采取特征分解,從而將流量特征按照時間采取細化提取,并在此基礎上利用優化的SVR模型對站點數據進行準確預測。通過三項性能指標,驗證了本文方法在軌道交通站點流量預測方面的準確性。 圖5 周一站點流量預測結果 圖6 周日站點流量預測結果 除了預測的精準性,預測效率也是軌道交通站點流量預測性能的重要指標。表1為各方法的站點流量預測耗時。根據數據對比,在對周一流量預測時,本文方法的耗時分別比其它方法減少了4.749s和1.072s;在對周日流量預測時,耗時分別比其它方法減少了4.665s和0.971s。本文方法的耗時優于其它方法,是因為構建SVR優化模型時,充分考慮了模型引入參數的影響,并采用遺傳算法對參數進行優化,從而保證預測精度和效率的均衡。 表1 站點流量預測耗時 為了準確得到軌道交通站點流量數據的時間序列特征,本文提出了流量數據模態分解法,增強局部特征提取的抗干擾性。基于成分分解設計了SVR預測模型,并針對模型的求解、預測精度和預測效率分別進行了優化。仿真確定SVR模型參數尋優的最大迭代次數為40,從而有效避免過學習的發生。此外,仿真得到周一站點流量預測的RMSE、MAE和MAPE指標分別為78.36、45.17、6.95%;周日站點流量預測的RMSE、MAE和MAPE指標分別為74.57、43.14、6.64%。通過實驗結果,證明了基于SVR與成分分解方法對交通站點流量具有更加準確的預測精準性,且有效權衡了精度與效率之間的關系。

3 SVR預測模型


4 SVR模型參數優化

5 仿真與結果分析
5.1 仿真數據與性能指標

5.2 實驗結果分析






6 結束語