王敏



摘 要:隨著現代物流行業的發展,公路運輸作為一種重要的貨物運輸方式正在扮演著越來越重要的角色。公路運輸具有靈活、快速、點對點等優勢,尤其對于短途、小批量貨物運輸需求更加廣泛。公路運價預測作為運輸流程的關鍵環節之一,已成為政府部門和物流業關注的焦點問題。公路運價預測任務受到多種因素影響,如市場需求、運輸距離、油價和政策變化等。這些因素之間相互作用,增加了公路運價準確預測的難度。針對這個問題,文章提出了一種基于深度神經網絡的公路運價預測模型,以應對公路運價預測的挑戰。其主要貢獻在于:傳統的多變量時序預測模型采用線性或非線性回歸模型,但這些模型往往受到變量之間非線性、時間動態性和復雜依賴性的建模能力限制。文章采用基于圖神經網絡的MTGNN模型,對公路運價預測進行了應用研究。該模型由圖卷積網絡和時序卷積網絡兩部分組成。首先,通過神經網絡學習圖結構并計算鄰接矩陣來表示節點之間的依賴關系和實現節點聚合。然后,使用圖卷積網絡模塊對節點信息進行傳播,從而獲取更準確的節點表示。接下來,時序卷積網絡提取經過圖卷積網絡學習后結果中的時序特征,實現對未來公路運價的預測。最后,輸出層對時序輸出結果進行計算,得出模型預測結果。
關鍵詞:公路運價;多變量時序預測;圖神經網絡
中圖分類號:F542;U4 文獻標志碼:A DOI:10.13714/j.cnki.1002-3100.2023.12.006
Abstract: With the development of modern logistics industry, road transportation is playing an increasingly important role as an important mode of freight transportation. Road transportation has advantages such as flexibility, speed, and point-to-point service, especially for short-distance and small-batch cargo transportation. However, predicting road freight rates, as one of the key links in the transportation process, has become a focus of attention for the logistics industry and government departments. The prediction of road freight rates is influenced by various factors, such as market demand, transportation distance, oil prices, and policy changes. The interaction between these factors makes it difficult to accurately predict road freight rates. To address this issue, this paper proposes a road freight rate prediction model based on deep neutral network to meet the challenges of predicting road freight rates. The main contribution of this paper is: In traditional multivariate time series prediction models, linear or nonlinear regression models are often used. However, these models are often limited in their ability to model non linearity, time dynamics, and complex dependencies between variables. In this study, the MTGNN model based on graph neural networks was applied to highway freight rate prediction. The model consists of two parts: graph convolutional network (GCN) and temporal convolutional network (TCN). First, the neural network learns the graph structure and calculates the adjacency matrix to represent the dependency between nodes and achieve node aggregation. Then, the GCN module is used to propagate node information and obtain more accurate node representations. Next, the TCN extracts temporal features from the results learned by the GCN to predict future highway freight rates. Finally, the output layer calculates the time series output results to obtain the model's prediction.
Key words: road freight rate; multivariate time series forecasting; graph neural network
0 ? ?緒 ? ?論
公路物流貨運價格是物流行業中的一個重要方面。近年來,研究人員對其進行了大量的定性研究。例如顧敬巖等[1]通過對我國公路物流貨運價格波動特征的定性分析發現,價格波動主要由市場供需關系、政策調控、競爭狀況和成本等因素導致。他們進一步深入探討了公路貨運市場價格調節機制失靈的根本原因,發現市場信息不對稱、價格管制不力、壟斷行為等因素也對價格波動產生了重要影響。針對這些問題,他們從市場和從業者的角度提出了多項建議措施。研究人員在公路物流貨運價格方面的分析與探討是非常豐富的。例如馬銀波[2]對公路貨運價格與公路貨運量之間的關系進行了分析,并從經濟學的角度解析了短期供給特征和行業運行狀況。他還探討了運價的走勢規律以及運價問題的成因。通過這些分析,深入挖掘了公路貨運價格背后的內在規律。另外,戴宏[3]對我國公路貨運物流服務價格存在的主要問題進行了系統性探討,并提出了一系列針對性建議。例如在融資渠道方面,建議加強資本市場的建設,拓展企業融資渠道。在模式創新方面,提倡發展多式聯運、物流園區等新型物流模式。在供給側改革方面,建議完善市場機制,加強監管,提高行業自律能力等。
在時間序列預測任務上,已經有了很多性能較好的研究。Sean J. Taylor和Benjamin Letham提出Prophet模型,通過將時間序列分解成季節項、趨勢項、剩余項和節假日效應四個部分,并對每個部分進行分析擬合,最后累加起來得到最終的預測值。無獨有偶,Büyük?ahin ? ?等人提出將時間序列數據分為線性項(L)和非線性項(N),再擬合。還有研究通過分解模型而不是分解數據的方式進行,例如經驗模態分解(EMD)變分模態分解(VMD)、小波分解(WD)等。對分離后的信號再用數學模型進行擬合、疊加、重構,就能得到最后的預測值。還有的通過NLP經典模型Seq2Seq去學習時間序列,通過殘差連接改進卷積網絡WaveNet和時序神經網絡LSTNet。
但是,基于神經網絡的公路運價預測研究還有很多問題有待解決。第一,數據獲取困難。公路運價涉及多個因素,如貨物類型、貨物重量、運輸距離、車型、路況和市場需求等,需要大量的數據進行建模。但是,公路運價的數據不容易獲取,需要考慮數據的保密性、獲取渠道的限制等問題。第二,建模復雜度高。首先,公路運價預測需要考慮多個因素的影響,如供需關系、成本變化、市場競爭等。同時,這些因素之間的關系非常復雜,需要采用多種數據分析和建模方法才能建立準確的預測模型。其次,市場環境不穩定也是一個重要原因。鐵路運價受市場環境的影響,如政策法規、自然災害等,這些因素可能對鐵路運價的預測造成一定干擾。此外,公路運輸市場的變化也非常迅速,需要不斷更新預測模型來適應市場需求。最后,模型可解釋性差也是缺點之一。某些公路運價預測模型,如神經網絡和支持向量機等,具有較高的預測準確性,但是由于其內部機制復雜,導致模型的可解釋性較差,難以對預測結果進行解釋和說明。
1 ? ?公路運價預測應用研究
本文采用了基于圖神經網絡的公路運價預測模型,其首先利用神經網絡對圖結構進行學習,同時計算圖的鄰接矩陣,然后利用圖卷積網絡模塊對節點信息進行傳播,最后利用時序卷積網絡對經過圖卷積網絡學習后的結果進行時序特征提取,并將時序輸出的結果通過輸出層進行計算,最終獲得模型預測結果。
1.1 ? ?問題提出
接下來,針對基于圖神經網絡的多變量時序預測任務給出正式描述:假設有一個時間序列S={x1,x2,...,xT},其中xt∈RD表示在時刻t的D維向量。對于一個給定的長度為N步的多變量時間序列X={xt1,...,xtN},基于圖神經網絡的多變量時間預測方法就是利用圖神經網絡對S進行學習得到一個預測函數f,其能夠對輸入序列X預測其未來第M步之后的變量值Y={xtN+M}或者之后M步內的變量變化情況Y={xtN+1,...,xtN+M}進行預測。
1.2 ? ?基于圖神經網絡的時序預測模型
本文構建的模型具體框架圖如圖1。首先,模型一共由5個模塊組成,分別包括輸入預處理模塊、圖結構學習模塊、圖卷積模塊、時序卷積模塊以及輸出模塊。其中,預處理模塊主要是將時序數據進行構造,生成時序預測任務的輸入和目標以及對訓練數據的采樣;圖結構學習模塊則是利用深度神經網絡從網絡節點之間學習到非對稱的鄰接矩陣;圖卷積模塊則是基于圖卷積和Attention,對時間序列中變量之間的信息進行傳播和篩選;時序卷積模塊則是利用多個標準的一維膨脹卷積核來對高維時序特征進行抽取;輸出層則是將多個圖卷積模塊和時序卷積模塊的輸出進行拼接,然后對輸出目標進行預測。
接下來,我們將詳細介紹框架中的圖結構學習模塊、圖卷積模塊以及時序卷積模塊。
1.2.1 ? ?基于神經網絡的圖結構學習模塊
在數學上,圖是由節點和邊組成的數學對象,通常表示為G=(V,E),其中V表示節點集合,E表示邊的集合,并用N來表示節點的數量。對于圖中的節點vi,我們定義其節點鄰居為N(vi)={u∈V|(vi,u)∈E},即在圖中與vi存在連邊的所有節點。通常我們可以通過使用鄰接矩陣來描述一個圖,即A∈RN×N,其中如果節點xi和節點xj存在連邊,則Ai,j=c>0,否則Ai,j=0。但是,由于無法提前得知多變量時間序列變量之間的依賴關系,所以無法直接通過輸入數據獲取圖結構。為了發現圖中節點之間的隱藏關系,我們采用一個基于神經網絡的圖結構學習模塊來計算圖的鄰接矩陣,進而從時序數據中自適應地捕獲變量之間的空間關系。
目前,用于計算節點之間相似性的方法通常是對稱的或者雙向的,但是對于公路運價的多變量時序數據來說,變量之間的關系應該是單向的,即前一個時間的節點狀態變化會引起后面其他節點的變化,但是反過來無法影響,所以我們在學習圖結構的時候,應該主動引入鄰接矩陣具有非對稱的屬性約束。具體網絡設計如下。
其中,E1和E2分別表示從原始節點中隨機采樣的兩個節點學習后得到的表征,θ1,θ2表示模型參數,α表示激活函數的飽和率,argtopk(·)用于返回在給定向量中前k個最大值的索引位置,這是在計算鄰接矩陣時常用的一個操作。在處理圖神經網絡時,M1和M2表示節點在網絡中的輸出結果,它們包含了節點之間的空間關系信息。為了更好地表示空間依賴關系,我們可以通過計算M1乘以M2的轉置(M1MT2)來對這些關系進行重新建模,然后通過公式(3)來計算鄰接矩陣的非對稱信息。其中,ReLU激活函數可以起到正則化鄰接矩陣的效果,當Ai,j>0時,有鄰接矩陣的對角元素Aj,i<0,通過激活函數后會使其值變為0。ReLu函數可以確保鄰接矩陣中的元素非負,同時還能在一定程度上強化鄰接矩陣的稀疏性。這樣的正則化效果有助于提高模型的泛化能力,減少過擬合的風險。最后,為了降低后續圖卷積網絡的計算代價,利用公式(4)對圖進行稀疏化,即只包括與節點最近的k個節點的鄰接矩陣值,其余值均賦值為0。
1.2.2 ? ?圖卷積模塊
模型中的圖卷積模塊主要是利用通過學習得到的鄰接矩陣和通過時序卷積后得到的節點特征矩陣來對數據的空間依賴性特征進行學習。這里對信息的處理包括兩個子模塊:信息傳播和信息選擇。并且使用MixHop作為圖卷積網絡模型。
MixHop是一種改進的圖卷積網絡模型,它使用多個鄰接矩陣進行卷積操作,能夠捕捉更多節點之間的關系。在MixHop模型中,每個卷積層使用多個鄰接矩陣來更新節點特征向量,這些鄰接矩陣可以有不同的權重和階數。其核心思想是將多個不同鄰接矩陣的信息進行融合,從而提高模型的表達能力。MixHop模型的卷積操作如下。
其中,Hl表示第l層節點的特征矩陣,Ai表示第i個鄰接矩陣,Wi(l)表示第i個鄰接矩陣對應的權重矩陣,k表示使用的鄰接矩陣的數量,σ表示激活函數。
1.2.3 ? ?時序卷積模塊
時序卷積模塊參考了LSTM的門控設計,采用了兩個膨脹卷積Inception模塊。這兩個模塊分別充當濾波器和信息控制器。第一個膨脹卷積Inception模塊在輸出后使用tanh作為激活函數。tanh函數能將輸出值映射到-1~1之間,起到濾波器的作用。這個模塊主要負責提取時序特征并生成對應的表征。第二個膨脹卷積Inception模塊使用sigmoid作為激活函數。sigmoid函數將輸出值映射到0~1之間,這樣就能控制信息量的傳遞。這個模塊的作用是根據輸入數據的特征來決定哪些信息可以通過過濾器傳遞給下一個模塊。
1.2.4 ? ?輸出模塊
由表1我們可以觀察到,最終輸入模型輸出層的信息為多個模塊的拼接。其中,輸出層包含兩個1×1的卷積層,對于單步預測,輸出層最終輸出長度為1的預測結果。
由于網絡模型設計中涉及深層的神經網絡,其存在大量的非線性激活函數和權重參數,信號經過多次傳遞可能會出現梯度消失或梯度爆炸的情況,從而導致網絡無法進行有效的學習。所以,為了更快地訓練模型,在模型網絡結構中也引入了殘差連接。殘差連接通過直接將輸入特征添加到網絡中間層的輸出特征上,從而使網絡信號能夠繞過一部分非線性變換和權重參數,保證梯度能夠在網絡中進行有效傳播,從而提高網絡的學習能力和效率。
1.3 ? ?實驗設置
1.3.1 ? ?數據描述
本文涉及的數據來源包括中華人民共和國國家統計局官網和大型運輸公司,涵蓋了2016年1月—2022年7月的公路貨運量與公路運價數據。為了更準確地掌握公路運價的變化趨勢和規律,本文采用了按周采集數據的方法進行實證分析,以更好地捕捉公路運價的變化趨勢。這些數據的采集和處理過程,將有助于公路運價預測,并能為相關的政策制定提供有力的依據和支持。
數據集劃分采用留出法,是指將數據集按照一定的比例劃分為訓練集和測試集。訓練集用于構建預測模型,測試集用于評估預測模型的性能。本文中將2016年7月—2021年9月作為訓練數據,2021年9月—2022年9月作為測試數據。
1.3.2 ? ?評價指標
本節選擇5個不同的指標來對算法結果進行測試,分別為平均絕對誤差、均方誤差、均方根誤差、平均絕對百分比誤差和R2。R2(R-squared,Coefficient of determination)是一種用于評估回歸模型擬合程度的統計量。它的取值范圍從0到1,越接近1表示模型對數據的擬合程度越好。由表1可以看出,MTGNN模型在相關性指標R2上取得了最好的成績。
1.4 ? ?實驗與評估
1.4.1 ? ?基線算法
TCN(Temporal Convolutional Network)是一種基于卷積神經網絡的時序預測模型,能夠自適應地捕捉時序數據中的長期依賴關系。相比于傳統的循環神經網絡,TCN模型具有更短的訓練時間、更少的參數和更好的預測性能。
DeepAR模型是基于循環神經網絡(RNN)和卷積神經網絡(CNN)的混合模型,其核心思想是將目標序列與其他相關時間序列聯合訓練,從而提高模型的預測準確性。在模型訓練過程中,DeepAR模型不僅考慮了目標序列的歷史信息,還結合了其他相關序列的歷史信息,從而更好地捕捉序列中的趨勢和季節性等時間特征。
N-BEATS(Neural basis expansion analysis for interpretable time series forecasting)是一種基于神經網絡的時間序列預測模型。N-BEATS模型采用可分解的堆疊基函數來建模時間序列數據,并利用多層神經網絡對其進行擴展和組合,從而實現高精度的預測。N-BEATS模型更加靈活和高效,具有更好的可解釋性和預測性能。
NHits模型是一種用于時間序列預測的深度神經網絡模型,它是N-BEATS模型的改進版。NHits模型使用類似于N-BEATS模型的框架,但引入了一種稱為Multi-Horizon Transformer的新型深度神經網絡結構,該結構具有更好的特征提取能力和跨時序預測能力。
1.4.2 ? ?實驗結果與分析
本文中應用的基于圖神經網絡的時序預測模型MTGNN,在公路運價預測任務上取得了最為優異的表現。如圖2所示,其直觀地展示了MTGNN模型處理時序數據時強大的能力和有效性。MTGNN可以同時處理多個時序數據,包括節點屬性、邊屬性和時間屬性等,可以在不同層級上學習數據的表示,并將多個維度的信息相結合,以提高模型的表達能力。在公路運價預測任務中,公路運價會受到季節變化、時間趨勢和短期事件等多種因素的影響,MTGNN模型可以同時對這些因素進行建模,從而提高預測的準確性。MTGNN模型采用了圖神經網絡來建模節點之間的依賴關系,通過學習節點之間的依賴關系,能夠更好地捕捉節點之間的復雜關系和依賴性,從而提高預測的準確性。在公路運價預測任務中,各個路段之間的運價存在復雜的依賴關系,MTGNN模型能夠學習這些依賴關系,并利用這些信息來提高預測的準確性。MTGNN可以自適應地學習圖結構,包括節點之間的連接和邊的權重,可以在不同時間步驟上學習不同的圖結構,并對圖結構進行自適應更新,從而以提高模型的預測能力和魯棒性。
2 ? ?結 ? ?語
基于圖神經網絡的公路運價預測模型主要包括兩個部分:圖卷積網絡和時序卷積網絡。首先,模型利用神經網絡對圖結構進行學習,計算圖的鄰接矩陣,并通過鄰接矩陣來表示節點之間的依賴關系,從而實現節點之間的聚合。然后,利用圖卷積網絡模塊對節點信息進行傳播,將節點特征傳遞給它們的鄰居節點,從而得到更準確的節點表示。接下來,時序卷積網絡對經過圖卷積網絡學習后的結果進行時序特征提取,從而提取出有用的時序信息,以實現對未來公路運價的預測。最后,利用輸出層對時序輸出的結果進行計算,最終獲得模型預測結果。基于圖神經網絡的公路運價預測模型能夠有效地利用節點之間的依賴關系,提高預測的準確性和可解釋性,特別是在公路運價具有空間依賴關系和時間依賴關系的情況下。因此,該模型在實際應用中具有廣泛的應用前景,可為交通運輸決策提供有價值的參考。
參考文獻:
[1] 顧敬巖,吳群琪.我國公路貨運市場價格的演進趨勢、問題及對策[J].交通運輸系統工程與信息,2013,13(6):191-197.
[2] 馬銀波.我國公路貨運價格特性分析[J].綜合運輸,2007(9):69-72.
[3] 戴宏.我國公路貨運物流服務定價機制研究[J].價格理論與實踐,2016(12):74-76.