基于GNN圖神經網絡的城市軌道交通流量預測優化

2025-03-09 00:00:00朱佾

交通科技與管理 2025年3期

摘要隨著城市化進程加快，城市軌道交通流量預測變得愈發重要，它能夠提升運營效率并改善乘客體驗。傳統的預測方法往往難以處理復雜的交通模式和節點間關系，文章提出了一種基于圖神經網絡（GNN）的城市軌道交通流量預測優化方法。GNN通過有效捕捉軌道網絡中車站之間的關系，結合歷史流量數據及其他影響因素，可以實現高效的流量預測。研究首先分析了現有方法的局限性，然后設計并實現了一種基于GNN的預測模型，通過多層信息傳遞和節點狀態更新，顯著提升了流量捕捉能力。研究成果為城市軌道交通管理提供了新的技術手段，也為相關領域的研究奠定了理論基礎與實踐依據。

關鍵詞圖神經網絡；城市軌道交通；流量預測

中圖分類號 U293 文獻標識碼 A 文章編號 2096-8949（2025）03-0028-05

0 引言

在現代城市的快速發展中，城市軌道交通系統承載著越來越多的人口流動需求。隨著城市化進程的加快，城市軌道交通的建設及其有效管理變得尤為重要。城市軌道交通的流量預測，是確保軌道交通系統高效運營的關鍵環節。準確的流量預測可以為城市交通管理者提供重要依據，以優化運營調度、提高乘客服務質量并合理配置資源。例如在高峰時期，運營商可以根據預測的流量調整列車發車頻率，避免出現乘客擁擠等情況；而在平峰期，企業能夠減少運營成本，避免資源浪費。傳統的流量預測方法通常基于歷史數據和簡單的統計模型，在處理數據的非線性特征和復雜關系時表現不足，導致預測效果不佳。此外，城市軌道交通的流量受天氣、節假日、突發事件及城市活動等多種因素的影響，簡單的預測模型難以提供足夠的準確性。該文旨在使用圖神經網絡對城市軌道交通流量進行優化預測，以期提升預測的準確性和可靠性。圖神經網絡通過利用圖結構的特性，能夠有效地捕捉節點間的復雜關系，從而提供更為精確的流量預測。

1 現有城市軌道交通流量預測方法及不足

1.1 傳統預測方法

（1）時間序列分析。時間序列分析是預測流量的經典方法之一，常用的模型包括自回歸整合滑動平均模型（ARIMA）。ARIMA通過分析歷史流量數據的時間序列特性，探尋其內在規律并進行預測。這種模型能夠對數據的季節性波動進行建模，適合于相對平穩的數據集。其不足之處包括：1）線性假設：ARIMA模型建立在一系列線性假設的基礎上，難以適應流量數據中的非線性特性。2）模型選擇復雜：多種參數選擇會顯著影響預測效果，選擇合適的模型和參數需要大量經驗和試驗。

（2）回歸分析。回歸分析方法，如線性回歸和多元線性回歸，經常用于預測交通流量，利用歷史流量及相關變量（如天氣、節假日等）進行建模。其不足之處包括：1）受限于假設前提：這些模型通常假設自變量與因變量之間的線性關系，而現實中交通流量與許多因素之間的關系復雜且非線性。2）對異常值敏感：回歸分析對數據中的異常值較為敏感，可能導致模型失效[1]。

1.2 機器學習方法

隨著機器學習技術的發展，支持向量機（SVM）、決策樹等模型在交通流量預測中得到了廣泛應用。這些方法能夠處理大量特征并捕捉復雜關系，改善了傳統方法的預測效果。其不足之處包括：1）特征選擇問題：機器學習模型的效果往往依賴于特征選擇和數據準備，這一過程可能費時且難以標準化。2）過擬合風險：在小樣本數據集上進行訓練時，容易發生過擬合，導致模型在實際應用中的預測能力下降。

綜合來說，雖然現有的流量預測方法在一定程度上提高了預測精度，但仍存在諸多不足。傳統方法的局限性使得它們無法有效捕捉復雜的交通流模式，而基于機器學習的方法在處理城市軌道交通網絡的節點間關系時則顯得力不從心。因此，有必要引入一種新興技術，以處理城市軌道交通流量數據的高維性、復雜性及其空間結構特性[2]。

2 什么是圖神經網絡

圖神經網絡（Graph Neural Network，GNN）是一類用于處理圖結構數據的深度學習框架。隨著網絡結構數據處理需求的增加，GNN將深度學習技術與圖論相結合。GNN的核心在于能夠從圖中學習節點間的關系與特征，并通過迭代的方式不斷更新節點的表示，從而實現任務的優化（如分類、預測、聚類等）。GNN特別適用于具有復雜關系的系統，能夠在不規則的拓撲結構上進行有效的信息學習與推理，這一特性使其在交通、社交網絡、通信等諸多領域展現了廣泛的應用潛力。在GNN中，圖的基本構件包括節點（Node）、邊（Edge）與鄰域（Neighborhood）：

節點：圖中的基本單元，代表不同的實體。在城市軌道交通中，節點可以表示車站、列車等。

邊：連接節點的關系，稱為邊。邊是單向或雙向的，表示節點之間的交互或聯系。在地鐵系統中，邊可以表示列車行駛的軌道。

鄰域：指某個節點直接相連的其他節點集合，通常用于表示社交網絡中一個用戶的朋友或軌道交通中一個車站的相鄰站點。

GNN的核心在于其信息傳遞與聚合機制，這是GNN能夠進行有效學習的重要基礎：

信息傳遞：在GNN的每一層中，每個節點均會從其鄰域節點接收信息。這一過程通常通過匯聚鄰域節點特征進行完成，即將鄰域節點的特征向量傳遞到中心節點。

聚合機制：聚合是對節點信息進行整合的步驟，它可以采用多種函數，從而生成新的節點表示。通過多層的迭代信息傳遞與聚合，節點的表示能夠不斷更新，以適應整個圖的特征。通過這種機制，GNN能夠在保留圖結構特性的基礎上，實現對節點結構數據的全面分析，為城市軌道交通流量預測的優化提供強有力的支持[3]。

3 基于圖神經網絡的城市軌道交通流量預測優化方法

在城市軌道交通流量預測優化的過程中，圖神經網絡提供了一種全新的建模方法，其能夠充分利用圖結構數據的特性，進行有效的流量預測優化。

3.1 模型構建

在進行流量預測優化之前，首先需要將城市軌道交通系統建模為圖結構，以便能夠通過圖神經網絡進行分析和優化。

（1）將城市軌道交通系統建模為圖結構。

城市軌道交通系統可以看作一個由節點（站點）和邊（線路）組成的圖。其中，每一個站點可以視為圖中的一個節點，而站點之間的軌道連接則構成了圖的邊。通過這種方式，能夠利用圖的結構信息進行流量預測優化。

（2）節點和邊的定義，圖的特征選擇。

1）節點定義：每個節點代表一個具體的車站，其屬性可以包括站點的名稱、位置、旅客流量、換乘信息等。這些屬性有助于模型更好地理解站點的特性及其對整體運輸的影響。

2）邊定義：邊表示兩個車站之間的連通性，邊的屬性可以包括列車運行時刻、列車間隔、路線長度、預估旅行時間等。這些信息不僅反映了車輛行駛的路徑，還可以表示站點之間的運輸能力和旅行便利性。

3）圖的特征選擇：為了使模型具備更好的學習能力，特征的選擇至關重要。可選擇的特征包括節點的流量特征（當前旅客數、歷史流量數據）、邊的時間特征（列車運行時間、希望的間隔時間），以及其余可能對流量預測有影響的因素（例如天氣、事件等）。

3.2 圖神經網絡實現步驟

在構建好模型后，接下來的步驟是通過GNN對數據進行分析和優化。

（1）數據準備與預處理。

1）數據收集：從城市軌道交通系統的運營數據中收集相關信息，構建完整的圖；數據來源可以是歷史運行記錄、乘客流量監測、車站傳感器數據等。2）數據清洗：對收集到的數據進行處理，去除重復、缺失或異常值，以確保數據的準確性與完整性。3）特征歸一化：對特征進行歸一化處理，確保不同范圍的特征能夠對GNN模型的學習產生同等影響。

（2）GNN模型的選擇與調整。

1）模型選擇：可以根據需求選擇適當的GNN結構，目前常用的有GCN（圖卷積網絡）、GAT（圖注意力網絡）等；選擇應基于圖的特性、復雜性，以及任務的具體要求。2）模型調整：根據模型的初步效果，針對數據集進行調整，可能包括層數、隱藏單元數目、激活函數等參數的優化；同時，可以借助交叉驗證方法，避免模型過擬合，并確保其泛化能力[4]。

3.3 影響城市軌道交通流量預測的因素分析

（1）時間依賴性。時間依賴性指的是流量數據隨時間變化而變化的特性。在城市軌道交通中，流量受多個時間因素的影響，包括以下4個因素：1）日內變化：城市軌道交通流量在一天中會有明顯的高峰和低谷，例如早高峰和晚高峰時段的乘客流量通常會顯著增加，而在深夜和清晨時段則會減少。2）周周期性：流量數據還受周周期的影響，工作日和周末的流量模式往往不同，周末可能由于休閑活動的增加而出現不同的流量模式。

3）季節性變化：不同季節（如夏季和冬季）可能會影響乘客的出行方式和頻率。4）長周期變化：隨著城市發展和人口增長，整體流量趨勢也會發生變化，這種變化可能需要長期的數據分析進行捕捉。

（2）空間依賴性。空間依賴性指的是不同站點之間流量的相互影響。城市軌道交通網絡是一個復雜的圖結構，其中每個站點（節點）和它們之間的連接（邊）共同影響著流量：1）站點間的流動性：某些站點可能是重要的換乘站，流量在這些站點之間的流動性較強，例如若某個站點的流量增加，可能會影響與其相連的其他站點的流量變化。2）地理位置：站點的地理位置（如靠近商業區、住宅區、學校等）會影響乘客的出行模式和流量，例如靠近大型購物中心或商業區的站點通常會在特定時段（如周末、節假日）出現流量激增。3）交通網絡結構：城市軌道交通的網絡結構（如環形、放射狀等）也會影響流量分布，例如環形線路的某些站點可能會因為換乘便利性而吸引更多的乘客。

（3）其他潛在因素驅動的站間相關性。除了時間和空間因素，其他潛在因素也會驅動站間流量的相關性：

1）社會經濟因素：如居民收入水平、人口密度、就業率等，都會影響乘客的出行需求和流量模式。2）出行目的：不同的出行目的（如通勤、購物、休閑等）會導致不同的流量模式。3）城市發展政策：政府的交通政策、基礎設施建設和公共交通服務的改善等，都會影響乘客的出行選擇，進而影響流量。在GNN模型中，這些潛在因素可以通過引入額外的特征（如社會經濟數據、出行目的等）進而增強模型的預測能力。

（4）外生因素。外生因素是指那些不在模型控制范圍內，但對流量產生顯著影響的因素。這些因素包括如下：1）節假日：節假日通常會導致流量模式的顯著變化。2）天氣變化：天氣條件（如雨雪、霧霾、極端高溫等）會直接影響人們的出行意愿。3）重大事件：如大型活動、體育賽事、音樂會等，都會導致特定站點的流量，在事件發生前后出現劇烈波動。在GNN模型中，可以通過引入外生因素的特征（如節假日指示變量、天氣數據、事件日歷等）進而增強模型的預測能力，使其更好地適應這些突發性變化。

4 基于圖神經網絡的城市軌道交通流量預測優化實例

4.1 背景

以某城市軌道交通系統為例，通過其官方平臺公布的流量數據為依據，制定基于圖神經網絡的城市軌道交通流量預測優化方案。

4.2 優化目標

提升流量預測的準確性和實時性，以支持更智能的交通管理決策。

4.3 模型框架圖

建立模型框架圖，如圖1所示。

4.4 基于圖神經網絡的城市軌道交通流量預測優化的數學模型

（1）數據生成模型。

流量計算公式如下：

（1）

式中，——站點i在時間段j的流量；——基礎流量，包含早晚高峰的影響；——天氣因素，取值為0.8（不良天氣）、1.0（正常天氣）或1.2（良好天氣）；——節假日因素，若為節假日則=1.2，否則=1.0。

其中，，。的概率分布為，，。

（2）圖數據構建。

圖結構的相關參數如下：

節點特征：每個節點的流量特征向量。

邊索引E：表示節點之間的連接關系，假設每個站點與相鄰站相連。

（3）GNN模型。

1）第一層線性變換的公式如下：

（2）

式中，——第一層輸出特征矩陣；——第一層權重矩陣；——第一層偏置項；——激活函數（ReLU）。

2）第一層線性變換的公式如下：

（3）

式中，——第二層輸出特征矩陣；——第二層權重矩陣；——第二層偏置項。

3）輸出層的公式如下：

（4）

式中，——最終輸出（預測流量）；——輸出層權重矩陣；——輸出層偏置項。

4）損失計算的公式如下：

（5）

式中，——損失值；——樣本數量；——真實流量；——模型預測的流量。

4.5 代碼實現

（1）開發環境。

操作系統是Windows10系統，程序運行的平臺軟件是PyCharm，使用的語言為Python，Python版本為3.9.13。

（2）所需庫與工具。

PyTorch：一個流行的深度學習框架，支持GNN模型的構建與訓練。

鑒于原始庫的下載速度較慢，推薦使用清華大學鏡像進行安裝，可以通過以下命令執行：

pip install -i https：//pypi.tuna.tsinghua.edu.cn/simple torch torchvision torchaudio torch-geometric

下面的代碼示例，實現了基于GNN圖神經網絡的城市軌道交通流量預測優化，模擬了10座車站的流量預測。

import torch

import torch.nn as nn

import torch.optim as optim

from torch_geometric.data import Data， DataLoader

import numpy as np

import pandas as pd

from sklearn.preprocessing import StandardScaler

# 生成模擬數據

def generate_synthetic_data（num_stations=10， num_time_slots=48， num_samples=1000）：

data = []

for _ in range（num_samples）：

for station in range（num_stations）：

time_slot = np.random.randint（0， num_time_slots）

flow = np.random.poisson（lam=20 + 10 * （time_slot in range（6， 9） or time_slot in range（17， 20）））

weather_factor = np.random.choice（[0.8， 1.0， 1.2]， p=[0.3， 0.4， 0.3]）

holiday_factor = 1.2 if np.random.rand（） lt; 0.1 else 1.0

final_flow = flow * weather_factor * holiday_factor

data.append（[station， time_slot， final_flow]）

return pd.DataFrame（data， columns=['station'， 'time_slot'， 'flow']）

# 生成數據

data = generate_synthetic_data（）

print（\"Synthetic data generated.\"）

# 數據預處理

scaler = StandardScaler（）

data['flow'] = scaler.fit_transform（data['flow'].values.reshape（-1， 1））

# 構建圖數據

def create_graph_data（data， num_stations=10）：

edge_index = []

x = []

for station in range（num_stations）：

station_data = data[data['station'] == station]

x.append（station_data['flow'].values）

if station gt; 0：

edge_index.append（[station， station - 1]）

edge_index.append（[station - 1， station]）

if station lt; num_stations - 1：

edge_index.append（[station， station + 1]）

edge_index.append（[station + 1， station]）

edge_index = torch.tensor（edge_index， dtype=torch.long）.t（）.contiguous（）

x = torch.tensor（np.array（x）， dtype=torch.float）.view（num_stations， -1）

return Data（x=x， edge_index=edge_index）

# 創建圖數據

graph_data = create_graph_data（data）

# 定義GNN模型

class GNNModel（nn.Module）：

def __init__（self， num_features）：

super（GNNModel， self）.__init__（）

self.conv1 = nn.Linear（num_features， 16）

self.conv2 = nn.Linear（16， 8）

self.fc = nn.Linear（8， 1）

def forward（self， data）：

x， edge_index = data.x， data.edge_index

x = torch.relu（self.conv1（x））

x = torch.relu（self.conv2（x））

x = self.fc（x）

return x

# 模型訓練

def train_model（model， data， num_epochs=100）：

optimizer = optim.Adam（model.parameters（）， lr=0.01）

loss_function = nn.MSELoss（）

for epoch in range（num_epochs）：

model.train（）

optimizer.zero_grad（）

output = model（data）

# 目標值需要調整形狀

target = data.x[：， -1].view（-1， 1）" # 將目標值調整為（10， 1）

loss = loss_function（output， target）" # 計算損失

loss.backward（）

optimizer.step（）

if epoch % 10 == 0：

print（f'Epoch {epoch}， Loss： {loss.item（）}'）

# 實例化模型并訓練

num_features = graph_data.x.shape[1]

model = GNNModel（num_features）

train_model（model， graph_data）

# 測試模型

model.eval（）

with torch.no_grad（）：

predictions = model（graph_data）

print（\"Predictions：\"， predictions.numpy（））

注意事項：

該代碼是一個基礎示例，在實際應用中可能需要更復雜的數據預處理和模型調優。

可以根據需要擴展外部因素的影響，比如節假日和重大事件的流量變化，可以通過在輸入數據中添加額外的特征進行實現。

4.6 程序測試結果

程序運行結果如圖2所示：

運行結果展示了經過圖神經網絡優化后的10座車站的流量預測，其中包括訓練之后的損失率及最終預測結果，實驗達到了預期目的。基于該程序后期可以擴展各種外部因素，可以通過添加額外的特征到輸入數據，多次運行進行流量預測，并進行比對，從而更好地調整運行圖及車站工作，以應對各種客流情況的出現。

5 結語

該文利用圖神經網絡的優勢，刻畫了城市軌道交通系統中各站點之間的復雜關系，提升了流量預測的準確性和實時性。通過對交通流量的動態建模，GNN能夠有效融合時間、天氣、節假日等多種影響因素，從而實現更為可靠的預測。看似簡單的流量預測實則蘊含著多維度的復雜性，未來的研究可以集中在模型的可解釋性和泛化能力上。通過引入更多的外部變量，進一步提升模型的預測性能和適應性。同時，結合實時數據與在線學習機制，未來的城市軌道交通流量預測系統將更靈活、高效地應對不斷變化的城市交通需求。此外，隨著技術的不斷進步和數據采集手段的豐富，GNN在城市交通管理中的應用前景廣闊，有望為智慧城市建設提供重要的技術支撐。因此，基于GNN的城市軌道交通流量預測將持續為城市交通管理提供科學依據，推動城市可持續發展。

參考文獻

[1]郭娟，劉雪鋒，譚萬波.城市軌道交通客流預測分析[J].建材與裝飾， 2017（46）：257.

[2]包磊.城市軌道交通客流量實時預測模型[J].城市軌道交通研究， 2017（5）：104-106+111.

[3]王君妝，譚冬平.融合路徑優化的異構圖神經網絡算法[J].軟件， 2024（8）：42-44.

[4]李文彬，許雁玲，鐘志楷，等.基于穩定學習的圖神經網絡模型[J].湖南理工學院學報（自然科學版）， 2023（4）：16-18.

收稿日期：2025-01-23

作者簡介：朱佾（1982—），男，碩士研究生，講師，研究方向：計算機、網絡安全、汽車、軌道交通。

交通科技與管理2025年3期

交通科技與管理的其它文章: 黏土地層泥水盾構停機風險分析; 公路攤鋪機故障診斷與維修技術研究; 海上專業救撈力量能力發展分析思考; 生成式人工智能背景下“橋梁工程”課程的改革與實踐; 長三角地區深度融入“一帶一路”鐵路貨運發展研究; 面向地鐵站內設備隱患的場景化知識圖譜構建方案研究