蘭添賀,曲大義,陳 昆,劉浩敏
(青島理工大學 機械與汽車工程學院,青島 266525)
城市道路交通具有路網復雜,交通流量大和潮汐性明顯等特點[1]。隨著汽車保有量的增加,交通擁堵的情況日益頻發,顯著影響了城市居民的出行。因此采用先進的技術手段,對城市路段的車流量進行監測和預測,成為智能交通領域的研究熱點之一[2]。短時交通流預測可以為交通管理控制和出行選擇提供幫助。近年來,國內外學者對短時交通流預測進行了大量的研究,提出多種方法提高交通流預測的準確度。
目前交通流預測的方法主要分為兩類[3],一種是基于傳統數理統計模型和回歸分析模型的預測方法[4-5],另一種是基于機器學習算法及其優化改進模型的預測方法[6-7]。其中傳統數理統計回歸分析方法主要有歷史平均法模型(Historical Average Method, HAM)[8]、線性回歸模型(Linear Regression, LR)[9]、卡爾曼濾波模型[10]和指數平滑模型[11]等。但是交通流量往往具有隨機性強和數據量巨大的特點,傳統方法很難達到理想的預測效果,因此基于機器學習算法的預測模型成為交通流預測研究的熱門方向。機器學習算法具有收斂速度快和適應力強的特點,能夠大大提升交通流預測的準確度[12]。VLADIMIR等[13]提出一種能夠實時進行短時交通流預測的模型,該模型采用隨機森林算法(Random Forests, RF)。RF算法參數少,訓練速度快。通過實際數據證明了該算法具有更快預測速度和更低的預測誤差。DINH等[14]為了提高交通流預測模型的性能,將SVM算法與K近鄰算法相結合,在保證一定準確度的前提下,進一步提高了模型的訓練速度和訓練規模。RAJALAKSHMI等[15]以多層感知機(Multilayer Perceptron, MLP)算法為模型框架,建立交通流預測模型,并使用粒子群優化算法對MLP算法的權重和閾值進行優化,從而實現動態調整MLP的網絡參數。實驗結果表明,優化的MLP交通流預測模型具有更穩定的預測效果。
綜上所述,機器學習模型有效提升了交通流預測的準確度。但是面對復雜多樣的城市道路,需要模型具有更好的通用性和更高的準確度,因此本文使用布谷鳥搜索算法(Cuckoo Search, CS)對SVM模型的重要參數進行優化,以期提高對不同類型城市道路交通流預測的準確度。將青島市的多組典型城市道路交通流量數據作為研究對象,設置HAM模型、LR模型、MLP模型、RF模型和SVM模型作為對比實驗模型,驗證CS-SVM模型的優越性。
SVM模型在被提出后得到了快速的發展。SVM模型被廣泛應用于回歸分析、文本分類和模式識別等問題中,并取得了良好的效果[16]。其中支持向量機回歸(Support Vector Regression, SVR)是SVM的重要分支。SVR模型能夠進行回歸預測分析,核心思想是讓目標集合中所有的點到回歸平面的距離最近。
設樣本集為A={(xk,yk),k=1,2,3,…,n},將變量x通過非線性變化σ()映射到高維特征空間H中。其次構建線性回歸函數g(x)=ωTσ(x)+b,并以此構建二次規劃方程如下:
(1)


(2)

最終將回歸問題的求解方程表示為
(3)
YANG等通過觀察自然界中布谷鳥的產卵行為,提出一種優化算法--布谷鳥搜索算法(Cuckoo Search, CS)[17]。CS算法具有較強的全局搜索能力,并且具有內置參數少、計算容易等特點。CS算法的核心思想為:模擬布谷鳥的飛行尋找過程,尋找最為合適的鳥巢用于孵化鳥蛋。
設布谷鳥每次產出α個鳥蛋,在一定鳥巢數量的范圍下,鳥巢主人發現鳥蛋不是自己出產的概率為φ(φ∈[0,1])。布谷鳥的搜索過程和孵蛋過程如下:
首先,初始化鳥巢的數量和位置,設鳥巢數量為β。設置適應度函數,并第一次對每個鳥巢的合適程度進行評價。每個鳥巢的主人通過Levy飛行搜索機制對鳥巢進行修補,設搜索最大次數為N。評價修補后的鳥巢與之前鳥巢的合適程度,并按照貪婪法則保留更優的鳥巢,計算過程如下:
ηi,t+1=ηi,t+l·L
(4)

u,v服從的均勻分布函數如下:
(5)
式中:Γ為伽瑪函數;λ為調整參數,取值范圍為[0,1]。
其次,如果發現外來鳥蛋,鳥巢主人將對鳥巢進行修補,修補的概率為φ。計算過程如下:
ηi,t+1=ηi,t+φ(ηj,t-ηi,t)
(6)
式中:ηj,t為ηi,t鄰近的鳥巢;φ取值[0,1]。
最后,鳥巢主人將修補后的鳥巢與當前適合程度最高的鳥巢進行比較,留下適合程度更高的鳥巢進行產蛋孵化。判定是否達到最大搜索次數,若沒有達到最大次數則繼續以上步驟尋找適合程度最佳的鳥巢;若達到最大次數,則停止搜索開始產蛋孵化。
SVM模型中的重要參數為C和epsilon。其中C為懲罰系數,體現在對樣本中錯誤數據的容忍程度。當數據較為分散隨機時,應將C設置調高,以舍棄更多的數值,提高模型的泛化能力;當數據規律性明顯、數據較為統一時,應將C設置調低,保留更多數值的特征,以提高擬合結果的準確度。自由參數通常通過實驗和歷史經驗進行設定,存在不確定性。當模型面對不同城市路段的交通流數據時,往往需要根據數據的特點進行參數調整,因此參數選擇很大程度上影響最終預測結果的準確性。

(7)

基于上述改進,SVM模型的優化過程如下:
步驟1:將原始交通流數據序列化分組,作為輸入數據。設置初始參數的數值,建立SVM模型。
步驟2:將隨機生成的β個鳥巢位置設為Wi,t=[xt,c,xt,e],xt,c為第t次迭代i鳥巢的c位置分量,對應SVM的參數C;xt,e為第t次迭代i鳥巢的e位置分量,對應SVM的參數epsilon。計算鳥巢位置的適應度函數,將Wi,t作為當前的最適合鳥巢。
步驟3:對鳥巢進行修補和位置更新,并對更新的位置加入擾動因子。將加入擾動因子的最新鳥巢位置和上一個鳥巢位置進行對比,保留適應度更高的鳥巢位置,作為當前的最佳鳥巢。
步驟4:判定是否達到設定的最大搜索次數,如果沒有達到最大次數則重復上述步驟;如果達到最大次數,則停止訓練,并將當前計算的鳥巢位置作為最佳結果。
步驟5:將最佳鳥巢位置分量作為SVM模型的對應參數C和epsilon。對每一組城市道路交通數據進行訓練,獲取預測結果,從而建立基于CS-SVM模型的短時交通流預測模型。優化過程流程如圖1所示。

圖1 優化過程流程
選擇青島市即墨區的城市交通流量數據作為研究對象。數據的收集時間為2021-10-31-2021-11-13,總計14 d。交通流量數據的時間間隔為5 min,每個路段的數據量為4032個。將收集的數據進行整理和清洗。對于數據出現空缺的問題,考慮到交通流數據具有周期性和規律性,且車流量的變化是隨時間變化而逐漸增減的,因此將空缺位置附近兩個數據的平均值作為填補數據。并設置有效數據區間,去除無效數據。為檢驗本文提出的模型具有廣泛適用性,收集4個不同路段的交通流量數據進行研究。4個不同的典型城市路段如下:
即蘭路:雙向六車道,為地面開放式道路。最高車輛數為81輛。車流量稀疏,鄰近郊區。
青威路:雙向八車道,為地面開放式道路。最高車輛數為145輛。鄰近學校,潮汐特征明顯。
墨城路:雙向六車道,為地面開放式道路。最高車輛數為139輛。鄰近商業區。
海爾路:雙向六車道,道路延伸處與多條縱向干線以非立體交通的形式交匯。最高車輛數為122輛。
即蘭路(JLR)、青威路(QWR)、墨城路(MCR)和海爾路(HER)的數據信息見表1。

表1 路段數據信息
CS-SVM模型的對比模型設置為:HAM模型、LR模型、MLP模型、RF模型和SVM模型。將時間步長設置為12(12×5=60 min)。MLP模型的學習率設置為0.0001,一次性的投放抓取次數設置為128。所有模型訓練集和測試集的比例為0.2。訓練輪數epoch設置為300。CS-SVM模型的鳥巢數量設置為20,最大飛行搜索次數設置為100,擾動系數?取值為0.5。

表2為所有模型的短時交通流預測結果。從表2可以看到,CS-SVM模型的預測誤差明顯低于其他對比模型。其中相比傳統數理統計和回歸分析模型,CS-SVM具有顯著的提升。4個路段的MAE值,CS-SVM相比HAM模型和LR模型平均下降了39.62%和31.59%。4個路段的RMSE值,CS-SVM相比HAM模型和LR模型平均下降了38.64%和29.11%。此外,CS-SVM具有比傳統機器學習模型更高的準確度。CS-SVM模型相比MLP模型和RF模型的MAE值平均下降了20.10%和10.04%,相比MLP模型和RF模型的RMSE值平均下降了19.84%和9.54%。同時,CS-SVM模型相比沒有加入CS算法優化的SVM模型,在MAE值上4個路段平均下降了6.56%,在RMSE值上4個路段平均下降了7.36%??梢姳疚奶岢龅腃S-SVM模型具有更高的準確度和更廣泛的適用性。

表2 短時交通流預測結果
圖2為CS-SVM算法優化過程中的迭代次數和適應度值變化曲線。

圖2 迭代次數和適應度值
由圖2可以看出,4個路段的CS-SVM算法均在35次以內求出了最佳適應度鳥巢位置。因此CS-SVM算法在參數優化過程中能夠快速收斂。并且在面對不同路段時,CS-SVM算法均能表現出良好的優化效果,具有高效穩定的優點。
為了提高交通流預測模型的準確度和適用性,本文使用CS算法對SVM的重要參數進行優化。同時為了進一步提高CS算法的優化效果,加入擾動因子加強CS算法尋找鳥巢位置的隨機性和變異能力。為驗證CS-SVM模型的預測效果,選用4組青島市的典型城市交通流量數據作為研究對象,并與HAM模型、LR模型、MLP模型、RF模型和SVM模型進行對比。實驗結果表明,CS-SVM模型具有更小的預測誤差,并且面對4條不同的路段均能表現出良好的模型性能。因此,本文提出的CS-SVM模型能夠有效提升短時交通流預測的準確度,能夠為交通組織優化、居民出行選擇和交通流理論研究等方面提供相應的幫助。