范馨月
(貴州大學 數學與統計學院 數學系,貴州 貴陽 550025)
交通流量作為刻畫交通狀態的基本參數,在城市路網的交通流狀態識別中顯得尤為重要。交通流量預測按照預測時間長短可以分為長時交通流預測及短時交通流量預測,其中短時交通流量預測時間跨度一般不超過15分鐘。短時交通流量準確預測在實際應用中對于智能交通系統建設及路徑規劃具有重要的意義。對于短時交通流的預測已有許多研究,常用的預測方法有回歸預測模型[1]、基于混沌理論的預測模型[2]、支持向量機、人工神經網絡預測模型[3-4]等。由于交通流量具有隨機性、時變性,序列數據比較復雜,采用回歸預測模型對交通流量進行預測誤差較大。神經網絡依靠其強大的學習能力及容錯能力應用也較為廣泛,但BP神經網絡模型對于短時交通流量的預測學習效率較低,容易陷入局部最優解,對模型的精度有一定的影響。極限學習機(extreme learning machine,ELM)是一種新型的快速學習算法,對于單隱層前饋神經網絡(single-hidden layer feedforward neural networks,SLFNs),極限學習機與傳統的支持向量機、反向傳播神經網絡相比,繼承了神經網絡逼近非線性函數的優點,它在隨機初始化輸入層和隱含層之間的權值連接矩陣與偏差的基礎上,將傳統神經網絡訓練問題轉化為求解線性方程組,并根據廣義逆矩陣理論,以解析方式直接計算出其輸出權值的最小二乘解,具有原理簡單、訓練速度快、預測精度高且泛化能力好的特點。ELM在保證學習精度的前提下,速度較傳統的學習算法快。后續有研究采用群體智能算法優化ELM的隱含層節點參數改進網絡結構,引入粒子群優化算法對ELM隱含層節點參數進行調整,提高ELM的泛化能力及穩定性[5]。一些學者[6-10]將ELM拓展到深度學習領域,提取更抽象的高層特征,提高網絡模型的整體性能。研究結果表明深度極限學習機可以提取數據中高層次的抽象信息,避免了網絡權值的反復迭代調整,提高了計算效率。小波降噪在處理含噪聲信號的分析中有較好的降噪效果,提取出有用的信號對信號的特征提取及預測有較好的效果,大量學者采用小波降噪和神經網絡組合預測,取得了不錯的效果[11-12]。
該研究采用小波降噪的深度極限學習機(DWD-ELM)對實驗城市路網中路口流量進行訓練并對路口短時交通流量進行預測,實驗結果表明利用半監督的逐層訓練機制可以解決城市道路道路交通流量差異帶來的實際差異問題,在處理含噪聲交通流數據時預測準確率較高,且具有較好的魯棒性。
由于交通系統具有非線性性及復雜性,交通流量的變化受到強噪聲的影響也有隨機時變性的特征。因此,在對交通流量進行短時預測時先進行降噪處理,可以得到更為真實可靠的反映交通流規律的時間序列。小波降噪綜合了特征提取及低通濾波,尋找對原序列的最佳逼近[13]。
小波降噪流程如下:(1)采用小波基函數將含有噪聲信號的車流量序列進行分解,分解為高頻信號序列和低頻信號序列;(2)對高頻信號序列進行閾值處理,以去除其中包含的噪聲;(3)小波重構(小波逆變換)并輸出降噪后的信號序列。離散型的小波變換定義為:
極限學習機是一種針對單隱層前饋神經網絡的分類算法,采用批處理的訓練方式,隨機選取隱含層的權值和偏置,不需要迭代,通過計算輸出層的權值來完成學習任務。對于不同的訓練樣本數據(Xi,Yi),X=[X1,X2,…,XN]T∈N,Y=[Y1,Y2,…,YN]T∈m,網絡中含有L個隱層節點。
(1)
其中,ωi=(ωi1,ωi2,…,ωiN)N為連接i個隱含層節點與輸入節點的輸入權值向量,bi為第i個隱含層節點的偏置,隱含層到輸出層之間的偏置為c∈m。βi=(βi1,βi2,…,βiN)T為連接第i個隱層節點和輸出節點的輸出權值向量,σ(·)為激活函數,式(1)改寫為矩陣形式為:
β·H+C=Y
(2)

其中,H表示訓練樣本隱含層節點的輸出特征矩陣,β=(β1,β2,…,βN)T為隱含層輸出權值,C=[c,c,…,c]∈m×N,Y=(Y1,Y2,…,YN)T為期望輸出,優化的目標函數為經驗損失函數。
這里為計算方便,設C=0∈m×N,ELM的訓練過程等價于求解線性方程組(2),隱含層和輸出層之間的連接權值β不需要迭代調整。輸入權重ai和神經元偏置bi在[-1,1]內隨機取值,輸出權重便可以通過求解線性方程(2)矩陣H的Moore-Penrose廣義逆H?獲得,即這里
(3)

文獻[14]呈現了Sigmoid函數在歷遍0到100的隱含層節點中準確率高且穩定的優勢,多數ELM的激活函數采取Sigmoid函數。
圖2示,PLAGL2強染色多見于低分化、高分期以及淋巴結轉移陽性的病理標本。通過對PLAGL2蛋白表達水平和PCa患者臨床病理參數進行分析,表1示,PLAGL2表達情況與PSA水平(χ2=19.652,P=0.003)、Gleason評分(χ2=60.920,P<0.001)、PI-RADS評分(χ2=13.147,P=0.004)、臨床分期(χ2=38.203,P<0.001)、淋巴結轉移(χ2=36.875,P<0.001)、包膜侵犯(χ2=9.943,P=0.017)和精囊侵犯(χ2=8.355,P=0.031)有關聯。
單隱層的ELM結構如圖1所示。ELM的優勢在于只需要設置網絡的隱含層節點數,輸入層和隱含層的連接權值、隱含層的閾值可以隨機設定,并產生唯一的最優解。和BP神經網絡不同,BP需要不斷反向調整權值和閾值,因此這里可減少一半的運算量。盡管ELM在許多研究中具有良好的表現,但由于交通流數據的不平衡分布及其具有冗余信息,帶有噪聲以及離群點,噪聲對極限學習機的預測準確率造成嚴重影響,從而影響了極限學習機的泛化能力。

圖1 單隱層ELM結構

小波降噪的深度極限學習機(wavelet de-noising deep extreme learning machine,DWD-ELM)將樣本數據(Xi,Yi)分為訓練集X=[X1,X2,…,XN]T∈N,Y=[Y1,Y2,…,YN]T∈m用于精調整個網絡,測試集N類似于逐層學習參數初始化,用于學習層級之間的參數,網絡中含有l=1,2,…,L個隱含層[15],則:
(4)

(5)


圖2 DWD-ELM網絡結構
同樣,矩陣H的Moore-Penrose廣義逆H?可通過式(3)計算得到。深度極限學習機可以提取出高層次的語義信息,極限學習機的理論避免了網絡權值的反復迭代調整,從而提高計算效率。此外,深度極限學習機采用半監督逐層訓練機制有效解決了許多實際問題中的訓練標簽難以準確獲取的問題。采用小波降噪結合深度極限學習機解決了在處理非線性異構數據特征難以獲取及訓練難等問題。
文中采用實驗城市的電子警察、卡口檢測到的過車數據進行研究及算法驗證,數據處理時間段為2020年一年的過車數據,按五分鐘為單位統計每日各路口的車流量。工作日期間不同車流量會呈現不同的規律性特征,限號城市由于受到號牌限制規律性更為突出。2020年由于新冠疫情的影響實驗城市取消限號政策,市民多選擇乘坐私家車出行,對交通狀態的影響較大。本研究采用2020年全年過車數據研究路段每個星期/周的歷史車流量進行訓練,從而增強數據特征。圖3為某路段2020年4月連續三個星期四車流量時間序列,序列受到噪聲干擾,為非平穩的時間序列,具有非線性的特征且受到強噪聲干擾。

圖3 實驗城市2020年4月連續三個
對圖3中4月16日的交通流量采用db10小波函數降噪處理,降噪后的車流量衰減數據更加平滑并保留了原始數據的尖峰點,在最大程度保留原始序列真實性的同時盡可能消除原始數據中的噪聲,見圖4、圖5。

圖4 降噪效果
分別采用DWD-ELM模型、原ELM模型和NN模型對2020年5月實驗路口5分鐘流量進行訓練。BP取最大神經元個數為500個,擴展速度為2,誤差為0.000 01。DWD-ELM模型能較好地擬合短時路口交通流量,平均絕對誤差為0.234%,相對誤差絕對值平均值為0.002 9,均方根誤差為0.699 9,對路口預測效果優于原ELM模型和BP模型,見圖6及表1。

時間

圖6 三種預測模型對2020年4月23日高峰時段

表1 三種預測模型效果
采用文中建立的DWD-ELM、原ELM和BP神經網絡對實驗城市2020年4月23日某路口高峰時段車流量作預測,并和實際值進行對照檢驗,比較實際值和預測值的誤差,見圖6及表1。DWD-ELM各項誤差指標均低于原極端學習機模型和BP神經網絡,可用于短時交通流的預測。
文中對含有隨機噪聲的交通流量進行小波降噪處理,建立了小波降噪的深度極限學習機預測模型,與傳統的極限學習機和BP神經網絡預測結果進行比較,得到較為可靠的短時交通流量預測值,具有較高的預測精度,為后續交通擁堵動態預測提供了一種解決思路。BP神經網絡雖然具有精度高、非線性映射能力強等特點,但在大規模交通數據預測時,容易出現過擬合。傳統的極限學習機具有精度高、學習速度快、參數調整簡單等優勢,鑒于深度網絡優秀的特征提取能力,在處理大規模數據時降低計算復雜度,減少訓練時間。將經過降噪處理后的序列與深度極限學習機相結合,具有良好的特征表達能力和較好的預測效果。需要指出的是,文中未考慮城市路段的上下游拓撲關系,未來可以考慮空間位置關系進行特征提取,以進一步提高預測的準確性。