李運








關鍵詞:BP神經網絡;深度置信網絡;城市軌道;客流量;培訓系統
在現代城市的建設中,城市軌道設施的建設與人們密切相關,影響著每一個人的日常出行。城市軌道客流量短時間迅猛增長,而車輛空間容載能力卻十分有限,軌道客流與道路空間的矛盾日益突出,造成的后果就是交通擁堵現象時常發生。
為解決這一問題,國內外眾多學者針對如何準確模擬與預測城市軌道客流進行了大量研究,Ku-mar等提出了一種基于季節的自回歸移動平均模型,該模型在對車流量的影響因素中添加了季節因素,考慮不同季節對車流量造成的影響,但是只使用了少量的輸入數據來進行模擬預測,預測結果只能說明城市軌道的短期客流量。盧志義等人通過時間序列分析的方法提出了一種基于ARMA(Auto-Regressive and Moving Average)的城市軌道交通客流量預測模型,采用天津地鐵客流量數據進行擬合與預測,取得了很好的效果。徐熠明基于灰色改良模型對上海市軌道交通日常客流量進行了預測,發現模型對于普通工作日的預測更接近真實值,對于周末以及特殊工作日預測結果表現不佳。這些傳統的交通流量預測方式采用的是轉化的思想,將流量預測問題轉化為研究時間序列預測問題,通過分析已有的時間序列數據,將提取到的特征推廣到要預測的數據上,從而預測數據未來的走向趨勢。這就需要先將采集到的交通流量數據分類整理成時間序列數據,因此對原始數據的要求很高,需要數據平穩且保持較大的數據量。
基于深度學習相關理論,可以設計與實現實訓基地培訓系統,檢測城市道路車流量的實時變化情況,進行城市軌道客流量的預測,它不僅可以關聯學習特征與學習任務,還可以自動提取數據特征背后隱藏的復雜信息,在模型網絡加深的過程中進行淺層特征的整合提取,利用組合特征來解決問題。希望通過研究為城市軌道客流量的預測提供新的研究思路,為深度學習與軌道客流預測的結合提供參考。
1基于DBN與BP神經網絡的基地培訓系統
1.1 DBN與BP神經網絡
深度學習在機器學習中屬于一個全新的領域,由于深度學習算法更加接近實現人工智能且具有良好的算法優越性而受到人們的廣泛關注。深度學習不僅僅教機器模仿人類的動作行為,更多的是教機器學會像人類一樣去思考,使機器能夠處理復雜的模式識別問題。近年來,深度學習在數據挖掘、機器學習、圖像識別、模型優化等方面都發揮著重要作用。
特征學習和深度學習交叉形成的深度置信網絡(DBN)是由BP神經網絡與多個受限玻爾茲曼機(RBM)共同構成的深度神經網絡。玻爾茲曼機中的神經網絡屬于反饋神經可以進行隨機遞歸,且每一層神經元之間都是相互連接的,各層之間也處于連接狀態,而受限玻爾茲曼機的層內神經元之間是沒有連接的,如圖1所示。
在BP神經網絡的模型訓練過程之中,先會輸入樣本,進行權重與閾值的隨機設置,加權求和得到的輸出值會作為下一層的輸入,層層迭代直至到達最終輸出,這是一個正向傳遞的過程。在正向傳遞的同時,模型也會通過最小化函數的設定與梯度下降法反復調整權重與閾值,直至實驗誤差在可接受的范圍之內,這是一個反向傳播對實驗結果進行干預的過程。BP神經網絡圖如圖2所示。
1.2實訓基地培訓系統的組成與設計
在實訓基地的設計與實現的過程中,由于不同單位在資金、場地、調研深度等方面有不同的需求,系統的設計與實現效果會存在較大差異。培訓系統的實現過程需要使用Python語言的tkinter庫進行系統設計與開發,tkinter庫是Python語言針對圖形界面開發專門提供的程序庫,它實現的系統界面簡潔,具有良好的人機交互性,通過tkinter庫編寫的軟件可以實時、快速地實現基地培訓系統,同時可以滿足系統對數據收集、數據分析與整理、模型訓練,以及城市軌道交通客流量的預測需求。構建的實訓基地培訓系統包括數據收集、實時數據分析處理、模型訓練、軌道客流預測等4個運營管理模塊,如圖3所示:
1.3系統數據收集與處理
研究的數據集為A市城市軌道交通客流量的真實數據,通過分布式傳感器系統與車輛GPS(Global Positioning System,全球定位系統)收集數據,對城市軌道線路多個點進行客流量的監測。本次實驗選用數據為城市道路交通傳感器從2019年6月1日到2020年6月1日共一年收集到的數據,收集到的數據文件包含位置信息、時問信息以及軌道交通客流量。其城市軌道交通道路分布圖如圖4所示:
整理與分析收集到的數據信息對未來的軌道交通客流量進行預測,根據均方根誤差對預測結果進行評估,均方根誤差(Root Mean Square Error,RMSE)按式(1)計算:
其中,Y是軌道客流量實際值,Y是系統模型對軌道客流量的預測值,N表示的是數據的個數。
對收集到的數據進行預處理,刪除超出范圍的異常值,同時對缺失的數據采用均值替換法填補,均值替換法如公式(2)所示:
1.4模型構建與優化
數據輸入主要包含兩部分信息,分別是離散化數據塊和非離散化數據塊,模型訓練過程的兩個部分分別是BP網絡模型的訓練與DBN模型的訓練,而DBN模型的訓練是訓練內容的核心。
BP網絡模型主要包括樣本集確定、網絡模型結構、參數訓練等模塊。其中樣本集采用上文收集到的城市軌道客流量數據集,預處理后得到實驗數據集。構建網絡模型需確定神經網絡模型中的數據特征,包括輸入層節點數量、隱層節點及數量,還需選擇適當的傳遞函數。在這幾個參數中,輸入層節點數量與實驗數據集緊密相關,因為過多的輸入層節點數量必然會導致模型訓練時問增加,因此選擇合適的參數就顯得尤為重要。根據數據收集的3個維度(分別是位置信息、時間信息與客流量信息)確定輸入層節點數量為3。同時,BP網絡模型中隱層的數量也會極大影響預測的準確性與訓練時間。增加隱層的數量雖然可以提高預測精度,但也極易引起過度擬合、訓練時問過長等問題。選擇大多數研究所采用的一層隱層的神經網絡結構來預測城市軌道交通客流量。在傳遞函數的選擇上,Sigmoid函數作為一種普遍的傳遞函數被大多數模型所采用,在對軌道交通客流量進行預測時也同樣采用Sigmoid函數。
傳統的BP神經網絡通常會出現梯度擴散的現象,而且算法容易趨于局部最優值而忽視全局最小值,這些問題使得傳統的BP神經網絡算法應用有很大局限。為此基于BP網絡模型提出了DBN模型,該模型結構的訓練流程有監督和無監督兩種模式,模型訓練過程的第一步是采用無監督的方式對DBN模型進行訓練,第二步是通過BP反向傳播的方式調整至合適的參數值,反復進行第二步直至實驗的預測誤差在允許的范圍內,此時的模型就是最終的DBN預測模型。
1.5城市軌道客流預測模塊
城市軌道客流預測工作對于交通設施的規劃、設計以及各方面的前期工作來說具有重要的意義,甚至可以說,對城市軌道交通進行客流預測,并對其結果進行分析與整理,能夠為城市軌道交通的設計工作以及建設工作做好充足的準備工作,所以在構建的城市實訓基地培訓系統中有必要添加軌道客流預測板塊,通過以往的數據建立BP神經網絡模型以及DBN模型,對兩種模型預測的城市軌道客流量值進行比較分析,基于此構建出軌道客流預測模塊,流程圖如圖5所示:
如圖5所示,數據進入系統后先進行歸一化處理,然后進行模型訓練,在訓練結束的時候進行軌道客流值的預測,將預測值與實際值進行比較驗證,當預測值的誤差收斂于可接受的范圍時輸出模型預測結果,否則進行模型參數的調整,重新優化預測模型,直至得到符合要求的模型。
2結果和討論
2.1 BP神經元隱藏層節點個數
通過實驗得到神經元個數與均方根誤差之間的關系如圖6所示:
根據圖6可以看出預測模型均方根誤差最小時,神經元個數為8。在隱藏層節點數目也為8時測量節點10與節點12的軌道客運量誤差值為0.03467與0.01544,經過驗證模型最適宜的神經元個數為8,減去必要的輸入輸出節點數目,最佳隱藏層節點數目為6。
2.2網絡參數設置結果
訓練集對網絡參數進行設置與訓練后,使用預測集進行預測,其中控制輸入節點數為4,隱藏層節點數為6,反復進行迭代所產生的均方根誤差結果如圖7所示。
通過圖7中的實驗數據可知,模型迭代次數過少時實驗誤差值較大,當迭代次數增多時均方根誤差整體趨于平穩,其中模型訓練集迭代次數在300~1000次之間時,實驗誤差大約在0.02478~0.02798之間趨于平穩,迭代次數在300次左右誤差最小約為0.02478,且大于300后,誤差還會稍微有所增加,因此,對于BP網絡訓練的迭代次數取值為300。
2.3 BP神經網絡模型與DBN模型結果分析比較
為了充分說明基于BP網絡和DBN網絡的預測結果,使用上述實驗數據進行更為準確的軌道客流預測,將預測結果與實際客流進行比較分析,結果如圖8所示。從圖8中可以看出DBN模型預測的城市軌道客流量曲線相比BP神經網絡模型的預測值擬合度更高,更加接近軌道客流實際值。
2.4培訓系統中預測模型整體評價
相比BP網絡預測模型,DBN預測模型的穩定性更高,選取5個數據節點,采用均方根誤差進行衡量以進一步驗證DBN模型的準確性及穩定性,誤差結果如圖9所示:
從圖9中可以看出,DBN預測模型相比BP神經網絡模型平均均方根誤差大約減少了0.01475,平均處理每個批次任務時間約為3.5 s,可知在相同數據集下,DBN模型比BP神經網絡模型的軌道客流量預測結果更好。
3結論
隨著互聯網技術的發展,傳統的基地培訓系統因無法滿足當前人們的需求而逐漸被淘汰。主要通過對分布式傳感器收集的數據進行預處理,研究了BP網絡模型的預測模型,根據實驗數據集分析得出BP神經網絡中隱藏層節點數量的最優參數值,預測軌道客流量。然后在提出的DBN預測模型中考慮不同隱藏層和隱藏層神經元節點對本次實驗中軌道客流的預測影響。實驗結果表明,DBN在客流量預測方面比BP模型準確度更高,隱藏層節點數目最佳為6,此時模型對軌道客流的預測結果效果最佳。
研究仍有許多不足之處:首先,使用的神經網絡對軌道客流進行預測的方法目前應用較少,技術上并不是很成熟。例如,在深度置信網絡中,神經元隱藏層節點的數目就沒有較好的方式來確定,只能通過試驗后誤差的分析進行參數的調整與優化。其次,研究城市軌道客流時為簡化問題方便建模,只選取了部分軌道客流信息,對軌道客流的影響因素只考慮了時間及位置信息。目前大數據技術在相關領域應用廣泛,在后續的研究中也可以考慮使用大數據等技術,進一步優化模型結構與性能。