999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度特征提取下城軌客流異常狀態識別

2021-03-17 01:28:46姚恩建
哈爾濱工業大學學報 2021年3期
關鍵詞:特征

郇 寧,姚恩建,薛 飛

(綜合交通運輸大數據應用技術交通運輸行業重點實驗室(北京交通大學), 北京 100044)

近年來,中國各大城市地鐵線網不斷擴張,軌道交通在城市綜合交通系統中的作用愈發重要. 在乘客出行需求日趨多樣化的背景下,大型文體賽事、慶典活動、道路交通管制等外部因素可能引發大量乘客于短時間內涌入車站,如果組織不當,可能導致乘客服務體驗下降、運行風險升高,引發站內、車廂過飽和甚至乘客人身安全事故. 因此,有必要形成一套適應城市軌道交通客流特性的異常狀態識別方法,以填補運營管理中異常信息的不對稱性,健全客運組織的風險預警機制.

異常識別(又稱異常檢測)是數據挖掘的一個重要分支,其目的在于發現數據集中與其他數據有顯著差異的樣本,如入侵檢測[1]、醫療診斷[2]、工業損檢[3]等. 在城軌運營管理領域,同類技術主要體現在車輛設備和工控系統的硬件安全檢查等方面[4-5],客運部門往往以基礎的統計分析或閾值判斷方法來識別客流的異常狀態,存在時間滯后性、誤判率高、難以適應客流的長期演化規律等不足. 相關研究中,文獻[6]系統地分析了城市軌道交通運營事故的特點及風險因素;文獻[7]基于時間序列相似性度量的思想,分析了進站量時間序列中的突發客流現象. 整體上,現有研究尚未形成關于城軌客流異常識別的成熟理論和方法,本研究從自動售檢票系統實時采集的刷卡數據中提取分鐘進站量時間序列,實現對客流狀態異常值的同步量化,主要內容包括特征提取和異常判定兩個部分.

廣義上的特征提取通常依托于機器學習算法,尤其是深度學習模型,利用深層次的非線性結構網絡模型獲取觀測樣本中的高階相關性信息,現已廣泛應用于模式識別領域[8-9]. 典型地,卷積神經網絡采用非全連接和權值共享的網絡結構,擅長從局部特征逼近整體特征,在圖像識別方面應用廣泛;堆疊自編碼器與深度置信網絡(deep belief network, DBN)都是以逐層訓練的方式提取訓練集特征,前者利用非線性變換尋找主特征方向,后者基于樣本概率分布獲取高層特征表示,在手寫識別、語音識別等方面有較好表現. 在以時間序列為對象的研究中[10-11],通常以多項式曲線擬合、離散傅里葉變換、連續小波變換、分段聚合近似等手段實現時間序列的降維、降噪表示,進而實現對隱含信息的深層挖掘.

異常判定按實現原理可大致分為4類:1)基于統計與數據分布的方法[12],通過假設數據集服從某種分布模式(如多元正態分布)來識別異常點,但對于包含非線性動態特征的復雜問題適用性較差. 2)基于閾值判斷的方法[13-14],依據客觀規律或人工經驗對異常事件的關鍵特征設置診斷條件,此類方法較為依賴對異常事件及其影響的先驗知識. 3)基于劃分思想的方法[15-16],如孤立森林算法利用隨機超平面切割每個子空間,將落在稀疏區域內的樣本判定為異常;單類支持向量機通過學習機制構建一個能夠圍繞全體正常樣本的幾何支撐域,將之以外的樣本視為異常. 該類方法的建模機理決定其僅適用于特定結構的數據集,且易受到噪音維度或無關維度的干擾;4)基于距離或密度的方法[17],如局部異常因子(local outlier factor, LOF)算法,通過衡量樣本點與其鄰域內其他樣本點的分隔程度來判定異常狀態,在方法效率及擴展性能上具有優勢,但當樣本集內簇群分布過于復雜時,存在靈敏度下降的現象.

本文在綜合考慮數據獲取條件與檢測需求的基礎上,提出一種基于DBN和LOF的異常識別方法,實現以數據特征為導向的特征提取與模式劃分,為異常判定提供精細、可靠的樣本子集,進而實現對異常客流狀態的有效判別.

1 城軌客流數據特征

城市軌道交通作為公共交通系統的重要組成,其客流不僅會受到外部異常因素的影響,自身也處于長期的動態變化之中. 因此,異常識別應建立在充分考慮客流常態變化的基礎之上,進而準確判定由外部因素引起的異常變化. 以廣州地鐵某站為例,分別選擇工作日、雙休日和節假日下的客流樣本進行對比,如圖1所示.

圖1 某站客流常態變化

圖1中,該站工作日的晨間通勤高峰強度大、持續時間短,雙休日與節假日白天的客流強度相對較高,但節假日不存在晚高峰現象. 上述客流樣本均應視為相應場景下的正??土鳡顟B,即異常識別應兼容的常態客流變化. 此外,對于不同車站,在受到節假日等因素影響時,其客流也會呈現出不同的變化規律,此類變化也應為異常識別方法所兼容.

進一步,結合典型案例分析由外部因素引發的客流異常變化. 案例1,2017年6月3日、6月17日,廣州國際體育演藝中心舉辦文藝演出活動,晚間散場客流規模超出預期,蘿崗站內付費區發生乘客滯留現象;案例2,2017年8月1日、9月12日,廣州天河體育館舉辦大型體育賽事,體育中心站呈現不同強度的夜間高峰. 同時,選擇與案例日期客流規律相近的正常樣本作為參照,如圖2所示.

在本質上,客流異常變化源于各類事件對乘客出行行為的影響,映射到客流層面,表現形式往往復雜多變,加之各類影響因素對客流的耦合效應,使得傳統的人工檢測、閾值判別的識別方法難以應對復雜多變的現實環境,呈現出較高的誤檢率、漏檢率. 由此,本文引入與客流數據特征相適應的深度學習方法,以提升異常識別的精細化、智能化水平.

(a)案例1 (b)案例2

2 客流異常狀態識別方法

圖3為客流異常狀態識別流程圖. 首先,建立考慮客流時變規律的滑動時間窗口機制,以追蹤進站客流的動態變化;其次,基于深度學習模型實現對窗口內客流特征的提取與模式識別;然后,依據模式劃分結果確定歷史樣本集范圍,根據所獲取的客流特征對樣本的異常狀態進行量化.

圖3 客流異常狀態識別流程

2.1 滑動時間窗口長度確定

滑動時間窗口的長度是影響識別效果的重要因素. 當窗口長度較大時,包含充足的采樣信息,但易導致判別滯后;當窗口長度較小時,對客流變化的感知更為細致,但易發生信息不足條件下的誤判. 因此,窗口長度應與客流數據的時變規律相適應. 由于進站客流的變化具有時間關聯性,故采用相關性分析方法挖掘歷史客流的時變規律,以符合關聯性約束的最大時間跨度作為窗口長度. 車站分時進站量的自相關性系數計算公式[18]為

(1)

(2)

2.2 異常識別模型構建

針對分鐘進站量時間序列特征維數高、分類復雜度高的特點,為提升檢測性能,在異常判定前對樣本進行特征提取與模式劃分處理. 采用預訓練和微調相結合的訓練機制,構建如圖4所示的DBN模型.

圖4 DBN結構示意圖

DBN模型自文獻[19]提出后廣泛用于模式識別領域. 具體地,DBN由受限玻爾茲曼機(restricted boltzmann machine, RBM)堆疊而成,RBM包含可視層V和隱含層H,層間采用全連接形式,層內無連接. 定義V層包含M個節點,即V=(v1,v2,...,vm),H層包含N個節點,即H=(h1,h2,...,hn). 對于一組給定狀態的(v,h),RBM的能量為

(3)

在給定可視層節點狀態時,隱含層節點hn的激活概率可表示為

(4)

同理,在給定隱含層節點狀態時,可視層節點vm的激活概率為

(5)

采用對比散度(k-step contrastive divergence)算法進行參數訓練[20],權值與偏置的更新規則為

(6)

(7)

(8)

頂端BP層作為一種有監督的分類器,根據預訓練獲取的隱含特征對樣本進行類別劃分,并通過誤差反向傳播微調DBN網絡參數. 定義樣本z于參數θ條件下的輸出為f(z,θ),類別y∈{1,...,i,...,C},預測結果屬于第i類的條件概率為

(9)

將fy(z,θ)視為真實類別y的似然函數,通過極大似然估計確定參數. 具體地,以最小化負的對數似然方法來確定參數,即交叉熵損失函數為

L[y,f(z,θ)]=-lnfy(z,θ).

(10)

以獨熱編碼向量y表示目標類別c,yi表示真實類別的分布,即僅存在yc=1,其余向量元素均取0,損失函數可表示為

(11)

如前述客流長期處于動態變化之中,不存在絕對標準的正常樣本,故根據樣本間的相對分布界定異常狀態. 因此,在獲得DBN模型輸出的樣本特征和模式劃分結果后,將待檢樣本與相同模式的歷史樣本映射至多維特征空間,以樣本的特征向量為依據,進行如下基于密度的異常判定[17].

對于特征空間Φ中的任一客流樣本p,定義k鄰近距離dk(p)為p與距離p第k遠的樣本q間的歐式距離d(p,q),則q至少存在k個樣本x,x∈Φ且x≠p,滿足d(p,x)≤d(p,q);且存在至多k-1個樣本不滿足該條件. 基于此,定義p的第k距離鄰域Fk(p)為到p距離在dk(p)以內的全部樣本,即

Fk(p)={x|d(p,x)≤dk(p)}.

(12)

(13)

(14)

由此可得樣本p的LOF值χk(p)的計算方法,計算公式為

(15)

由式(15)可知,χk(p)為樣本p鄰域樣本的局部可達密度與自身局部可達密度比的均值. 當一組樣本的特征向量相等時,χk(p)=1;當χk(p)的取值越大于1,說明樣本p的密度越小于其鄰域樣本密度,即p為異常的可能性越大.

3 案例分析

3.1 數據描述

以2018年3月份至6月份廣州地鐵早高峰(7:00—9:00)的分鐘進站量數據為實驗對象. 在前3個月內,采集5 000條樣本構成訓練集,用于標定模型參數;在最后1個月內,采集1 000條樣本構成測試集,用于檢驗模型精度. 經歸一化處理,限制樣本振幅于[0,1],即實驗所用的分鐘進站量時間序列樣本.

綜合考慮采樣時段客流特性、分類命中率以及異常識別準確率等因素,結合實驗測試結果,建立樣本標簽體系見表1,從客流的波動特性和變化趨勢兩個方面描述樣本的形態特征,并采用數值規則與人工判別相結合的方式對樣本集進行標注.

表1 樣本標簽描述

3.2 案例結果

經實驗測試,確定DBN模型參數如下:節點結構為{60-30-20-20-15-8},批訓練的塊大小取100,學習率取0.05,迭代輪次取120. 為評價模式劃分效果,定義混淆矩陣H,其元素hij表示屬于i類樣本被劃分到j類的數目,總體精度η表達式[21]為

(16)

經統計,表2為測試樣本集的模式劃分結果. 此外,對比傳統反向傳播神經網絡以及二、三、四隱含層DBN的模式劃分效果,取得的整體精度分別為83.1%,63.7%,92.5%和87.6%. 可見,三隱含層DBN的表現較優,也表明該模型能夠在降低樣本數據維度的同時,有效提取客流特征,為異常判定匹配合理的參考樣本.

表2 測試集分類混淆矩陣

為全面檢驗異常識別方法的有效性,在測試集中正常樣本的基礎上,引入不同的干擾策略以模擬典型的客流異常狀態,規則見表3. 為直觀展示異常識別過程,以測試集中的一組樣本為例,按分鐘進站量同步計算LOF值的變化情況,如圖5所示.

表3 測試集異常樣本模擬干擾策略

(a)策略Ⅱ、策略Ⅲ

(b)策略Ⅳ、策略Ⅴ

利用策略Ⅰ下的測試集測試此方法的誤檢率,利用策略Ⅱ、Ⅲ、Ⅳ和Ⅴ下的測試集測試此方法的準確率. 以訓練集中97%可靠度下的LOF值控制限為標準,取反應時間為5 min. 具體地,對于策略Ⅰ,若任意連續5 min內LOF均值超出控制限,則認為發生誤判;對于策略Ⅱ、Ⅲ、Ⅳ和Ⅴ,若干擾引入后5 min內LOF均值達到控制限,則認為識別準確. 測試集異常識別結果見表4.

可見,識別效果與異常狀態的形式和程度相關,且受到合格條件中反應時效要求的影響. 整體上,該方法的平均誤檢率為3.98%,對于4類策略下異常樣本的平均識別準確率分別為87.53%、91.74%、92.07%和96.17%,能夠在保證較低誤檢率的情況下,實現對各類異常狀態的準確識別.

表4 測試集異常識別結果

4 結 論

1)通過分析分時進站量時間序列的自相關性,建立了與客流時變特性相適應的滑動時間窗口機制,確定最佳窗口長度為60 min,為異常狀態動態識別奠定了基礎.

2)設計了解決待檢樣本特征提取與模式劃分的DBN模型,確定了三隱層的模型結構,實現了精確率為92.5%的客流樣本模式劃分,為異常判定提供了精細化的樣本分類結果.

3)引入了4類干擾策略模擬客流的異常狀態,通過計算時間窗口內待檢樣本的LOF值,實現了對各類異常狀態的靈敏識別,平均準確率為91.9%,為城軌車站大客流預警提供了有效的解決方案.

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 国产免费精彩视频| 国产91av在线| 九色在线观看视频| 国产亚洲成AⅤ人片在线观看| 欧美日韩综合网| 亚洲综合在线最大成人| 18禁不卡免费网站| 国产成人高清精品免费| 老司机精品99在线播放| 亚洲天堂高清| 国产精品大尺度尺度视频| 精品国产91爱| 中文字幕在线视频免费| 国产午夜人做人免费视频中文| 久草网视频在线| 在线日韩一区二区| 国产毛片久久国产| 久久久无码人妻精品无码| 国产精品播放| 香蕉综合在线视频91| 天堂岛国av无码免费无禁网站 | 欧美中文字幕无线码视频| 国产丝袜精品| 精品久久综合1区2区3区激情| 日本国产精品| 无遮挡国产高潮视频免费观看 | 国产福利拍拍拍| 亚洲视频在线网| 色综合国产| 狠狠久久综合伊人不卡| 三级国产在线观看| 国产精品亚洲日韩AⅤ在线观看| 精品一区二区无码av| 国产免费人成视频网| 精品天海翼一区二区| 国产本道久久一区二区三区| 亚洲高清无在码在线无弹窗| 欧美特黄一级大黄录像| 另类欧美日韩| 久久精品人人做人人爽电影蜜月| 婷婷亚洲天堂| 亚洲一级毛片| 久久国产亚洲偷自| 中文字幕不卡免费高清视频| 国产精品白浆无码流出在线看| 超碰91免费人妻| 午夜性刺激在线观看免费| 亚洲开心婷婷中文字幕| 2020国产免费久久精品99| 色天天综合| 亚洲成人高清无码| 黄色网页在线播放| 国产精品xxx| 久久婷婷色综合老司机| 全午夜免费一级毛片| 精品国产中文一级毛片在线看| 97视频免费看| 亚洲乱强伦| 在线播放91| 日本精品一在线观看视频| 国产成人a毛片在线| 久久99蜜桃精品久久久久小说| 欧美啪啪网| 无码专区在线观看| 99视频在线看| 99在线免费播放| 欧美成人二区| 国产午夜福利在线小视频| 夜色爽爽影院18禁妓女影院| lhav亚洲精品| av尤物免费在线观看| 91人人妻人人做人人爽男同| 国产在线视频欧美亚综合| 亚洲国产理论片在线播放| 国产 在线视频无码| 国产成人无码Av在线播放无广告| 欧美伊人色综合久久天天| 亚洲精品在线91| 天天色天天综合网| 国产视频入口| 国产欧美日韩另类精彩视频| 22sihu国产精品视频影视资讯|