劉尊民,劉慶元,曲大義,陳秀鋒,3
(1.青島理工大學 機械與汽車工程學院,山東 青島 266520; 2. 山東省交通規劃設計院,山東 濟南 250001; 3. 青島海信網絡科技股份有限公司,山東 青島 266071)
現階段交通運維系統中各個設備是相互獨立的,設備之間沒有建立網絡鏈路、數據鏈路關系,當一個核心節點出現故障時,系統會報掛載在其下的所有外場設備的故障[1-2]。傳統故障診斷方法通過收集故障原始信息,通過各種分析、處理手段結合工作人員的豐富經驗,對故障信息進行綜合分析及識別[3-4]。該方法依托操作人員的干預完成,診斷結果受人為因素影響大,且針對交通運維系統的診斷工作量巨大,不適合信息化發展的需求。目前智能故障診斷方法研究較多,如人工智能應用中的專家系統、神經網絡技術、模糊理論等,具有傳統方法無法比擬的優勢,是故障診斷領域的重要發展方向[5-7]。但成熟的故障診斷技術方法,在大數據背景下的智能交通系統中,普遍存在適應性不強,專門解決該應用的技術方法相對較少等諸多問題[8-9]。
針對以上情況,提出了一種采用基于雙層鏈路的故障反推演定位方法,給出了智能交通系統中終端設備、網絡設備及數據鏈路的故障精確定位方法。所能判別的故障信息包括:終端設備故障(硬件)、網絡設備故障(硬件)、通信服務適配器(軟件)故障。其中終端設備可定位到某臺設備,若設備上傳故障代碼可精確到故障類型;網絡設備可定位到網絡結構中的某臺設備;通信服務程序可定位到軟件構架中的某個程序接口。
為了保障故障定位的準確性,解決外場設備自動報障故障原因不精確,設備維修過度依賴于維修人員經驗的問題,采用基于雙層鏈路的故障反推演定位方法,通過對硬件構架及軟件接口模塊的多維度診斷處理,實現智能交通系統中設備故障的精確定位。系統主流程如圖1。

圖1 系統主流程Fig. 1 System main process
基于雙鏈路的設備故障定位方法通過以下步驟實現:①自動產生設備數據上傳時間間隔閾值,若超限且未上報準確故障信息,則進入第②步;②依據網絡設備鏈路結構,對網絡鏈路采用多維度反推演方法進行故障定位,若判斷無故障則進入第③步;③在數據鏈路層面,根據報障設備信息,啟動多維診斷線程,探測各服務適配器程序通信及數據鏈路狀態,若判斷無故障則進入第④步;④排除網絡設備及數據鏈路設備后,可精確定位到設備本身故障。故障處理過程中,自動更新維護服務器端故障設備表格。
運維服務器端自動維護設備閾值表格及設備信息表格,智能交通設備與服務器始終維持鏈接狀態,采用基于設備數據采集頻率特征自適應運算產生方法,自動設置時間間隔閾值,該閾值為設備與服務器未發生通信的時間間隔。時間間隔閾值的設置方法如下:
1)根據設備統計周期內的歷史數據,提取歷史數據上傳時間間隔,假設采集到N+1個數據,計算數據間的時間間隔,生成數據序列,記為{Ti|i=1,2,3,...,N}。
2)數據序列中極大極小值分別為Tmin、Tmax,忽略后計算平均值,記為Tmin。計算公式如下:
(1)
3)去除Tmin、Tmax后,重新組織數據序列為{Ti|i=1,2,3,...,N-2}。計算N-2個數據序列方差,記為Tσ。計算公式如下:
(2)
4)計算數據偏差,剔除異常數據。其中k為系數,在程序中動態設定,以確定剔除數據的比例:
|Ti-TM|≥k·Tσ
(3)
5)假設剔除異常數據個數為m個,重新組織數據序列為{Ti|i=1,2,3,...,N-m-2},重新計算數據平均值及方差如下:
(4)
(5)
6)定時計算當前未上傳數據設備的時間間隔Td,當Td滿足公式(6)時,啟動故障診斷步驟。其中k′為系數,根據數據方差值動態設定:
(6)
利用網絡適配器,對所有網絡設備廣播發送巡檢指令,對網絡鏈路的所有節點進行檢測。若所有節點通信正常,則進入數據鏈路層故障檢測,否則進行網絡層故障檢測。
從底層網絡故障節點逐層追溯網絡狀態,以輪詢的方式發送診斷指令,對返回結果進行識別判斷,一直追溯到無故障節點。簡化網絡結構,說明網絡層故障檢測方法。假設網絡為5層結構,其簡化示意如圖2。

圖2 網絡節點簡化示意Fig. 2 Diagram of network node
假設C0節點故障,該節點下所有節點都處于異常通信狀態,檢測方法如下:
第1條鏈路:巡檢順序為E0, D0,C0,B0。到B0正常節點后結束。
第2條鏈路:巡檢順序為E1,D0,C0,B0。到B0正常節點后結束。
第3條鏈路:巡檢順序為E2,D1,C0,B0。到B0正常節點后結束。
則其他鏈路檢測方法同上。
C0節點下的所有通信異常節點反向追溯到B0節點,每條鏈路檢測結果可定位到C0為故障節點,滿足所有節點的故障判斷狀態一致后,即多異常節點的互相驗證后,確定C0為故障節點。若故障節點下的網絡節點數量大于100個,為提高遍歷速度,則只判斷100個節點的互鎖驗證狀態,屏蔽其它節點的故障信息。
通過上述方法反向逐層多路診斷,并發多線程多維度進行反推演,以網絡設備故障定位相互驗證,并屏蔽已獲驗證的網絡設備下層節點故障信息,可精確定位故障到網絡設備。
若網絡故障修復完成,或無網絡故障,故障仍然存在,則故障來源為數據鏈路故障或終端設備故障,進入數據鏈路層故障檢測。
傳統運維管理系統中通常不監測數據鏈路故障,對設備和服務之間的數據流向不進行管理,當軟件服務出現故障導致設備數據無法正常傳輸時,系統會報設備的故障,無法自動判斷并準確定位故障來源。
基于雙層鏈路的故障精確定位方法中判斷無網絡故障后,啟動數據鏈路的通信測試線程,進行數據鏈路的故障排除。由上位機服務器下發測試指令,在數據層面各服務適配器程序依序返回回傳數據。如果異常,修改數據鏈路表的異常標識,標識此節點服務故障,進行報障。通過該診斷方法,可精確定位故障到數據通信服務適配器。
若數據鏈路修復完成,或無數據鏈路層故障,故障仍然存在,可精確定位到設備本身故障。通過更換設備或設備檢修排除該類型故障。故障處理完成后,更新服務器端設備信息表格。
該方法已在青島智能交通運維系統世園會子項目中試點應用,可實現系統級數據鏈路故障定位及設備級故障定位。其中設備級故障主要包括網絡設備故障及外場設備故障,外場設備種類較多,目前已實現電子警察、卡口、超速監測、移動抓拍、誘導屏、信號機、視頻監控、流量檢測器、事件檢測器、氣象檢測、喊話系統、霧區防撞12種類型設備的狀態監測。累計跟蹤9天的維修單數據,系統共檢測出故障數為174個,其中系統級軟件服務故障11個,設備故障163個。如表1所示,報障樣本中,159個檢測準確,檢測準確率為91.4%,滿足用戶需求。

表1 故障統計結果Table 1 Statistical results of fault
隨著智能交通系統規模的增大,類似“網絡設備故障,導致大片外場設備報障”的情況經常發生,影響維修效率。該方法基于網絡拓撲和數據鏈路的故障自動識別技術,解決了由上游節點故障導致的關聯設備重復誤報問題,青島項目中平均每天自動合并設備故障200多個,避免因誤報產生的無效派工及排查工作,設備運維效率得到了顯著提升。
1)提出了一種基于采集頻率特征的自適應閾值產生方法。基于設備歷史數據的上傳頻率自動產生時間間隔數據序列,剔除異常數據后,通過統計平均法,獲取設備的數據上傳時間間隔標準值,在加權方差的基礎上,自適應運算產生時間間隔閾值,超過閾值后,自動啟動故障診斷流程。
2)提出了一種基于雙層鏈路的故障精準定位方法。通過開辟網絡鏈路監測線程及數據鏈路監測線程,對智能交通系統全故障狀態進行精準定位。在網絡鏈路層采用多維度反推演故障定位方法,依據網絡設備鏈路結構及終端數,設置多維度網絡故障探測線程。依據探測返回信息,進行故障反推演定位。從網絡底層開始逐層探測,定位到網絡設備故障信息源,若有多個報障信息,結合已報故障設備地址信息,進行故障信息互鎖驗證。
參考文獻(References):
[1] 吳明遠,林保華. 智能交通設備運維系統[C]//第九屆中國智能交通年會大會論文集.廣州:電子工業出版社,2014:1178-1180.
WU Mingyuan,LIN Baohua. Intelligent transportation system equipment operation and maintenance[C]//Proceedingsof9thChinaAnnualConferenceonintelligenttransportsystems.Guangzhou:Electronic Industry Press, 2014:1178-1180.
[2] 趙懷柏. 基于故障溯源技術的交通設備管理系統設計[D].上海:復旦大學,2013.
ZHAO Huaibai.TheDesignofTrafficEquipmentManagementSystemBasedontheTechnologyofFaultTracing[D]. ShangHai:Fudan University, 2013.
[3] 李晗,蕭德云. 基于數據驅動的故障診斷方法綜述[J]. 控制與決策,2011,26(1):1-8.
LI han,XIAO Deyun.Survey on data driven fault diagnosis methods[J].ControlandDecision, 2011,26(1):1-8.
[4] 馬曄,崔寶同. 網絡控制系統的故障檢測[J]. 科學技術與工程,2012,12(7):1544-1547.
MA Ye,CUI Baotong. Fault detection for networked control system[J].ScienceTechnologyandEngineering, 2012,12(7):1544-1547.
[5] 王智弘,李東輝. 基于小波變換和粗糙集的電力電子電路故障診斷方法[J].電氣自動化,2015,37(3) : 109-111.
WANG Zhihong, LI Donghui. A fault diagnosis method for power electronic circuits based on wavelet transformation and rough set[J].ElectricalAutomation,2015,37(3) : 109-111.
[6]CORRECHER A, GARCIA E, MORANT F, et al. Intermittent failure dynamics characterization[J].IEEETrans-actionsonReliability, 2012, 61(3): 649-658.
[7] 王禮軍. 模糊神經網絡專家系統在故障診斷中的應用[J]. 重慶交通大學學報(自然科學版), 2012, 31(3):469-472.
WANG Lijun,Application on fuzzy neural network expert system in fault diagnosis[J].JournalofChongqingJiaotongUniversity(NaturalScience), 2012, 31(3):469-472.
[8] 段苗花.智能交通設備運維監控系統的設計與實現[D].杭州:浙江工業大學,2015.
DUAN Miaohua.DesignandRealizationofIntelligentMaintenanceandMonitoringSystemofTransportationEquipment[D].Hangzhou: Zhejiang University of Technology, 2015.
[9] 陸百川, 郭桂林, 肖汶謙,等. 基于多尺度主元分析法的動態交通數據故障診斷與修復[J]. 重慶交通大學學報(自然科學版), 2016, 35(1):134-137.
LU Baichuan, GUO Guilin, XIAO Wenqian, et al. Fault diagnosing and modifying of dynamic traffic data based on MSPCA[J].JournalofChongqingJiaotongUniversity(NaturalScience),2016, 35(1):134-137.