單俊強, 李海濤, 邢國棟, 張虎*
(1.國能包神鐵路集團有限責任公司機務分公司,內蒙古,鄂爾多斯 017000;2.安徽安為科技有限公司,安徽,合肥 230000)
對于鐵路機務數據信息來說,其間具有較強的關聯性,通過數據挖掘和集成分析可以直接地呈現機務信息的規律性[1-2]。依據鐵路機務數據中包含的關鍵信息,以歷史數據為依托,做出更加符合鐵路機務開展的決策,從而保證車輛運行、司乘人員行為的穩定性。其中,數據信息集成共享是最為基礎的環節之一,而現有的集成平臺顯然難以發揮更好的應用效果。
文獻[3]結合復變函數設計數據庫模塊和多源數據查詢模塊,完成了混合型大數據集成系統的設計。然而,經過驗證可知該系統集成效率較低。文獻[4]融合物聯網技術和云計算技術,強化了鐵路機務數據信息分析能力,支撐鐵路信息化集成建設。但是,系統數據查詢響應時間較長。文獻[5]結合多種集成硬件實現數據整合與共享,為鐵路智能化調度提供了依據。但是,該集成系統的應用時效性較差。
為了解決以往相關研究的應用不足之處,本文提出將人工智能技術中的IFB樹結構融入到鐵路機務數據信息集成平臺建設過程中,構建優化后的數據查詢模型,達到縮短數據查詢時間、提高數據信息集成效率的目的。
信號處理器是數據信息集成的關鍵硬件,以TMS320 F2812芯片為核心,深入分析芯片的引腳和串行通信方式,結合哈佛總線架構[6],建立信號處理器基礎架。TMS320 F2812芯片具體結構如圖1所示。

圖1 TMS320F2812芯片結構示意圖
根據圖1可以看出,以TMS320F2812芯片為基礎設計的信號處理器,主要包括Flash內存、快速模數轉換器、增強的CAN模塊、多通道緩沖串口等4個關鍵部分。
電源模塊作為數據信息集成平臺的動力保障硬件,是影響平臺運行穩定性的關鍵。根據鐵路實際環境,設置幅值為5.0 V、3.6 V的電源,再結合集成穩壓電路LM2576T-5.0,完成穩壓電源的設計。其中,采用包含3 A輸出電流的穩壓器,依托于集成穩壓開關電路中包含的自我保護電路,增加少量的外部元件,設置具有穩定高效特點的穩壓電路。
考慮到數據信息集成平臺設計的主要目的是共享各方面的鐵路機務數據信息,輔助管理者建立決策方案[7]。數據倉庫的建立需要以提供高級決策支持功能為基礎,再針對細節數據統計要求設計低級別查詢功能。基于上述集成內容,采用三級模式構建鐵路機務數據信息整合模型,通過匯總數據層、數據操作層、數據整合層完成總體設計。具體的設計思想如圖2所示。

圖2 數據倉庫示意圖
根據圖2可知,高粒度數據存儲是建立鐵路決策的最后環節。依托于指標體系,從多元化鐵路機務信息中提取出數據倉庫主體所需的數據信息。除此之外,為了降低數據增量的計算復雜度,提出面向業務主體的數據簡單聚集模式,圍繞決策主題實現高粒度數據存儲,作為信息集成平臺的運行基礎。
考慮到鐵路機務數據信息具有多元性[8],在數據倉庫中除了運用信號處理器進行數據初步處理,再融合以元數據驅動為基礎的雙向映射策略,深入分析機務數據信息的映射規則公式,依托于解析出的參數信息轉換數據形式。為了便于數據信息集成平臺的數據采集與數據共享管理,應用雙向映射模式,針對源數據庫和目標數據庫建立正向映射、逆向映射關系。首先,定義源數據模型和目標數據模型如下:
A={Q(x,y,z)}
(1)
B={C(f,g),D(e,r)}
(2)
式(1)~式(2)中,A表示源數據模型,B表示目標數據模型,Q、C、D表示3個鐵路機務源數據信息,x、y、z表示數據Q的3個屬性,f、g表示數據C的2個屬性,e、r表示數據D的2個屬性。
鐵路機務數據信息的正向映射指的是由源數據模型向目標數據模型的映射,可以將其表示為
α=(A,B,φ)
(3)
式(3)中,α表示正向映射,φ表示正向映射規則。其中:
φ={Q(x,y,z)→C(f、g)∧D(e、r)}
(4)
逆向映射指的是正向映射關系的逆操作,也就是將目標數據轉換為元數據形式,具體表達形式如下:
α-1=(B,A,φ)
(5)
式(5)中,α-1表示逆向映射,φ表示逆向映射規則,其中:
φ={C(f、g)→Q(x,y),D(e、r)→Q(y,z)}
(6)
數據倉庫的設計為數據信息采集提供了基礎條件,提出鏈路數據采集模式[9],設計分布式數據采集技術。采用適當的工具采集通信網絡的狀態數據,將鏈路信息進行初步轉換,再結合分布式結構和管理域原理,完成分布式數據采集[10]。首先,按照鐵路機務數據的地域、組織等,將其劃分為多個域,針對每個域設置一個管理者,通過采集每個域管理者提供的信息,完成整體機務數據信息的采集。分布式采集管理模型的具體形式如圖3所示。

圖3 分布式采集管理模型
圖3所示的分布式管理模型主要采用對等式結構,將鐵路機務數據采集任務分配到每個域管理者頭上。從域首節點開始運行數據采集技術,將域內其他節點設置為監控主機節點,通過每個域的首節點與其他域首節點的交互,進行域間鏈路的數據采集。考慮到鐵路機務數據的類型較多,可以將分布式數據采集鏈路設置為有線鏈路、無線鏈路2種形式,采用以太網建立有線鏈路,并提出相應的鏈路指標測量方法,明確當前數據采集鏈路帶寬,結合實際數據采集環境改進非對稱鏈路帶寬,提高機務數據采集精度。采用RI-TAW-PATHCHAR方法測量鏈路帶寬,應用ICMP echo報文得出測量分組的報文循環時間為
(7)
式(7)中,R表示報文循環時間,m表示節點,q表示排隊延遲,s表示測量分組的長度,u表示鏈路帶寬,t表示節點對測量分組的處理時間,l表示傳播延遲。為了對式(7)進行簡化計算,設置響應報文為ICMP超時報文,計算報文延遲時間為
(8)
式(8)中,i表示鏈路段落,η表示響應報文延遲時間。根據報文延遲時間可推導出上行鏈路帶寬:
(9)
式(9)中,k表示線性函數ηm(s)的斜率。將響應報文設置為ICMP reply報文時,可將報文循環延遲時間表示為
(10)
式(10)中,η′表示ICMP reply報文延遲時間,結合式(9)和式(10),可以推導出:
(11)

以IFB樹結構為基礎,對于上述建立的數據查詢搜索空間,采用單值查詢模式構建人工智能數據查詢模型。具體的IFB樹示意圖如圖4所示。

圖(a) 差值查詢
根據圖4可知,數據查詢過程中所有的葉子節點均在同一層結構中,且其中包含鐵路機務數據的所有關鍵字信息,可以向目標人員提供所需的數據信息,實現鐵路機務數據信息集成共享。
針對鐵路機務數據的集成共享管理,提出以人工智能為核心的集成平臺設計。按照研究內容完成平臺建設后,為了驗證平臺應用性能,以神朔鐵路為例,進行平臺測試。
神朔鐵路位于陜西省境內,長達270 km,途經19個主要停靠站點,每個站點都有大量的裝車行為,神朔鐵路的機務段負責全線運輸的機車牽引、檢修,其包含十余個子系統,每個子系統在常年應用過程中,均積累了大量數據,難以實現子系統之間跨區域的數據共享,呈現出“信息孤島”現象。
結合神朔鐵路的貨運發送特征,提取出鐵路機務數據分析主題,建立數據倉庫整合主題。深入分析數據整合主題緯度,將其劃分為靜態、動態與目標維度3部分,如表1所示。根據表1構建鐵路機務數據集成平臺運行的基礎樣本。

表1 鐵路機務數據特征分析主題維度分析表
神朔鐵路建立集成平臺后,進行為期2周的平臺應用測試,其中前兩天主要為了觀察系統運行的穩定性。明確鐵路機務數據信息集成平臺可以順利運行后,獲取數據集成平臺運行顯示界面,如圖5所示。

圖(a) 日車公里
根據圖5可知,應用本文提出的集成平臺運行后,可以直觀地表現出鐵路機務數據的變化總體變化狀態,表明了以人工智能技術為基礎建立的數據集成平臺具有可行性。
為了更加直觀地體現出設計平臺的優勢,以數據查詢時間為評估指標,根據平臺測試結果得出如表2所示的數據查詢時間統計表。

表2 數據查詢時間統計表
根據表2可知,隨著機務數據條數的增長,集成平臺的數據查詢時間也在不斷增長,從最初的0.56 s增長至4.98 s。
通過計算可知,本文提出的數據集成平臺的平均查詢時間為0.18 s,有效縮短了集成平臺的數據查詢時間,提高了機務數據集成共享效率。
為了實現鐵路機務數據的集成管理,避免出現信息“孤島現象”,本文以人工智能技術為基礎,設計新的數據集成平臺。測試表明,所提出的集成平臺有效縮短了數據查詢時間,提高了系統的時效性,為機車調度指揮提供了支持。