信息交換技術、信息處理技術及信息存儲技術的快速發展,使得海量數據得以匯聚。超大規模數據隱含更真實的事物本質和規律,其呈現出來的巨大價值正推動著各行各業的深刻變革。
順應大數據技術的發展趨勢,鐵路行業在信息化建設取得長足發展的基礎上,積極開展大數據技術的應用研究。近幾年,在高速鐵路牽引供電領域,已開始逐步整合各類信息平臺數據,研制基于大數據技術的跨平臺多源信息整合與分析系統,構建多維信息共享、多元信息一體化的管理系統,在大數據的應用上做出了諸多有效嘗試,力求將高速鐵路牽引供電系統打造成高效、節能、環保、智能化的系統。本文主要介紹大數據技術在高速鐵路牽引供電系統中的應用。
高速鐵路牽引供電系統的數據具有來源廣、類別多的特征。
按照數據來源劃分,數據源可以分為牽引供電系統內部數據、鐵路內部其他系統數據及鐵路外部數據。數據來源構成和分類如圖1所示。牽引供電系統內部數據主要來自供電SCADA系統、供電6C系統、供電調度運行管理系統及供電運維管理系統等;鐵路內部其他系統數據主要來自高速鐵路自然災害監測系統、鐵路運輸調度管理系統、高速鐵路綜合視頻監控系統等;鐵路外部數據主要來自地方氣象預報公共服務系統。
按照數據類別劃分,數據源一般可分為結構化數據、半結構化數據以及非結構化數據。結構化數據包括預定義的數據類型、數據格式和數據結構,如關系數據庫數據、電子表格文件等;半結構化數據主要有識別模式和自描述定義,支持語法分析的文本數據文件;非結構化數據沒有固定的結構,如文本文件、圖紙、圖像和視頻等。

圖1 高鐵牽引供電大數據來源及分類
通過建立統一的具備高擴展性的高鐵牽引供電大數據管理平臺,可實現數據的采集、存儲和處理,并提供面向高鐵供電領域多場景應用的客戶端服務接口。高鐵牽引供電大數據管理平臺總體技術架構如圖2所示。

圖2 高鐵牽引供電大數據管理平臺架構
高鐵牽引供電大數據管理平臺提供流式數據采集、數據庫數據采集和文件數據采集3種數據采集方式。
流式數據采集用于采集高鐵牽引供電各類接口系統提供的流式數據,包括設備狀態監控數據、各類實時檢測監測數據等,提供數據來源配置、傳輸通道配置、傳輸目的配置等功能。
數據庫數據采集用于從各類牽引供電接口系統關系型歷史數據庫中抽取數據到大數據管理平臺,提供抽取源、路徑、目標、抽取規則、轉換規則等配置功能。
文件數據采集用于采集圖片、視頻、文本以及電子表格等文件中數據信息,提供文件校驗規則、預處理規則等配置功能。
高鐵牽引供電大數據管理平臺采用分布式文件系統、分布式數據庫、關系型數據庫及內存式數據庫等多種存儲引擎,構建易于擴展的分布式大數據存儲系統,可隨數據規模的擴大動態增加存儲節點,具有較強適應性。
高鐵牽引供電大數據管理平臺可根據不同業務場景需求,處理不同規模、復雜多樣的數據,提供批處理、流處理、交互式處理等多種數據處理方式,并提供基于大規模數據的聚類、關聯、回歸、分類等多種大數據分析算法。
批處理方式用于復雜的批量數據處理,其時間跨度在幾分鐘到數小時之間。
流處理方式用于實時數據流的處理,其時間跨度在數百毫秒到數秒之間。
交互式處理用于基于歷史數據的交互式查詢處理,其時間跨度在數十秒到數分鐘之間。
大數據應用的目的在于發現知識、洞察規律并實現預測。高鐵牽引供電大數據的應用能夠為高鐵牽引供電系統的運行、維護帶來高效、便捷和精準的服務。目前,高鐵牽引供電大數據的應用形式大致可分為數據可視化、多維數據融合、業備深度挖掘3種。
數據關聯可視化是大數據最基礎的應用形式。簡單的數據展示已無法滿足高鐵牽引供電系統的業務需求。數據可視化技術能夠充分利用統計學、計算機圖形學和圖像處理技術,將海量數據信息直觀、生動、高效地展示給相關人員,使其及時準確地了解各種信息。同時,通過可視化展示可將錯綜復雜、看起來無法解釋及關聯的數據建立聯系和關聯,發現規律和特征。
例如,高鐵牽引供電大數據管理平臺可抽取供電6C系統數據,采用區域著色圖、折線圖(圖3)、餅圖(圖4)、數值與曲線綜合展示圖(圖5)等多種方式進行可視化展示。

圖3 接觸網導高、拉出值、硬點等對比折線圖

圖4 接觸網缺陷分布餅圖及指示盤

圖5 接觸網缺陷分布與整改綜合展示圖
通過高鐵牽引供電大數據管理平臺,將供電系統內部數據與外部數據進行融合,通過關聯分析,可明晰牽引供電系統與其他外部因素之間的聯系,以更加全面地了解牽引供電系統生產運營狀況和發展規律。當前階段,面向高鐵牽引供電大數據應用的典型多維數據融合主要表現在以下幾方面:
(1)與綜合視頻數據融合。獲取綜合視頻圖形數據,并采用圖像識別技術,識別所亭內開關狀態、復核安防報警、監視操作及識別煙火等,通過與SCADA系統及安監系統數據的關聯,可實現對現場情況的多維感知及相互驗證。
(2)與列車調度數據融合。獲取高鐵集中調度系統(CTC)中的行車數據,并與牽引供電相關系統運行數據相融合,實時掌握牽引供電與動車負荷的聯系,同時加入行車實時數據,更有利于故障跳閘原因分析及行車組織方案的優化。
(3)與地理信息系統(GIS)融合。通過牽引供電系統數據與GIS數據的融合,以地理位置為基礎對各種牽引供電數據進行管理,使其具備空間屬性。同時,GIS的空間查詢及分析能力可為牽引供電系統的應急搶修提供路線規劃。如圖6所示。

圖6 供電6C系統數據與GIS的融合
(4)與地方氣象預報公共服務數據融合。通過獲取長期的氣象數據及氣象預報數據,可對牽引供電設備的健康狀態與外部氣象環境進行關聯分析,并可提早針對惡劣氣象情況制定預案。如圖7所示。

圖7 供電系統與氣象數據融合
通過聚類分析、預測分析及關聯分析等大數據分析方法,從大量的、復雜的、不規則的、離散的數據中獲取隱含的、具備潛在規律的信息,對大數據的價值進行深度挖掘,以此指導高鐵牽引供電系統的安全生產和運營。
(1)故障預測與健康管理(PHM)。通過收集并管理設備的各種實時狀態數據、環境數據以及非實時記錄數據,依據大量數據實現牽引供電系統關鍵設備的故障預測、健康評估(圖8)、可靠性及風險評估和維修決策等(圖9),為牽引供電系統安全可靠運行及高效經濟運維提供決策依據。
(2)廣域保護。高鐵牽引供電大數據管理平臺通過抽取供電SCADA系統數據,以供電臂為單元,實現區域內各負荷數據的擬合,通過數學模型自動分析電流分布異常情況,可精確定位故障位置及判斷故障性質,快速切除故障區段。

圖8 牽引供電系統關鍵設備健康評估

圖9 牽引供電系統關鍵設備可靠性及風險評估和維修策略
目前,大數據技術在高鐵牽引供電系統數據可視化、多維數據融合及業務深度挖掘方面已經展現初步成效。隨著大數據技術在牽引供電領域的廣泛應用和發展,其應用價值也將不斷擴展和提升;伴隨鐵路供電系統修程修制的改革,其必將成為推動鐵路供電系統發展和創新的有力工具。
參考文獻:
[1]李康.淺論大數據技術在電力系統中的應用[J].中國戰略新興產業,2017(44):87-89.
[2]沈國輝,佘東香,孫湃,等.電力系統可視化技術研究及應用[J].電網技術,2009(17):31-36.
[3]劉巍,黃曌,李鵬,等.面向智能配電網的大數據統一支撐平臺體系與構架[J].電工技術學報,2014(S1):486-491.
[4]王玘,何正友,林圣,等.高鐵牽引供電系統PHM與主動維護研究[J].西南交通大學學報,2015,50(5):942-952.