中國鐵路太原局集團有限公司科信部 王 凱
大秦鐵路股份有限公司科學技術研究所 王健慧
中國鐵路太原局集團有限公司科信部 杜 軍
西南交通大學機械工程學院 楊 崗 周 奧
隨著鐵路行業信息化、網絡化的不斷深入以及重載鐵路方面的業務流程也在逐漸標準化,該過程中產生的數據信息在呈指數的形式日益增長。針對這些海量的、多類型的數據信息,由于目前重載鐵路方面缺乏一套完整、規范及統一的數據管理標準,使用傳統的數據處理方法進行管理顯得有些能力不足。利用元數據在數據組織、管理、共享方面的優勢,可以有效的對海量的、多源異構的重載鐵路數據進行處理,實現了鐵路數據的管理和共享。針對基于元數據是實現數據處理的重要手段,本文從元數據概述、鐵路元數據管理及其標準、發展現狀和未來發展趨勢等幾個方面綜合闡述了重載鐵路元數據的研究狀況。
隨著科技的不斷發展以及鐵路工程建設網絡化、信息化的全面推進,動車組信息系統相關信息資源日益增大,該過程中產生的相關數據也在以指數的形式飛速增加。但是當前在國內動車組數據服務平臺建設各方面還不太成熟,且當前傳統的數據處理方式在對海量的、多源異構的數據處理上顯得能力有些欠缺,如:系統檢索的響應緩慢,數據不規范、不標準缺乏嚴格的格式標準,同時系統接口相關管理可能不統一。這些問題都可能給后期對數據的使用或分析帶來很多困難,導致這些數據資源不能都有效的發揮其價值。因此在重載鐵路方面急需要相關解決措施,對該方面海量的大數據進行實時獲取與處理。通過研究重載鐵路元數據來制訂一套有益于互操作、統一的數據描述標準規范,能夠實現對鐵路工程方面數據的收集、整理、存儲、傳遞、保存。這樣就能夠有效的解決鐵路數據信息查詢不方便、數據規范化不統一、數據信息不可操作性等問題。
元數據被稱為“描述(或關于)數據的數據”,它是對數據及信息資源的描述性信息,也可以表示為某種資源的相關信息的結構數據。它不但能夠對數據提供相關描述的作用,同時還能夠對數據進行有效管理。
元數據可以說是由一些數據項共同組成的集合,這些數據項都是用來描述某具體資源對象。其中元數據元素是它的最基本組成單元,每個元數據元素都有一些相關屬性(如:定義、約束性等)來對數據信息來進行關鍵性描述。由于各行業產生的數據信息日益增加,數據類型也是各有差異,因此對于這些多源異構的數據信息的管理和描述需要不同的元數據類型。對于元數據的類型將其按用途分類有:描述性元數據、業務性元數據,管理性元數據和技術性元數據。
描述性元數據是用于闡述和識別信息資源對象的屬性、內容和特征的元數據。如:專題索引,用戶注釋等。描述性元數據能夠對信息資源進行相關敘述、定位以及檢索,可以讓用戶不需要瀏覽信息對象,也能對該信息有基本的理解和相關的認識。
業務性元數據是用來讓用戶了解相關業務數據信息的一種方式,它是數據倉庫環境搭建的關鍵,它是先進決策開發的一種支持工具。業務元數據主要作用是為業務處理提供統一的解釋。
管理性元數據簡單來說就是對信息資源進行管控和支配的元數據。如:用戶使用權限及數據存儲格式、信息收集、信息管理流程、信息所有者、版權與翻版跟蹤等。
技術性元數據就是與信息系統運行狀態相關的元數據,通常是指用來開發和管理數據倉庫使用的相關數據。如:軟件與硬件的信息、數據驗證安全、軟件版本的控制、系統的響應跟蹤及數字化信息的格式等。
元數據在網絡信息資源組織方面的作用可以概括為:描述、檢索、選擇、定位、管理和評估這六個方面。應用元數據結構可以構建信息資源,利用元數據的內容信息,可以讓用戶快速、準確的查詢到數據所在的位置,實現數據的共享。應為元數據是對數據的描述,所以可以讓使用者準確對數據進行了解與評價;同時元數據中提供了相應數據的位置的信息,所以通過元數據可以對數據提供者所屬機構和個人資料進行查詢;能夠使得數據在共享時更加方便,并且減少了冗雜數據的產生,大大提高了工作效率。元數據的不僅能描述信息,而且還對數據具有規范性。元數據標準性促使相關信息按照統一的標準呈現,及時有效的減少了用戶在數據對接時不兼容的問題。利用以上元數據特性,可以通過搭建數據共享平臺對數據進行及時更新、有效管理和數據共享等工作。
隨著計算機技術和信息化在各行各業的飛速發展,各行業特別是重載鐵路方面的數據資源總量正呈指數增長,近幾年產生的數據量比以往有很大增長,這些大量的多源異構的數據處理起來會有很大的困難,而大數據技術提供了一種高效快速的機制去處理這些海量的數據。如今各國都在推進大數據的發展和應用,中國更是對其給予了厚望。而大數據發展還在起步階段,關于大數據的資源共享,面對處理哪種資源可以開放、資源的開放前提、開放什么程度等問題,必須需要制定相關的國家標準及建立相應的元數據資源庫去解決這些問題。
目前國內外在鐵路工程信息資源方面缺少一套完整的、統一的元數據標準體系,這就導致無法有效的規范鐵路數據信息。在《地理信息分類與編碼規則》(GB/T 25529-2010)中,只是將鐵路工程在地理方面相關要素信息進行了劃分,并未對鐵路工程相關領域做出全面的、詳細的定義和劃分。在發布的《建筑工程設計信息模型分類和編碼標準》當中,主要對建筑工程領域的信息資源進行了相關分類和編碼,其中把鐵路工程與建筑工程有重疊或類似的領域不再單獨編寫,而是均采用的是這個標準來進行相關分類和編碼,但是這個標準缺少對鐵路工程元數據系統性和全面性的描述。因此目前在重載鐵路方面急需要一個適合鐵路工程信息數據管理的標準規范。為了響應鐵路行業發展要求,鐵路BIM聯盟2019年發布了《鐵路基礎設施元數據標準》,該標準結合了鐵路行業自身特點及過往經驗,對鐵路工程數據信息的元數據標準進行了科學性、系統性規定。該標準根據鐵路工程項目生命周期包含的設計、建設、運維三個階段所需要的元數據不一樣,將鐵路元數據劃分成了基本、設計、建設和運維元數據四個類別。其中基本元數據是三個階段中通用的部分,該標準的發布解決了鐵路工程方面存在的數據定義、處理、儲存、共享和使用等方面數據格式不統一的問題,有效的推動了鐵路工程建設數字化、網絡化和信息化快速發展。
(1)吸取過去的經驗,結合鐵路行業的特點及其實際應用需求,提高數據的可操作性及指導性。
(2)參照其他行業已有的標準,鐵路行業與其重疊的專業領域不再定義專門的標準,直接應用現有的標準,保持數據的統一實現數據信息的共享。
(3)應該實現鐵路工程信息資源的產生、管理、保存和使用的標準化,體現元數據使用的科學性及合理性。
關于BIM聯盟發布的《鐵路基礎設施元數據標準》該內容主要分為了8個部分來編寫,分別是總則、規范性引用文件、術語和定義、各單位職責、元數據階段劃分、元數據描述方法、元數據管理及元數據管理平臺應用接入。這里主要是對元數據描述方法進行相關說明。該標準結合鐵路基礎設施數據管理要求的實際情況,將元數據從概念的層次上區分為文檔類、組織類、人員類和項目類。該標準分別使用了“IFD編碼、數據元中文和英文名稱、定義、目的、約束性、可重復性、元素類型、數據類型、是非枚舉、值域、數據元值的最大和最小長度、表示格式、數據元最大和最小允許值、計量單位、子元素、信息來源、相關元素和注釋”18個方面對元數據元素進行了有關描述。元數據元素描述方法如表1所示。
鐵路基礎設施元數據的管理主要由元數據的著錄、審核和發布三個部分組成(如圖1所示)。其中元數據的著錄和審核由鐵路BIM聯盟各個成員負責,而元數據的發布有鐵路BIM聯盟負責。

表1 元數據元素描述方法

圖1 元數據管理流程
其中元數據的著錄分為錄入元數據相關填報模板、導入元數據填報Excel文件以及提交審核這三個步驟。即BIM聯盟各成員在完成元數據梳理后,按照規定的格式將元數據相關信息錄入填報模板,然后將元數據分類(如“項目”、“路線”等)導入BIM聯盟元數據管理平臺,同時每次只能導入一個分類下的元數據,然后提交給聯盟其他成員審核。
元數據的審核由下載元數據填報的文件、修改元數據填報文件、上傳修改后元數據文件及審核的意見四個步驟完成。即審核人員對提交的元數據文件查閱,并對相關內容進行修改,然后上傳BIM元數據管理平臺,同時給出審核意見。當元數據著錄和審核的成員對該文件都無異議后,將其內容移到待發布庫中。
元數據發布。由BIM聯盟管理人員將審核通過的元數據進行發布新版本,提供給信息供應鏈中各方使用。同時BIM聯盟會為發布的新元數據配備相應的版本編號,并更新相關的版本列表。
針對鐵路行業數據量龐大、數據關聯復雜且數據范圍廣泛所帶來的挑戰,元數據提供了有效的管理手段為數據資源的使用者和提供者。將鐵路元數據與大數據處理技術結合實施到鐵路數據服務平臺中,為鐵路工程建設行業各業務相關的應用系統提供數據的采集、整理、儲存、傳遞和共享以及大數據分析等服務。
對于重載鐵路工程元數據的未來發展首先得保證元數據的質量,目前我國的元數據質量狀態存在很大的問題,尤其在鐵路方面沒有一套高質量完整的元數據,在數據平臺存在著“基本元數據覆蓋率(完整性)”、“開放格式”等質量方面的問題。可以參照“歐洲數據門戶EDP”開創的元數據質量保障模塊來監督鐵路各領域信息資源的相關元數據質量。該模塊元數據質量標準有三個度量標準,第一個標準是用來考察元數據是否符合規范,后兩個標準是關于數據資源的可獲取程度以及機器可讀文件所含比率,這兩個標準用來評價元數據記錄是否具有準確性以及數據集是否具有開放性。
由于信息時代的到來,各領域都在朝著數字化、信息化方向發展,那避免不了數據平臺或系統間的數據信息交換和共享。這就必須要求系統具備一種能夠統一的來正確理解和有效使用數據和元數據的能力,即數據資源在系統間的可互操作性。解決“語義可互操作性”保證了在交換數據信息時,發送和接受雙方能夠有同一的方式理解和解析數據信息,知道信息所蘊含的意義。從而突破數據資源跨領域和跨國界交流和共享的障礙。
結束語:隨著鐵路網絡化、信息化建設的全面推進,信息化管理在重載鐵路方面進而得到實施并產生了顯著的成效。目前我國對重載鐵路元數據建設還落后于國際先進水平,為建設鐵路工程數據信息共享平臺帶來了困難,使鐵路領域產生的海量數據的處理面領著挑戰。針對鐵路工程建設的特點,研究鐵路元數據的有效治理、元數據的高質量以及解決互操作性等問題都將成為未來發展要解決的課題。