摘要:文章對物流元數據的概念進行了界定,針對元數據現狀,提出了一種物流元數據存儲組織模型,并根據此模型,設計一種基于“元關系”的元數據與物流信息實體之間的同步更新機制,較好地解決了物流元數據的集成管理等問題。
關鍵詞:物流元數據;存儲模型;同步機制
中圖分類號:TP311文獻標識碼:A
文章編號:1002-3100(2008)10-0007-04
Abstract: The paper gives the definition to metadata in logistics, according to the current situation of metadata, proposes one store model of organizing to metadata in logistics, and design one synchronization mechanism between metadata and logistics entity information which based on“metadata relationship”, solves integrated management of metadata in logistics and other problems well.
Key words: metadata in logistics;store models;synchronization mechanism
0引言
元數據(Metadata),亦可譯為描述數據,臺灣學者譯為詮釋數據。迄今人們對該術語的翻譯和理解尚不統一。
隨著物流技術、計算機和網絡通信的發展,信息流在物流活動中的重要性日益增加,數據的集成和共享變得越發重要。由此所帶來的管理和訪問大型物流數據集的復雜性,成為數據生產者和用戶亟待解決的問題。一方面,物流數據生產者需要有效的數據管理和維護辦法;另一方面,用戶需要找到更快、更全面和有效的途徑,以便發現、訪問、獲取和使用現勢性強、精度高、易管理和易訪問的物流數據。在這種情況下,物流數據的內容、質量、狀況等元數據信息變得更加重要,成為信息資源有效管理和應用的重要手段。
目前,國內對物流元數據的研究還相對較少。國外部分領域(如地理空間、數字圖書館等)已經利用商用數據庫對其元數據進行管理,并借助網絡發布技術實現元數據及信息的共享。但是,此類軟件尚不成熟,具體表現為:(1)元數據的管理與數據庫分離,在數據管理及訪問上存在不便;(2)元數據的存儲模型不能很好地兼容新的元數據標準;(3)元數據的同步更新機制不夠靈活,影響到快速更新與共享。
基于上述問題,在研究將元數據融入物流信息管理的基礎上,本文將對物流元數據的概念進行界定,并對物流元數據管理的兩個重要部分——存儲模型和同步更新機制進行研究。

1物流元數據
元數據在各領域的定義不盡相同,本文在綜合各種定義的基礎上,對物流元數據定義如下:物流元數據是在物流活動中所產生的數據(包含知識和規則)的描述,是一種結構化的數據,包括數據的格式、技術和業務過程、數據的規則和約束以及數據結構等。
物流元數據也是一種數據,在形式上與其他數據沒有區別,它可以以數據存在的任何一種形式存在。過去,各企業、各部門依據自身的需求所建立的數據處理和管理系統,缺乏統一的規范,對元數據內容和管理各不相同,并且沒有考慮元數據的共享,導致數據集成存在很大障礙。解決這一問題的途徑是建立統一的元數據標準。元數據標準能夠使數據生產者和用戶一起著手處理有關元數據交換、共享和管理的問題。但是,物流元數據目前缺乏統一的標準,部分企業所建立的規范也不能滿足全行業的需要。因此,本文采取另一種方式,即從存儲模型上著手,力圖在不改變現有各系統的基礎上,融合已有的元數據規范,解決這一問題。
2存儲模型
2.1存儲策略
元數據的存儲包括元數據標準(即模式)的存儲和元數據本身的存儲。二者之間的關系可以看做是類和實例之間的關系。目前,XML文件是公認的元數據最佳表示方法。因為元數據是樹狀文件,XML本身也是樹型層次結構,能夠很好地說明元數據的元素類型、元素之間的關系,并且能夠對元數據進行嚴格驗證。不過,在將XML文件存入關系數據庫時存在一些問題:XML文件和關系數據庫之間的對象映射關系還比較復雜;另外,如果將XML文件作為關系數據庫的一個字段進行存儲,則不便于對元數據元素的檢索和展現。

根據以上分析,需要一種存儲策略把XML Schema的元數據標準映射并存儲到關系型數據庫中。為此,建立了圖1所示的基于XML Schema的物流元數據存儲體系,將物流元數據按照模式和內容分別存儲。在由XML Schema模式到關系型模式的轉換過程中,核心工作是制定轉換規則,而建立轉換映射規則的前提是對XML Schema文件建立有效結構。DOM (Document Object Model,文檔對象模型)是一種抽象數據結構,它將XML文檔表示為由節點構成的樹。在DOM樹中,節點用來表示元素、屬性和文本。每棵DOM樹都有唯一的根節點。Element代表元素,是最常用的節點,它可以組成以它為根的DOM的子樹。元素節點還可以有元素子節點、屬性子節點等。利用DOM樹的思想將XML Schema轉換為DOM樹結構,分別對根元素和各級子節點的復合元素建表。并且,為了保持它們的父子關系,需要在數據表中建立指向其子節點的復合元素的外鍵(FK)。其結構解析過程如圖2所示。
2.2存儲組織模型
由于各企業、各部門依照自身的需要,使用不同的開發工具建立的物流管理系統,大多數有不同或不能兼容的內部元數據和特有的元數據接口,在沒有統一的物流元數據標準之前,數據集成存在很多問題,也非常困難。因此,可靠的存儲組織模型,成為高效集成的關鍵。
本文建立如圖3所示的模型,一個物流共享元數據庫由多個元數據庫提取得到,一個元數據庫包含多個物流元數據規范,每個規范可包含多個元數據對象。其中,每1個規范代表1個被采用的元數據標準。基于上述的層次組織模型,就可以實現元數據按照規范的分類組織,新的元數據標準可以以新的規范形式加入到某一元數據庫中。該模型具有一定的開放性。
需要注意到,在此種存儲組織模型中,元數據與物流信息實體的同步性非常重要,否則將無法查找和確認元數據所屬標準,元數據也就失去其應有價值。因此,本文接下來對該模型的同步機制進行研究。
3同步機制
3.1元關系
關系按照其類型,可分為一般關系、組合關系、繼承關系、屬性型關系等。其中,屬性型關系是指兩個對象之間的關系僅用外鍵字段關聯無法實現、需用獨立屬性表來維護關聯的關系,如圖4所示。基于此,在借鑒地理信息系統平臺軟件的基礎上,建立物流元數據和信息實體之間“元關系”,維護兩者之間的數據一致性,解決同步更新問題。
元關系屬于1∶N的屬性型關系,用于描述物流信息實體與元數據集之間的關系。該關系的源對象是物流信息實體,目的對象是元數據集,因為一種物流信息實體本身可能就是一個數據集,其中每個數據都有自己的元數據描述,如果直接在它們之間建立關系,那么數據庫系統所要維護的元關系表中的記錄條數會很多,直接影響到元數據的查詢檢索及更新等操作,降低系統使用效率。從實現角度來看,為了重用數據庫中現有關系類的管理機制,可以把元關系作為關系類的一種擴展形式,直接交由關系類表進行管理,需要維護的僅僅是物流信息實體與元數據集之間的元關系屬性表。
圖5以庫房信息為例,給出了元關系的實現描述。
為了實現1個庫房信息和1條元數據的關聯,首先需要在它們各自所屬的要素類和元數據集之間建立1個元關系。這一步交由數據庫中的關系類表來管理和維護,與此同時,對應的該條元關系的1張元關系屬性表被產生。它用于維護兩類對象所管理實體之間的關聯操作。基于這種“元關系”機制,通過定義1個物流信息實體與基于不同規范的元數據集之間的多條元關系,實現1個信息實體與多條元數據的關聯。這將有助于借助元數據發布系統,在分布、異構的信息資源中更快捷、更有效地查詢、訪問、獲取自己需要的數據。
3.2利用元關系實現同步機制的過程

假設某一物流信息實體標識為LogisticID,元數據集標識為MetaDSID,則同步過程描述如圖6所示。
首先在物流信息實體和元數據集之間建立元關系,填入關系類表;在關系類表中查詢數據庫中所有關系類型為元關系、原始類ID為LogisticID的關系類;考慮到1個物流信息實體可能與不同模式下的多個元數據集都建有關系,所以對查詢所得到的每個關系類,按照下列步驟進行處理。
(1)在關系類對應的元關系屬性表中查找滿足原始鍵值為EntityID、目的鍵值為MetaID的屬性記錄;
(2)若沒有找到表明該物流信息實體沒有元數據則根據元數據可同步元素列表的定義,自動從物流信息實體中獲取相關信息,生成1條新元數據,添加到元數據集中;
(3)若找到相關屬性記錄集,則對其中每一條屬性記錄,先根據元數據可同步元素列表的定義,自動從物流信息實體中獲取相關信息,然后再對該條記錄進行更新操作。
4結束語
元數據是使物流信息充分發揮作用的重要條件之一。本文針對物流業務實際,對物流元數據進行了定義,并對其存儲模型、同步機制的實現進行了初步研究。可應用于數據文檔建立、數據發布、數據瀏覽、數據轉換等方面,對于促進數據的管理、使用和共享均有重要的作用。
參考文獻:
[1] John Poole. 公共倉庫元模型開發指南[M]. 彭蓉,劉進,譯. 北京:機械工業出版社,2004.
[2] David Marco. 元數據倉儲的構建與管理[M]. 張銘,李欽,等譯. 北京:機械工業出版社,2004.
[3] 吳建中. DC元數據[M]. 上海:上海科學技術文獻出版社,2001.
[4] 邱祖斌. 國防科技工業數字圖書館元數據加工手冊[S]. 北京:航空工業出版社,2006.
[5] 肖瓏,趙亮. 中文元數據概論與實例[M]. 北京:北京圖書館出版社,2007.