摘 要: 對物流元數據的概念進行了定界,針對元數據的現狀,提出了物流元數據的存儲組織模型,并根據此模型,設計了一種基于“元關系”的元數據與物流信息實體之間的同步更新機制,較好地解決了物流元數據的集成管理等問題。
關鍵詞: 物流元數據; 存儲模型; 同步機制; 元數據的存儲; 元關系
中圖分類號:TP393 文獻標志碼:A 文章編號:1006-8228(2013)10-13-03
0 引言
元數據在各領域有不同的定義,在綜合各種定義的基礎上,對物流元數據定義如下:物流元數據是在物流活動中所產生的數據(包含知識和規則)的描述,包括數據的格式、技術和業務過程、數據的規則和約束以及數據結構等。
物流元數據也是一種數據,在形式上與其他數據沒有區別,它可以以數據存在的任何一種形式存在。但是,物流元數據目前缺乏統一的標準,部分企業所建立的規范也不能滿足全行業的需要。本文探討采取另一種方式,即從存儲模型上著手,盡量在不改變現有各系統的基礎上,融合已有的元數據規范,解決這一問題[1-3]。
1 物流元數據
1.1 企業間物流信息交換現狀
目前國內很多企業都無法順利地實現物流信息的交換,大部分企業的物流信息系統是封閉運作的,企業在各自的內部網絡采用共同的標準協議進行數據交換,但在企業間、整個物流行業間還沒有形成一套統一的、規范化的物流數據交換標準, 企業物流信息沒有共同的數據規范統一約束,導致了數據交換的困難。
1.2 基于元數據的物流信息交換技術
OAI(Open Archive Initiative)技術的目的是實現異構系統間資源的共享和交換。其主要思想是:將服務提供者和數據提供者分離, 服務提供者只提取元數據信息,對元數據信息進行重新組織,不需要了解數據提供者的內部數據格式,只需要遵循協議的格式,將參數傳給數據提供者就可以得到所需的元數據,進行資源共享和互操作[4]。
在物流聯盟中制定了統一的元數據規范,各成員只需提取元數據信息,無需再對異構數據進行復雜的數據交換,就可以對資源進行共享和信息的互操作,達到高效、合理、及時完成項目運作的目的。另外,通過元數據映射也可達到各類系統間的數據交換。為此,基于OAI的思想,從物流信息交換的研究角度出發,提出一個元數據框架的設想和信息交換模型,可以作為一個物流系統間異構數據交換的可行解決方案。
1.3 物流信息元數據框架
這里把目前第三方物流的業務概括為兩個中心,即物流中心和配送中心。物流中心承擔著訂單管理、貨物管理、倉庫管理、財務管理等,而配送中心主要負責貨物的配送管理、車輛管理等。
第三方物流業務流程產生如下數據流:發貨訂單、驗貨單、貨物通知單、貨物維護單、貨物入庫單、發貨通知單、配送計劃單、貨物記錄單、貨物運輸單、回單、退貨單;還有基礎資料信息,包括企業信息、人員信息、車輛信息、儲位信息等。
根據物流信息資源,劃定了物流信息元數據的基本框架。按元數據方法劃分成三個類型,即貨物信息元數據、單證元數據、人員信息元數據。依據各數據之間的相互關系,可以確定一個合作模型中物流信息元數據基本框架。這個框架可以支持對物流信息的組織、存儲、檢索和交換,依據元數據性質把物流信息元數據分為兩類,一類是結構性元數據,另一類是管理性元數據[5]。
2 存儲模型
2.1 存儲策略
元數據的存儲包括元數據標準的存儲和元數據本身的存儲。二者之間的關系是類和實例之間的關系,XML文件是表示元數據最佳方法。由于元數據是樹狀文件,XML本身也是樹型層次結構,能夠很好地說明元數據的元素類型、元素之間的關系,并且能夠對元數據進行嚴格驗證。不過,在將XML文件存入關系數據庫時存在一些問題:XML文件和關系數據庫之間的對象映射關系比較復雜。如果將XML文件作為關系數據庫的一個字段進行存儲,則不便于對元數據元素進行檢索和展現。
根據以上分析,我們需要一種存儲策略,把XML Schema的元數據標準映射并存儲到關系型數據庫中。為此,建立了圖1所示的基于XML Schema的物流元數據存儲體系,將物流元數據按照模式和內容分別存儲。在由XML Schema模式到關系型模式的轉換過程中,核心工作是制定轉換規則,而建立轉換映射規則的前提是對XML Schema文件建立有效結構。DOM(Document Object Model,文檔對象模型)是一種抽象數據結構,它將XML文檔表示為由節點構成的樹。在DOM樹中,節點用來表示元素、屬性和文本。每棵DOM樹都有惟一的根節點。Element代表元素.是最常用的節點,它可以組成以它為根的DOM的子樹。元素節點還可以有元素子節點、屬性子節點等。利用DOM樹的思想將XML SChema轉換為DOM樹結構,分別對根元素和各級子節點的復合元素建表。并且,為了保持它們的父子關系,需要在數據表中建立指向其子節點的復合元素的外鍵(FK)。其結構解析過程如圖2所示[2,6]。
2.2 存儲組織模型
由于各企業、各部門依照自身的需要,使用不同的開發工具建立的物流管理系統,大多數有不同或不能兼容的內部元數據和特有的元數據接口。在沒有統一的物流元數據標準之前,數據集成存在很多問題,也非常困難。因此,可靠的存儲組織模型,成為高效集成的關鍵。
本文采用如圖3所示的模型,一個物流共享元數據庫由多個元數據庫提取得到,一個元數據庫包含多個物流元數據規范,每個規范可包含多個元數據對象。其中,每一個規范代表一個被采用的元數據標準。基于上述的層次組織模型,就可以實現元數據按照規范的分類組織,新的元數據標準以新的規范形式加入到某一元數據庫中。該模型具有一定的開放性。
3 同步機制
3.1 元關系
關系按照其類型,可分為一般關系、組合關系、繼承關系、屬性型關系等。其中,屬性型關系是指兩個對象之間的關系僅用外鍵字段關聯無法實現,而需用獨立屬性表來維護關聯關系,如圖4所示。基于屬性表建立物流元數據和信息實體之間“元關系”。維護兩者之間的數據一致性,解決同步更新問題。
為了實現一個庫房信息和一條元數據的關聯,首先需要在它們各自所屬的要素類和元數據集之間建立一個元關系。這一步交由數據庫中的關系類表來管理和維護,與此同時,產生一張對應該條元關系的屬性表。它用于維護兩類對象所管理實體之間的關聯操作。基于這種“元關系”機制,通過定義一個物流信息實體與基于不同規范的元數據集之間的多條元關系,實現一個信息實體與多條元數據的關聯。這將有助于借助元數據發布系統,在分布、異構的信息資源中更快捷、更有效地查詢、訪問、獲取所需要的數據[9-10]。
3.2 利用元關系實現同步機制的過程
首先在物流信息實體和元數據集之間建立元關系,填入關系類表;在關系類表中查詢數據庫中所有關系類型為元關系、原始類ID為ItemsID的關系類;考慮到一個物流信息實體可能與不同模式下的多個元數據集都建有關系,所以對查詢所得到的每個關系類。按照下列步驟進行處理。
⑴ 在關系類對應的元關系屬性表中查找滿足原始鍵值為EntityID、目的鍵值為MetaID的屬性記錄。
⑵ 若沒有找到元關系屬性記錄表明該物流信息實體沒有元數據,則根據元數據可同步元素列表的定義,自動從物流信息實體中獲取相關信息,生成一條新元數據。添加到元數據集中。
⑶ 若找到相關屬性記錄集,則對其中每一條屬性記錄,先根據元數據可同步元素列表的定義,自動從物流信息實體中獲取相關信息,然后再對該條記錄進行更新操作。
參考文獻:
[1] 傅海洋,黃俊,劉曉晨.物流元數據及其管理研究[J].物流科技,2008.10.
[2] 吳寶山.基于XML的物流元數據的存儲研究[D].安徽大學碩士學位論文,2007.
[3] 肖瓏,趙亮.中文元數據概論與實例[M].北京圖書館出版社,2007.
[4] 朱毅.元數據存儲框架及服務發布[J].科技信息,2009.23.
[5] 肖瓏,趙亮.中文元數據概論與實例[M].北京圖書館出版社,2011.
[6] 杜楠,彭宏.混合式的元數據管理系統研究[J].計算機工程與設計,2009.15.
[7] 黎建輝,吳威,閻保平.一種基于XML的元數據映射與轉換算法[J].微電子學與計算機,2008.1(25).
[8] 鄭琳曦.內容管理研究與實現[D].北京工業大學工程碩士學位論文,2007.
[9] XML Linking Language(XLink)Version 1.0.
[10] World Wide Web Consortium.XML Schema.
[11] Open GIS Geography Markup Language (GML)Implementation Specification3.0:OpenGlS Consortium,Inc,2013.
[12] Yan Jie, Zhu Yaolong, Xiong Hui. A Design of Metadata ServerCluster in Large Distributed Object-based Storage. In: 12th NASA Goddard, 21st IEEE Conference on Mass Storage Systems and Technologies,2012.
[13] David Marco.元數據倉儲的構建與管理[M].機械工業出版社,2011.