袁維海
(安徽經濟管理學院,安徽 合肥230059)
1999年,基于射頻識別技術(Radio Frequency IDentification:RFID)的傳感網的概念由MIT實驗室的Ashton提出,[1]2005年國際電信聯盟(International Telecommunications Union:ITU) 正式明確了物聯網的概念:“Internet of Things”,這一概念的內涵使得物聯網遠遠超出了RFID的范疇。[2]2009年,溫家寶總理提出“感知中國”,由此物聯網在國內受到了愈加廣泛的關注和越來越多的嘗試。物聯網在國內更多的被定義為“一個基于互聯網、傳統電信網等信息載體,讓所有能夠被獨立尋址的普通物理對象實現互聯互通的網絡”。[3]由此概念出發,可以看出,推動物聯網在各領域的廣泛應用的必要前提是普通物理對象的“獨立尋址”和“互聯互通”,也即要賦予“物”以標識和元數據,[4]由于元數據的本質可以理解為“描述數據的數據”,因此,元數據在物聯網中的作用也就為管理這些海量的“物”信息,提供了一個重要的支撐平臺。
目前,對于物聯網的研究更多地集中在承載網絡、傳感技術、商業模式、云計算等方面。隨著物聯網應用系統建設的不斷推進,物聯網所感知、傳遞、存儲、計算、處理的信息將遠遠超過現有互聯網的信息量。因此,如何更加高效地管理這些信息是物聯網建設和應用的一項重要工作,如果能將廣泛應用于檔案界元數據的研究成果應用于當前缺乏數據標準和規范的物聯網中將是十分必要和有效的。
物聯網的深入應用使得 “普通的物理對象”越來越廣泛地接入物聯網的承載網絡,如何更好地標識、描述對象的相關數據是物聯網具體應用的基礎和前提,因此,元數據對于數據信息的描述功能,為海量“物“信息的描述提供了重要的支撐,而對于海量“物”信息準確、合理的描述,也可以提高對“物”信息的檢索和獲取。從這一角度看,加強物聯網中元數據體系的建設,實現對海量“物”信息更加有效的訪問控制是可行和必要的。
各領域、各行業、各部門,直至各個企業、家庭對于物聯網的實際需求都是不同的,所要聯接的“物”也是不同的,同樣對“物”信息的描述與訪問需求也是不同的。這種不同勢必造成按照傳統信息系統的方式構建的物聯網系統,將難以實現各物聯網系統內部,各系統之間的互聯互通以及對這一聯通進行有效的訪問控制。由于物聯網信息較互聯網的特殊性,物聯網系統的重復建設和信息孤島問題也較互聯網更為突出。因此,實現信息互通需要在不同物聯網系統中加入元數據服務層。
元數據在物聯網中的應用不僅可以為物聯網子系統的互聯互通提供便利,使用戶可以更快捷地獲取海量“物”信息,同時,元數據提供的描述機制,可以為用戶實現自助式的信息分析統計提供可行的途徑,用戶也可以更多地從數據獲取工作中解放出來,更多地實施數據價值的發掘和利用。
由于物聯網中“物”的廣泛性,使得信息本身的類型繁多,同時,不同主體對于元數據的需求同樣也是不同的,沒有一個標準能夠覆蓋不同行業的元數據需求。以都柏林核心元素集 (Dublin Core Element Set:DC)為例,DC是網絡信息資源編目的主要元數據格式之一,DC的簡潔性使得其可以相對便利地應用到各個領域,但同樣因為這樣的簡潔性也使得其并不能完全覆蓋各個領域的需求。因此,DC向各個領域的延伸也同樣需要一個循序漸進的過程。在物聯網應用系統即將大量建設的階段,等待統一的物聯網元數據標準將是一個漫長且艱難的過程,而在各個領域、各行業的物聯網系統中,構建不同的元數據基本規范,并由這些基礎方案構建一個物聯網元數據體系,這對于加快物聯網建設進程,將更具可行性。
物聯網各個領域、各行業中應用系統元數據基本規范的建設,必然產生對于現有元數據標準在元素集上的刪減和擴充。元數據對于信息的描述,主要包括描述基本內容、知識產權和元數據自身的維護信息,[5]從本質上看,這些描述的作用都可以理解為主體對資源內容檢索和訪問控制的需要。由于物聯網中“物”信息的特殊性,安全需求就顯得尤為重要。因此,物聯網子系統的元數據元素集的建立,還需要從訪問控制的角度,加入必要的元數據元素,以此對元數據在訪問控制方面的特性給予相應的完善和優化。
物聯網元數據基本規范的建設,以及對于標準元素集的刪減擴充,必將形成不同的元數據格式,這種不同又將會給信息的互聯互通帶來障礙。兼顧物聯網各子系統信息的聯通,還需要建立相應的元數據的映射機制,這就要求各個子標準的構建需要對行業標準等進行必要的兼顧。因此,在具體的物聯網應用系統中構建元數據方案,需要按照通用元素、特有元素和擴展元素的分類對多種標準的元素集進行分類,從而為元數據映射和數據共享奠定基礎。
目前,元數據在信息系統中的作用更多地表現為檢索的功能,隨著物聯網應用的不斷深入,物聯網系統不僅需要解決數據資源采集和管理的問題,更重要的還需要不斷挖掘數據資源的內在價值和關聯知識,因此,設計更加可行的,并能夠體現資源價值和關聯知識的元數據子方案,將可以更好地促進物聯網的規范應用。
隨著物聯網應用系統建設的不斷推進,在應用系統中增加元數據服務是十分必要的,但目前的物聯網應用系統更多的是表現為信息感知而非信息管理,在物聯網系統中對于元數據服務的設計還很不足。科學數據共享工程技術標準——元數據標準化基本原則與方法[6]給出了一個針對不同領域制定各自元數據標準的指導意見,但并未給出物聯網應用系統實施中進行元數據設計的具體方法,一方面是由于目前各領域的元數據標準建設還相對滯后,另一方面是各領域的元數據標準在具體的物聯網信息系統建設中,同樣需要根據物理對象的不同特性,以及使用者的不同需求,進行不同的設計。
依托某校企合作科研項目中項目組開發的基于無線定位的企業員工管理系統的一個子系統,本文進行了元數據服務方案設計的嘗試。該管理系統主要用以對企業業務人員的定位考勤,同時協助業務人員通過移動終端進行數據采集和檢查,并可以將采集到的“物”信息傳送回服務端。具體的元數據規范化工作主要包括以下3個方面。
通過對系統的功能分析,將元數據服務層設計在數據庫資源與系統應用層之間的系統應用中,因此,該元數據服務并未關注定位考勤的GIS元數據標準問題,而更多地關注信息庫的訪問控制,協助用戶可以通過服務端或是互聯網絡等,實現對數據庫信息的檢索、顯示和提取。具體結構如圖1所示。

圖1 元數據服務的應用層次
從基本內容、版權信息和外部屬性3個方面,分析不同類別的數據元信息,設定主體對于“物”信息的不同訪問需要,以此形成子系統元數據的元素集,利用這些元素集對數據元進行描述,以便實現不同主體對于數據信息的訪問控制。以都柏林核心元素集為基礎,對于員工管理系統中的員工考勤數據信息庫進行元數據需求分析。其中基礎元數據定義如表1所示。
參照表1信息,該系統剔除了柏林核心元素集中語言、關聯、出版者、其他責任者4個元素,原因在于該數據庫中信息與圖書資源不同,不存在不同的語言,也不存在不同的版本,可以忽略此4項描述的需求,同時對余下的元素中按照“可選”和“必選”進行劃分。
同時,由于此考勤管理系統中,涉及一定的個人安全信息,因此需要以動態訪問控制的實現為目標,擴充相應的元數據元素,進一步優化元數據的設計。在該子系統中,項目組從訪問控制的角度增加了“安全級別”的元數據元素,用于規范特定數據源的存儲、訪問、修改、銷毀的標記,從業務人員考勤管理和移動終端信息采集的特殊需求的角度,將創建者界定為人員從屬的組織,因此增加“人員”元素,用于描述信息資源所涉及的人員信息,同時增加“網絡結點”元素,用以描述采集、上傳的“物”信息的特定網絡結點。相關信息如表2所示。

表2 系統中元數據元素的擴充
元數據基本方案的設計,為該系統后續的信息檢索和訪問控制奠定了基礎,同時也使得該系統區別與傳統的員工管理系統。由于系統中元數據方案以都柏林核心元素集為基礎進行刪減和擴充,使得其與其他物聯網子系統的信息交互將更為便利,而不僅僅是一個獨立的信息孤島,同時,這種交互也將進一步提高該系統中信息的應用價值。

表1 員工考勤數據信息庫基礎元數據定義
物聯網元數據標準化工作和元數據體系建設,是一個龐大的系統工程,一個完善的覆蓋所有領域、行業、企業的元數據標準,并不符合物聯網發展的實際。在一個兼容、可行、可擴充的前提下,探索各物聯網子系統的元數據體系建設將更具可操作性。本文主要從元數據在物聯網中的作用出發,探討物聯網子系統元數據的基本規范的建設,并從訪問控制的角度,研究元數據元素集的刪減與擴充,是對物聯網元數據體系建設的探索,也將對物聯網子系統的具體實施起到積極的作用。
[1]劉若冰.物聯網的研究進展與未來展望[J].物聯網技術,2011,(7):58-62.
[2]International Telecommunication Union.ITU Internet Reports 2005.The Internet of Things[R].2005:2-5.
[3]劉云浩.物聯網導論[M].北京:科學出版社,2010:3-5.
[4]王靜.物聯網的元數據體系初探[J].標準化研究,2010,(4):37-39.
[5]李建花,曲守寧.面向信息集成的元數據模型的研究和應用[J].計算機與數字工程,2010,38(12):149-152.
[6]中華人民共和國科學技術部.科學數據共享工程技術標準——元數據標準化基本原則與方法[EB/OL].http://www.sciencedata.cn/.