摘 要: 在分布式傳感網絡(DSN)上提供一個基于語義技術的任務?設備映射機制設計,有利于設備發現和任務匹配。其映射模式包括任務和設備匹配用的共享規范集合以及各個元素之間的關系。基于四元組,重用SSN,OntoSensor,AWS等現有的面向領域的本體,擴展匹配機制中的元素,形成本體知識庫。以森林火災防測為目標領域,利用Jena API等工具進行了樣機開發,實現了能力斷言和設備匹配功能,并從邏輯功能、響應時間、主客觀評測等方面對本體知識庫和樣機進行了參數評估,從參數結果驗證了提出的匹配機制和框架結構的可行性。
關鍵詞: 本體知識庫; 語義技術; 映射機制; 任務分配
中圖分類號: TN711?34; TP277 文獻標識碼: A 文章編號: 1004?373X(2016)19?0082?07
Abstract: A design of mission and device mapping scheme based on semantic technology is proposed for the distributed sensor network (DSN), which is very helpful to discover the device and match the mission. The mapping mode includes the mission, shared specification set for device matching, and relationship among these elements. On the basis of the tetrad, the avai?lable domain ontology of SSN, OntoSensor, AWS is reused to extended the elements in matching mechanism to form the ontology knowledge base. The forest fire prevention is taken as the target domain, and the Jena API tool is used to develop the prototype to realize the functions of capability assertion and device matching. The parameters of ontology knowledge base and prototype were assessd in the aspects of logical function, response time, subjective and objective evaluation. The results verify that the proposed matching mechanism and frame structure are feasible.
Keywords: ontology knowledge base; semantic technology; mapping scheme; mission allocation
0 引 言
由大量異構平臺、傳感器構成的分布式傳感網絡可以概括為“多載荷傳感網絡”,隨著計算機技術、網絡通信技術的普及與發展,分布式傳感網絡技術日趨成熟,大量的多載荷平臺(如衛星、無人機、艦艇、水下自主機器人和自動巡邏車等)構成多維度交叉的分布式系統[1],對目標區域進行不同空間和時間尺度的實時自主巡邏、監測,從生態、治安、軍事、環境等方面為人類提供服務,呈現出傳輸高速化、寬帶化,網絡節點異構化,應用場景泛在化與智能化的特點。然而,多載荷傳感網絡存在任務復雜度高、設備種類繁多,個例狀態復雜等特點,網絡中的信息描述方式較為復雜,沒有統一的規范,進而阻礙了用戶發布任務與發現設備,難以實現有效的資源分配。因此,任務和設備的映射機制不僅僅應該提供一個通用的描述格式,而且其匹配機制還應包含元素之間的關系[2]。
傳統的傳感器網絡[3](Sensor Network,SN)側重于硬件基礎設施,其節點由大量結構簡單的傳感器構成,在分布式的環境上下文中測量對象的溫度、速度、聲音等物理屬性。隨著語義網(Semantic Web,SW)的興起,Sheth A等人結合語義網的資源發現能力、資源集成和互操作等特性,提出了語義傳感網絡[4](Semantic Sensor Web,SSW)的概念化結構,其核心是憑借語義技術對傳感網絡中的信息進行語義注釋,從而能夠與語義網進行信息共享。本文旨在探討具有分布式、開放性、智能化的多載荷分布式網絡環境,通過語義技術[5?7],設計面向動態任務的設備匹配機制,建立用于存儲元素和關系的知識庫,其核心機理是對大量數據進行高度抽象,得出層次化、普適性的概念體系結構,進而對數據進行語義化注釋,便于機器進行信息檢索,從而減小多源設備帶來的信息復雜性和異構性,為實現自主的資源分配和態勢評估做出支撐。
1 映射規范和映射過程
任務需求源自于用戶,通常更接近自然語言,從而使得需求模糊不清,不利于機器理解,在傳統傳感網絡中,任務和設備是綁定的,用戶不能自主定制任務,從而限制了動態環境下的任務分配[8]。從底層,異構的物理結構和協議的統一格式描述,限制了設備分配。為了解決這些問題,需要提出一種信息共享格式。
1.1 映射規范
本文提出了任務?設備映射模式(Mission?Device Mapping Schema,MDMS),這種方式主要包括共享的規范集合(Specification Set)以及集合元素之間的關系,并以語義的方式進行描述。通過分析任務需求和設備能力,它們之間頂層關系可以作如下表述:設備向任務提供能力,另一方面任務需求需要多個設備實例滿足需求。設備具有多重屬性維度,如目標及目標屬性,移動性、監測區域、性能、智能、通信、可用性、地點、環境影響因素(天氣、地形等),本文主要將這些屬性劃分為四個標簽集合,這些集合形成一個四元組(T,I,C,S):
目標(Target):目標是多個可觀測屬性的物理表征,目標標明了數據源,同時也標明了設備可以處理的對象。
屬性(Interest):屬性是可以被觀測的目標屬性,目標和屬性共同表示了數據源及數據特征點,如某區域森林(目標)的溫度(屬性)。
設備能力(Capability):描述了由設備類型共享的能力,具體而言,能力可以劃分為兩種:簡單能力(Simple Capability)和復雜能力(Complex Capability)。簡單類型只代表了單一的能力如領域、速度、能級等,而復雜類型則需要與目標、屬性進行關聯,如觀測、可視化等。這樣的定義影響了知識庫的設計。
狀態(Status):描述了設備個例在環境上下文中的動態信息,例如地點、可用時間段等。
根據這些共享的元素,本文使用多元組(屬性(I),目標(T),能力(C)和狀態(S))描述元素和元素關系形成共享的規范集合,以及這些元素所具備的關系。同時,這四個集合同時也用于描述任務需求,從而為映射機制提供可匹配的內容。基于定義的規范和關系,可得出映射模式圖,如圖1所示。
設備(device)可以用一個四元描述:[d=][Id,Td,Cd,Sd,]通過語義的方式表達如下:[M=Task1,Task2,][Task1,Task2]是可以通過許多可行性方案的子任務。通過使用規范集合對設備和任務進行描述,從而建立兩者共享的規范集合,為了靈活地對給定的任務進行設備匹配,本文改進了 “語義對接”的方法:將設備信息以四元組的形式存放至知識庫中,以任務需求為導向,根據需求形成索引規則,進而在知識庫中進行查詢,找出滿足需求的設備;在設備集合與任務之間建立雙向映射,從而可以對備選集合進行定位,分配指定任務;對于多個具有競爭關系的任務,則根據優先級、適用性等分配策略進行有效的分配。具體如圖2所示。
1.2 擴展本體知識庫
傳統的數據庫缺乏關聯性和自動性,本文采用本體作為數據結構形式,利用已有的本體,在統一框架內設計規范集合內的概念及關系,構造一個概念層次分明、結構可循的傳感信息知識描述體系,通過描述邏輯將本體中的層次化結構進行邏輯表述,使得概念有良好的層次化結構和分類,從而實現了子類的繼承和多態化。
為了彌補MDMS規范集合與現存本體之間的空缺,本文設計了若干個概念作為中間件,這些中間件可以通過相關的本體進行擴展和細化。任務屬于一種即時的、動態的需求,所以用圖形化用戶界面(GUI)進行配置更加符合需求,然而為了進行自主匹配,任務也以規范化集合的形式存儲在本體知識庫中。本體知識庫中所涉及的關鍵概念具體如下:
1.3 映射步驟
基于本體知識庫,可以構建良好的設備目錄,從而為任務需求提供設備能力查詢。任務需求和設備能力能夠被同一個四元組描述,這個四元組包含了屬性、目標、能力和狀態。通過符號邏輯,可以清楚地表現這些元素之間的匹配關系,進而進行語義表達。以復雜任務“監測森林火災”為例,該任務可以分解成兩個子任務:“可視化森林林冠”和“監測森林氣象數據”,表示為[M=]{Task1,Task2},每個子任務的需求可以由規范集合進行描述:[R={IR,TR,CR,SR},]這個任務需求可以由一組包含多個設備的設備集合滿足[D={d1,d2,…,dn},]而每個設備具備不同的規范集合,[d={Id,Td,Cd,Sd},]設備集合的屬性由這些設備屬性疊加或干涉而來,于是就可以搜索出多個符合條件的設備集合組作為備選方案,[DTask={D1,D2,…,Dn},]所以有如下的邏輯表達式:
[D∈DTask?RI,T,C∈DI,T,C?RS∈DS]
在邏輯表達式中,如果[D]同時滿足以下條件,則認為它是有效的設備集合之一。[D]的屬性、目標、能力組成的具有邏輯關系的三元組能夠滿足任務需求,[D]組中的設備個例的狀態符合子任務需求的狀態條件。采取這樣的匹配方式是由于屬性、目標和能力之間存在內在聯系,如果不考慮這些元素間的內在聯系,會出現元素類型匹配,但是邏輯關系混亂的情況。
最后,將獲取到的設備集合返回給客戶端,作為滿足任務需求的備選方案,在這個過程中,可以進一步對策略進行優化,從最大適用性、最小組合、最優經濟等方面對設備集合進行篩選排序,以提供更符合用戶需求的策略。方案如圖5所示。
2 框架設計與樣機構建
2.1 框架設計
目前已經存在多種面向不同領域的本體和標準,然而面向語義傳感器網絡框架則較少,而且部分框架并未完全遵循SWE[9]標準。較為典型的如Henson等提出的SSN三層體系架構[10],但是該框架僅適用于本地傳感器網絡,無法實現傳感器Web的動態部署和數據上傳問題,且沒有闡述如何接入本體庫。本文提出一種新型的三層框架,框架的整體結構如圖6所示。
該框架大致劃分為本體知識庫、本體訪問層、業務邏輯層和表現層。本體知識庫包含任務規范和設備目錄,用于存儲任務和設備中的元素以及元素之間的關系,該數據結構符合設計的擴展本體關系(MDMO);本體訪問接口主要分為規則推理和結構管理,規則推理主要通過規則對本體知識庫進行查詢,其查詢規則符合語義邏輯,即不僅僅進行元素訪問,還需要考慮元素之間的關系;結構管理需要對知識庫中的數據結構和元素進行更新和添加,即管理整個知識庫的結構和元素;業務邏輯主要包含需求轉換和設備映射,需求配置是將用戶的需求轉換成相應的規則,而設備映射則是以匹配模式對設備目錄進行索引;表現層提供了用戶配置需求和展示備選方案的交互界面。
2.2 業務邏輯實現
通過規則,該樣機的業務邏輯主要實現了兩個功能:設備能力斷言;任務需求與設備能力匹配。在構建樣機的過程中,選擇jena Rules[11]作為規則語言,因為由該格式編寫的規則能夠在系統運行過程中動態地被推理機進行調用。該推理規則如圖7所示。
規則具體例子如圖7(a)所示。該規則包含9條三元組語句,第二行至第七行構成了該規則的“身軀”,描述了任務所需求的屬性和能力。在樣機推理過程中,主要包含三種推理規則:前置推理,需求推理和后置推理。前置推理主要用于設備的能力斷言,即通過附加關系確定復雜平臺的能力;后置推理用于設備個例狀態判斷,例如可用性、位置、能源等;后置推理主要是保證個例的正確匹配。
2.3 樣機功能測試
為了驗證樣機功能,本文在本體知識庫中實例化了若干個模擬任務和設備,包括3個任務,由5個子任務分別構成;10個備選設備。按照預期結果,會出現如圖8所示的匹配關系。
當推理機進行處理時,采用的規則類似于圖7中的規則。其他設備則作為冗余項目以驗證是否能夠進行正確的匹配。以第一個任務“監測森林火災”為例,該任務由兩個子任務構成,其中子任務1是“監測森林氣象數據”,主要包含4個復雜能力需求:“監測森林溫度”、“監測森林濕度”、“監測風速”、“監測風向”。而在設備目錄中存在WXT520基站類型,該設備攜帶了溫度傳感器、風向傳感器和濕度傳感器,分別對應任務1的需求;同理,子任務2的能力需求也可以被UAV類型滿足,于是經過推理機推理,WXT520,UAV的可用個例集合將作為備選方案返回給用戶。按照上述推理流程,三個任務分別各產生了可用的設備集合,并返回了多個設備實例,如圖9所示,某些實例可以被不同的子任務共享,如Human Team,它的能力可以同時滿足第二個任務的Task1和Task2。
3 樣機定量評估
3.1 人工和客觀評價
本文采用人工評價和客觀評價兩種方法對本體和樣機進行評測,人工評價指標主要參考文獻[12]中的模型構建階段的評估指標和評估方法以及文獻[13]的人工評價標準;客觀評測采用文獻[13]的標準與方法。人工評價計算方法為:[Subjective=Def×wdef+St×wst,]其中Def為定義精準性,計算方法為[Def=DE×wd+OR×wr+][CU×wu,]DE為領域專家評價結果,OR為本體專家評測結果,CU為普通用戶評價結果,[W]為權重,St同理。由于本文的本體主要用于映射,所以更注重對本體的結構合理性,以加速推理機的查找,所以結構合理性的權重分別為0.6,0.4,根據評價人員側重情況和本體面向領域,領域專家、本體專家和普通用戶的權值分別取[Wd=0.35,][Wr=0.35,][Wu=0.3,]滿足[Wd+Wr+Wu=1,]如表1所示,從結果中可以看出,本文提出的本體與其他本體在結構的合理性以及定義精準性方面得到了使用者的認可。
3.2 查找耗時
查找耗時指對于給定的任務,經由推理機根據規則正確遍歷數據庫消耗的時間。該項指標主要與知識庫的設計結構、個例數量、推理規則、任務復雜度有關,而推理規則由任務需求生成,可視為同一變量。因此,本小節主要以個例數量、任務復雜度為變量,測試不同規模下的反饋時間,主要分為兩個步驟:
(1) 固定本體知識庫中的個例數量,通過增加復雜能力,增加需求數量。本文將任務需求劃分為有匹配項和無匹配項兩類,若任務所有的復雜能力需求在知識庫中有可以滿足的設備,則視為有匹配項;若全無,則視為無匹配項。其響應時間與任務需求數量關系擬合曲線如圖10所示。
平均響應時間主要受到本體自身的復雜度影響,尤其是個例數量,在任務需求既定,個例數量增加的情況下,平均響應時間呈現出明顯的上升趨勢,從而導致查找速度變慢。所以單個本體庫不能過大,為了減緩本體中個例數量增多,可以通過將本體文件中的個例進行分割存儲,保存至多個數據文檔中,再通過配置文件對這些文檔進行索引,從而減少檢索需要的時間。
4 結 語
目前匹配機制主要是聚集在設備類型匹配上,對個例狀態僅設定了可用性、可用時間等簡單條件。策略推薦機制也不完善。隨著網絡變得越來越智能化,傳統傳感網絡勢必向互聯化、智能化發展,這就需要一個自主的、完備的系統,以實現態勢評估。通過語義技術解決任務與設備匹配問題,以本體為正規表達,基于本體知識庫可以設計出一種映射模式。為解決此類問題提供了探索性的提示。然而,還有很多新興技術對于以后的工作十分重要,如資源分配和信息融合。
參考文獻
[1] HOWE B M, YI C, ARABSHAHI P, et al, A smart sensor web for ocean observation: fixed and mobile platforms, integrated acoustics, satellites and predictive modeling [J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2010, 3(4): 507?521.
[2] Google. Google physical Web [EB/OL]. [2014?03?11]. http://google.github.io/physical?web.
[3] SHARMA V, KUMAR R. A cooperative network framework for multi?UAV guided ground Ad Hoc networks [J]. Journal of intelligent robotic systems, 2015, 77(3/4): 629?652.
[4] SHETH A, HENSON C, SAHOO S S. Semantic sensor Web [J]. IEEE Internet computing, 2008, 12(4): 78?83.
[5] LIU J J, NISHIYAMA H, KATO N, et al. Toward modeling Ad Hoc networks: current situation and future direction [J]. IEEE wireless communications, 2013, 20(6): 51?58.
[6] CONTI M, GIORDANO S. Mobile Ad Hoc networking: milestones, challenges, and new research directions [J]. IEEE communications magazine, 2014, 52(1): 85?96.
[7] BERTRAND A, MOONEN M. Seeing the bigger picture: how nodes can learn their place within a complex Ad Hoc network topology [J]. IEEE signal processing magazine, 2013, 30(3): 71?82.
[8] HUTCHINSON R. Sensor?mission assignment in constrained environments [J]. IEEE transactions on parallel and distributed systems, 2010, 21(11): 1692?1705.
[9] HENSON C, PSCHORR J K, SHETH A P, et al. SemSOS: semantic sensor observation service [C]// Proceedings of 2009 IEEE International Symposium on Collaborative Technologies and Systems. Baltimore: IEEE, 2009: 44?53.
[10] COMPTON M, HENSON C, LEFORT L, et al. A survey of the semantic specification of sensors [C]// Proceedings of 2009 International Workshop on Semantic Sensor Networks. [S.l.]: IEEE, 2009: 709?711.
[11] Anon. Jena rules [EB/OL]. [2001?10?22]. http://hydrogen.informatik.tu?cottbus.de/wiki/index.php/JenaRules.
[12] 劉艷玲.本體構建的評估研究[D].太原:山西大學,2008.
[13] 馬曉偉.基于Web的本體評價系統的研究與實現[D].青島:中國海洋大學,2009.
[14] 張現忠.語義傳感器Web中傳感器本體構建研究[D].大連:大連海事大學,2011.
[15] WEI T, LU Y, CHANG H, et al. A semantic approach for text clustering using WordNet and lexical chains [J]. Expert systems with applications, 2015, 42(4): 2264?2275.
[16] GAO J B, ZHANG B W, CHEN X H. A WordNet?based semantic similarity measurement combining edge?counting and information content theory [J]. Engineering applications of artificial intelligence, 2015, 39: 80?88.