劉紅蕾,張峰,谷峪,鮑玉斌,李芳芳,于戈
(1.東北大學 計算機軟件與理論研究所,遼寧,沈陽 110819;2.國家海洋信息中心,天津 300171)
隨著技術的進步,傳感器硬件設備的感知精度、自適應能力均得到了大幅提升,無線傳感器網絡的應用范疇越來越廣闊。無線傳感器網絡不需要線纜等基礎設施 (Akyildiz et al,2002;任豐源等,2003) 較好地克服了人工方式現場工作量大和無法保證數據實時有效性的缺點,非常適合針對海洋等復雜環境的監測任務。但由于傳感節點本身的能量限制和位置分布并不均勻,目標區域內不同位置的被感知和估算的環境信息在可用性方面差異較大;此外,節點的位置不可避免地會受到海洋復雜環境的影響而改變,從而導致目標區域感知數據可用性的動態變化。綜上,面向海洋應用的特點,建立高效的時空模型對感知數據可用性進行評價,從而獲取高質量的可用信息成為亟待解決的問題(鄭琳等,2014)。針對上述挑戰,本文充分分析了傳感器節點的數據獲取模型,能量消耗模型,還進一步針對海水的流動性,引入改進的Leeway 漂流模型,對隨機部署在海洋表面的傳感器節點的運動狀態進行建模,使其能夠更加真實地反映海洋環境。進一步從數據的可靠性和時效性兩個方面對數據的可用性進行評價,探索了在保證數據可用性前提下的高質量數據源選擇方法及航行路線評價方法,并通過仿真實驗展示了采用的模型對上述應用的有效支持。
為了通過無線傳感器網絡獲取海洋數據信息,本文引入了相適宜的傳感器節點的感知模型和能量消耗模型。同時,考慮到WSN(Wireless Sensor Network) 在復雜的海洋環境中的移動性,引入了海洋搜索中常用的改進的Leeway 模型來對傳感器節點的運動狀態進行建模。接下來,本節就將介紹這3 個模型,為傳感數據可用性評價技術的提出奠定基礎。
1.1.1 概率感知模型
在傳感器網絡的研究中,主要有兩類感知模型(Yao et al, 2009):一種是確定性感知模型(deterministic sensing model),如Boolean sensing model;一種是概率感知模型,包括Shadow-fading sensing model (Patwari et al, 2003) , Elfes sensing model (Savvide et al, 2001) 等。Boolean sensing model 是一種較為簡單的感知模型,在傳感器網絡的研究中應用普遍。相對而言,概率感知模型能夠更為準確地表示出節點的感知特性。本文所采用的便是概率模型中的一種,即Elfes sensing model。
根據Elfes sensing model 的描述,一個節點能夠探測到距它的距離為d 的事件的概率為:

其中,R1為傳感器節點的感知范圍。參數λ和γ 的值由節點的物理特性決定。Rmax是節點的最大感知范圍。這是一種較為普遍的感知模型,因為當R1= Rmax時,該模型即變為Boolean sensing model。Yao 等(2009) 將這個模型進行了簡化:

在本文之后的研究和實驗中,采用的便是這種簡化的Elfes sensing model。
1.1.2 聯合探測概率
在傳感器網絡中,一個目標往往可以被多個傳感器節點同時感知,故而對該目標的探測是這些傳感器節點協同作用的結果。因此,在對感知目標的有效探測概率進行計算時應采用聯合探測概率。
假設S= {s1,s2,…,sn} 為所有可以對點Pj進行感知的傳感器節點集合,則點Pj可被傳感器網絡探測到的概率為:

其中,p(i,j)為傳感器節點Si對點Pj的探測概率。根據上式,可對監測區域的探測概率分布進行計算。
1.2.1 相關假設
對研究的傳感器網絡做如下假設:
a) 假設各節點的位置已知,因為現有的無線傳感器網絡節點定位技術已十分成熟(Jain et al,2006;Erdun et al,2009;Wang et al,2007)。
b) 假設所有的傳感器節點是同構的,具有相同的工作參數和初始能量。
c) 假設每個節點在單位時間內均產生和發送l比特數據。為了便于研究,假設網絡采用單跳方式傳輸數據,即每個節點直接向匯聚節點發送數據。
d) 假設匯聚節點的能量足夠多,不會在網絡工作時因能量耗盡而死亡。
網絡以周期性的方式工作,一個節點在一個周期內完成對被監測對象的數據采集,并將所獲得的數據包發往基站。
1.2.2 能耗模型
采用Wang 等(2001) 提出的模型來計算節點的能量消耗,該模型也是目前多數有關網絡能耗問題的研究所采用的。該模型根據發送方和接收方的距離d,設定一個閾值d0,近距離傳輸(d 式中:Eelec表示發射裝置和接收電路每發送或接收單位比特的耗能。ETx(l,d)是發送端向距離d 發送l比特的數據所消耗的能量。ERx(l)是接收端接受l比特數據所消耗的能量。而放大器能量εfs·d2和εfs·d4由到接收器的距離和能夠接受的比特誤差率決定。對于本文中的實驗,通信能量參數設定如表1 所示。 表1 能耗模型參數 進一步地,對到匯聚節點距離不同的傳感器節點的工作壽命進行分析。假設傳感器節點的初始能量為E0,網絡的工作周期為T,則節點Sk的工作壽命即傳感器節點的持續時間Tlast(Sk)計算公式如下: 區別于陸地,無線傳感器網絡的節點部署及網絡性能均會受到海面環境的影響。從而傳感器網絡獲取的感知數據的可用性也會隨著逐漸改變。因此本文引入了劉磊(2012) 中的改進的Leeway 漂流模型,對隨機部署在海洋表面的傳感器節點運動狀態進行建模,從而能更準確地建立傳感數據的可用性的評估模型,反映真實的海洋環境狀況。 1.3.1 改進的Leeway 模型介紹 通過查閱可知,傳感器節點的運動方程為: 這里(X0,Y0)為節點初始位置, X(Δt)(Y(Δt ))為經過Δt 時間后的位置,vx,vy為速度在x和y 方向上的分量。θ=2π[R]01表示水平擴散方向的隨機性,為0 和1 之間均勻分布的隨機數。,在實驗中設定,σ=0.1~1 m2/sec2,T=Δt/2, Δt 為選取的時間間隔,dw 服從均值為0,2Δt 方差為的正態分布,取值概率滿足式1-8。 1.3.2 改進的Leeway 模型的仿真 仿真參數如表2 所示。 表2 仿真參數 設定海況為3 級以下,海表面風速在1.5 ~2.0 m/s,傳感器網絡的運動情況如圖1 所示。傳感器節點部署在1 000×1000(m2) 的監測海域內。最小圓圈內的點為節點的初始位置,星號為節點的當前位置(分別是2、4、6…20、22、24 小時后節點的位置)。 整個光合作用途徑的轉變是一個十分復雜的過程,涉及到很多基因。而光合作用途徑的轉變是可逆的,在去除鹽脅迫后,PEP羧化酶的轉錄和酶活均大幅度下降[40]。 整個網絡的運動狀況決定于風海流和潮流,隨著時間的推移,節點逐漸偏移初始位置。由于潮流的作用偏移量沒有一直增加,每當潮流方向改變1次,偏移量也會改變,同時,擴散作用也越來越明顯,網絡成散開狀,節點之間的距離在逐漸的增加。這兩點從圖1.1 中也可以看出來,圖1.1(a)中,節點逐漸偏離初始位置,而接下來的(b)、(c)、(d) 偏移量并沒有按照這種趨勢一直增加,擴散作用越來越明顯,網絡成散開狀。因此,不同于在陸地上部署無線傳感器網絡,在海洋上,風海流和潮流作為主要影響因素,導致無線傳感器網絡無規則運動,節點偏移和擴散影響了整個網絡的感知能力,進而影響了傳感數據的可用性,導致傳感數據的可用性具有實時性的特點。 圖1 傳感器的運動情況 本節將綜合考慮傳感器節點的感知能力、能量消耗和海洋中節點的運動模型,針對數據質量中的數據可用性,建立面向海洋應用的傳感數據可用性綜合評判指標及方法,主要從數據的可靠性和時效性兩個方面對傳感數據的可用性進行評價。 假定同一監測區域內的同構數據源在系統單位時間內是同步的,則每個時間片內n 個同構數據源共同產生多源多模態數據。假設目標區域大小為S× S,將其分成N × N 個小方格,設gij(1 ≤i ≤N,1 ≤j ≤N) 為目標區域內的一個小方格,設S= {s1,s2,…,sn} 為目標區域內可以進行感知的所有傳感器節點的集合,則傳感數據的可靠性和時效性的度量方法如下。 利用對目標監測的結果中可靠數據占整體的比例來衡量傳感數據的可靠性,假定Re(gij)為一個方格傳感數據的可靠性,聯系無線傳感器網絡的探測概率模型,定義對于?gij有, 式中:Re(sk,gij)表示數據源感知到gij的數據的可靠性,d(sk,gij)為數據源sk到格點gij的距離,Rmax是單個數據源感知的最大距離。 則對于?gij感知數據可靠性定義為: 根據式(2-1) 和式(2-2),可以計算出目標區域中每個格點的感知數據的可靠性,記為(xi,yi,ri),其中xi是格點的橫坐標,yi是格點的縱坐標,ri是格點(xi,yi) 的可靠性。為了向用戶多角度的直觀的展示目標區域的傳感數據可靠性,可以基于以上信息繪制對應的三維圖和等高線圖。作為示例,在300×300 單位的監測區域內隨機部署80個傳感器節點,利用式(2-1) 和式(2-2) 計算出目標區域中所有格點的可靠性,得到了圖2 和圖3 的三維圖和等高線圖,從中能夠清晰的看到目標區域中傳感數據的可靠性的狀況。 圖2 網絡的感知數據可靠性三維圖 圖3 網絡的感知數據可靠性等高線圖 對于一個區域來說,僅知道一個小格點的傳感數據可靠性是遠遠不夠的。要得到一個區域的傳感數據可靠性,首先針對傳感數據可靠性定義一個閾值Remax將?gij的感知數據可靠性Re(gij)映射成一個二值數據re(gij),即 時效性是指相對于當前任務,數據是最新數據的程度。一般用時效性來考察數據的時間特性對應用的滿足程度。數據從產生、發展、到消亡,有一個相對的有效期。不同類型的應用對數據的時間特性有不同的要求。 針對海洋環境監測,隨著時間的推移,WSN很可能隨著海水漂流到其它海域,同時節點向接收端傳送數據時要消耗能量,進而節點逐漸失效,兩種原因導致無線傳感器網絡對海洋環境無法做到持續監測。因此本文將引入劉磊等人的文獻中特定區域的持續監測時間這一概念,對于特定區域D的持續時間,表示為Tlast(D)|λ,用來衡量WSN 對于特定監測區域的監測能力,并反映數據質量的時效性。 為了研究任意網格點的感知數據的時效性,本文也利用網格的持續時間這一概念來衡量。定義對于?gij有 式中:Ta<λ(gij)表示網格點gij數據可靠性Re(gij)<λ時對應的時刻,T0(gij)表示數據可靠性Re(gij)>λ的初始時刻,由于海洋環境的特殊性,必須強調,在整個Tlast(D)|λ 內,必須保證數據可靠性Re(gij)>λ。但由于傳感器的運動復雜,每個格點的持續時間并沒有辦法計算,所以將這個持續時間映射到傳感器節點上,用傳感器節點的持續時間Tlast(Sk)研究后續問題。 本節根據第二節定義的傳感數據可靠性和時效性的度量方法,提出兩個應用——采集船的航行路線評價和數據源的選擇。 對船在航行過程中收集到的傳感數據的可用性進行評價,是本文算法的一個重要應用。 首先按照用戶給定的監測粒度對監測區域進行劃分,計算得到每個網格的傳感數據可靠性和每個傳感器節點的持續時間的值。然后根據船的實際路線信息,計算出船實際航行時所途經的所有網格。最后根據式3-1 對船航行時整個路線的傳感數據可用性進行評價。 式中:w(pk)是船途經的第k 個網格gij的傳感數據可靠性對應的權值,w(pk)可以根據對此網格采集的興趣度來確定。tk是一個時間戳。Re(pk)是對應網格點的tk時刻的傳感數據可靠性。n 為船的航行路線所經過的所有網格點的數量。Avg(U)為船的航行路線的傳感數據可用性的評價指標。 問題描述:假設對于傳感器節點分布較密集的區域內的一個網格點gij,設有n 個傳感器節點{s1,s1,s2,…,sn} 對網格點gij進行感知。那么在此網格點處,由于傳感器節點間的探測區域存在交叉,可能造成數據的冗余。當然,在傳感器節點部署比較稀疏的區域,有些網格點的周圍不存在滿足條件的傳感器節點,可能造成了數據的“空洞”。特別是在海洋環境中,隨著海面環境的不斷變化,傳感器的位置是不確定的,因此傳感器網絡的拓撲結構也是動態變化的。如圖4 所示,表示t 時刻某海域的傳感器網絡的拓撲結構。從(a) 圖中可以看出在該時刻,傳感器節點的分布是不均勻的,即某些監控區域內傳感器節點過多,而很大一部分監控區域內無傳感器節點。 圖4 傳感器網絡拓撲結構圖 對于傳感器節點分布較密集的區域,由于傳感數據的時間和空間相關性,多個傳感器節點間的傳感數據是很相似的,若每個傳感器節點均將自己感知到的數據傳輸給匯聚節點,根據節點能耗模型可以知道,傳感器節點傳送數據給匯聚節點所消耗的能量占其本身能量消耗的一個很大比重,因此,會造成資源的極大浪費。另一方面,要對傳感數據進行處理,那么處理大量的相似甚至相同的信息,也會造成相關資源的浪費。在此情景下,本節針對監測區域內任意一個網格點,提出基于可用性的數據源選擇算法,旨在保證數據質量的前提下,選擇合適的數據源將其傳感數據上傳給匯聚節點同時保證數據的傳輸代價最小。 本文首先針對任意一個對網格點gij起作用的傳感器節點sm,定義一個數據源選擇的指標Cs: 式中:Re(sm,gij)表示數據源sm感知到gij的數據的可用性,tlast(sm)表示傳感器節點的持續時間。 根據定義,首先計算出n 個傳感器節點對網格點gij的傳感數據的可靠性集合Re = {Re(s1,gij),Re(s2,gij),…,Re(sn,gij)},和n 個傳感器節點的持續時間集合Tlast= {tlast(s1),tlast(s2),…,tlast(sn)},這樣就能計算出數據源選擇的指標集合CS = {Cs1,Cs2,…,Csn}。對CS 集合的所有數據進行排隊,排隊順序是由大到小。選擇前k 個指標對應的傳感器節點作為網格點gij的數據源,將傳感到的數據上傳給匯聚節點,同時,利用傳感器硬件技術,使其它節點休眠以節省資源。 k 的指定是一個重要問題,要綜合考慮用戶的要求和實際監測環境的要求。 對于沒有傳感器節點的空白監控區域,匯聚節點可根據該區域的歷史數據以及下一時刻的感知數據,利用插值技術(如Hermit 插值和Spline 插值)對該監控區域數據進行預測以保證感知數據的可用性。 這節通過實驗展示上述綜合評價方法和評價過程,求出任意T 時刻的數據可靠性,并實現兩個應用——采集船航行路線的評價和數據源的選擇。 圖5 為程序運行之后的截圖(系統運行了能耗模型和可靠性度量方法)。分別得到了T 時刻的剩余節點數和監測海域初始時刻的數據可靠性) 其中在對話框的左側顯示了部署傳感器節點的數目、傳感器節點的位置信息、能耗模型的相關參數、網格點劃分粒度,最終給出本次模擬區域的數據可靠性。在對話框的右側顯示了T 時刻剩余的節點數、剩余節點的初始位置信息等。 圖5 運行截圖——得到T 時刻剩余節點 圖6 運行截圖——初始和T 時刻節點位置對比 觀察圖5 和圖6,初始時刻,監測區域D 中部署了80 個傳感器節點,此時監測區域D 的傳感數據可靠性為0.852,經過T(3 600 s) 時間節點的能量消耗和運動,監測區域D 的傳感數據可靠性變為0.426。說明傳感器節點的能量消耗和運動對傳感數據的可靠性有著巨大的影響。但僅基于T=1 h 的數據可靠性,不能推知T=2 h 的傳感數據可靠性一定小于0.426,因為傳感器節點的Leeway 運動模型中已經證明傳感器節點的運動決定于風海流和潮流,實際環境中隨著風向和潮流流向的變化導致監測區域外的節點回到監測區域內,數據可靠性就會提高。 圖7 路線評價截圖 圖8(系統運行了3.2 數據源選擇方法) 為指定網格點的數據源選擇截圖。其中在對話框下半部分的數據源選擇部分,本文指定了特定的網格左上頂點的橫縱坐標,其中橫坐標為100,縱坐標為40,同時給出了k 的值為2。圖的上半部分有3 個并列的網格區域,從左起,第一個網格區域展示了整個監測區域的部署情況,部署了60 個節點。第2 個網格區域展示了對指定網格有感知作用的所有數據源,可以觀察到共有12 個傳感器節點對此網格有感知作用。第3 個網格區域展示了針對特定網格進行的數據源選擇,根據要求本文算法選擇了兩個數據源。 圖8 數據源選擇截圖 然后對數據源的選擇結果進行分析,在第2 個網格區域中,從每個傳感器節點到匯聚節點的距離可以直接觀察出傳感器節點A 對指定位置的數據可靠性要高于節點B 對指定位置的數據可靠性,但是最后數據源的選擇結果中有B 節點卻沒有A節點,原因是數據源選擇算法不僅考慮了節點對網格點的數據可靠性,也考慮到了節點本身的持續時間。傳感器節點的持續時間與到匯聚節點的距離有關,根據這一點,可以知道,A 節點的持續時間要小于B 節點的持續時間。 通過傳感設備監控海洋環境有著廣泛的應用需求,同時也面臨著對感知到的環境數據進行控制和修復的諸多挑戰。本文在海洋監測應用背景下,從可靠性和時效性兩方面對傳感數據的可用性進行形式化定義及度量,并結合傳感器節點自身的能量限制,及海面環境影響下的移動性等因素,提出采集船的航行路線評價和數據源選擇算法并進行了仿真實驗的驗證。提出的傳感數據可用性評價技術有助于高質量的數據獲取、清洗和分析,是建立健壯的數字海洋系統的重要基礎。本文只對單一種類數據的可靠性和時效性進行了研究,未來工作計劃考慮一致性和完整性等更多指標的數據質量特征,并建立多模態融合數據的可用性評價模型。 Akyildiz I F, Su W, Sankaransubramaniam Y, et al, 2002. A survey on sensor network. Communications magazine, IEEE, 40 (8) : 102-114. Erdun Zhao, Yating Lv, 2009. A Density Mobility Scheme for Improving Coverage in Wireless Sensor Networks. International Conference on Web Information Systems and Mining,725-726. Guiling Wang, Guohong Cao, Piotr Berman, Thomas F, 2007. La Porta.Bidding Protocols for Deploying Mobile Sensors.IEEE Transactions on Mobile Computing,6 (5) :563-567. Patwari N, Hero III A O, 2003. Using proximity and quantized RSS for sensor localization in wireless networks//Proceedings of the 2nd ACM international conference on Wireless sensor networks and applications.ACM,20-29. S Jain, R Shah, W Brunette, et al, 2006. Exploiting Mobility for Energy Efficient Data Collection in Sensor Networks. Mobile Networks and Applications,Springer Science,11 (3) :327-339. Savvides A,Han C,Strivastava M B,2001.Dynamic Fine-Grained Localization in Ad-Hoc Networks of Sensors.Proc.ACM MobiCom,166-179. Wang A, Heinzelman W R, Sinha A, 2001.Energy-scalable protocols for battery-operated micro-sensor networks. Journal of VLSL Signal Processing,29 (3) :223-237. Yao J,Zhang G,Kanno J,et al,2009.Decentralized detection and patching of coverage holes in wireless sensor networks//SPIE Defense,Security, and Sensing. International Society for Optics and Photonics,73520V-73520V-10. 劉磊,王小青,種勁松,等,2012.海洋監測無線傳感器網絡的節點數目量化分析.電子測量技術,35(5):107-113. 任豐源,黃海寧,林闖,2003. 無線傳感器網絡. 軟件學報,14(7):1 282-1 290. 鄭琳,劉艷,崔文林,等,2014.海洋監測數據質量評估研究.海洋通報,33(2):228-234.


1.3 海洋背景WSN 運動模型




2 傳感數據可用性的評價
2.1 可靠性度量






2.2 時效性度量


3 傳感數據可用性評價的應用
3.1 采集船的航行路線評價

3.2 數據源的選擇


4 實驗
4.1 計算任意T 時刻網格的數據可靠性


4.2 采集船的航行路線評價

4.3 數據源的選擇

5 總結