趙東+馬華東+劉亮
摘要:認為移動群智感知網絡的感知質量包含時空覆蓋質量和數據質量兩個層面,前者關注是否能采集到足夠多的數據,而后者關注數據是否足夠準確和可信。分別從這兩個層面討論了感知質量度量和保障的方法,對移動群智感知網絡的部署和應用具有一定的指導意義和實用價值。
關鍵詞: 移動群智感知;感知質量度量;感知質量保障
目前,物聯網已經進入深度發展階段,對物理環境更大規模、更復雜、更全面的感知需求越來越強烈。在過去十多年內,人們主要關注以無線傳感網為代表的固定部署感知網絡,用來對森林、海洋、火山等自然環境進行監測。然而,這種傳統感知模式的網絡部署和維護成本很高,不適宜進行大規模的城市感知。近幾年來,人們開始關注一種新型物聯網感知模式,即“移動群智感知[1-3]”,或者叫“以人為中心的感知[4]”、“參與感知[5]”、“機會感知[6]”等。這種感知模式的產生一方面是由于現實世界中存在著大量的移動感知節點,例如,具有多達十幾種傳感器的智能手機、各種可穿戴設備(如智能手環、智能手表、智能眼鏡等)、車載感知設備(如全球定位系統(GPS)、第2代車載自動診斷系統(OBD-II)、車載二氧化碳傳感器等)或其他便攜式電子設備(如Intel的空氣質量傳感器)。這些感知節點通常由移動的人或車攜帶,因而更容易實現對整個城市的覆蓋,我們將其稱之為“移動感知”。另一方面,最近學術界和工業界流行一種“眾包”思想,它是一種新的分布式的問題解決模式,就是將一個復雜的問題分解成很多個簡單的問題,然后外包給大量的普通用戶來協同完成。于是,移動感知與眾包思想的結合,就產生了這種新型物聯網感知模式——移動群智感知,它將普通用戶的移動設備作為基本感知單元,通過移動互聯網進行有意識或無意識的協作,實現感知任務分發與感知數據收集,完成大規模的、復雜的社會感知任務[3]。
與傳統的固定部署感知模式相比,移動群智感知有三大優點:網絡部署成本更低、網絡維護更容易、系統更具有可擴展性[7],因此更適合完成一些大規模的、復雜的感知任務,可應用于城市環境監測、智能交通、城市管理、公共安全等領域。
然而,很少有人關注移動群智感知網絡的感知質量問題。我們認為,移動群智感知網絡的感知質量包含時空覆蓋質量和數據質量兩個層面,前者關注是否能采集到足夠多的數據,而后者關注數據是否足夠準確和可信。
然而,在移動群智感知模式下,用戶的屬性、位置、情境等方面的動態變化性使得我們很難對時空覆蓋質量進行度量和保障;而用戶感知設備、感知方式、主觀認知能力、參與態度等方面的異構性也使得我們很難對感知數據的質量進行相關的度量和保障。
因此,文章分別從時空覆蓋質量和數據兩個層面討論感知質量度量與保障的問題以及對應的解決方法,對移動群智感知網絡的部署和應用具有一定的指導意義和實用價值。
1 時空覆蓋質量度量與保障
隨著移動感知設備的持有者隨機地到達城市的各個地方,這些節點即可隨時隨地進行感知。這種移動性對許多應用的感知質量起著重要的作用。以城市空氣質量監測為例,假定我們計劃使用大量的出租車攜帶空氣質量傳感器,對北京的五環內區域進行監測,構建每天早上6點到晚上12點時間段的空氣質量感知地圖。事實上,有兩個基本問題有待解決:怎樣度量這些出租車提供的感知機會以及它們能達到的感知質量?需要部署多少輛出租車能達到所需的感知質量?
首先,我們從時間維度來考慮。在傳統的固定部署的傳感網中,研究者常常使用覆蓋率來度量感知質量,通常需要監測區域內每個點總是被至少一個傳感器節點覆蓋,這種網絡的覆蓋質量一般不會隨著時間而改變。然而,由于人的移動性,移動群智感知網絡的覆蓋質量是動態變化的。考慮到感知覆蓋的時空變化因素,我們將整個監測區域劃分為多個網格單元,將每個網格單元被連續覆蓋兩次的間隔時間作為一個新的度量指標,稱之為覆蓋間隔時間,用來描述每個網格單元被覆蓋的機會。通過對北京和上海兩個城市的出租車移動軌跡數據集進行分析,我們發現覆蓋間隔時間服從截斷的帕累托分布。進一步地,我們提出一個稱作“機會覆蓋率”的度量指標來表示城市監測區域的整體感知質量與節點個數之間的關系,其定義為在特定時間間隔內能被覆蓋的網格單元占所有網格單元的比例的期望值,可以表示成關于覆蓋間隔時間分布的函數。圖1顯示基于北京和上海兩個出租車移動軌跡數據集的機會覆蓋率與節點個數和時間間隔呈單調遞增關系。于是,我們可以推導出至少需要多少節點能使在特定的時間間隔內機會覆蓋率不小于指定的閾值。例如,根據對兩個出租車移動軌跡數據集的分析,我們需要分別在北京和上海900平方千米的區域內至少部署1 700輛和1 900輛出租車,才能保證其在1個小時的時間間隔內機會覆蓋率不小于50%。更詳細的分析方法和結果請見文獻[8]。盡管不同城市可能需要不同的節點個數滿足所需的機會覆蓋率,我們提出的模型和方法可以對網絡規劃問題提供一般性的指導。
其次,我們從空間維度考慮。一個監測區域的環境現象(如PM 2.5濃度、二氧化碳濃度、噪音等)可以表示為一個二維信號,類似于一個圖像。在大部分環境監測應用中,移動感知節點將采集到的感知數據發送到數據中心,然后數據中心匯集現有數據,并利用空間插值技術估計未知數據,從而得到一個完整的感知地圖,相當于一個感知圖像。如圖2所示,移動群智感知網絡就像一個“城市攝像機”,而每個移動感知節點就相當于這個攝像機的每個“像素”。在傳統的圖像系統中,分辨率是度量圖像質量的一個重要指標。從這個概念得到啟發,我們利用群智感知分辨率作為指標來度量感知圖像的質量。分辨率越高,則代表所部署的移動群智感知網絡越能準確地捕獲到環境現象的變化。然而,與傳統數字圖像系統中的分辨率定義不同,我們不能簡單地將像素數(即移動感知節點個數)看做群智感知分辨率。這是因為,數字攝像機的像素會形成一個精細的網格,而城市攝像機的像素在城市中則呈現分散化的動態化分布。為了解決這個問題,我們首次提出“城市分辨率”這一新的指標來度量城市感知圖像的質量。簡單地說,我們分別基于移動群智感知網絡和[n×n]網格化部署的感知網絡采集到的部分感知數據,利用空間插值技術來估計未知數據,得到兩個完整的監測區域感知數據矩陣,然后利用相關系數來評估兩個矩陣的相似性,如果它們的相似性足夠高,則認為該移動群智感知網絡的城市分辨率是[r=n×n]。我們分別使用3種不同變化度的二維信號,通過蒙特卡羅仿真研究了分辨率r與移動感知節點個數[s]之間的關系,發現它們之間存在一個近似的線性關系:[r=α2s],其中,在真實的人或車移動模型下,[α]的參考值范圍是[0.5,0.6]。一方面,基于該線性關系,我們就可以根據移動群智感知網絡的節點個數推出所能達到的感知質量;另一方面,我們也可以反過來推出,需要部署多少移動感知節點能達到所需的城市分辨率需求。同樣以北京和上海兩個出租車移動軌跡數據集為例,圖3顯示了其城市分辨率分布情況。可以看出,人或車密集分布的區域具有更高的城市分辨率,例如北京的中心和東部區域,以及上海的中心和西南區域。更詳細的介紹請見文獻[9]。
上面提到的方法主要適用于城市環境監測、交通擁堵狀況和道路健康狀況監測等需要對整個城市的每個區域進行連續監測的大規模城市感知應用。與此不同,Chon等人則研究了“以地方為中心”的移動群智感知應用的覆蓋質量[10]。所謂以地方為中心的應用,就是自動識別或跟蹤用戶每天訪問的不同地方(如咖啡館、超市、辦公室、家、學校等),來幫助用戶認識和分析自己的日常行為模式,或者獲取基于位置的搜索和信息推薦等服務。構建和部署這些應用的前提是對用戶訪問的每個地方采集足夠的感知數據(如GPS位置、聲音、圖像、光照、Wi-Fi信號指紋等)來建立各種模型。這里的覆蓋問題就是:多長時間內多少用戶采集數據能覆蓋到多少人們經常訪問的地方?為此,Chon等人在韓國招募了85人并在兩個月時間內收集了大約4.8萬次用戶訪問不同地方的感知數據然后進行分析,得到了一些有趣的結果:僅僅利用少量的用戶(85人),就能對人們常去的地方提供高覆蓋率(最流行的地方的15%);用戶訪問地方的個數服從冪律分布,基于該模型可估計出需要多少用戶能達到所需的地方覆蓋率;用戶對泄露個人隱私的擔心并沒有帶來太大的影響,例如,用戶允許在93%的食物相關的地方收集聲音數據,在82%的所有類型的地方收集聲音數據。
以上方法主要用來度量時空覆蓋質量,而保障時空覆蓋質量則需要綜合利用多種方法:(1)可以將固定部署感知模式和移動群智感知模式相結合,在移動用戶很難到達的空白區域,通過優化部署固定的感知網絡來保障時空覆蓋質量;(2)利用空間插值、壓縮感知等方法來彌補感知數據的缺失,也可以利用感知現象的時空相關性,或者天氣、交通、重大事件等外部因素與感知現象的關聯性,采用機器學習的方法來實現未知數據的準確估計;(3)設計合適的激勵機制來鼓勵更多的用戶來參與這些感知活動。
2 感知數據質量度量與保障
感知數據質量受很多方面因素的影響,主要包括:
·用戶所使用的感知設備類型。例如,價格高昂的高端手機的傳感器一般比那些價格低廉的低端手機的傳感器精度要高。
·用戶采集數據的環境和方式。例如,把手機拿在手里采集環境噪聲的數據質量比把手機放在衣服口袋或手提包里采集環境噪聲的數據質量高。
·用戶的主觀認知能力。例如,基于移動群智感知的圖像搜索應用依賴用戶對圖像的識別能力,而不同用戶對同一圖像的認知可能是不一樣的。
·用戶的參與態度。例如,有的用戶會嚴格按照要求來采集數據,而有些用戶會比較隨意,甚至有些惡意用戶會上傳虛假偽造的數據。
以上因素都會造成感知數據質量的參差不齊。下面,我們首先根據感知任務或對象的類型來介紹幾種典型的感知數據的質量度量和保障的方法:
·面向二進制型任務的方法。二進制型任務的結果只有兩種。事件檢測是一種典型的二進制型任務,即判斷某種事件是否發生。最簡單的方法是投票,即當判定事件發生的用戶數量超過特定閾值的時候,才最終確定事件發生。
·面向多類別型任務的方法。多類別型任務的結果多于兩種,例如,用戶對某個事物的評價可以打分為1~5的某個分數。投票法雖然也可以用來度量結果的不確定性,但還不夠準確。最大期望法是一種常用的更準確的方法,它采用迭代的方式工作,即首先根據用戶的感知數據來估計用戶的可靠性,然后根據用戶的可靠性來估計最終的任務結果,并不斷重復上述過程。
·面向連續信號型任務的方法。對區域環境現象的連續監測屬于連續信號型任。Koutsopoulos針對這類任務提出了一種感知數據質量度量方法,即計算某個用戶提交的歷史數據與所有用戶數據的平均值之間的累積誤差作為該用戶的感知數據質量指標[11]。
以上3種方法的基本思想都是發揮集體的智慧來抵御個人數據不準確的影響,從而提高整體數據的可靠性。然而,這些方法并不能充分應對惡意用戶的攻擊。Mousa等人總結了串謀攻擊、女巫攻擊、GPS欺騙等11種可能的惡意用戶攻擊方式[12]。面對這些攻擊,一般有兩類方法解決感知數據的可信性問題:
·可信平臺模塊。這類方法是在用戶的移動感知設備設置專門的硬件模塊,保證用戶感知和上報到數據中心的數據是由真實的、授權的感知設備所采集,還可以采用簽名和硬件加密機制來保護感知數據只能由授權用戶訪問。與此類似,我們基于“安全數碼相機”的思想,利用MD5算法和基于隨機數的加密算法設計了一個圖像篡改檢測方法來保障用戶上傳圖像數據的真實性[13]。
·信譽系統。這類方法是評估和記錄用戶的歷史感知數據的可信性,并將其用在未來的系統交互過程中,對于信譽度低的用戶感知數據采用的可能性也比較低,同時也會采用相應的激勵或懲罰措施。貝葉斯系統是一種常用的具體方法[14]。
3 結束語
作為物聯網的新型感知模式,移動群智感知促進了大量創新應用的出現,同時也面臨一系列新的問題與挑戰。文章分別從時空覆蓋質量和數據質量兩個層面分析了移動群智感知網絡中感知質量度量和保障的各種問題,并提供了一些對應的解決方法。隨著相關技術的不斷進步和成熟,移動群智感知質量度量與保障將對移動群智感知網絡的快速發展和廣泛應用提供重要的支撐作用。
參考文獻
[1] GANTI R K, YE F, and LEI H. Mobile Crowdsensing: Current State and Future Challenges [J]. IEEE Communications Magazine, 2011, 49 (11): 32-39
[2] MA H D, ZHAO D, and YUAN P. Opportunities in Mobile Crowd Sensing [J]. IEEE Communications Magazine, 2014, 52(8): 29-35
[3] 劉云浩. 群智感知計算[J]. 中國計算機學會通訊, 2012, 8 (10): 38-41
[4] CAMPBELL A, EISENMAN S, LANE N, et al. The Rise of People-Centric Sensing [J]. IEEE Internet Computing, 2008, 12 (4): 12-21
[5] BURKE J, ESTRIN D, HANSEN M, et al. Participatory Sensing [C] // Workshop on World-Sensor-Web, Co-Located with ACM SenSys, Boulder, Colorado, USA, 2006: 1-5
[6] LANE N, EISENMAN S, MUSOLESI M, et al. Urban Sensing Systems: Opportunistic or Participatory? [C] // in Proceedings of HotMobile, Silverado Resort, Napa Valley, USA, 2008: 11-16
[7] 趙東,馬華東. 群智感知網絡的發展及挑戰[J]. 信息通信技術, 2014(05): 66-70
[8] ZHAO D, MA H D, LIU L, and LI X Y. Opportunistic Coverage for Urban Vehicular Sensing [J]. Computer Communications, 2015: 71-85. doi:10.1016/j.comcom.2015.01.018
[9] LIU L, WEI W, ZHAO D, and MA H D. Urban Resolution: New metric for Measuring the Quality of Urban Sensing [J]. IEEE Transation on Mobile Computing, 2015(09): 21-25. doi:10.1109/TMC.2015.2404786
[10] CHON Y, LANE N, KIM Y, et al. Understanding the Coverage and Scalability of Place-Centric Crowd Sensing[C]// in Proceedings of ACM UbiComp, Zurich, Switzerland, 2013: 3-12
[11] KOUSOPOULOS I. Optimal Incentive-Driven Design of Participatory Sensing Systems[C]// Proceedings of IEEE INFOCOM, Turin, Italy, 2013: 1402-1410
[12] MOUSA H, MOKHTAR S B, HASAN O, et al. Trust Management and Reputation Systems in Mobile Participatory Sensing Applications: A Survey [J]. Computer Networks, 2015, 90. doi:10.1016/j.comnet.2015.07.011
[13] QIN T, MA H D, ZHAO D, et al. Crowdsourcing Based Event Reporting System Using Smartphones with Accurate Localization and Photo Tamper Detection[C]// in Proceedings of BIGCOM, Taiyuan, China, 2015: 141-151
[14] TANAS C, HERRERA- JOANCOMARTI J. When Users Become Sensors: Can We Trust Their Readings? [J]. International Journal of Communication Systems, 2015, 28 (4): 601-614