趙庶旭,張占平,王小龍,韓淑梅,元 琳,張家禎
(蘭州交通大學電子與信息工程學院 蘭州 730071)
無線傳感器網絡(wireless sensor network, WSN)具有部署方便、抗干擾能力強、安裝成本低等特點,它能擴展人們收集外界信息的能力[1]。將傳感器節點部署在不同的環境中,實時、便捷地獲取所需數據,實現了信息世界與物理世界的無縫融合。因此,傳感網已被廣泛應用于環境監測、智能家居、智能制造、智慧醫療等領域[2]。近年來,日益增長的應用需求和用戶規模對傳感網數據的多樣性、實時性和安全性提出了新的要求。傳感云的誕生為之提供了有效的解決方案。傳感云作為云計算與傳感網結合的一種新技術,給傳感網注入了新的活力,催生了新的應用與服務,同時拓展了傳感網在數據處理和存儲方面的能力[3]。但考慮到云服務商(cloud service provider, CSP)提供的服務機制存在數據隱私和數據完整性等潛在問題[4],無論CSP 采取何種可靠措施,基礎設施都可能出現漏洞。同時,信譽度低的CSP 可能會泄露或隱藏用戶存儲的私人數據[5]。邊緣傳感云能為用戶提供低時延、低能耗和高安全性的服務,其中邊緣協同傳感云資源分配已成為當前研究的重點問題。
文獻[6]從數據采集、存儲、處理及安全性等方面對傳感云和邊緣協同傳感網進行對比分析,研究表明基于中心化的傳感云易發生數據泄露,且傳感網與云端頻繁的數據交換易導致核心網絡阻塞及能耗損失加劇;同時該文獻指出邊緣協同傳感網是一種擴展傳感網計算能力和存儲能力的有效技術。文獻[7]針對精準農業中數據采集冗余會增加WSN能耗和時延問題,提出一種基于邊緣計算的低時延和低能耗多傳感器數據采集方法,但沒有考慮到傳感節點密集型數據的處理。文獻[8]在智慧家居場景中針對傳感云架構易出現數據丟失及篡改的問題,提出了一種結合邊緣計算與區塊鏈技術的數據處理架構,通過在邊緣層部署異常數據檢測算法,以保證傳感網數據質量,但沒有考慮到時延及能耗的優化。文獻[9]針對時空變化場景中WSN 感知質量與節點能耗不平衡的問題,提出了一種分層的邊緣自適應框架,通過主成分分析和稀疏貝葉斯學習算法得到了感知質量和傳感節點能耗的權衡策略,但未考慮感知時延的優化。文獻[10]在智慧物流場景中,針對分布式倉庫管理系統響應時延較長的問題,構建了一種基于邊緣計算的WSN 快速響應系統,并通過一種快速響應算法優化系統響應時延,但該方法單方面考慮時延會導致WSN 節點電量消耗過快。
上述研究主要集中于邊緣協同傳感網數據質量、時延及能耗方面的優化,忽略了密集型數據卸載到邊緣服器的隱私泄露問題。為解決該問題,本文設計了一種最大化隱私熵的分布式邊緣協同資源選擇(distributed edge collaborative resource selection,DECRS)聯合優化方案,針對優化問題建立數學模型,并采用智能啟發式算法得到時延、能耗及隱私熵聯合優化的邊緣資源選擇策略。同時,考慮到多傳感器傳感網數據采集中冗余數據導致節點時延和能耗增加問題,提出一種邊緣協同分析節點選擇(edge collaborative analysis node selection, ECANS)方案,在最大化數據質量條件下得到數據采集策略。
本文系統模型如圖1 所示。該模型由傳感器網絡、邊緣服務器、邊緣優化器和應用程序組成。其 中, N={N1,N2,···,Nζ}表 示 傳 感 網 集 合,Nζ={n1,n2,···,nψ} 表 示 傳 感 網 ζ 的 傳 感 節 點 集 合,X={x1,x2,,···,xψ}表 示傳感網 ζ中每個傳感節點的位置信息, ? ={l1,l2,···,lκ}為區域信息,且滿足式(1)和式(2)。

圖1 系統模型

傳感器集合由P={p1,p2,···,pξ}表示,規定相同區域內不同傳感節點的傳感器不完全相同,且能采集聲音、視頻、圖像、濕度、溫度等數據。邊緣服務器由集合Q={q1,q2,···,qω}表示。考慮到傳感網節點資源受限,當應用程序集合Rapp={R1,R2,···,Rτ}中的一個或多個應用請求計算密集型數據時,需要把數據分塊,然后卸載到邊緣服務器。與其他物聯網設備不同,傳感網中的數據可分為直接量和間接量,直接量不需要額外計算,從傳感器讀取后能直接使用,如溫度、濕度等;而間接量需要把采集的數據處理后將結果提供給應用程序,如圖像、視頻目標檢測、語音識別等[11]。若強行在傳感網節點計算間接量,會消耗大量節點能耗,導致傳感網節點過早死亡。
本文架構的處理流程主要由數據采集和邊緣資源選擇兩階段組成,如圖2 所示。在數據采集階段,為降低數據采集的時延與能耗,提出了ECANS方案獲得數據采集策略;在邊緣資源選擇階段,提出了一種最大化隱私熵的DECRS 方案,先根據優化目標建立模型,然后通過智能啟發式算法得到最大化隱私熵下的最優邊緣資源選擇策略。

圖2 系統處理流程
在多傳感器傳感網數據采集中,不合理的數據采集策略不但消耗大量的節點能耗,還會增加數據采集時延。本文考慮到現有方法存在多傳感器傳感網數據采集中采集數據冗余度大的問題,設計了基于字母編碼(letter coding, LC)的ECANS 方案,通過ECANS 算法得到數據質量最大化下的節點選擇策略。定義單個傳感器與節點的關系由式(3)表示,則所有節點與傳感器的連接關系由矩陣Π 表示:

用戶通過應用程序請求的數據集合由Rτ={Rd1,Rd2,···,Rdσ}表示,單個傳感節點提供的數據由nψ={s1,s2,···,sρ}表 示,其中sρ為一個三元組


圖3 LC 數據編碼流程
所有節點提供的數據與用戶應用程序請求數據須滿足式(5):

定 義 有效數據與總數據的比值為數據質量(data quality, DQ),數據采集中DQ 值越大,表明節點選擇策略越好[7]。節點 ξ的數據質量由式(6)表示。為得到節點選擇策略,本文設計了ECANS 算法,描述如算法1 所示,其中ID 函數用于返回該數據編碼對應的節點序號。

返回Nodeout
在傳感網節點密集型數據處理中,基于中心化的計算模式增加了數據泄露風險。為降低該風險,提出一種基于隱私保護的DECRS 方案。首先將單個密集型數據分塊;然后基于智能啟發式算法得到最大化隱私熵條件下的邊緣資源選擇策略;最后通過該策略把數據卸載到分布式邊緣服務器(distributed edge server, DES)上。該方法有效提高了數據塊在DES 上計算的分布,從而達到降低數據泄露的目的。
密集型數據的資源選擇策略由矩陣Y=[y1,y2,···,yη]表 示,其中yη由 式(7)表示,當子數據塊 θ在邊緣服務器qω計 算時bθ,ω為1,否則bθ,ω為0。對于應用請求 Rdσ,經ECANS 方案節點選擇及數據采集后所得的密集型數據由集合Data={data1,data2,···,dataη}表 示。該集合中密集型數據 Data與資源選擇策略Y的關系由式(8)表示。且 dataη可被隨機分成θ個子塊,如集合 dataη={dη,1,dη,2,···,dη,θ},為保證數據的完整性, θ需滿足式(9)約束,其中 ω為邊緣服務器數量。 dataη的子數據塊dη,θ卸載到邊緣服務器的概率 prη,k服從參數為 χ的泊松分布[12],如式(10)所示。子數據塊dη,θ與其資源分配概率的關系如式(11)所示。

數據 dataη的隱私熵由式(12)計算,則所有數據 Data的 資源選擇策略Y與隱私熵K的關系由式(13)表示, D ata中 所有數據卸載的平均隱私熵K由式(14)表示。


為降低邊緣資源分配中的時延和能耗,建立時延和能耗的優化模型。在場景中,邊緣服務器的計算速率由集合F={f1mec,f2mec,···,fωmec}表示,不同計算速率的邊緣服務器計算時產生的時延和能耗不同。
1)邊緣資源選擇時延模型
分布式邊緣資源選擇的時延包括傳感網數據采集時延、傳感網、核心網的數據傳輸時延和邊緣服務器上的計算時延。設集合DSData={ds1,ds2,···,dsη}表示 Data的數據量。數據在WSN 的傳輸速率滿足香農定理:

式中,Csensor表 示傳感網傳輸速率;Bsensor表示傳感網帶寬;Ps為 傳輸功率; δs為 天線增益; φs表示信道噪聲。數據在傳感網的傳輸時延由式(16)計算,其中 dsi為 第i個傳感網節點密集型數據的數據量。
節點數據從WSN 到達邊緣服務器需經過核心網,其接入方式分為無線網絡接入和有線網絡接入[13-14]。本文選擇天線陣列(antenna array, AA)接入,因此數據在核心網的傳輸速率仍然滿足香農定理,如式(17),所有數據 D ata在核心網的傳輸時延由式(18)計算。

多個子數據塊dη,θ在邊緣服務器上并行計算,計算時延tη,j如 式(19)所示,且 dataη的計算時延由多個子塊計算時延的最大值tη決定,如式(20)所示。傳感節點的數據采集時延及計算時延如式(21)和式(22)所示。


2)邊緣資源選擇能耗模型
在分布式邊緣資源選擇中,系統能耗主要來源于數據采集、傳輸和計算過程。系統能耗由數據量、傳輸功率和計算功率決定,且不同的邊緣服務器由于計算能力的不同,其計算功率也存在差異。多個邊緣服務器單位數據的計算功率由集合PMEC={p1,p2,···,pω}表 示,子數據塊 d sη,j的計算能耗wη,j由式(24)計算,則 dataη和 Data中全部數據計算所消耗的能耗wη、WMEC分別由式(25)、式(26)表示,其中pi表示邊緣服務器i計算的功率。

數據在傳感網和核心網的傳輸能耗由式(27)和式(28)計算,傳感節點數據采集的能耗由式(29)計算,則邊緣資源選擇的總能耗W由式(30)計算。


在分布式邊緣協同傳感網場景下,時延和能耗是資源選擇中最常用的兩個指標,隱私熵用于衡量資源分配的安全性。本文綜合考慮這3 個因素,構建聯合優化函數如下:

式中, α,β ∈[0, 1]用于調節系統資源選擇中對時延、能耗及隱私熵的權衡,若 α值越大,系統資源選擇對時延越敏感,若 β值越大,則系統資源選擇對能耗越敏感,若1 ?α?β值越大,則表明系統對數據隱私越敏感。最終,把邊緣協同優化問題轉化為系統隱私熵Kreq、時延Treq、 能耗Ereq約束下尋找最佳資源選擇策略Y?問題,使得式(32)取最小值,其中Y?為Y的最優策略。

針對上述問題,首先通過ECANS 方案得到節點選擇策略,并根據該策略采集數據。之后在資源選擇階段使用DECRS 方案得到條件約束下的最優卸載策略。由于求解策略矩陣Y?是一個NP 問題,其凹凸性不確定,用數學方法無法在有限時間內得到滿意解,本文使用智能啟發式蟻群算法求解邊緣資源選擇策略。但由于傳統的蟻群算法每次把數據塊分配給大信息素的邊緣服務器,將導致算法停滯,即算法很難找到最優或近似最優解。
算法2 DECRS
輸入:密集型數據集合D ata, 螞蟻數量A ntNum,迭代次數I terNum, 邊緣服務器計算速率集合F;

在仿真實驗環境下進行實驗,操作系統為MAC OS15.6,CPU 為Intel i9 2.30 GHz,內 存 為16 GB,硬 盤 為512 GB,編 程 平 臺 為Pycharm 2019,編程語言為Python。實驗包括數據采集和邊緣資源選擇兩部分。根據本文所提方案,首先在不同區域傳感網中分別采用多種方法采集數據,并分析不同方法的時延與能耗;然后,針對密集型數據邊緣資源選擇問題,通過DECRS 方案、基于遺傳算法(genetic algorithm, GA)方案[14]、基于粒子群算法(particle swarm optimization, PSO)方案[15]及隨機選擇(random resource selection, RRS)方案,得到不同方案資源選擇策略的時延、能耗及隱私熵,并對其進行分析。實驗的其他參數見表1。

表1 實驗參數
1) ECANS 方案時延及能耗分析
為驗證ECANS 方案的數據采集性能,將本文方案與文獻[7]的有效節點選擇方案(effective node sensing, ENS)、區域節點周期性采集方案(periodically sensing with all nodes, PSAN)從時延性能和能耗性能方面進行對比分析。圖4 為數據采集的時延測試,實驗表明本文ECANS 方案數據采集時延最短,且平均采集時延為1.45 s;ENS 方案更趨向于滿足應用請求的節點組合,而沒有考慮冗余數據對數據采集時延的影響,平均時延為3.35 s;PSAN方案采集整個區域節點的數據,因此數據冗余度更大,從而導致數據采集時延最大且每次都相同[16],平均時延為5.00 s。ECANS 方案較ENS 和PSAN,平均時延分別降低了56.71%和71.00%。

圖4 傳感節點數據采集時延
圖5 為能耗對比分析。在多次數據采集中本文所提方法的能耗最小,為10.39 J;ENS 方案通過剔除無關節點減少了節點采集數據的數量,從而降低了數據采集的能耗,能耗為24.54 J;而PSAN方案在數據采集時,需要采集區域內所有節點上傳感器的數據,這將導致數據采集能耗最大,為44.70 J。ECANS 方案較ENS 和PSAN,平均能耗分別降低了57.66%和76.76%。

圖5 傳感節點數據采集能耗
圖6 為不同數據采集方案的數據質量,由圖可得本文的ECANS 方案所得的平均數據質量最高,為57.66%,經分析得本方案有效剔除了無關及相關度小的傳感節點,得到最佳的數據采集策略,從而使數據質量最大化。而ENS 方案和PSAN 方案所得平均數據質量分別為30.40%和22.93%,這是由于采集無關傳感節點的數據導致數據質量降低。

圖6 傳感節點數據采集數據質量
2) DECRS 方案隱私熵分析
在相同的數據分塊方式下,不同邊緣資源選擇方案的隱私熵對比如圖7 所示。圖中RRS 方案的隱私熵在迭代次數為25 時達到最大3.90,由于隨機資源選擇的不確定性大,但不能使隱私熵持續最大化。對于其他方案,隨著迭代次數的增加,GA方案的隱私熵收斂于2.90,PSO 方案的隱私熵收斂于3.32,而DECRS 方案最終達到3.83。分析得出DECRS 方案使用的改進蟻群算法收斂速度快,不易陷入局部最優,而PSO 方案和GA 方案的核心算法在本場景收斂速度慢、效率低,更易陷入局部最優。

圖7 不同方法的隱私熵
針對不同分塊數量對DECRS 方案隱私熵的影響進行仿真,結果如圖8 所示。實驗中分別設置分塊數為5、10、15 塊,并對其進行邊緣資源分配。實驗結果表明,在邊緣服務器數量為15 臺的條件下,隨著分數增加,隱私熵增大,分別為2.29、3.27、3.83。經分析得知,隨著分塊數量越接近邊緣服務器數,子數據塊被分配到邊緣服務器越均勻,被攻擊者得到完整數據的概率越小,從而數據泄露風險越小[17]。

圖8 不同分塊方式的隱私熵
為評價隱私保護強度,本文采用Kiullback-Leibler(KL)[18-21]衡量不同方案的隱私泄露風險,其值越低,表明隱私保護強度越高,數據越不易泄露。
兩 個特 征 集 {(xi,yi)|xi,yi∈Rn}和 {(xi′,yi)|x′i,yi∈Rn}最多有一條記錄不同,采用KL 散度,可將不同傳輸模式下的隱私泄漏CPL 定義為:

以隨機資源選擇所得的最大隱私熵作為標準,分別計算不同方案在每次資源選擇的KL 散度,如圖9 所示,隨著迭代次數的增加,GA 方案、PSO方案及DECRS 方案的KL 散度都呈下降趨勢,這是因為3 種方案在資源選擇時以最大化隱私熵為目標資源選擇。但3 者達到收斂分別收斂于2.87、2.20、1.49,有CPL(GA)>CPL(PSO)>CPL(DECRS),表明DECRS 方案所得的策略隱私泄露風險較低。

圖9 KL 散度對比
3) DECRS 方案時延、能耗分析
不同資源選擇方案的時延如圖10 所示,隨著迭代次數的增加,RRS 的時延在[20.25, 83.34]內變化,而隨著迭代次數增加,GA、PSO、DECRS方案的總時延呈現下降趨勢,但GA 方案和PSO 方案的收斂效率低,且分別收斂于14.57 s 和12.23 s;DECRS 方案收斂于9.89 s,表現最好。經分析,DECRS 方案得到解的效率及精度高,且可使數據塊在最小時延約束下在多個邊緣服務器上并行計算,通過減少計算時延降低資源分配的總時延。

圖10 不同方案的資源選擇時延
不同資源選擇方案的能耗如圖11 所示,由于RRS 資源選擇的隨機性,其能耗在[376.49,3 765.64]內變化。而DECRS 方案收斂于807.36 J,PSO 方案收斂于872.99 J,GA 方案收斂于979.96 J。DECRS 方案較GA 及POS 方案,能耗分別降低了17.56%和7.51%。經分析可得,DECRS 方案收斂速度快,能找到近似最優解,而GA 方案和PSO方案得到解的質量相對較差。

圖11 不同方案的資源選擇能耗
考慮不同天線陣列模式對資源選擇時延的影響,將DECRS 方案在隨機天線選擇模式(random antenna selection, RAS)、聯合天線模式(combining selection, CS)、最 大 傳 輸 模 式 (maximum antenna transmission, MAT)下進行對比[22-23]。從圖12 可知,在3 種天線模式下隨著迭代次數增加時延降低,且CS 模式收斂于10.07 s,MAT 模式收斂于15.20 s,RAS 模式收斂于17.33 s;CS 模式與RAS模式和MAT 模式相比,傳輸時延分別降低了41.89%、33.75%。經分析得,CS 模式下所有天線被開啟并傳輸數據,使傳輸帶寬增加,從而使傳輸時延降低,而RAS 模式和MAT 模式的速率均小于CS 模式,因此,傳輸時延相對較大。

圖12 不同傳輸模式的資源選擇時延
不同天線模式的能耗如圖13 所示。RAS 模式能耗收斂于923.59 J,MAT 模式能耗收斂于991.37 J,CS 模 式 收 斂 于1 145.09 J。RAS 模 式 能 耗 較MAT 及CS,分別降低了19.34%和6.84%。經分析得,CS 模式下所有天線被開啟后,隨著傳輸速率的增大,系統能耗也會增大,而RAS 模式隨機選擇單個天線傳輸,從而導致總能耗減小。

圖13 不同傳輸模式的資源選擇能耗
隨機生成權重因子(本文 α=0.4, β =0.3)的總開銷如圖14 所示,在相同傳輸模式下,RRS 方案的總開銷在[83.81, 767.22]范圍內變化,其他3 種方案的總成本均低于RRS 方案。經分析得,資源選擇中,DECRS 方案、PSO 方案及GA 方案考慮到時延、能耗及隱私熵倒數的聯合最小,尋找最優的資源選擇策略,且分別收斂于166.96、180.82和202.98。但DECRS 方案所得的總開銷較PSO方案及GA 方案有顯著減少。同時,該參數下聯合優化的總開銷變化趨勢與能耗相似,這是由于能耗在總開銷占的比重較大,而時延和隱私熵占比較小。

圖14 資源選擇聯合優化
4)傳感網性能對比
針對本文所提的分布式邊緣協同方法對傳感網性能提升問題,從時延及能耗方面進行驗證與分析。圖15 針對傳感網數據響應時延,系統中引入ECANS 和DECRS 方案后,傳感網響應時延明顯降低,這是由于本文方法在數據采集階段通過ECANS 方案得到最優數據采集策略,從而降低了數據采集時延;而在計算階段,本文DECRS 方案考慮到用戶時延、能耗和隱私熵的要求,得到三者聯合最優策略,通過降低數據計算的時延和傳輸時延,降低傳感網響應時延。圖16 為傳感網能耗的優化結果,使用本文方法后,傳感網能耗明顯降低。這是由于ECANS 方案在數據采集階段減少了傳感節點數量,從而減少數據采集及傳輸能耗,導致傳感網能耗降低。在節點密集型數據的卸載階段,通過DECRS 方案得到最優的資源選擇策略,并將密集型數據卸載到邊緣,從而使節點端數據量減少,導致傳感網平均時延和能耗分別降低了46.92%和11.26%。

圖15 邊緣協同傳感網節點時延

圖16 邊緣協同傳感網節點能耗
本文建立了一種分布式邊緣協同傳感網安全、節能和高效的資源選擇模型。在傳感網數據采集階段,提出一種ECANS 方案,得到最佳數據采集策略,通過降低數據冗余度,降低節點數據采集的時延與能耗。在密集型數據計算階段,本文基于啟發式智能算法和信息熵理論提出一種分布式邊緣協同WSN 安全、節能及高效的DECRS 方案,在降低數據泄露風險和能耗的同時提高計算效率。下一步工作,將基于KubuEdge 及嵌入式硬件實現本文所提系統及方法,并在真實場景部署,驗證本文方法的性能。