基于隱私同態(tài)的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法

2022-09-08 07:53:20夏偉蔡文婷劉陽(yáng)

電測(cè)與儀表 2022年9期

夏偉，蔡文婷，劉陽(yáng)

(南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司，廣州 510000)

0 引言

數(shù)據(jù)聚合是對(duì)城市配電網(wǎng)信息綜合處理的重要技術(shù)手段，通過(guò)對(duì)數(shù)據(jù)聚合操作能夠降低數(shù)據(jù)采集過(guò)程中的通信費(fèi)用和能量消耗。但是在數(shù)據(jù)聚合中沒(méi)有受到隱私保護(hù)，致使配電網(wǎng)數(shù)據(jù)常出現(xiàn)丟失、篡改現(xiàn)場(chǎng)，因此，在數(shù)據(jù)隱私保護(hù)的基礎(chǔ)上，對(duì)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合已成為目前亟需解決的問(wèn)題。

針對(duì)該問(wèn)題，國(guó)內(nèi)外學(xué)者研究了數(shù)據(jù)聚合算法，可以有效聚合城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)。其中，文獻(xiàn)[1]研究了基于霧計(jì)算的智能電網(wǎng)安全與隱私保護(hù)數(shù)據(jù)聚合方法，該方法利用云霧合作的加密算法對(duì)數(shù)據(jù)多層隱私保護(hù)，并在霧端對(duì)數(shù)據(jù)進(jìn)行了多層融合，實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)數(shù)據(jù)的聚合；文獻(xiàn)[2]研究了霧輔助的輕量級(jí)隱私保護(hù)數(shù)據(jù)多級(jí)聚合方法，該方法利用霧協(xié)作方法收集數(shù)據(jù)，采用模數(shù)性質(zhì)對(duì)數(shù)據(jù)加密，并借助三列函數(shù)設(shè)計(jì)認(rèn)證方法，實(shí)現(xiàn)數(shù)據(jù)的聚合。但是上述兩種算法在進(jìn)行數(shù)據(jù)聚合過(guò)程中，沒(méi)有受到隱私保護(hù)，導(dǎo)致數(shù)據(jù)常出現(xiàn)丟失、篡改情況。文獻(xiàn)[3]研究了智能電網(wǎng)中的數(shù)據(jù)聚合方法，結(jié)合Paillier加密體制和ElGamal加密體制對(duì)智能電網(wǎng)數(shù)據(jù)進(jìn)行加密處理，并通過(guò)雙線性對(duì)技術(shù)對(duì)數(shù)據(jù)聚合。文獻(xiàn)[4]研究了一種緩解能量空洞的數(shù)據(jù)聚合算法，通過(guò)數(shù)據(jù)聚合的方式使每個(gè)節(jié)點(diǎn)發(fā)送數(shù)據(jù)時(shí)以最大的分片數(shù)進(jìn)行傳送，采用節(jié)能的方式對(duì)WSN能耗進(jìn)行優(yōu)化，以減小EH的區(qū)域，使全網(wǎng)能耗最低。但是上述兩種算法的加密性較差，導(dǎo)致數(shù)據(jù)聚合時(shí)間較長(zhǎng)，聚合效率較低。

而隱私同態(tài)是一種直接對(duì)密文數(shù)據(jù)進(jìn)行相關(guān)運(yùn)算的加密技術(shù)，能夠避免數(shù)據(jù)融合時(shí)隱私信息的泄漏，常應(yīng)用于在數(shù)據(jù)聚合方案中。基于隱私同態(tài)的這個(gè)優(yōu)點(diǎn)，將其應(yīng)用到城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合中，根據(jù)重新獲取的數(shù)據(jù)，并在通過(guò)密度閾值函數(shù)設(shè)置、初始聚類中心選取與網(wǎng)格聚類的步驟下完成城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合，并采用隱私同態(tài)技術(shù)對(duì)聚合后的數(shù)據(jù)進(jìn)行加密處理。通過(guò)仿真實(shí)驗(yàn)可知，文中在實(shí)現(xiàn)數(shù)據(jù)聚合的同時(shí)，提高了數(shù)據(jù)的安全性，解決了傳統(tǒng)算法中存在的問(wèn)題。

1 數(shù)據(jù)重獲

在進(jìn)行城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合計(jì)算之前，首先要通過(guò)電力公司數(shù)據(jù)庫(kù)，獲取保存在電力公司中的所有數(shù)據(jù)，以進(jìn)行數(shù)據(jù)聚合，包括涉及到的用電資源、網(wǎng)格信息等。雖然數(shù)據(jù)庫(kù)中存有大量各類型數(shù)據(jù)，但與所研究的網(wǎng)格數(shù)據(jù)相差較大，每個(gè)數(shù)據(jù)的概念與結(jié)構(gòu)也應(yīng)符合計(jì)算需求，因此要在經(jīng)過(guò)處理后的數(shù)據(jù)庫(kù)中篩選與文中相匹配的數(shù)據(jù)。首先，在大數(shù)據(jù)中找到與公共信息模型可交換的數(shù)據(jù)，互相融合，得到一個(gè)基于公共信息模型(CIM模型)的結(jié)構(gòu)。然后，選擇一個(gè)最優(yōu)的鏈路，在此過(guò)程中不斷完善數(shù)據(jù)結(jié)構(gòu)，為配電網(wǎng)系統(tǒng)奠定一個(gè)夯實(shí)的基礎(chǔ)。最后，對(duì)重獲的數(shù)據(jù)進(jìn)行分析，提供一個(gè)最佳的聚類方式，保證電網(wǎng)的穩(wěn)定運(yùn)行，其這個(gè)配電網(wǎng)數(shù)據(jù)重獲的過(guò)程如圖1所示。

按照?qǐng)D1中的步驟分析，個(gè)別數(shù)據(jù)的交換方式仍然不能全部導(dǎo)入，格式與模型中的結(jié)構(gòu)也互相不統(tǒng)一，致使準(zhǔn)確率有些許波動(dòng)。因此，需要進(jìn)行格式統(tǒng)一，從而降低數(shù)據(jù)通信開(kāi)銷。

圖1 配電網(wǎng)數(shù)據(jù)重獲過(guò)程

2 城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合

2.1 城市配電網(wǎng)多級(jí)網(wǎng)格劃分

城市配電網(wǎng)多級(jí)網(wǎng)格映射關(guān)系圖如圖2所示。城市配電網(wǎng)多級(jí)網(wǎng)格的劃分需綜合考慮供電區(qū)相對(duì)獨(dú)立性、網(wǎng)格完整性、管理便利性等因素，主要分為高壓層、目標(biāo)網(wǎng)架、中壓線路層、配電站層、配變層。

圖2 配電網(wǎng)多級(jí)網(wǎng)格映射關(guān)系圖

2.2 密度閾值函數(shù)設(shè)置

傳統(tǒng)的聚類算法是基于數(shù)據(jù)庫(kù)完整的情況下進(jìn)行的，而數(shù)據(jù)流的聚類是基于數(shù)據(jù)的聚類算法上的，在其他領(lǐng)域上具有廣泛的應(yīng)用，例如商業(yè)互通、網(wǎng)絡(luò)記錄的記錄與分析。

對(duì)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)空間進(jìn)行網(wǎng)格單元?jiǎng)澐郑總€(gè)網(wǎng)格單元中，存在多維空間s，將k維為均分成長(zhǎng)度相等的dk段，那么在dk段中的數(shù)據(jù)集合表示為：

sk={sk1,sk2,…,sk}

(1)

d=(d1,d2,…,dn)∈m

(2)

并且約束條件[4]為：

dk∈skgt,(k=1,…,n)

(3)

式中g(shù)t為空間中的網(wǎng)格單元。若整個(gè)配電網(wǎng)中網(wǎng)格單元的總數(shù)為：

(4)

D(m,td)=λtD(m,tb)+1

(5)

式中td為時(shí)間。如果數(shù)據(jù)在時(shí)刻ta時(shí)進(jìn)入網(wǎng)格單元，其數(shù)據(jù)密度就會(huì)與時(shí)間的改變相關(guān)，將其定義為：

D(d,t)=λt-ta

(6)

式中λ為流動(dòng)系數(shù)，且為整數(shù)，一般徘徊在0～1，d代表數(shù)據(jù)，tb代表某一時(shí)刻。如果網(wǎng)格單元m中數(shù)據(jù)的密集程度為D(m,t)，在不同的時(shí)刻t與y的分布密度也就不同，分別如下：

(7)

(8)

當(dāng)網(wǎng)格單元的數(shù)據(jù)密度滿足Di≤D(m,t)，那么就稱為密集單元，式中Zt與Zy為常量，且兩者的關(guān)系為Zt>Zy，如果滿足Dy>D(m,t)≤Dt，那么在此條件下的網(wǎng)格單元為替代網(wǎng)格單元，當(dāng)Dy>D(m,t)時(shí)，網(wǎng)格單元就為噪聲網(wǎng)格單元[5-7]。

如果噪聲單元密度不斷增大，在時(shí)刻y的密度就遠(yuǎn)遠(yuǎn)大于普通網(wǎng)格單元密度，一般都會(huì)慢慢消化網(wǎng)格中的密集數(shù)據(jù)，經(jīng)過(guò)處理，就形成了一個(gè)進(jìn)化的網(wǎng)格單元，叫做進(jìn)化噪聲單元；而剩下的網(wǎng)格單元情況是本來(lái)只具有很少的數(shù)據(jù)，經(jīng)過(guò)慢慢疊加[8]，逐漸演變成噪聲網(wǎng)格單元，只有將噪聲網(wǎng)格單元減少到最小或是消失，才會(huì)實(shí)現(xiàn)數(shù)據(jù)的有效聚合，保留網(wǎng)格數(shù)據(jù)攜帶的信息，并且被永久儲(chǔ)存。

假設(shè)單元m的初始移動(dòng)時(shí)間為ta，最后移動(dòng)時(shí)間為tb，那么兩者的密度閾值函數(shù)[9]定義為：

(9)

基于以上函數(shù)，就可以判斷單元是否是噪聲網(wǎng)格單元，集合的最小值Dmin按照時(shí)間的長(zhǎng)短來(lái)辨別新增的網(wǎng)格數(shù)據(jù)，且會(huì)隨著時(shí)間的改變而進(jìn)行自身優(yōu)化，經(jīng)過(guò)時(shí)間的淘汰[10]，就可以確定密度函數(shù)的閾值，當(dāng)接收到網(wǎng)格數(shù)據(jù)后，Dmin(tb,ta)的值會(huì)立即降到最小，因此利用Dmin(tb,ta)的變化來(lái)分析網(wǎng)格單元的類型的方法不但可行且效率最高。

2.3 初始聚類中心的選取

選取聚類中心的目的在于判斷數(shù)據(jù)之間的距離，獲取最佳聚類系數(shù)，為網(wǎng)格聚類奠定基礎(chǔ)。聚類中心的選取主要與系數(shù)K相關(guān)，利用其均值隨機(jī)挑選一個(gè)初始聚類中心，但其結(jié)果容易受到影響，導(dǎo)致結(jié)果會(huì)處于一個(gè)波動(dòng)的范圍，假如以距離為主進(jìn)行選擇，就會(huì)出現(xiàn)分貝不同的噪聲干擾，聚類的效果并不明顯。因此在進(jìn)行初始聚類中心的選取[11]時(shí)，要準(zhǔn)確無(wú)誤地判斷數(shù)據(jù)之間的距離以解決分布的密度問(wèn)題，從網(wǎng)格數(shù)據(jù)庫(kù)中選擇，在密集單元里選出一個(gè)位移最大的初始K值作為聚類中心[12]，盡量將噪聲的干擾降到最低，從而提升算法的運(yùn)行效率。假設(shè)將一個(gè)密集單元作為圓心，以數(shù)據(jù)間最大距離r作為半徑，其中包含的圓形區(qū)域就叫做r-鄰域[13]，按照以往的聚類實(shí)踐，r的大小通常是數(shù)據(jù)之間最大距離的二分之一。

設(shè)定一個(gè)上限閾值為p，那么在r區(qū)域中最多有p個(gè)對(duì)象，因此稱此對(duì)象為網(wǎng)格中心對(duì)象[14]，而兩個(gè)多維空間之間的最佳距離為：

(10)

式中i和j為兩個(gè)不同的對(duì)象，d(i,j)為兩個(gè)數(shù)據(jù)之間的最佳距離，n為空間維度，xi1,xi2,...,xin與yi1,yi2,...,yin為n維空間中的數(shù)據(jù)。該算法是基于兩個(gè)數(shù)據(jù)之間最佳距離來(lái)計(jì)算區(qū)域中的對(duì)象總數(shù)[15]，如果數(shù)量超過(guò)閾值p，就可以將其挑選出來(lái)，移動(dòng)到密集單元集合D中，然后在集合中找出初始聚類中心，利用系數(shù)K進(jìn)行聚類計(jì)算。

為了使得到的效果優(yōu)于原始值[16]，將網(wǎng)格內(nèi)的數(shù)據(jù)進(jìn)行分離，運(yùn)用數(shù)據(jù)之間的差異算法來(lái)進(jìn)行評(píng)價(jià)，假設(shè)一組數(shù)據(jù)X={x1,x2,...,xN}，并且分成k個(gè)小組為C1,C2,...,Ck，而每一組的聚類中心分別為m1,m2,...,mk，將網(wǎng)格數(shù)據(jù)中的某一點(diǎn)與聚類中心的距離定義[17]為：

(11)

而數(shù)據(jù)間的特異性決定聚類之間的差別[18]，那么將網(wǎng)格數(shù)據(jù)中的邊緣與聚類中心的距離定義為：

(12)

式中N為數(shù)據(jù)總數(shù)，Cj小組的聚類中心為mi，而mj為小組中的數(shù)據(jù)，d(mi,mj)為Ci與Cj之間的距離，基于以上兩個(gè)距離，得到一個(gè)有效的評(píng)價(jià)函數(shù)V(k)：

(13)

由以上公式可知，只有函數(shù)的范圍保證在[-1,1]之間，當(dāng)函數(shù)的值趨近于1時(shí)，代表網(wǎng)格內(nèi)數(shù)據(jù)之間的差異性越小，聚類的效果比較明顯；當(dāng)函數(shù)的值趨近于-1時(shí)，代表聚類方法失敗，所以當(dāng)Vk的值達(dá)到最大時(shí)，其系數(shù)K就為最佳聚類系數(shù)。

2.4 網(wǎng)格聚類

在上述處理的過(guò)程上，采用網(wǎng)格數(shù)據(jù)聚合計(jì)算的方法將有限的空間分割成多個(gè)小單元[19]，這些獨(dú)立的小單元各自形成了一個(gè)網(wǎng)格結(jié)構(gòu)，然后數(shù)據(jù)就會(huì)依附在網(wǎng)格上進(jìn)行聚類，假設(shè)一個(gè)網(wǎng)格結(jié)構(gòu)中的數(shù)據(jù)總數(shù)上限為γ，那么超過(guò)上限的網(wǎng)格單元就是一個(gè)密集單元[20]，超過(guò)一個(gè)以上的密集單元就可以將其定義為最大的網(wǎng)格單元集合。若用t代表一個(gè)聚類，將其定義為2b長(zhǎng)的0-1串a(chǎn)1,…,a2b-1，其中2b代表密集單元的數(shù)量，i為其中的一個(gè)數(shù)據(jù)，當(dāng)ai=1時(shí)，i則處于聚類之內(nèi)，反之a(chǎn)i=0。文中假設(shè)數(shù)據(jù)的計(jì)量單位是“塊”，那么以塊X1,X2,...,Xi的方式達(dá)到網(wǎng)格結(jié)構(gòu)，每一塊都可以在本身存在的網(wǎng)格內(nèi)進(jìn)行轉(zhuǎn)換，利用隨機(jī)抽樣的方式抽取數(shù)據(jù)，那么其目的就是完成設(shè)定的目標(biāo)，數(shù)據(jù)自行聚類，結(jié)果為R1,R2,...,Rn，其中R代表每塊數(shù)據(jù)X1,X2,...,Xi聚類后的結(jié)果，n代表數(shù)量。

為了保證每個(gè)聚類都不丟失其中的主要數(shù)據(jù)信息，在其進(jìn)行移動(dòng)時(shí)就可以隨機(jī)保存多個(gè)密集單元[21]，因此所有信息都會(huì)被密集單元所攜帶，并將信息繼續(xù)傳遞下去。假設(shè)在t時(shí)刻完成的數(shù)據(jù)為X1，總數(shù)為m，此時(shí)將密集單元進(jìn)行定義：如果從t時(shí)刻為初始聚類，計(jì)算每一個(gè)網(wǎng)格單元μ中的數(shù)據(jù)密度，那么其密度滿足：

den(u)>γ(t-i+1)m

(14)

式中γ為數(shù)據(jù)密度上限。單個(gè)數(shù)據(jù)的聚類思想是如以上描述的方式，而整個(gè)數(shù)據(jù)集合的數(shù)據(jù)流聚類的核心就是先容納所有數(shù)據(jù)塊X1經(jīng)過(guò)，將其攜帶的數(shù)據(jù)都有規(guī)律的放入相應(yīng)的網(wǎng)格結(jié)構(gòu)中，然后再計(jì)算其中數(shù)據(jù)的密度，并找出密集單元；然后搜索得到最大的密集集合，在原有的聚類基礎(chǔ)上，重新將數(shù)據(jù)流去除、新增和組合[22]。而對(duì)于重新加入的網(wǎng)格單元μ，將會(huì)出現(xiàn)三種情況：如果周圍沒(méi)有與之相呼應(yīng)的單元，那么就要新建一個(gè)密集單元，互相結(jié)合得到新的聚類；若存在與其相對(duì)應(yīng)的網(wǎng)格單元ω，那么就將μ融合到新的單元ω；若其對(duì)應(yīng)的單元：

ω1,ω2,…,ωk(k>1)

(15)

則可以把ω1,ω2,...,ωk所在的聚類全部結(jié)合到一個(gè)網(wǎng)格中，而融合后的單元μ就會(huì)被取締，這時(shí)也會(huì)出現(xiàn)三種情況：如果所有聚類中存在空的密集單元，那么該單元就要被取消；如果聚類中的密集單元都是有所關(guān)聯(lián)的，那么就可以將單元μ去除，其他單元不變；如果聚類中的密集單元均為任何關(guān)聯(lián)，那么該聚類就要分割，分別放入其他聚類中。在以上條件的約束下，重新將密集單元進(jìn)行聚類。

基于上述過(guò)程，實(shí)現(xiàn)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)的聚合。

3 基于隱私同態(tài)的數(shù)據(jù)加密

3.1 隱私同態(tài)加密原理

隱私同態(tài)加密原理，即對(duì)加密的數(shù)據(jù)進(jìn)行處理得到一個(gè)輸出，再將這一輸出進(jìn)行解密，其結(jié)果與用同一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果是一樣的。操作人員可以在加密的數(shù)據(jù)中進(jìn)行檢索、對(duì)比等操作，得到正確的結(jié)果，而在整個(gè)處理過(guò)程中無(wú)需對(duì)數(shù)據(jù)進(jìn)行解密。其重要意義在于，真正從根本上解決云計(jì)算等將數(shù)據(jù)及其操作委托給第三方時(shí)的保密問(wèn)題。

隱私同態(tài)加密算法簡(jiǎn)要介紹如下：

(1)加密Enc(m)：r=2^n,p=2^n^2, 計(jì)算c=m+2r+pq；

(2)解密Dec(c)：m=(cmodp) mod 2；

(3)密鑰：奇數(shù)p，遠(yuǎn)遠(yuǎn)大于r、m，q遠(yuǎn)大于p。

其中，加密操作為Enc，解密操作為Dec，明文為m，mod表示模運(yùn)算。明文空間是{0,1}，密文空間是整數(shù)集。p是一個(gè)正的奇數(shù)，q是一個(gè)大的正整數(shù)(沒(méi)有要求是奇數(shù)，它比p要大的多)，p和q在密鑰生成階段確定，p看成是密鑰。而r是加密時(shí)隨機(jī)選擇的一個(gè)小的整數(shù)(可以為負(fù)數(shù))。

3.2 隱私同態(tài)技術(shù)加密聚合

通過(guò)上述過(guò)程對(duì)所有數(shù)據(jù)聚合，為保證數(shù)據(jù)的安全性，防止城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)丟失和篡改，采用隱私同態(tài)技術(shù)加密聚合后的數(shù)據(jù)，過(guò)程如下所示：

(1)建立融合樹(shù)[23]，將聚合后的數(shù)據(jù)發(fā)送到離基站節(jié)點(diǎn)最近的某個(gè)傳感器節(jié)點(diǎn)，將距離最近的節(jié)點(diǎn)記作n0，構(gòu)建起以n0為中心的加密樹(shù)；

(2)對(duì)同態(tài)Hash函數(shù)參數(shù)g發(fā)布，g為一個(gè)大素?cái)?shù)；

(3)為網(wǎng)格內(nèi)數(shù)據(jù)分配ID號(hào)[24]，在有數(shù)據(jù)查詢請(qǐng)求后，各個(gè)傳感器節(jié)點(diǎn)對(duì)數(shù)據(jù)檢測(cè)，并將隱私數(shù)據(jù)存儲(chǔ)到內(nèi)存中；

(4)對(duì)數(shù)據(jù)加密處理，將聚合后的數(shù)據(jù)進(jìn)行加密處理，加密算法表示為：

Ci=Enc(mi)=mi+IDi

(16)

式中mi為隱私數(shù)據(jù)；IDi為第i個(gè)數(shù)據(jù)的ID號(hào)；Enc為數(shù)據(jù)加密參數(shù)：

(5)對(duì)同態(tài)消息驗(yàn)證碼計(jì)算[25]，在隱私同態(tài)技術(shù)中，各個(gè)傳感器能夠計(jì)算出感知數(shù)據(jù)的同態(tài)消息驗(yàn)證碼;

(6)將密文信息和聚合數(shù)據(jù)的消息驗(yàn)證碼上傳到融合節(jié)點(diǎn)中，構(gòu)建基于隱私同態(tài)的數(shù)據(jù)聚合加密模型，從而實(shí)現(xiàn)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)的聚合，其表達(dá)式為：

H(mi)=gmi

(17)

4 仿真實(shí)驗(yàn)對(duì)比

為驗(yàn)證所提出的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法的有效性，采用Matlab軟件搭建城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)模型仿真平臺(tái)并在此平臺(tái)下進(jìn)行實(shí)驗(yàn)分析。實(shí)驗(yàn)數(shù)據(jù)取自某城市電網(wǎng)公司建立的配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)庫(kù)，該數(shù)據(jù)庫(kù)含有2 000個(gè)數(shù)據(jù)，對(duì)數(shù)據(jù)進(jìn)行分組，數(shù)據(jù)集的元組數(shù)設(shè)為10，配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)設(shè)置情況如表1所示。

表1 配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)設(shè)置情況

根據(jù)密度閾值函數(shù)設(shè)置對(duì)配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)進(jìn)行預(yù)處理，并將文獻(xiàn)[1]提出的基于霧計(jì)算的聚合方法與文獻(xiàn)[2]提出的基于霧輔助的方法與所研究方法對(duì)比，對(duì)比三種方法的聚合效果。

4.1 數(shù)據(jù)丟失情況對(duì)比

圖3為三種方法在數(shù)據(jù)聚合后，數(shù)據(jù)丟失的對(duì)比結(jié)果。

圖3 數(shù)據(jù)丟失情況對(duì)比

基于圖3可知，文中方法在數(shù)據(jù)量為100條到500條時(shí)沒(méi)有出現(xiàn)數(shù)據(jù)丟失情況，在數(shù)據(jù)量增多到1 000條時(shí)出現(xiàn)了數(shù)據(jù)丟失情況，但是丟失數(shù)量在1次內(nèi)，丟失數(shù)量較少，在可接受范圍內(nèi)。而基于霧計(jì)算的聚合方法與霧輔助方法數(shù)據(jù)丟失情況較多，聚合效果較差。主要是因?yàn)槲闹蟹椒ú捎秒[私同態(tài)技術(shù)加密聚合后的數(shù)據(jù)，保證了數(shù)據(jù)的安全性，最大限度防止了城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)丟失，由此可以證明文中方法在數(shù)據(jù)聚合過(guò)程中能夠保證數(shù)據(jù)的防丟失安全性。

4.2 數(shù)據(jù)篡改情況對(duì)比

對(duì)比經(jīng)過(guò)三種方法聚合后數(shù)據(jù)被篡改的情況，結(jié)果如圖4所示。

圖4 數(shù)據(jù)篡改情況

由圖4可知，文中方法的數(shù)據(jù)篡改次數(shù)在2次內(nèi)，出現(xiàn)的被篡改情況較少，而其他兩種方法均發(fā)生不同情況的數(shù)據(jù)篡改情況，主要是因?yàn)槲闹蟹椒ú捎秒[私同態(tài)技術(shù)加密聚合后的數(shù)據(jù)，保證了數(shù)據(jù)的安全性，最大限度防止了城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)被篡改。由此可以證明文中方法在數(shù)據(jù)聚合過(guò)程中能夠保證數(shù)據(jù)的防篡改安全性。

4.3 數(shù)據(jù)聚合效率對(duì)比

在數(shù)據(jù)聚合中，僅僅關(guān)注數(shù)據(jù)的完整性和機(jī)密性是遠(yuǎn)遠(yuǎn)不夠的，信息聚合的時(shí)效性也非常重要，為此對(duì)比三種方法的數(shù)據(jù)聚合效率，對(duì)比結(jié)果如圖5所示。由圖5可知，所研究的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合方法聚合效率最高，在數(shù)據(jù)多與少的情況下，所花費(fèi)的數(shù)據(jù)聚合時(shí)間都較少。而基于霧計(jì)算的聚合方法，以及霧輔助的聚合方法受到數(shù)據(jù)量影響較大，在數(shù)據(jù)量較多時(shí)，花費(fèi)的聚合時(shí)間較多。而文中在密集單元里選出一個(gè)位移最大的初始值作為聚類中心，將噪聲的干擾降到最低，從而提升了算法的運(yùn)行效率。

圖5 數(shù)據(jù)聚合效率對(duì)比

4.4 數(shù)據(jù)加密效率對(duì)比

三種方法的數(shù)據(jù)加密效率對(duì)比結(jié)果如圖6所示。由圖6可知，其他兩種方法的數(shù)據(jù)加密時(shí)間較多，文中方法研究的數(shù)據(jù)加密時(shí)間遠(yuǎn)遠(yuǎn)少于這兩種方法。主要原因是文中方法采用了隱私同態(tài)方法對(duì)數(shù)據(jù)加密，隱私同態(tài)技術(shù)不需要對(duì)數(shù)據(jù)密鑰分配，簡(jiǎn)化了加密流程，從而減少了數(shù)據(jù)加密的時(shí)間。

圖6 數(shù)據(jù)加密效率對(duì)比

4.5 通信開(kāi)銷對(duì)比

對(duì)比三種方法在傳輸數(shù)據(jù)時(shí)產(chǎn)生的通信開(kāi)銷，對(duì)比結(jié)果如圖7所所示。由圖7可知，文中方法通信開(kāi)銷維持在同一量級(jí)，通信開(kāi)銷較低，且遠(yuǎn)低于其他兩種方法的通信開(kāi)銷，說(shuō)明所研究的方法不僅能夠減少數(shù)據(jù)聚合時(shí)間，還能夠減少數(shù)據(jù)通信開(kāi)銷。主要原因是文中方法將數(shù)據(jù)的格式轉(zhuǎn)化成與大多數(shù)數(shù)據(jù)相同的格式，重新獲取新的數(shù)據(jù)，保證了數(shù)據(jù)獲取的完整性，降低了數(shù)據(jù)通信開(kāi)銷。

圖7 通信開(kāi)銷對(duì)比

5 結(jié)束語(yǔ)

文中提出了基于隱私同態(tài)的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法。(1)預(yù)先對(duì)數(shù)據(jù)采樣，保證數(shù)據(jù)聚合的完整性；(2)提出網(wǎng)格聚類算法，對(duì)聚類中心與密度函數(shù)選擇，保證數(shù)據(jù)的準(zhǔn)確聚類；(3)將隱私同態(tài)技術(shù)應(yīng)用到數(shù)據(jù)聚合中，在保證數(shù)據(jù)順利聚合的同時(shí)，保證數(shù)據(jù)的安全性。

實(shí)驗(yàn)算例表明，通過(guò)對(duì)比已有經(jīng)典聚合方法，文中所提出的基于隱私同態(tài)的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法，數(shù)據(jù)丟失數(shù)量限制在1次內(nèi)，數(shù)據(jù)篡改次數(shù)限制在2次內(nèi)，減少聚合后數(shù)據(jù)丟失與被篡改的次數(shù)，還能有效提高數(shù)據(jù)加密效率與聚合效率，并顯著降低數(shù)據(jù)的通信費(fèi)用。