夏偉,蔡文婷,劉陽(yáng)
(南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司, 廣州 510000)
數(shù)據(jù)聚合是對(duì)城市配電網(wǎng)信息綜合處理的重要技術(shù)手段,通過(guò)對(duì)數(shù)據(jù)聚合操作能夠降低數(shù)據(jù)采集過(guò)程中的通信費(fèi)用和能量消耗。但是在數(shù)據(jù)聚合中沒(méi)有受到隱私保護(hù),致使配電網(wǎng)數(shù)據(jù)常出現(xiàn)丟失、篡改現(xiàn)場(chǎng),因此,在數(shù)據(jù)隱私保護(hù)的基礎(chǔ)上,對(duì)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合已成為目前亟需解決的問(wèn)題。
針對(duì)該問(wèn)題,國(guó)內(nèi)外學(xué)者研究了數(shù)據(jù)聚合算法,可以有效聚合城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)。其中,文獻(xiàn)[1]研究了基于霧計(jì)算的智能電網(wǎng)安全與隱私保護(hù)數(shù)據(jù)聚合方法,該方法利用云霧合作的加密算法對(duì)數(shù)據(jù)多層隱私保護(hù),并在霧端對(duì)數(shù)據(jù)進(jìn)行了多層融合,實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)數(shù)據(jù)的聚合;文獻(xiàn)[2]研究了霧輔助的輕量級(jí)隱私保護(hù)數(shù)據(jù)多級(jí)聚合方法,該方法利用霧協(xié)作方法收集數(shù)據(jù),采用模數(shù)性質(zhì)對(duì)數(shù)據(jù)加密,并借助三列函數(shù)設(shè)計(jì)認(rèn)證方法,實(shí)現(xiàn)數(shù)據(jù)的聚合。但是上述兩種算法在進(jìn)行數(shù)據(jù)聚合過(guò)程中,沒(méi)有受到隱私保護(hù),導(dǎo)致數(shù)據(jù)常出現(xiàn)丟失、篡改情況。文獻(xiàn)[3]研究了智能電網(wǎng)中的數(shù)據(jù)聚合方法,結(jié)合Paillier加密體制和ElGamal加密體制對(duì)智能電網(wǎng)數(shù)據(jù)進(jìn)行加密處理,并通過(guò)雙線性對(duì)技術(shù)對(duì)數(shù)據(jù)聚合。文獻(xiàn)[4]研究了一種緩解能量空洞的數(shù)據(jù)聚合算法,通過(guò)數(shù)據(jù)聚合的方式使每個(gè)節(jié)點(diǎn)發(fā)送數(shù)據(jù)時(shí)以最大的分片數(shù)進(jìn)行傳送,采用節(jié)能的方式對(duì)WSN能耗進(jìn)行優(yōu)化,以減小EH的區(qū)域,使全網(wǎng)能耗最低。但是上述兩種算法的加密性較差,導(dǎo)致數(shù)據(jù)聚合時(shí)間較長(zhǎng),聚合效率較低。
而隱私同態(tài)是一種直接對(duì)密文數(shù)據(jù)進(jìn)行相關(guān)運(yùn)算的加密技術(shù),能夠避免數(shù)據(jù)融合時(shí)隱私信息的泄漏,常應(yīng)用于在數(shù)據(jù)聚合方案中。基于隱私同態(tài)的這個(gè)優(yōu)點(diǎn),將其應(yīng)用到城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合中,根據(jù)重新獲取的數(shù)據(jù),并在通過(guò)密度閾值函數(shù)設(shè)置、初始聚類中心選取與網(wǎng)格聚類的步驟下完成城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合,并采用隱私同態(tài)技術(shù)對(duì)聚合后的數(shù)據(jù)進(jìn)行加密處理。通過(guò)仿真實(shí)驗(yàn)可知,文中在實(shí)現(xiàn)數(shù)據(jù)聚合的同時(shí),提高了數(shù)據(jù)的安全性,解決了傳統(tǒng)算法中存在的問(wèn)題。
在進(jìn)行城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合計(jì)算之前,首先要通過(guò)電力公司數(shù)據(jù)庫(kù),獲取保存在電力公司中的所有數(shù)據(jù),以進(jìn)行數(shù)據(jù)聚合,包括涉及到的用電資源、網(wǎng)格信息等。雖然數(shù)據(jù)庫(kù)中存有大量各類型數(shù)據(jù),但與所研究的網(wǎng)格數(shù)據(jù)相差較大,每個(gè)數(shù)據(jù)的概念與結(jié)構(gòu)也應(yīng)符合計(jì)算需求,因此要在經(jīng)過(guò)處理后的數(shù)據(jù)庫(kù)中篩選與文中相匹配的數(shù)據(jù)。首先,在大數(shù)據(jù)中找到與公共信息模型可交換的數(shù)據(jù),互相融合,得到一個(gè)基于公共信息模型(CIM模型)的結(jié)構(gòu)。然后,選擇一個(gè)最優(yōu)的鏈路,在此過(guò)程中不斷完善數(shù)據(jù)結(jié)構(gòu),為配電網(wǎng)系統(tǒng)奠定一個(gè)夯實(shí)的基礎(chǔ)。最后,對(duì)重獲的數(shù)據(jù)進(jìn)行分析,提供一個(gè)最佳的聚類方式,保證電網(wǎng)的穩(wěn)定運(yùn)行,其這個(gè)配電網(wǎng)數(shù)據(jù)重獲的過(guò)程如圖1所示。
按照?qǐng)D1中的步驟分析,個(gè)別數(shù)據(jù)的交換方式仍然不能全部導(dǎo)入,格式與模型中的結(jié)構(gòu)也互相不統(tǒng)一,致使準(zhǔn)確率有些許波動(dòng)。因此,需要進(jìn)行格式統(tǒng)一,從而降低數(shù)據(jù)通信開(kāi)銷。

圖1 配電網(wǎng)數(shù)據(jù)重獲過(guò)程
城市配電網(wǎng)多級(jí)網(wǎng)格映射關(guān)系圖如圖2所示。城市配電網(wǎng)多級(jí)網(wǎng)格的劃分需綜合考慮供電區(qū)相對(duì)獨(dú)立性、網(wǎng)格完整性、管理便利性等因素,主要分為高壓層、目標(biāo)網(wǎng)架、中壓線路層、配電站層、配變層。

圖2 配電網(wǎng)多級(jí)網(wǎng)格映射關(guān)系圖
傳統(tǒng)的聚類算法是基于數(shù)據(jù)庫(kù)完整的情況下進(jìn)行的,而數(shù)據(jù)流的聚類是基于數(shù)據(jù)的聚類算法上的,在其他領(lǐng)域上具有廣泛的應(yīng)用,例如商業(yè)互通、網(wǎng)絡(luò)記錄的記錄與分析。
對(duì)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)空間進(jìn)行網(wǎng)格單元?jiǎng)澐郑總€(gè)網(wǎng)格單元中,存在多維空間s,將k維為均分成長(zhǎng)度相等的dk段,那么在dk段中的數(shù)據(jù)集合表示為:
sk={sk1,sk2,…,sk}
(1)

d=(d1,d2,…,dn)∈m
(2)
并且約束條件[4]為:
dk∈skgt,(k=1,…,n)
(3)
式中g(shù)t為空間中的網(wǎng)格單元。若整個(gè)配電網(wǎng)中網(wǎng)格單元的總數(shù)為:
(4)

D(m,td)=λtD(m,tb)+1
(5)
式中td為時(shí)間。如果數(shù)據(jù)在時(shí)刻ta時(shí)進(jìn)入網(wǎng)格單元,其數(shù)據(jù)密度就會(huì)與時(shí)間的改變相關(guān),將其定義為:
D(d,t)=λt-ta
(6)
式中λ為流動(dòng)系數(shù),且為整數(shù),一般徘徊在0~1,d代表數(shù)據(jù),tb代表某一時(shí)刻。如果網(wǎng)格單元m中數(shù)據(jù)的密集程度為D(m,t),在不同的時(shí)刻t與y的分布密度也就不同,分別如下:
(7)
(8)
當(dāng)網(wǎng)格單元的數(shù)據(jù)密度滿足Di≤D(m,t),那么就稱為密集單元,式中Zt與Zy為常量,且兩者的關(guān)系為Zt>Zy,如果滿足Dy>D(m,t)≤Dt,那么在此條件下的網(wǎng)格單元為替代網(wǎng)格單元,當(dāng)Dy>D(m,t)時(shí),網(wǎng)格單元就為噪聲網(wǎng)格單元[5-7]。
如果噪聲單元密度不斷增大,在時(shí)刻y的密度就遠(yuǎn)遠(yuǎn)大于普通網(wǎng)格單元密度,一般都會(huì)慢慢消化網(wǎng)格中的密集數(shù)據(jù),經(jīng)過(guò)處理,就形成了一個(gè)進(jìn)化的網(wǎng)格單元,叫做進(jìn)化噪聲單元;而剩下的網(wǎng)格單元情況是本來(lái)只具有很少的數(shù)據(jù),經(jīng)過(guò)慢慢疊加[8],逐漸演變成噪聲網(wǎng)格單元,只有將噪聲網(wǎng)格單元減少到最小或是消失,才會(huì)實(shí)現(xiàn)數(shù)據(jù)的有效聚合,保留網(wǎng)格數(shù)據(jù)攜帶的信息,并且被永久儲(chǔ)存。
假設(shè)單元m的初始移動(dòng)時(shí)間為ta,最后移動(dòng)時(shí)間為tb,那么兩者的密度閾值函數(shù)[9]定義為:
(9)
基于以上函數(shù),就可以判斷單元是否是噪聲網(wǎng)格單元,集合的最小值Dmin按照時(shí)間的長(zhǎng)短來(lái)辨別新增的網(wǎng)格數(shù)據(jù),且會(huì)隨著時(shí)間的改變而進(jìn)行自身優(yōu)化,經(jīng)過(guò)時(shí)間的淘汰[10],就可以確定密度函數(shù)的閾值,當(dāng)接收到網(wǎng)格數(shù)據(jù)后,Dmin(tb,ta)的值會(huì)立即降到最小,因此利用Dmin(tb,ta)的變化來(lái)分析網(wǎng)格單元的類型的方法不但可行且效率最高。
選取聚類中心的目的在于判斷數(shù)據(jù)之間的距離,獲取最佳聚類系數(shù),為網(wǎng)格聚類奠定基礎(chǔ)。聚類中心的選取主要與系數(shù)K相關(guān),利用其均值隨機(jī)挑選一個(gè)初始聚類中心,但其結(jié)果容易受到影響,導(dǎo)致結(jié)果會(huì)處于一個(gè)波動(dòng)的范圍,假如以距離為主進(jìn)行選擇,就會(huì)出現(xiàn)分貝不同的噪聲干擾,聚類的效果并不明顯。因此在進(jìn)行初始聚類中心的選取[11]時(shí),要準(zhǔn)確無(wú)誤地判斷數(shù)據(jù)之間的距離以解決分布的密度問(wèn)題,從網(wǎng)格數(shù)據(jù)庫(kù)中選擇,在密集單元里選出一個(gè)位移最大的初始K值作為聚類中心[12],盡量將噪聲的干擾降到最低,從而提升算法的運(yùn)行效率。假設(shè)將一個(gè)密集單元作為圓心,以數(shù)據(jù)間最大距離r作為半徑,其中包含的圓形區(qū)域就叫做r-鄰域[13],按照以往的聚類實(shí)踐,r的大小通常是數(shù)據(jù)之間最大距離的二分之一。
設(shè)定一個(gè)上限閾值為p,那么在r區(qū)域中最多有p個(gè)對(duì)象,因此稱此對(duì)象為網(wǎng)格中心對(duì)象[14],而兩個(gè)多維空間之間的最佳距離為:
(10)
式中i和j為兩個(gè)不同的對(duì)象,d(i,j)為兩個(gè)數(shù)據(jù)之間的最佳距離,n為空間維度,xi1,xi2,...,xin與yi1,yi2,...,yin為n維空間中的數(shù)據(jù)。該算法是基于兩個(gè)數(shù)據(jù)之間最佳距離來(lái)計(jì)算區(qū)域中的對(duì)象總數(shù)[15],如果數(shù)量超過(guò)閾值p,就可以將其挑選出來(lái),移動(dòng)到密集單元集合D中,然后在集合中找出初始聚類中心,利用系數(shù)K進(jìn)行聚類計(jì)算。
為了使得到的效果優(yōu)于原始值[16],將網(wǎng)格內(nèi)的數(shù)據(jù)進(jìn)行分離,運(yùn)用數(shù)據(jù)之間的差異算法來(lái)進(jìn)行評(píng)價(jià),假設(shè)一組數(shù)據(jù)X={x1,x2,...,xN},并且分成k個(gè)小組為C1,C2,...,Ck,而每一組的聚類中心分別為m1,m2,...,mk,將網(wǎng)格數(shù)據(jù)中的某一點(diǎn)與聚類中心的距離定義[17]為:
(11)
而數(shù)據(jù)間的特異性決定聚類之間的差別[18],那么將網(wǎng)格數(shù)據(jù)中的邊緣與聚類中心的距離定義為:
(12)
式中N為數(shù)據(jù)總數(shù),Cj小組的聚類中心為mi,而mj為小組中的數(shù)據(jù),d(mi,mj)為Ci與Cj之間的距離,基于以上兩個(gè)距離,得到一個(gè)有效的評(píng)價(jià)函數(shù)V(k):
(13)
由以上公式可知,只有函數(shù)的范圍保證在[-1,1]之間,當(dāng)函數(shù)的值趨近于1時(shí),代表網(wǎng)格內(nèi)數(shù)據(jù)之間的差異性越小,聚類的效果比較明顯;當(dāng)函數(shù)的值趨近于-1時(shí),代表聚類方法失敗,所以當(dāng)Vk的值達(dá)到最大時(shí),其系數(shù)K就為最佳聚類系數(shù)。
在上述處理的過(guò)程上,采用網(wǎng)格數(shù)據(jù)聚合計(jì)算的方法將有限的空間分割成多個(gè)小單元[19],這些獨(dú)立的小單元各自形成了一個(gè)網(wǎng)格結(jié)構(gòu),然后數(shù)據(jù)就會(huì)依附在網(wǎng)格上進(jìn)行聚類,假設(shè)一個(gè)網(wǎng)格結(jié)構(gòu)中的數(shù)據(jù)總數(shù)上限為γ,那么超過(guò)上限的網(wǎng)格單元就是一個(gè)密集單元[20],超過(guò)一個(gè)以上的密集單元就可以將其定義為最大的網(wǎng)格單元集合。若用t代表一個(gè)聚類,將其定義為2b長(zhǎng)的0-1串a(chǎn)1,…,a2b-1,其中2b代表密集單元的數(shù)量,i為其中的一個(gè)數(shù)據(jù),當(dāng)ai=1時(shí),i則處于聚類之內(nèi),反之a(chǎn)i=0。文中假設(shè)數(shù)據(jù)的計(jì)量單位是“塊”,那么以塊X1,X2,...,Xi的方式達(dá)到網(wǎng)格結(jié)構(gòu),每一塊都可以在本身存在的網(wǎng)格內(nèi)進(jìn)行轉(zhuǎn)換,利用隨機(jī)抽樣的方式抽取數(shù)據(jù),那么其目的就是完成設(shè)定的目標(biāo),數(shù)據(jù)自行聚類,結(jié)果為R1,R2,...,Rn,其中R代表每塊數(shù)據(jù)X1,X2,...,Xi聚類后的結(jié)果,n代表數(shù)量。
為了保證每個(gè)聚類都不丟失其中的主要數(shù)據(jù)信息,在其進(jìn)行移動(dòng)時(shí)就可以隨機(jī)保存多個(gè)密集單元[21],因此所有信息都會(huì)被密集單元所攜帶,并將信息繼續(xù)傳遞下去。假設(shè)在t時(shí)刻完成的數(shù)據(jù)為X1,總數(shù)為m,此時(shí)將密集單元進(jìn)行定義:如果從t時(shí)刻為初始聚類,計(jì)算每一個(gè)網(wǎng)格單元μ中的數(shù)據(jù)密度,那么其密度滿足:
den(u)>γ(t-i+1)m
(14)
式中γ為數(shù)據(jù)密度上限。單個(gè)數(shù)據(jù)的聚類思想是如以上描述的方式,而整個(gè)數(shù)據(jù)集合的數(shù)據(jù)流聚類的核心就是先容納所有數(shù)據(jù)塊X1經(jīng)過(guò),將其攜帶的數(shù)據(jù)都有規(guī)律的放入相應(yīng)的網(wǎng)格結(jié)構(gòu)中,然后再計(jì)算其中數(shù)據(jù)的密度,并找出密集單元;然后搜索得到最大的密集集合,在原有的聚類基礎(chǔ)上,重新將數(shù)據(jù)流去除、新增和組合[22]。而對(duì)于重新加入的網(wǎng)格單元μ,將會(huì)出現(xiàn)三種情況:如果周圍沒(méi)有與之相呼應(yīng)的單元,那么就要新建一個(gè)密集單元,互相結(jié)合得到新的聚類;若存在與其相對(duì)應(yīng)的網(wǎng)格單元ω,那么就將μ融合到新的單元ω;若其對(duì)應(yīng)的單元:
ω1,ω2,…,ωk(k>1)
(15)
則可以把ω1,ω2,...,ωk所在的聚類全部結(jié)合到一個(gè)網(wǎng)格中,而融合后的單元μ就會(huì)被取締,這時(shí)也會(huì)出現(xiàn)三種情況:如果所有聚類中存在空的密集單元,那么該單元就要被取消;如果聚類中的密集單元都是有所關(guān)聯(lián)的,那么就可以將單元μ去除,其他單元不變;如果聚類中的密集單元均為任何關(guān)聯(lián),那么該聚類就要分割,分別放入其他聚類中。在以上條件的約束下,重新將密集單元進(jìn)行聚類。
基于上述過(guò)程,實(shí)現(xiàn)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)的聚合。
隱私同態(tài)加密原理,即對(duì)加密的數(shù)據(jù)進(jìn)行處理得到一個(gè)輸出,再將這一輸出進(jìn)行解密,其結(jié)果與用同一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果是一樣的。操作人員可以在加密的數(shù)據(jù)中進(jìn)行檢索、對(duì)比等操作,得到正確的結(jié)果,而在整個(gè)處理過(guò)程中無(wú)需對(duì)數(shù)據(jù)進(jìn)行解密。其重要意義在于,真正從根本上解決云計(jì)算等將數(shù)據(jù)及其操作委托給第三方時(shí)的保密問(wèn)題。
隱私同態(tài)加密算法簡(jiǎn)要介紹如下:
(1)加密Enc(m):r=2^n,p=2^n^2, 計(jì)算c=m+2r+pq;
(2)解密Dec(c):m=(cmodp) mod 2;
(3)密鑰:奇數(shù)p,遠(yuǎn)遠(yuǎn)大于r、m,q遠(yuǎn)大于p。
其中,加密操作為Enc,解密操作為Dec,明文為m,mod表示模運(yùn)算。明文空間是{0,1},密文空間是整數(shù)集。p是一個(gè)正的奇數(shù),q是一個(gè)大的正整數(shù)(沒(méi)有要求是奇數(shù),它比p要大的多),p和q在密鑰生成階段確定,p看成是密鑰。而r是加密時(shí)隨機(jī)選擇的一個(gè)小的整數(shù)(可以為負(fù)數(shù))。
通過(guò)上述過(guò)程對(duì)所有數(shù)據(jù)聚合,為保證數(shù)據(jù)的安全性,防止城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)丟失和篡改,采用隱私同態(tài)技術(shù)加密聚合后的數(shù)據(jù),過(guò)程如下所示:
(1)建立融合樹(shù)[23],將聚合后的數(shù)據(jù)發(fā)送到離基站節(jié)點(diǎn)最近的某個(gè)傳感器節(jié)點(diǎn),將距離最近的節(jié)點(diǎn)記作n0,構(gòu)建起以n0為中心的加密樹(shù);
(2)對(duì)同態(tài)Hash函數(shù)參數(shù)g發(fā)布,g為一個(gè)大素?cái)?shù);
(3)為網(wǎng)格內(nèi)數(shù)據(jù)分配ID號(hào)[24],在有數(shù)據(jù)查詢請(qǐng)求后,各個(gè)傳感器節(jié)點(diǎn)對(duì)數(shù)據(jù)檢測(cè),并將隱私數(shù)據(jù)存儲(chǔ)到內(nèi)存中;
(4)對(duì)數(shù)據(jù)加密處理,將聚合后的數(shù)據(jù)進(jìn)行加密處理,加密算法表示為:
Ci=Enc(mi)=mi+IDi
(16)
式中mi為隱私數(shù)據(jù);IDi為第i個(gè)數(shù)據(jù)的ID號(hào);Enc為數(shù)據(jù)加密參數(shù):
(5)對(duì)同態(tài)消息驗(yàn)證碼計(jì)算[25],在隱私同態(tài)技術(shù)中,各個(gè)傳感器能夠計(jì)算出感知數(shù)據(jù)的同態(tài)消息驗(yàn)證碼;
(6)將密文信息和聚合數(shù)據(jù)的消息驗(yàn)證碼上傳到融合節(jié)點(diǎn)中,構(gòu)建基于隱私同態(tài)的數(shù)據(jù)聚合加密模型,從而實(shí)現(xiàn)城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)的聚合,其表達(dá)式為:
H(mi)=gmi
(17)
為驗(yàn)證所提出的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法的有效性,采用Matlab軟件搭建城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)模型仿真平臺(tái)并在此平臺(tái)下進(jìn)行實(shí)驗(yàn)分析。實(shí)驗(yàn)數(shù)據(jù)取自某城市電網(wǎng)公司建立的配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)含有2 000個(gè)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行分組,數(shù)據(jù)集的元組數(shù)設(shè)為10,配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)設(shè)置情況如表1所示。

表1 配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)設(shè)置情況
根據(jù)密度閾值函數(shù)設(shè)置對(duì)配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)進(jìn)行預(yù)處理,并將文獻(xiàn)[1]提出的基于霧計(jì)算的聚合方法與文獻(xiàn)[2]提出的基于霧輔助的方法與所研究方法對(duì)比,對(duì)比三種方法的聚合效果。
圖3為三種方法在數(shù)據(jù)聚合后,數(shù)據(jù)丟失的對(duì)比結(jié)果。

圖3 數(shù)據(jù)丟失情況對(duì)比
基于圖3可知,文中方法在數(shù)據(jù)量為100條到500條時(shí)沒(méi)有出現(xiàn)數(shù)據(jù)丟失情況,在數(shù)據(jù)量增多到1 000條時(shí)出現(xiàn)了數(shù)據(jù)丟失情況,但是丟失數(shù)量在1次內(nèi),丟失數(shù)量較少,在可接受范圍內(nèi)。而基于霧計(jì)算的聚合方法與霧輔助方法數(shù)據(jù)丟失情況較多,聚合效果較差。主要是因?yàn)槲闹蟹椒ú捎秒[私同態(tài)技術(shù)加密聚合后的數(shù)據(jù),保證了數(shù)據(jù)的安全性,最大限度防止了城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)丟失,由此可以證明文中方法在數(shù)據(jù)聚合過(guò)程中能夠保證數(shù)據(jù)的防丟失安全性。
對(duì)比經(jīng)過(guò)三種方法聚合后數(shù)據(jù)被篡改的情況,結(jié)果如圖4所示。

圖4 數(shù)據(jù)篡改情況
由圖4可知,文中方法的數(shù)據(jù)篡改次數(shù)在2次內(nèi),出現(xiàn)的被篡改情況較少,而其他兩種方法均發(fā)生不同情況的數(shù)據(jù)篡改情況,主要是因?yàn)槲闹蟹椒ú捎秒[私同態(tài)技術(shù)加密聚合后的數(shù)據(jù),保證了數(shù)據(jù)的安全性,最大限度防止了城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)被篡改。由此可以證明文中方法在數(shù)據(jù)聚合過(guò)程中能夠保證數(shù)據(jù)的防篡改安全性。
在數(shù)據(jù)聚合中,僅僅關(guān)注數(shù)據(jù)的完整性和機(jī)密性是遠(yuǎn)遠(yuǎn)不夠的,信息聚合的時(shí)效性也非常重要,為此對(duì)比三種方法的數(shù)據(jù)聚合效率,對(duì)比結(jié)果如圖5所示。由圖5可知,所研究的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合方法聚合效率最高,在數(shù)據(jù)多與少的情況下,所花費(fèi)的數(shù)據(jù)聚合時(shí)間都較少。而基于霧計(jì)算的聚合方法,以及霧輔助的聚合方法受到數(shù)據(jù)量影響較大,在數(shù)據(jù)量較多時(shí),花費(fèi)的聚合時(shí)間較多。而文中在密集單元里選出一個(gè)位移最大的初始值作為聚類中心,將噪聲的干擾降到最低,從而提升了算法的運(yùn)行效率。

圖5 數(shù)據(jù)聚合效率對(duì)比
三種方法的數(shù)據(jù)加密效率對(duì)比結(jié)果如圖6所示。由圖6可知,其他兩種方法的數(shù)據(jù)加密時(shí)間較多,文中方法研究的數(shù)據(jù)加密時(shí)間遠(yuǎn)遠(yuǎn)少于這兩種方法。主要原因是文中方法采用了隱私同態(tài)方法對(duì)數(shù)據(jù)加密,隱私同態(tài)技術(shù)不需要對(duì)數(shù)據(jù)密鑰分配,簡(jiǎn)化了加密流程,從而減少了數(shù)據(jù)加密的時(shí)間。

圖6 數(shù)據(jù)加密效率對(duì)比
對(duì)比三種方法在傳輸數(shù)據(jù)時(shí)產(chǎn)生的通信開(kāi)銷,對(duì)比結(jié)果如圖7所所示。由圖7可知,文中方法通信開(kāi)銷維持在同一量級(jí),通信開(kāi)銷較低,且遠(yuǎn)低于其他兩種方法的通信開(kāi)銷,說(shuō)明所研究的方法不僅能夠減少數(shù)據(jù)聚合時(shí)間,還能夠減少數(shù)據(jù)通信開(kāi)銷。主要原因是文中方法將數(shù)據(jù)的格式轉(zhuǎn)化成與大多數(shù)數(shù)據(jù)相同的格式,重新獲取新的數(shù)據(jù),保證了數(shù)據(jù)獲取的完整性,降低了數(shù)據(jù)通信開(kāi)銷。

圖7 通信開(kāi)銷對(duì)比
文中提出了基于隱私同態(tài)的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法。(1)預(yù)先對(duì)數(shù)據(jù)采樣,保證數(shù)據(jù)聚合的完整性;(2)提出網(wǎng)格聚類算法,對(duì)聚類中心與密度函數(shù)選擇,保證數(shù)據(jù)的準(zhǔn)確聚類;(3)將隱私同態(tài)技術(shù)應(yīng)用到數(shù)據(jù)聚合中,在保證數(shù)據(jù)順利聚合的同時(shí),保證數(shù)據(jù)的安全性。
實(shí)驗(yàn)算例表明,通過(guò)對(duì)比已有經(jīng)典聚合方法,文中所提出的基于隱私同態(tài)的城市配電網(wǎng)多級(jí)網(wǎng)格數(shù)據(jù)聚合算法,數(shù)據(jù)丟失數(shù)量限制在1次內(nèi),數(shù)據(jù)篡改次數(shù)限制在2次內(nèi),減少聚合后數(shù)據(jù)丟失與被篡改的次數(shù),還能有效提高數(shù)據(jù)加密效率與聚合效率,并顯著降低數(shù)據(jù)的通信費(fèi)用。