江元, 李曉明, 尚云飛
(1.國網(wǎng)甘肅省電力公司, 甘肅,蘭州 730030;2.國網(wǎng)甘肅省電力公司,營銷服務中心, 甘肅,蘭州 730030)
網(wǎng)絡信息安全問題日益嚴峻,極大影響了電力系統(tǒng)優(yōu)質(zhì)運行[1]。營銷系統(tǒng)是信息管理類應用的核心業(yè)務系統(tǒng),該系統(tǒng)能夠生成、儲存、處理及傳輸用戶信息、用電信息等重要數(shù)據(jù)材料,具備很強的保密性,非法使用及泄露會給電力行業(yè)帶來不可估計的嚴重損失[2]。通過多年的信息化建設(shè)實踐證明,在開放、共享的網(wǎng)絡環(huán)境內(nèi),電力營銷數(shù)據(jù)依舊處在一種高風險狀態(tài),對其進行有效加密是十分迫切的發(fā)展需求。
文獻[3]提出一種全同態(tài)數(shù)據(jù)加密聚合方案。運用DGHV全同態(tài)算法對隱私數(shù)據(jù)實施加密,同時把節(jié)點身份信息嵌入至數(shù)字簽名中,令方案擁有追查并修復錯誤的能力。該方案無需可信第三方,以簇為單位分配干擾因子,從而抵御內(nèi)部攻擊并提高運行效率。但該方法計算速率較慢,即時性不高。文獻[4]以船舶通信網(wǎng)絡為例,針對無法實現(xiàn)身份數(shù)據(jù)認證而造成加密權(quán)限紊亂問題,設(shè)計一種基于身份認證的船舶通信網(wǎng)絡全同態(tài)加密方法。運用匯聚節(jié)點方法把身份認證程序代入全同態(tài)加密系統(tǒng)內(nèi),經(jīng)過明文集計算對身份認證數(shù)據(jù)采取同態(tài)加密,檢測匯聚節(jié)點數(shù)據(jù)實現(xiàn)身份認證檢測;對加密文案進行去噪,通過整數(shù)同態(tài)加密達到船舶通信網(wǎng)絡全同態(tài)加密目標。但該方法安全性能差,被破解概率較高。
本文總結(jié)上述方法缺陷,提出一種基于混沌序列的電力營銷數(shù)據(jù)去隱私化加密方法。通過評估電力營銷數(shù)據(jù)隱私風險系數(shù),了解電力營銷數(shù)據(jù)潛在安全隱患;闡明混沌序列加密原理,使用基于Logistic混沌序列的數(shù)據(jù)加密模型,完成高精度、高效率的電力營銷數(shù)據(jù)加密目標。
數(shù)據(jù)隱私風險評估就是對數(shù)據(jù)風險采取全方位的評判與衡量。隱私風險即為數(shù)據(jù)產(chǎn)生泄露的可能性與后續(xù)帶來的負面影響[5]。
聯(lián)系數(shù)是描述2個集合互相關(guān)聯(lián)、制約并凸顯屬性的同、異、反關(guān)系解析式[6]。假設(shè)Z是一個非空集,那么A={〈z,aAz,bAz,cAz〉z∈Z}的聯(lián)系數(shù)為式(1),
μAz=aAz+bAzi+cAzj
(1)
式中,aAz、bAz、cAz依次為Z內(nèi)元素z隸屬A的支持度、不確定度與對立度。
式(1)中包含同、異、反3個因子,所以又將其叫作三元聯(lián)系數(shù)。對三元聯(lián)系數(shù)內(nèi)的不確定值度b(2)實施進一步計算,得到一般形式式(2),
μ=a+b1i1+b2i2+…+bnin+cj
(2)
偏聯(lián)系數(shù)是表示偏離走勢變化高低的一種函數(shù),折射出同異反聯(lián)系形態(tài)的發(fā)展趨勢與變化[7]。在電力營銷數(shù)據(jù)隱私風險評估過程中,同勢代表隱私風險評估和預期標準風險接近于相同變化形態(tài),也就是處在隱私評估的低風險區(qū)域;均勢代表隱私風險評估和預期標準風險水準差距略高,處在隱私評估的中級風險區(qū)域;反勢代表隱私風險評估和預期標準風險是相反狀態(tài)。處在隱私評估的高風險區(qū)域。
五元聯(lián)系數(shù)μ的記分函數(shù)表示成式(3),
Sμ=a+b-d+e
(3)
五元聯(lián)系數(shù)μ的精確函數(shù)為式(4),
Hμ=a+b+d+e
(4)
記分函數(shù)Sμ與精確函數(shù)Hμ類似于數(shù)據(jù)統(tǒng)計內(nèi)的均值與方差,記分函數(shù)越高,數(shù)據(jù)隱含風險越大;記分函數(shù)越低,其風險指數(shù)越小。在記分函數(shù)相等的情況下,精確函數(shù)越高,數(shù)據(jù)風險越大,反之越低。所以,本文使用記分函數(shù)與精確函數(shù)對電力營銷數(shù)據(jù)的隱含風險實施等級排列預測[8-9]。
權(quán)重是數(shù)據(jù)隱私風險評估時,可以呈現(xiàn)出每個待評估指標影響力度的數(shù)值。本文融合主觀賦權(quán)與客觀賦權(quán),設(shè)計一種五元偏聯(lián)系數(shù)勢的最小二偏賦權(quán)方法[10]。
關(guān)于隱私風險屬性Gi,將其r階偏聯(lián)系數(shù)勢矩陣描述成式(5):
(5)

(6)
式(6)僅代表權(quán)重關(guān)鍵水平相等的狀態(tài)。一般情況,數(shù)據(jù)隱私風險指標的權(quán)重關(guān)鍵水平是互不相等的。在不同權(quán)重矢量Wi組成的評估指標內(nèi),想要了解評估結(jié)果的適用性,就要建立最小二偏函數(shù)為式(7):
(7)
組建Lagrange函數(shù)對上式進行計算,獲得最小h偏賦權(quán)解析式為:
(8)
混沌現(xiàn)象為非線性確定性系統(tǒng)內(nèi)的一種隨機過程,將2個特別接近的原始值引入相同混沌函數(shù)實施迭代計算,通過特定階段的計算后,數(shù)值序列沒有任何相似性[11]。此種加密方式隸屬于確定性系統(tǒng),但很難對其進行預判,隱藏在冗雜系統(tǒng)內(nèi)卻又無法分解。
混沌信號的非周期性、持續(xù)寬帶頻譜、與噪聲相似等特征,令其具備天然的隱蔽特性,對原始條件高度敏感,擁有長期的不可預測性[12],讓數(shù)據(jù)很難遭受惡意侵害與攻擊。
Logistic映射表示非線性混沌方程,其映射過程為式(9):
Xn+1=bXn1-XnXn∈0,1
(9)
式中,b代表控制參變量。明確b的具體數(shù)值后,通過隨機原始值X0∈0,1能夠迭代計算出一個明確的時間序列X1,X2,…,Xn。
混沌序列加密的安全性關(guān)鍵依賴混沌密鑰流,在混沌加密系統(tǒng)內(nèi),把混沌系統(tǒng)生成的隨機序列xi>當作密鑰流ki>和明文數(shù)據(jù)流mi>的按位運算,繼而得到密文數(shù)據(jù)流ci>。明文數(shù)據(jù)流為二進制,而密鑰流ki>是對混沌序列xi>實施數(shù)據(jù)處理得到的。采用計算機技術(shù)對初始混沌數(shù)據(jù)xi>進行多類處理,讓其在有限計算準確度前提下,完成混沌序列的隨機性。
混沌加密密碼作為一種序列密碼。混沌序列密碼系統(tǒng)的加密端與解密端為2個完全獨立且相等的混沌系統(tǒng),2個系統(tǒng)之間沒有耦合關(guān)聯(lián)[13]。明文數(shù)據(jù)在加密端加密后直接傳輸?shù)浇饷芏耍饷芏四軌蛟谌拷邮蘸笤賹嵤┙饷堋;煦缧蛄忻艽a加密方式較為靈活,能夠有效運用混沌信號的特征獲得結(jié)構(gòu)復雜的加密函數(shù)。混沌序列密碼系統(tǒng)如圖1所示。

圖1 混沌加密過程
通過混沌序列轉(zhuǎn)變原有數(shù)據(jù),讓沒有授權(quán)的用戶即便得到已加密數(shù)據(jù),但由于無法進行解密,依舊不能明確信息內(nèi)容的方法,由此最大程度保障數(shù)據(jù)安全,預防數(shù)據(jù)外泄現(xiàn)象發(fā)生。同時在加密前將數(shù)據(jù)去隱私化能更有效提升數(shù)據(jù)安全性。
將式(9)模式的Logistic映射產(chǎn)生的序列概率分布函數(shù)記作式(10):
(10)
使用ρx能夠輕易獲得Logistic映射生成的混沌序列某些具備重要作用的統(tǒng)計特征,例如x的平均時間,也就是混沌序列軌跡點平均值,描述為式(11):
(11)
針對互相關(guān)函數(shù)來說,單獨挑選2個原始值x0與y0,那么序列互相關(guān)函數(shù)為式(12):
(12)
序列的自相關(guān)函數(shù)ACF和delta函數(shù)相等。
因為去隱私化加密對象是數(shù)字量,因此把通過實數(shù)組成的序列xk>映射為經(jīng)過整數(shù)組建的偽隨機序列,完成去隱私化目的,并將其作為加密密鑰,使用的映射方式為挑選小數(shù)點后幾位有效數(shù)字組合為整數(shù),構(gòu)建一種Logistic混沌映射選的加/解密模型,如圖2所示。完整的加/解密運算方法如圖3所示。

圖2 混沌序列加密模型示意圖
為了讓序列更具隨機性,同時提升其加密速率,隨機數(shù)值擇取的間隔M等于6是最為恰當?shù)摹k的值是Xk小數(shù)點后3、4、5位,這樣就會增強抗選擇明文攻擊性能。
為了提升明文攻擊適應度,對Xn實施數(shù)據(jù)處理,讓Xn和Xn+1二者間的關(guān)系更加復雜,繼而防止攻擊者使用簡單的推導過程求解出μ值。本文使用間隔取數(shù)手段,在Xn和Xn+1之間安置一個數(shù)值,那么Xn和Xn+1的關(guān)聯(lián)式轉(zhuǎn)變?yōu)槭?13):
(13)

圖3 混沌加密/解密方法架構(gòu)圖

為了不暴露明文信息冗余度,加密體制需要充分且勻稱地使用密文空間,混沌序列也要明確加密后密文數(shù)據(jù)的統(tǒng)計分布狀態(tài),也就是明文數(shù)據(jù)是否被全部掩蓋,這也是權(quán)衡加密方法有效性的關(guān)鍵準則。如果密鑰序列是完全隨機狀態(tài),那么加密之后的密文數(shù)據(jù)順從勻稱分布。將明文與密鑰序列當作一個字節(jié)的數(shù)據(jù)流,從中任意選取一個字節(jié)的明文m與密鑰k。假設(shè)m取值是不相等的,也就是某一位出現(xiàn)0或1的幾率是不同的,并且數(shù)據(jù)位出現(xiàn)0或1是互相獨立事件。若明文第i位出現(xiàn)1的幾率是p,密鑰序列在理想情況下符合白噪聲性,也就是產(chǎn)生0或1的求元率是相同的,都是0.5。那么加密后密文c的第i位出現(xiàn)1的求元率為式(14):
(14)
因此可以看到,加密后密文的求元率分布是勻稱的,也就完成了電力營銷數(shù)據(jù)去隱私化加密目標。某電力企業(yè)數(shù)據(jù)庫內(nèi)部分電壓輸出原始數(shù)據(jù)如表1所示。采用本文方法得到的電壓輸出原始數(shù)據(jù)去隱私化加密后的模式如表2所示。
按照本文方法計算步驟,將Logistic當作例子,探究混沌序列加密的真實效用,對其進行電力營銷數(shù)據(jù)去隱私化加密及解密仿真。
對相同明文使用兩組略有差別的原始密鑰依次加密后的密文字符ASC碼值分布示意圖如圖4所示。圓點線代表明文,正方形點線對照x0值為0.600 01加密后獲得的密文字符,μ=3.74。從圖4可知,相同的明文在密鑰產(chǎn)生細小改變時,明文會發(fā)生明顯改變,折射出密文對密鑰的敏感特征。

表1 電壓輸出原始數(shù)據(jù)

表2 電壓輸出去隱私化加密數(shù)據(jù)

圖4 密文字符ASC碼值分布示意圖
本文加密方法的迭代次數(shù)分布狀況如圖5所示。從圖5可知,迭代次數(shù)集中發(fā)生在220-620之間,降低了迭代次數(shù),提升了加密方法的計算速率與計算開銷。
為了進一步驗證本文方法加密性能可靠性,依次與文獻[3]和文獻[4]進行仿真對比,對某企業(yè)電力營銷數(shù)據(jù)進行加/解密操作。測驗環(huán)境是奔騰3.0GHzCPU,2GB內(nèi)存。獲得3種方法性能對比如表3所示。從表3可知,本文方法的解密效率與迭代次數(shù)均優(yōu)于2個文獻,由此證明了本文方法數(shù)據(jù)加密優(yōu)越性。

圖5 本文方法迭代次數(shù)分布示意圖

表3 加密方法性能對比
為了進一步驗證不同方法的抗攻擊能力,在一定強度的攻擊下,采用WSN加密方法、身份認證加密方法以及混沌序列的加密方法對數(shù)據(jù)丟包率進行檢測,結(jié)果如圖6所示。

圖6 不同方法下數(shù)據(jù)丟包率
分析圖6可知,當運行時間為10 s,WSN加密方法的數(shù)據(jù)丟包率為0.4,身份認證加密方法的數(shù)據(jù)丟包率為0.63,混沌序列的數(shù)據(jù)丟包率為0.10。當運行時間為50 s,WSN加密方法的數(shù)據(jù)丟包率為0.8,身份認證加密方法的數(shù)據(jù)丟包率為0.84,混沌序列的數(shù)據(jù)丟包率為0.35。本文方法的數(shù)據(jù)丟包率都較低,說明本文方法具有較強的抗攻擊能力。
使用混沌序列下的電力營銷數(shù)據(jù)去隱私化加密方法,可提高電力營銷數(shù)據(jù)安全性,同時規(guī)避了物理同步混沌系統(tǒng)面臨的技術(shù)問題,完成電力營銷數(shù)據(jù)精準加密,且抗攻擊能力好,為滿足信息化時代數(shù)據(jù)加密需求提供扎實基礎(chǔ)。但該方法只能保護數(shù)據(jù),無法防御惡意攻擊行為,下一步研究方向即在加密的同時,對入侵行為進行檢測和識別。