劉璐璐,賈俊強,蔣詩百,楊麗娜,馬占軍
(國網新疆電力有限公司信息通信公司,新疆烏魯木齊 830001)
配電終端是指整個配電開關監控終端回路,由輸電網絡、供電裝置、傳輸線路等多個設備結構共同組成。在實際應用過程中,配電終端既負責調節電力元件兩端的負載電壓水平,也可以將傳輸電流的數值水平控制在既定范圍內[1]。隨著配電終端網絡覆蓋面積的增大,電力數據的輸出量也不斷增大。對于加密主機而言,配電終端數據輸出量的增大會導致密鑰文本的約束作用能力下降,從而造成數據加密耗時的大幅延長。
李春華[2]等提出了OFDM-PON 系統中的基于信道相位信息的動態加密方案。該加密方案只能定義靜態密鑰文本,雖然保障了加密設備對于同層傳輸數據的處理能力,但卻難以實現對分層傳輸信息的加密處理,這也是導致密文模板完善水平始終相對較低的主要原因。為解決上述問題,提出基于樸素貝葉斯的配電終端數據聯合分層加密算法。樸素貝葉斯是在貝葉斯定理特征條件的基礎上建立的獨立假設型分類方法,可以在決策樹組織的作用下,根據概率統計原則確定樣本數據的分類標準[3]。與其他類型的分類方法相比,樸素貝葉斯模型的誤判率更低,可以在保障樣本數據完整性的同時,建立多個樣本集合,一方面實現了對多類型數據信息的按需轉存,另一方面也可以避免非同類數據進入同一樣本存儲集合中。在運算過程中,樸素貝葉斯模型同時結合了先驗概率系數與后驗概率系數,能夠避免主觀偏見對于樣本數據分類結果造成的影響,既解決了樣本信息獨立使用而造成的過擬合問題,也使得樣本集合的完整性水平得到了保證[4]。
配電終端數據處理以樸素貝葉斯模型和決策樹結構為基礎,并可以根據挖掘深度指標的取值結果確定加密指令的執行與傳輸速度。
處理配電終端數據時,樸素貝葉斯模型將明文樣本作為未被編碼的信息參量,將密文樣本作為完成編碼的信息參量,在不違背加密原則的情況下,明文樣本、密文樣本之間存在相互轉化的可能,且轉化規則的編碼形式始終受到樸素貝葉斯模型的直接約束[5-6]。規定表示配電終端數據的編碼特征,其定義表達式為:
其中,α表示信息參量標記系數最小取值,n表示標記系數最大取值,β表示編碼信息提取系數,iα表示基于系數α的密文樣本,in表示基于系數n的密文樣本。在式(1)的基礎上,設δ、ε表示兩個隨機選取的貝葉斯節點計數值,且δ≠ε的不等式條件恒成立,ΔU表示配電終端數據密文樣本的單位累積量,聯立上述物理量,可將樸素貝葉斯模型表達式定義為:
配電終端數據聯合分層加密處理需要樸素貝葉斯模型與決策樹組織的共同配合,故而在制定加密算法時,需要根據求解所得的模型表達式完善決策樹組織的具體連接形式。
決策樹組織是實現配電終端數據聯合分層加密處理的關鍵結構,決策樹組織的連接形式如圖1所示。

圖1 決策樹組織連接形式
密文數據樣本輸出量決定了決策樹組織對配電終端數據加密的處理能力[7]。在離散節點數量為e1,過渡節點數量為e2的情況下,可以將決策樹組織中的密文數據樣本輸出量求解結果表示為:
式中,η表示配電終端數據的加密有效率,γ表示密碼文本分層傳輸系數的初始賦值。在樸素貝葉斯模型作用下,密文數據樣本輸出量越大,表示決策樹組織對配電終端數據的加密處理能力越強[8]。
數據挖掘深度也稱為加密指令的聯合執行深度。在分層標準保持不變的情況下,樸素貝葉斯模型對于配電終端數據的編碼作用能力也保持不變,而由于決策樹組織的存在,待加密數據可以借助離散節點進入過渡節點,此時將挖掘深度指標保持在標準數值區間之內,可以保障主機元件對配電終端數據聯合分層加密處理能力[9-10]。設Amax表示配電終端數據在決策樹組織中的最大累積量,?表示數據挖掘系數,ι、κ表示兩個不為零的加密數據聯合度量值,sι表示度量值為ι時的密文信息分層標準,sκ表示度量值為κ時的密文信息分層標準,f表示基于樸素貝葉斯模型的數據樣本密鑰特征。在上述物理量的支持下,聯立式(3),可將配電終端數據挖掘深度表示為:
如果配電終端數據密文模板的編碼形式相同,那么這些數據樣本的挖掘深度值也相等。
數據分層標準是主機元件完成配電終端數據聯合分層加密處理的關鍵參考條件,根據密文樣本取值量的不同,分層標準的劃分規則也有所不同,在樸素貝葉斯模型的作用下,待加密的配電終端數據總量越多,分層標準的劃分規則越細致[11-12]。規定表示待加密配電終端數據的中位數,求解式為:
設λ表示配電終端數據聯合標記系數,表示加密處理過程中的關鍵分層指標,聯立式(5),可將數據分層標準表達式定義為:
推導數據分層標準表達式時,要求系數取值不能等于密碼文本分離系數的最小值與最大值。
編碼密鑰的創建必須參考配電終端數據明文信息的當前輸出量,在樸素貝葉斯模型的作用下,更改決策樹組織的連接形式,從而在適應配電終端數據分層標準的同時,匹配數據樣本信息與密碼樣本[13-14]。設z表示配電終端數據的原碼系數,Cz表示原碼z的明文譯碼結果,μ表示明文編譯系數,聯立上述物理量,可將原碼編譯向量表示為:
聯立式(6)、式(7),可將基于樸素貝葉斯的配電終端數據密鑰表達式定義為:
其中,?表示配電終端數據的分層加密速率。為使密鑰文本能夠適應配電終端數據的分層加密需求,要求系數?的取值必須大于自然數“1”。
加密系數決定了主機元件對配電終端數據的處理能力。當待加密信息保持分層傳輸狀態時,樸素貝葉斯模型對決策樹組織的約束作用能力會不斷減弱,不但會導致密鑰文本完整性的下降,還有可能造成配電終端數據大量堆積的問題。但在已知加密系數求解結果的基礎上,控制配電終端數據的輸出量水平,則能夠有效促進密鑰文本的分層傳輸能力,使得文本信息的完整性得到保障[15-16]。加密系數求解表達式為:
其中,ρ表示配電終端數據的聯合分布密度,m1、m2表示兩個不相等的密鑰文本轉碼系數。在配電終端數據聯合分層加密處理的過程中,加密系數求解結果大于零,表示數據信息傳輸方向為正,加密系數求解結果小于零,表示數據信息傳輸方向為負。
針對配電終端數據加密處理能力的驗證,可以對數據樣本加密耗時進行分析。在穩定的配電終端運動環境中,數據樣本加密耗時影響密文模板的完整性,對于配電主機而言,若數據樣本總存儲量相對較大,實施加密處理時,如果樣本加密耗時較短,那么表示信息參量在加密主機與耗電設備之間的傳輸速率較快,單位時間內數據樣本的傳輸量較大。由于待篩選數據較多,配電主機可以選擇更合適的信息參量用于定義密文模板,故而所得密文模板的完整性也就相對較高。
實驗過程中,首先搭建如圖2 所示的配電終端數據傳輸回路,利用560-TX PRO 設備對已輸出數據樣本進行聚合處理,再借助XT32 處理器去除不滿足實驗需求的樣本參量,完成上述處理步驟后,TR-A3設備再次聚合信息參量,并將這些數據反饋回配電終端主機,以供其進行后續的加密處理。

圖2 配電終端數據傳輸回路
利用基于樸素貝葉斯的配電終端數據聯合分層加密算法控制終端主機,在加密處理已篩選數據文本的過程中,記錄加密耗時的數值變化情況,所得數據為實驗組變量;再利用OFDM-PON 型加密方案控制終端主機,在加密處理已篩選數據文本的過程中,記錄加密耗時的數值變化情況,所得數據為對照組變量;對比實驗組、對照組變量數據,總結實驗規律。
實驗的樣本對象包含順序傳輸數據、逆序傳輸數據兩種。順序傳輸情況下,首次聚合的樣本總量大于二次聚合;逆序傳輸情況下,首次聚合的樣本總量小于二次聚合。
分別采用實驗組、對照組加密方法,得到配電終端數據加密耗時的具體數值對比結果,如圖3 所示。

圖3 配電終端數據加密耗時
1)順序數據傳輸:當配電終端數據傳輸方向為順序時,數據加密耗時的均值水平相對較低,當配電終端數據輸出量達到9×109MB 時,實驗組最大耗時結果為7.5 ms,對照組最大耗時結果為33.4 ms,二者差值為25.9 ms。
2)逆序數據傳輸:當配電終端數據傳輸方向為逆序時,數據加密耗時的均值水平相對較高,當配電終端數據輸出量達到9×109MB 時,實驗組最大耗時結果為27.3 ms,對照組最大耗時結果為53.3 ms,二者差值為26.0 ms。
整個實驗過程中,對照組配電終端數據加密耗時始終大于實驗組。
綜上可得實驗結論為:
1)OFDM-PON 型加密方案在處理配電終端數據時,所需的加密耗時相對較長,特別是當數據信息傳輸方向為逆序時,該方法所需加密耗時超過了50 ms,不能有效解決密文模板完整性較差的問題。
2)基于樸素貝葉斯的加密算法可以較好地解決配電終端數據加密耗時過長的問題,當數據信息傳輸方向為順向時,該方法所需加密耗時也不會超過30 ms,對于完善數據樣本密文模板能夠起到一定的促進性作用。
新型配電終端數據聯合分層加密算法以樸素貝葉斯模型為基礎,在計算數據挖掘深度的同時,建立完整的分層處理標準,再聯合密鑰文本,確定加密系數指標的具體計算結果。與OFDM-PON 型加密方案相比,基于樸素貝葉斯模型的加密算法可以有效解決配電終端數據加密耗時過長的問題,對于完善密文模板起到了明顯的促進性作用。