張譯,魏永瑜,馬燕,冶秀蘭,馬元明
(國網青海省電力公司信息通信公司數據運營中心,青海西寧 810000)
數據中臺以低成本、高速率的優勢為企業的創新領域帶來巨大提升,中臺架構越來越復雜,導致交互式傳輸協議的時效性能力出現下降,系統所存儲的內生性數據在中臺間的交互效率過低,協議交互性安全水平的持續下降,因此對于數據中臺內生性數據安全交互至關重要。
對此,一些學者進行了有關研究。王逸兮等人[1]提出基于中臺架構的內生性數據安全交互系統設計,以CAN 中臺總線控制器作為核心調配元件,按需連接寄存器處理模塊與內生處理器交互控制模塊,實現交互系統的硬件執行環境搭建。設置交互式連接協議棧,通過定義數據安全映射關系的方式,轉換中臺間存儲數據的交互格式,實現系統的軟件執行環境搭建。聯合相關硬件設備結構體,完成基于中臺架構的內生性數據安全交互系統設計。但該方法在轉換數據過程中計算量巨大,轉換時間緩慢。孫猛等人[2]提出基于哈希算法的大數據分析中臺在智能電廠中的信息檢索方法。依據智能電廠中不同數據信息結點間連接距離,測算智能電廠的數據信息鏈接權重。利用哈希算法整合大數據分析中臺,通過統計搜索關鍵字和數據結果之間的距離,以獲得的最小間距數據結果輸出為搜索結果。從而實現智能電站數據檢索,但該方法在構建模型時會導致數據中臺的魯棒性不足。
為解決傳統方法存在的問題,提出基于最鄰近算法的數據中臺內生性數據安全交互系統。
中臺內生性數據安全交互系統的控制中心為CAN 中臺總線控制器,采用JKU-9901 型控制器作為其核心執行結構[3-4]??刂破鹘Y構如圖1 所示。

圖1 CAN中臺總線控制器結構
在CAN 總線控制器作用下,系統將出入口節點調試成相同的連接模式,建立內生性節點與中臺上機位之間的連接關系。采用交互式傳感器整合與處理數據。通過將已存儲的信息參量釋放在空白的系統信道結構體中,使其始終保持相對空閑的運行狀態,抑制內生性數據的混亂傳輸行為,控制交互式傳輸協議對中臺主機造成的阻礙性影響強度[5-6]。
寄存器與控制器構成了雙中臺架構的基礎,寄存器采用的型號為TTR-9014,通過配置寄存器處理模塊,實現有效調節內生性數據傳輸,達到控制中臺架構體系的操作目的。
在控制器與寄存器的基礎上,為了更好地管理中臺內生性數據,并能夠識別服務記錄,設計一種采用區塊鏈信息技術的雙中臺架構[7-8]。雙中臺架構如圖2 所示。

圖2 雙中臺架構
雙中臺架構能夠劃分信息鏈與服務鏈,并在某個應用過程中實現,信息鏈中的中臺儲存的是內生性數據信息,服務鏈中的中臺儲存的是服務記錄信息。雙中臺架構是基于最鄰近算法提出的中臺內生性數據安全交互的核心架構,以此完成基于最鄰近算法的數據中臺內生性數據安全交互系統的硬件部分構建[9-10]。
基于最鄰近算法中的樣本均衡原理,假設樣本集合S中的數據A、B之間的距離均為d(A,B),樣本集合S中的任意數據A∈S,鄰域?的圓形區域范圍N如式(1)所示:
設數據A在鄰域?中的最少采樣個數為m,通過?與m的聯系,即可得出該鄰域內的樣本分布情況,即當?>m時,該鄰域為稠密地域;當?<m時,該鄰域為稀少地域;當?=m時,該鄰域為均勻分布地域[11-12]。
文本鄰域的稠密區域分布,經過計算即可得出。當文本B、C處于密集區域時,若C處于B的?鄰域內,則將該文本優化掉,同時縮放?。當?=m時,則B的鄰域變為均勻分布區域。
對內生性數據排序處理,利用最鄰近算法設定準確度閾值,穩定最鄰近算法的精確度和分類排序的效率。準確度閾值作為最鄰近算法迭代終止的判定條件,在設置時可根據對中臺內生性數據的準確度要求而定,完成排序后即可對數據中臺的內生性數據進行處理,為后續的數據安全交互打下基礎[13-14]。
完成內生性數據處理后,建立其安全交互流程,在雙中臺為基礎的分布式系統中提出區塊鏈體系之間的安全交互問題,交互流程如圖3 所示。

圖3 基于最鄰近算法的數據交互流程
以業務中臺與業務鏈之間的數據交換為例,提出的系統設計技術重點是最鄰近算法中的舒普門限設定簽名技術,對交易主體傳輸的服務記錄認證和上鏈。一方面,舒普門限設定簽名中簽名的生成與認證之間是完全無交互的,以此降低不必要的傳輸費用;另一方面,舒普門限簽名者資格具有單一性,做到不同經營主體之間的權力均分,防止濫用職權上傳非法經營信息,以此完成其數據中臺內生性數據的安全交互[15]。
以下提供安全交互流程的詳細過程:
第1 步:首先從中臺中所選定的可信中心,隨機選取一個多項式f(x),如式(2)所示:
其中,i為初始密鑰參數;a為公共模塊數量;xi為安全參量。
第2 步:可信中心必須統計服務主體的數量d,并將數據發送到中臺所相應的服務主機J上,過程如式(3)所示:
同時,可信中心也必須提供公鑰對(n,e),并統計業務記錄上鏈操作的業務總體數量L[16]。
第3 步:將所有服務主體J計算服務記錄的數據散列,并通過簽名分片,如式(4)所示:
其中,s表示聚合前的簽名。
第4 步:生成聚合簽名,生成過程如式(5)所示:
再按照拉格朗日插值方程計算簽名的普適方程:
通過推廣歐幾里得算法可得參數a和b滿足如下關系:
其中,e為歐幾里得算法系數,從而可得到最后的聚合簽名,如式(8)所示:
第5 步:根據鏈上協議檢驗聚合的門限標簽是否真實,并根據式(8)做出判定:若等式不存在,則上鏈錯誤;一旦等式建立,即說明簽約生效,也可以直接把交換記錄加密后上鏈存儲,等到需求調用時,再在鏈上拉取相應信息并加以解密,這樣就在一定程度上保證了與內生性數據信息的交換安全性。
為了驗證提出的基于最鄰近算法的數據中臺內生性數據安全交互系統的實際應用效果,設定對比實驗,搭建交互平臺如圖4 所示。

圖4 交互平臺
根據圖4 可知,設計的交互平臺連接多個業務主體,通過分布式授權連接RAM,利用中央控制單元和業務鏈實現數據平臺交互,完成信息分析[17]。
同時使用傳統的基于中臺架構的內生性數據安全交互系統和基于哈希算法的交互系統對業務鏈與業務中臺交互,與提出的交互系統進行實驗對比,分析交互的數據結果準確性和交互時間。數據交互精度計算過程如式(9)所示:
其中,Z表示數據交互精度;σ表示交互的正確數據;τ表示交互的錯誤數據。
得到的數據精度檢測結果如圖5 所示。

圖5 數據交互精度檢測結果
根據圖5 可知,隨著數據量的增加,交互精度也在不斷增加,當數據量低于20 GB 時,三種交互系統的交互精度都在99%以上,而當數據量超過100 GB,傳統交互系統顯現出極大的局限性,交互能力較弱,交互精度較低,提出的交互系統精度仍然能夠保持在99%以上,由此證明,提出的交互系統具有極強的交互能力。
為了保證實驗檢測結果的準確率,進行了10 次實驗,分析10 次實驗的三種交互系統對數據的交互時間,得到的實驗結果如表1 所示。

表1 交互時間實驗結果
根據表1 可知,在10 次實驗中,隨著交互數據量不斷增加,花費的交互時間都存在不同,但是提出的交互系統花費的交互時間始終低于傳統的交互系統。與傳統系統交互時間相比較,提出的交互系統的交互時長得以顯著縮短。這是因為該系統引入了最鄰近算法,通過數據參數檢驗和簽名分類實現數據交互,多種交互步驟可以同時完成,在相同的交互時間內,交互的數據量更多,交互效果更好,而傳統的交互系統采用順位交互的方式,通過排序和權重分析實現數據交互,交互耗時過長,交互能力相對較弱。
數據中臺內生性數據的安全交互是該領域的重點研究問題之一,基于最鄰近算法,設計了數據中臺內生性數據安全交互系統,硬件部分采用控制器與寄存器結合的雙中臺架構,并通過最鄰近算法對中臺內生性數據進行處理,最后通過建立交互協議,完成數據中臺內生性數據的安全交互。實驗結果表明,設計的安全交互系統在魯棒性、計算速度、精確度方面都具有較好的數據,適用于實際投入使用。但在對于系統建立的費用方面仍有不足之處,系統搭建花費過高,后續研究將圍繞此方面進行。