文/張曙光
常規數據集域隱私匹配算法,依托遞推演算的方式,能夠實現數據集域隱私匹配計算,但由于受到計算條件的限制,存在匹配計算不穩定性的不足,不適合大數據下的集域隱私匹配,為此提出了基于矩陣分解的大數據集域隱私匹配算法研究。試驗數據表明提出的基于矩陣分解的大數據集域隱私匹配算法研究,具備較高的有效性。
大數據集域隱私匹配算法研究平臺結構主要包括,集域數據載入、數據預處理、大數據分析與儲存和數據顯示四部分構成。
集域數據載入是對原有的集域數據進行載入的端口,其中包括通信協議、儲存器、索引、數據棧四部分構成。數據的預處理是對已經載入的數據進行預處理,為矩陣分解計算,與大數據集域隱私匹配算法規則的載入提供平臺。結合大數據的方式對數據進行處理,并提供數據顯示窗口,其匹配算法研究平臺結構框架圖如圖1所示。
已知矩陣分解計算方程x(k+1)=L-1(b-Ux(k)),可用f(x)函數表示,其f(x)滿足規則方程f(x)=∑ax+1/c的要求,其中x代表單個變量,c代表條件變量。則f(x)滿足以下要求。
當f(x)>1,c取正值,L-1(b-Ux(k))< ∑ax+1/c,正向求解;
當f(x)<1,c取負值,L-1(b-Ux(k))>∑ax+1/c,累加求解;
當f(x)=1,c為0,L-1(b-Ux(k))=∑ax+1/c,累加求解或正向求解;
基于大數據集域隱私匹配算法規則與矩陣計算遞歸求解過程又稱為核函數計算,是集域隱私匹配求解的必要過程。依托大數據集域隱私匹配算法研究平臺的搭建,引入矩陣分解計算以及大數據集域隱私匹配算法規則載入,實現大數據集域隱私匹配算法研究模型的構建。
大數據集域隱私匹配計算變量參數主要包括系統變量范圍、匹配系數、集域隱私權數的計算三個部分,系統變量范圍、匹配系數、集域隱私權數的參數確定是,完成基于矩陣分解的大數據集域隱私匹配算法的核心計算過程。

表1:15%數據波動性匹配計算穩定性試驗結果表

表2:35%數據波動性匹配計算穩定性試驗結果表

表3:65%數據波動性匹配計算穩定性試驗結果表
系統變量范圍是指,大數據集域隱私匹配計算的能夠統計的變量范圍,在合理計算范圍內進行有規則的匹配計算。
根據統計學計算得出系統變量范圍可用公式(1)表示:

式中,μ代表集域隱私均值參數,σ代表集域隱私方差參數,參數滿足-∞<μ<∞,σ>0,x代表系統變量單元。
根據系統變量范圍,進行匹配系數的計算,其匹配系數可用公式(2)表示:


式中,xi代表系統變量中的第i次參數,基于系統變量范圍、匹配系數、集域隱私權數的確定,實現了大數據集域隱私匹配計算變量參數的確實。
為了保證本文提出的基于矩陣分解的大數據集域隱私匹配算法研究的有效性,進行仿真模擬試驗分析。試驗過程中,以不同的數據體量作為實驗對象,根據數據本身的波動性,以及匹配計算結果波動性,進行匹配計算穩定性仿真實驗。為了保證試驗的客觀性,使用常規集域隱私匹配算法作為比較對象,對比仿真試驗結果,并將試驗數據呈現在同一數據表中,進行匹配計算穩定性分析。
根據實驗,得出15%數據波動性匹配計算穩定性試驗結果表如表1所示,標準匹配計算穩定性采用相對值法計算得來,其中1為100%穩定,1.06代表向上起伏6%,0.92代表向下起伏8%。
對數據本身的波動性為35%,進行方差與極差的數據分析。其35%數據波動性匹配計算穩定性試驗結果表如表2所示。
由實驗得出,在數據本身的波動性為35%時,提出的大數據集域隱私匹配算法離散性已經明顯優于常規集域隱私匹配算法。
在數據本身的波動性為35%時,提出的大數據集域隱私匹配算法抑制波動性性優于常規集域隱私匹配算法。
同理對數據本身的波動性為65%,進行方差與極差的數據分析。其65%數據波動性匹配計算穩定性試驗結果表如表3所示。
得出以下結論:隨著數據本身的波動性的增加,匹配計算穩定性通常顯示向上起伏;提出的大數據集域隱私匹配算法,受到隨著數據本身的波動性影響較小;提出的大數據集域隱私匹配算法離散性與抑制波動性,優于常規集域隱私匹配算法;綜合上表,得出的大數據集域隱私匹配算法較常規集域隱私匹配算法,綜合匹配計算穩定性提高26.49%。
本文提出了基于矩陣分解的大數據集域隱私匹配算法研究,基于大數據集域隱私匹配算法研究模型的構建,以及計算變量參數、分析流程的確定,實現本文的研究。試驗數據表明,本文設計的方法具備極高的有效性。希望本文的研究能夠為大數據集域隱私匹配算法提供理論依據。