梅瑩瑩
(安徽三聯學院,合肥230601)
隨著網絡信息大數據規模的不斷增大,需要對網絡信息大數據進行優化挖掘,分析網絡信息大數據的動態增量,結合信息處理和特征提取技術進行網絡信息大數據的動態增量式挖掘,提高網絡信息大數據的異構管理和特征識別能力[1]。研究網絡信息大數據動態增量分布式挖掘方法,在實現網絡信息管理和人工智能信息處理中具有重要意義[2]。
對網絡信息大數據挖掘的本質是進行網絡信息大數據的時間序列分析,結合網絡信息大數據的特征提取進行數據挖掘,傳統方法中,對網絡信息大數據挖掘方法主要采用主成分分析方法,提取網絡信息大數據的主成分特征量進行數據挖掘,但該方法進行網絡信息大數據挖掘的特征分辨能力不好[3]。針對上述問題,本文提出基于相似度特征提取的網絡信息大數據動態增量分布式挖掘方法。首先構建網絡信息大數據的異構存儲結構模型,采用模糊分布式檢測方法進行網絡信息大數據動態增量特征分布式檢測,提取網絡信息大數據的相似度特征量;然后采用模糊聚類方法進行網絡信息大數據動態增量分布式融合聚類處理,在模糊聚類中心進行網絡信息大數據動態增量分布式檢測和識別,實現網絡信息大數據動態增量分布式挖掘;最后進行仿真實驗分析,展示了本文方法在提高網絡信息大數據動態增量分布式挖掘能力方面的優越性能。
為了實現網絡信息大數據動態增量分布式挖掘,首先構建網絡信息大數據的異構存儲結構模型,采用模糊分布式檢測方法進行網絡信息大數據動態增量特征分布式檢測,數據存儲結構采用異構分布式存儲方式,采用區域融合聚類和分塊匹配方法,進行網絡信息大數據的存結構設計[4],得到在數據中心網絡中網絡信息大數據的存儲結構模型(如圖1所示)。

圖1 網絡信息大數據的存儲結構模型
根據圖1所示的網絡信息大數據存儲結構模型,采用動態匹配方法進行關聯性挖掘rk,構建網絡信息大數據的動態增量式檢測模型U(v)[5],得到數據挖掘的模糊關聯特征量為:

給出網絡流量矩陣k,某一檢測周期j內對網絡信息大數據進行分布式檢測,采用梯度投影方法提取網絡信息大數據的模糊隸屬度函數,得到迭代式為

將4個維度矩陣依次按行相接ijk,在數據存儲空間信息p中,得到網絡信息大數據的關聯規則特征分布滿足

該內容塊被劃分成多個多維熵矩陣,構建數據挖掘的梯度投影函數f(Y),求得子空間的系數向量,采用向量量化均衡配置方法進行標準化處理,得到衡量數據存儲異構性的模糊參數f(X),滿足如下條件

在數據值域內求得全局最優解,得到數據的長度為N,將Lx=ai轉化為2N+1個字符串,使用信息熵作為模糊聚類中心,進行大數據融合,得到數據挖掘的融合聚類中心為

把上述特征通過并行計算進行模糊重構得到網絡信息大數據分布式重構模型,在重構的存儲空間內進行動態增量式挖掘。
在上述進行數據存儲結構分析的基礎上,根據分解參數H1進行網絡信息流量矩陣的特征重構hs(k),基于h0熵的檢測方法得到數據挖掘的二元規劃模型

采用非負子空間方法提取網絡信息大數據的動態增量式E特征量[6],得到網絡信息大數據挖掘的邊界條件

將網絡信息流量矩陣分離為正常子空間β和異常子空間,得到網絡信息大數據的基本塊文件mi,j(1≤i≤n,1≤j≤k),在網絡流量的正常模式下,存在關聯映射Φ:X→Y,滿足

其中,?是X上的運算,°是Y上的運算。在當前骨干網中求得網絡大數據挖掘的Hash值,對于任意兩個數據塊mi和mj,采用模糊分布式檢測方法進行網絡信息大數據動態增量特征分布式檢測[7],提取網絡信息大數據相似度信息,為:

式中,xi∈Rn,代表網絡信息大數據的狀態矢量,ui∈Rm,對times字段的網絡信息大數據進行增量式挖掘和輸出轉換控制。若網絡信息大數據動態增量數據集為m,令Aj(L)作為聚類中心,其中j=1,2,...,k,設置r個不同的聚類中心中網絡信息大數據動態增量函數h1,…,hr,每一個函數滿足hi:{0,1}*→[1,m]。網絡信息大數據動態增量挖掘的誤差為

式中,M∈R3×3為正定矩陣;N為常數,e=X-Y為網絡信息大數據動態增量挖掘的模糊度函數,動態增量特征分布式檢測表示為

通過上述設計,利用流量的時間和空間相關性,進行網絡信息大數據動態增量的動態增量式挖掘[8]。
在構建網絡信息大數據的異構存儲結構模型的基礎上,進行數據挖掘優化,本文提出基于相似度特征c提取的網絡信息大數據動態增量分布式挖掘方法,采用模糊分布式檢測方法進行網絡信息大數據動態增量特征分布式檢測[9],得到數據的多維時尺度信息為

上式中,TB、TC為網絡信息大數據的模糊采樣預制和頻率預制,f為網絡信息大數據的頻率特征,|Xcode(f)|為自適應加權系數,網絡信息大數據聚類的加權學習系數為


從不同層面上對網絡信息大數據進行動態增量分布式檢測,得到不同維度相似度特征量提取矩陣滿足

構建網絡信息大數據的相似度特征檢測模型,采用支持向量機算法進行網絡信息大數據的融合性聚類[11],采用空間分布式網格檢測方法,提高對網絡信息大數據的自適應挖掘能力。
采用模糊聚類方法進行網絡信息大數據動態增量分布式融合聚類處理,在深度學習下網絡信息大數據動態增量式聚類的表達式分別為

在模糊聚類中心進行網絡信息大數據動態增量分布式檢測和識別,得到網絡信息大數據聚類的自適應學習權系數為

挖掘網絡信息大數據的模糊相關性特征量,結合聯合關聯規則檢測方法進行網絡信息大數據的動態增量分布式檢測,得到網絡信息大數據動態增量分布式挖掘的迭代函數為

其中,x(t)=?(t),t∈[-h,0],采用多層空間區域聚類方法,在高維相空間中進行網絡信息大數據的狀態監測,基于弱凸性和顯著性的分割方法進行特征分割[12],得到數據的融合聚類中心為:

選取特征值的區間函數,得到數據聚類的空間區域分布集為

其中ωj=(ω0j,ω1j,???,ωk-1,j)T,當網絡信息大數據的相干系數滿足時,在三維點元模型中進行網絡信息大數據挖掘,得到動態增量分布式挖掘的狀態函數為

通過顯著性測試方法進行數據挖掘過程的收斂性判斷,實現網絡信息大數據動態增量分布式挖掘,實現流程如圖2所示。

圖2 數據挖掘的實現流程
為了測試本文方法在實現網絡信息大數據動態增量分布式挖掘中的應用性能,進行仿真測試分析。實驗采用Matlab設計,對網絡信息大數據采樣的樣本長度為800,數據的屬性分布維數為4,空間網格分布為20×20,網絡信息大數據的訓練集為80,相似度系數為0.24,數據分類屬性為5,根據上述仿真參數設定,進行網絡信息大數據動態增量分布式挖掘,得到數據的時域分布如圖3所示。

圖3 數據時域分布
以圖3所示的大數據為研究對象,采用模糊聚類方法進行網絡信息大數據動態增量分布式融合聚類處理,在模糊聚類中心進行網絡信息大數據動態增量分布式檢測,得到挖掘輸出如圖4所示。

圖4 數據挖掘輸出
分析圖4得知,采用本文方法進行網絡信息大數據動態增量分布式挖掘的收斂性較好,測試數據挖掘的有效性,得到測試結果如圖5所示。

圖5 數據挖掘的有效性測試
分析圖5得知,采用本文方法進行網絡信息大數據動態增量分布式挖掘的有效性較好,數據的特征收斂度水平較高。進一步測試數據挖掘的查準率,得到對比結果(見表1),分析得知,相比傳統方法,本文方法進行數據挖掘的查準率較高。

表1 數據挖掘的查準率對比
構建網絡信息大數據動態增量分布式存儲結構模型,結合數據特征檢測方法,進行網絡信息大數據動態增量分布式挖掘,本文提出基于相似度特征提取的網絡信息大數據動態增量分布式挖掘方法。構建網絡信息大數據的異構存儲結構模型,提取網絡信息大數據的相似度特征量,采用模糊聚類方法進行網絡信息大數據動態增量分布式融合聚類處理,在模糊聚類中心進行網絡信息大數據動態增量分布式檢測和識別,實現網絡信息大數據動態增量分布式挖掘。分析表明,本文方法進行網絡信息大數據動態增量分布式挖掘的準確性較高,數據挖掘的查準率較高,具有很好的挖掘效果。