林倩瑜
(集美大學誠毅學院, 福建 廈門 361021)
隨著云計算技術和云服務技術的快速發展,大量用戶通過云存儲的方法將數據存儲在云系統中,實現對數據的在線調度和管理。云存儲系統中的大數據稱為云服務組合大數據,云服務組合大數據的準確挖掘和分類管理是保障云服務質量的關鍵。當采用智能挖掘和信息處理算法進行云服務組合大數據的優化挖掘和調度,并根據云服務組合大數據的挖掘結果構成最優的服務組合時,可提高數據的自適應檢索和調度性能。研究云服務組合大數據的優化分類挖掘算法在云服務器的優化管理和智能控制方面都具有重要意義[1]。
云服務組合大數據建立在對大規模數據集的特征提取和關聯規則約束分析基礎上,結合模糊信息聚類和特征提取方法,實現云服務組合大數據的優化挖掘和智能檢索[2]。傳統方法中,對云服務組合大數據挖掘的方法有時頻分析方法、平均互信息挖掘方法、模糊挖掘方法以及網格挖掘方法等[3-4]。上述方法采用智能特征提取技術進行云服務組合數據的關聯規則項提取和模糊聚類處理,提取云服務組合大數據集的規則知識項,實現數據優化挖掘,取得了一定的研究成果。其中,文獻[5]中提出一種基于模糊指向性聚類的云服務組合大數據挖掘技術,采用機器學習方法進行關聯規則數據的量化編碼,基于模糊信息融合方法對大數據進行準確挖掘,但該方法的計算信息量較大,對云組合服務大數據挖掘的實時性不好。文獻[6]中提出基于粗糙集和神經網絡的云服務組合大數據挖掘算法,構建云服務組合大數據的特征分布模型,采用BP神經網絡進行數據分類,在特征子空間中實現云組合服務大數據的優化挖掘,但該方法在抗干擾能力方面性能不佳。
針對上述問題,本文提出一種基于模糊卷積神經網絡的大數據分類挖掘技術。首先,進行云服務組合大數據的信息融合處理,對高維融合數據進行頻繁項檢測和關聯規則特征提取;然后,對提取的關聯規則采用模糊卷積神經網絡分類器進行屬性分類,結合特征壓縮方法對分類輸出的云服務組合大數據進行降維處理,采用模糊聚類方法實現對云服務組合大數據的分類挖掘;最后,進行仿真實驗分析,證明了本文方法在提高云組合服務大數據挖掘能力方面的優越性。
為實現云服務組合大數據的優化挖掘,首先構建云服務組合模式下大數據的分布式數據結構模型,用四元組G表示云服務組合大數據的模糊分布式存儲中心,G=(V,E,W,C)。假設d為云服務組合大數據交互的相空間嵌入維數,采用多個非線性成分聯合統計方法進行云服務組合大數據的高維特征空間重構,結合模糊聚類方法進行大數據的自適應分類處理。根據上述分析,構建云服務組合大數據挖掘的總體結構模型,如圖1所示。

圖1 云服務組合大數據挖掘的總體結構模型
云服務組合大數據挖掘過程中受到的擾動影響因素較多,具有時變性和隨機性。采用模糊聚類方法進行大數據信息融合[7],構建關聯規則項約束方程表達云服務組合大數據的信息流模型:
xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn
(1)
其中:h(·)為云服務組合大數據分布式時間序列,表示為一個具有多維數據結構模型的函數;ωn為大數據多傳感信息融合跟蹤的觀測或測量誤差。云服務組合大數據的分布結構模型的分布函數描述式為:
(2)
式中:p為分布式云服務組合大數據存儲結構的階數;α為統計信息采樣的時間窗口寬度。

k=0,1,…,N-1
(3)
其中an表示云服務組合大數據線性規劃模型的幅值。對于一組連續的云服務組合大數據,采用連續模板匹配技術進行大數據的分布式數據結構分析,結合匹配相關檢測方法進行云服務組合大數據的信息融合處理[9]。
設有m個云服務組合大數據節點A1,A2,…,An,每個節點的閉頻繁項集特征提取輸出表示為a1,a2,…,an。基于極限學習方法進行數據特征提取的全局尋優,構造云服務組合大數據挖掘的線性規劃問題數學表達如下:

(4)
(5)


(6)
其中NI、NR和NS分別表示云服務組合大數據的平均互信息特征量和狀態分布集。
在上述采用連續模板匹配技術的大數據分布式數據結構分析和關聯規則特征提取基礎上,進行數據分類挖掘算法的優化設計。本文提出一種基于模糊卷積神經網絡的大數據分類挖掘技術,采用統計平均方法[11],構建需要挖掘的大數據的回歸分析模型:
(7)
采用一個多元統計特征方程描述云服務組合大數據的擬合狀態模型為
(8)

(9)
假設卷積神經網絡進行大數據識別的學習步長為η,經過n步訓練和學習后,采用自適應加權算法[13],得到模糊卷積神經網絡進行大數據特征分類器的加權系數為
(10)
采用模糊卷積神經網絡的學習算法[14],得到云服務組合大數據分類的自適應學習加權系數為

(11)
在B?D,A∩B?D等規則約束項下,得到云服務組合大數據分類的屬性集滿足:

(12)
數據的統計量化集為(u,v)∈E,設A?V,B?V且A∩B=φ,采用模糊卷積神經網絡分類器進行屬性分類,實現云服務組合大數據重組和數據結構重排[14]。
在采用模糊卷積神經網絡分類器進行屬性分類的基礎上,為降低計算開銷,結合特征壓縮方法對分類輸出的云服務組合大數據進行降維處理[15]。特征壓縮器描述為
(13)
其中:

(14)
采用模糊卷積神經網絡分類器得到云服務組合大數據的概念格結點為
(15)
對分類輸出的云服務組合大數據進行降維處理,采用模糊聚類方法實現對云服務組合大數據的分類挖掘[16-17],下面詳述其實現過程。

輸出:云服務組合大數據分類挖掘結果α。
初始化參數,從t=1開始進行云服務組合大數據特征的自適應尋優:
步驟1計算所有樣本云服務組合大數據挖掘的規則項特征點e(t)=y-Dα(t)。
步驟2構建模糊卷積神經網絡分類器,得到神經網絡分類器的加權值:

(16)


為測試本文方法在實現大數據分類挖掘中的性能,進行仿真實驗。實驗軟件平臺采用Matlab 7,實驗中的大數據樣本庫采用Olivetti-Oracle Research Lab(ORL)云服務組合大數據庫。每個高維融合數據子塊閾值YHW=0.43,大數據采樣的占空比為0.5 dB,樣本訓練集規模為120 Kbps,測試集為3 000 Kbps,卷積神經網絡的輸入層節點數為100,輸出層為20,關聯規則特征向量的分布密度為0.14,仿真迭代次數為100,對云服務組合大數據挖掘的采樣周期為12 s。實驗中,以數據挖掘的準確召回率為測試指標:
(17)
其中:I表示挖掘大數據事務中的項;li表示準確挖掘數據的組合長度;函數f(Ij,Ik)定義為

(18)
根據上述仿真環境和參數設定進行大數據分類挖掘的仿真實驗,得到數據挖掘的時域波形如圖2所示。

圖2 數據挖掘的時域波形
以云服務組合大數據為研究對象,采用模糊卷積神經網絡分類器進行屬性分類。結合特征壓縮方法對分類輸出的云服務組合大數據進行降維處理,得到特征提取結果如圖3所示。
分析圖3得知:采用本文方法進行云服務組合大數據挖掘對各類數據的圖譜分辨能力較好,數據屬性聚類性能較高,特征分辨能力較強。采用不同方法測試數據挖掘的準確性,在相同的數據仿真條件下,以文獻[5]和文獻[6]的方法為對比。上述方法分別采用FCM方法和普通的神經外網絡方法進行數據挖掘,本文方法建立在對上述兩種方法融合改進的基礎上,因此具有對比性。通過仿真得到對比結果如圖4所示。分析仿真結果發現:本文方法進行數據挖掘的精度比傳統方法分別提升了12.43%和21.76%,且迭代步數較短,說明挖掘的時效性較高。

圖3 大數據分類挖掘的特征提取結果

圖4 數據挖掘準確性對比
云服務組合大數據的準確挖掘和分類管理是保障云服務質量的關鍵。根據云服務組合大數據的挖掘結果構成最優的服務組合,提高數據的自適應檢索和調度性能。本文提出一種基于模糊卷積神經網絡的大數據分類挖掘技術,結合匹配相關檢測方法進行云服務組合大數據的信息融合處理,對高維融合數據進行頻繁項檢測和關聯規則特征提取。采用模糊卷積神經網絡分類器進行屬性分類,結合特征壓縮方法對分類輸出的云服務組合大數據進行降維處理,采用模糊聚類方法實現對云服務組合大數據的分類挖掘。仿真分析結果表明,采用本文方法的大數據挖掘的分類性能較好,數據挖掘精度較高。