張皓



摘 要: 為了提高物聯網區塊鏈數據挖掘能力,需要進行數據優化聚類處理,提出基于深度學習的區塊鏈數據分片峰值聚類算法。采用異構有向圖分析方法進行物聯網區塊鏈數據存儲結構設計,結合特征空間重組技術進行物聯網區塊鏈數據結構重組,提取物聯網區塊鏈數據的關聯信息特征量,采用語義相關性融合的方法進行區塊鏈數據特征提取和自適應調度,對提取的物聯網區塊鏈數據特征量進行模糊聚類處理,采用模糊C均值聚類方法進行物聯網區塊鏈數據的網格分片峰值聚類和屬性分類識別,采用深度學習方法進行數據聚類過程中的分片峰值融合和聚類分析,實現區塊鏈數據分片峰值聚類。仿真結果表明,采用該方法進行區塊鏈數據分片峰值聚類的收斂性較好,誤分率較低,自適應學習能力較強。
關鍵詞: 深度學習; 區塊鏈; 數據; 挖掘; 聚類
文章編號: 2095-2163(2021)07-0020-05中圖分類號:TP391文獻標志碼: A
Block chain data sliced peak clustering algorithm based on deep learning
ZHANG Hao
(Huali College, Guangdong University of Technology, Guangzhou 511325, China)
【Abstract】In order to improve the ability of blockchain data mining in the Internet of Things, it is necessary to carry out data optimization clustering processing and propose a block chain data slice peak clustering algorithm based on deep learning. Using the heterogeneous directed graph analysis method to design the data storage structure of the Internet of Things block chain, combining the feature space reorganization technology to reorganize the data structure of the Internet of Things block chain, extracting the related information characteristic quantity of the Internet of Things block chain data, using the semantic correlation fusion method to extract the block chain data feature and adaptive scheduling, performing fuzzy clustering processing of the extracted block chain data feature quantity, using the fuzzy C-means clustering method to identify the grid segmented peak clustering and attribute classification of the block chain data of the Internet of Things, and using deep learning methods to perform the segmented peak fusion and clustering analysis in the process of data clustering, the segmented peak clustering of the block chain data is realized . The simulation results show that the convergence of block chain data segmentation peak clustering with this method is good, the error rate is low, and the adaptive learning ability is strong.
【Key words】deep learning; block chain; data; mining; clustering
0 引 言
隨著物聯網技術的發展,需要對物聯網區塊鏈數據進行優化挖掘和存儲設計,通過物聯網區塊鏈數據的聚類分析,降低數據的存儲空間,提高數據的挖掘精度,相關的物聯網區塊鏈數據聚類方法研究受到人們的極大關注。對物聯網區塊鏈數據挖掘是建立在對數據的特征提取和信息識別基礎上,采用模糊信息識別技術,進行物聯網區塊鏈數據的存鏈結構開發,結合物聯網區塊鏈數據的大數據特征分布進行異構重組[1],建立物聯網區塊鏈數據的大數據信息分析模型,采用信息融合和資源優化調度的方法進行物聯網區塊鏈數據聚類分析。
當前,對物聯網區塊鏈數據聚類方法主要有K-Means聚類法、網格區域聚類方法、粒子群聚類方法等[2-3],建立物聯網區塊鏈數據的特征提取和大數據分析模型,采用相關的特征分布式檢測方法,實現物聯網區塊鏈數據聚類。文獻[4]提出基于模糊層次結構聚類的物聯網區塊鏈數據聚類方法,采用異構有向圖分析方法進行物聯網區塊鏈數據分塊層次結構設計,提高數據聚類的精度,但該方法的計算開銷較大,實時性不好。文獻[5]提出基于特征空間重組技術的數據聚類方法,在大數據背景下進行物聯網區塊鏈數據在線聚類優化設計,結合分片重組技術進行數據聚類優化,但該方法的模糊度較大,聚類精度不高。文獻[6]提出指標約束的物聯網節點部署的區塊鏈融合技術, 采用諧波諧振擾動特征分析方法,構建物聯網節能降損可靠性評估模型,結合分塊數據組網控制,采用數據聚類方法,實現物聯網輸出參數可靠性評估,但該方法的聚類性不好。
針對上述問題,本文提出基于深度學習的區塊鏈數據分片峰值聚類算法。首先進行區塊鏈數據的結構特征分析,然后進行區塊鏈數據的特征提取,結合分片峰值聚類方法,實現數據聚類優化,最后進行仿真測試分析,得出有效性結論。
1 物聯網區塊鏈數據結構分析和特征提取
1.1 物聯網區塊鏈數據結構分析
采用有向圖模型構建物聯網區塊鏈數據的聚類節點分布結構模型,采用相關性的統計分析方法,得到物聯網區塊鏈數據的異構存儲結構模型,計算物聯網區塊鏈數據的模糊聚類特征分布集[6],得到融合度函數定義為:
分析物聯網區塊鏈數據集統計差異分布特性,得到每個插值點的實際值公式定義為:
其中,dm+1(m)為物聯網區塊鏈數據集在第m點的預測值,dk+1(m)為采用第m點處采集的物聯網區塊鏈數據的模糊性特征量,根據物聯網區塊鏈數據的特征提取結果采用模糊C均值聚類方法進行信息處理[7],設定全局變量,建立物聯網區塊鏈數據挖掘的模糊分割系數為:
其中,Mi表示物聯網區塊鏈數據挖掘的中位數;Lm為物聯網區塊鏈數據挖掘的下界;fm為物聯網區塊鏈數據的中位數;fless表示各維度下物聯網區塊鏈數據的最小統計特征量。
1.2 物聯網區塊鏈數據特征提取
構建資源聚類的節點分布模型,在大數據背景下進行物聯網區塊鏈數據分片峰值聚類優化設計,設物聯網區塊鏈數據聚類節點圖模型屬性集為X=x1,x2,…,xn,進行物聯網區塊鏈數據聚類節點圖模型設計,采用語義本體模型構造的方法,進行物聯網區塊鏈數據處理[8],通過自相關特征匹配方法,分析2組相似的物聯網區塊鏈數據的相對貼近度φ1定義為:
其中,∑nj=1ωj=1,s-∈S,a-∈-0.5,0.5。設s1,a1,s2,a2,…,sn,an是一組描述物聯網區塊鏈數據聚類的語義特征分布集,建立物聯網區塊鏈數據聚類的統計分析模型,在模糊網格區域,進行物聯網區塊鏈數據聚類的統計分析和自適應調度,在模糊語義相關性融合聚類下,進行物聯網區塊鏈數據的模糊加權分析[9],得到模糊加權的特征分布向量為ω=(ω1,ω2,…,ωn)T,ωj∈[0,1],考慮等價的語義映射,進行物聯網區塊鏈數據的融合分析,建立物聯網區塊鏈數據的統計特征量,通過一個映射函數M表示,M:C * C' →r描述物聯網區塊鏈數據的相似度信息,通過空間聚類分析的方法,進行物聯網區塊鏈數據分布式調度,建立本體模型,進行物聯網區塊鏈數據的語義相似度融合和特征聚類處理[10]。
2 物聯網區塊鏈數據聚類
2.1 區塊鏈數據特征提取和自適應調度
采用有向圖模型構建物聯網區塊鏈數據的聚類節點分布結構模型,在物聯網區塊鏈數據庫中進行資源信息特征提取[11],設{(s1,a1),(s2,a2),…,(sn,an)}是物聯網區塊鏈數據的二元語義特征分量,采用異構有向圖分析方法進行物聯網區塊鏈數據存儲結構設計,結合特征空間重組技術進行物聯網區塊鏈數據結構重組,提取物聯網區塊鏈數據的關聯信息特征量[12],得到物聯網區塊鏈數據聚類的優化加權系數為,采用統計分析方法進行物聯網區塊鏈數據的聚類中心檢測,得到物聯網區塊鏈數據的關聯性本體結構模型為:
對物聯網區塊鏈數據進行模糊處理,構建物聯網區塊鏈數據的自適應調度參數SymbolQC@2F(x),建立物聯網區塊鏈數據聚類的模糊決策矩陣:
物聯網區塊鏈數據聚類的特征提取問題轉化為一個二元語義決策問題,物聯網區塊鏈數據聚類的模糊特征匹配評價指標集為,采用主體詞匹配的方法,分析X的相似度函數,得到物聯網區塊鏈數據的模糊隸屬度函數為:
其中,x~ik為物聯網區塊鏈數據的語義特征量,w~ik-1為慣性權重。利用概念、實例和屬性等實體集,得到物聯網區塊鏈數據聚類中心節點在k+1時刻的迭代函數為:
采用決策樹模型進行物聯網區塊鏈數據的特征重構,在物聯網區塊鏈數據的遞歸圖模型中,采用相空間重構的方法,實現物聯網區塊鏈數據聚類的模糊特征信息采樣[13],得到物聯網區塊鏈數據的模糊信息加群權重向量vi,物聯網區塊鏈數據的相關特征分布矩陣表示為:
其中,c為物聯網區塊鏈數據聚類的搜索步數,μik為物聯網區塊鏈數據的語義關聯度決策系數。根據上述分析,進行物聯網區塊鏈數據的特征分析和優化調度,得到物聯網區塊鏈數據的模糊聚類中心為di,采用分塊特征演化方法,進行物聯網區塊鏈數據的關聯特征檢測,得到模糊檢測向量vi,vi=((w1,t1),(w2,t2),…(wj,tj)),結合模糊相關性融合的方法,進行物聯網區塊鏈數據的分片峰值聚類分析[14-17]。
2.2 數據分片峰值聚類的深度學習
采用模糊C均值聚類方法進行物聯網區塊鏈數據的網格分片峰值聚類和屬性分類識別[18],采用深度學習方法進行數據聚類過程中的分片峰值融合和聚類分析,得到物聯網區塊鏈數據的在線聚類準則為:
物聯網區塊鏈數據聚類節點的深度學習加權系數為We=ωj(e),0。修正每個聚類自適應加權學習系數vi,就可得到聚類有效性評價矩陣R=rij,aijm×n和指標權重W=((ω1,β1),(ω2,β2),…,(ωn,βn)),綜上分析,建立物聯網區塊鏈數據聚類的深度學習模型,構建物聯網區塊鏈數據的模糊特征分布集[19-21],得到物聯網區塊鏈數據的約束規劃模型為:
由此得到物聯網區塊鏈數據聚類的最優評價集記為L1,…,Ln和Pmin1,…,Pminn,物聯網區塊鏈數據的優化聚類模型為:
其中,cosinij→x(dij,dxv)為物聯網區塊鏈數據的融合聚類特征集,根據上述分析,實現物聯網區塊鏈數據的優化聚類[22-23]。
3 仿真實驗與結果分析
為了驗證本文方法在實現物聯網區塊鏈數據分片峰值聚類中的應用性能,進行實驗測試分析,采用C++和Matlab 7混合編程進行物聯網區塊鏈數據聚類的算法處理,在Hadoop云平臺中構建物聯網區塊鏈數據數據庫結構模型,物聯網區塊鏈數據大數據分布的初始樣本規模為1 200,量化分布訓練集為120,深度學習的步長為2.4,自適應學習的迭代步數NP=30,各組數據采樣集的相似度為0.68,根據上述仿真參數設定,進行物聯網區塊鏈數據峰值聚類,得到物聯網區塊鏈數據的時域分布如圖1所示。
以圖1所示的數據為研究對象,采用語義相關性融合的方法進行區塊鏈數據特征提取和自適應調度,對提取的物聯網區塊鏈數據特征量進行模糊聚類處理,實現分片峰值聚類,得到聚類結果如圖2所示。
分析圖2得知,采用本文方法進行物聯網區塊鏈數據聚類的峰值融合度較好,收斂性較強,測試誤分率,得到結果見表1,分析表1得知,本文方法進行物聯網區塊鏈數據聚類的誤分率較低。
分析圖3結果得知,采用本文方法進行物聯網區塊鏈數據聚類的誤分率較低,提高了數據聚類的收斂控制能力。
4 結束語
采用模糊信息識別技術,進行物聯網區塊鏈數據的存鏈結構開發,結合物聯網區塊鏈數據的大數據特征分布進行異構重組,建立物聯網區塊鏈數據的大數據信息分析模型,本文提出基于深度學習的區塊鏈數據分片峰值聚類算法采用決策樹模型進行物聯網區塊鏈數據的特征重構,在物聯網區塊鏈數據的遞歸圖模型中,采用相空間重構的方法,實現物聯網區塊鏈數據聚類的模糊特征信息采樣,采用深度學習方法進行數據聚類過程中的分片峰值融合和聚類分析,實現區塊鏈數據分片峰值聚類。分析得知,采用本文方法進行區塊鏈數據分片峰值聚類的收斂性較好,誤分率較低,數據聚類的精度較高。
參考文獻
[1]李宇帆,張會福,劉上力,等. 教育數據挖掘研究進展[J]. 計算機工程與應用, 2019, 55(14): 15-23.
[2]楊歡歡, 李天瑞, 陳馨菂. 基于螺旋圖的時間序列數據可視化[J]. 計算機應用, 2017, 37(9): 2443-2448.
[3]李勁,岳昆,蔡嬌,等. 基于距離度量的多樣性圖排序方法[J]. 軟件學報,2018,29(3):599-613.
[4]YU Yong, WANG Ziyuan, XU Dianguo. Speed and current sensors fault detection and isolation based on adaptive observers for induction motor drivers[J]. Journal of Power Electronics, 2014, 5(14):967-979.
[5]BERRIRI H, NAOUAR W, BAHRI I, et al. Field programmable gate array-based fault-tolerant hysteresis current control for AC machine drives[J]. IET Electric Power Applications, 2012, 6(3):181-189.
[6]李雷,王磊,趙麗,等. 基于大數據技術的配電網絡節能降損技術分析[J]. 電子技術與軟件工程,2020(19):224-225.
[7]龐俊, 于戈, 許嘉, 等. 基于MapReduce框架的海量數據相似性連接研究進展[J]. 計算機科學, 2015, 42(1):1-5.
[8]肖文, 胡娟.? 基于數據集稀疏度的頻繁項集挖掘算法性能分析[J]. 計算機應用, 2018, 38(4): 995-1000.
[9]李彥,劉軍. 面向大數據的多維數據缺失特征填補仿真研究[J]. 計算機仿真,2018,35(10):432-435.
[10]王慧健, 劉崢, 李云, 等. 基于神經網絡語言模型的時間序列趨勢預測方法[J]. 計算機工程, 2019, 45(7): 13-19,25.
[11]王曉雷,陳云杰,王琛,等. 基于Q-learning的虛擬網絡功能調度方法[J]. 計算機工程, 2019, 45(2): 64-69.
[12]姚富光,鐘先信,周靖超. 粒計算:一種大數據融合智能建模新方法[J]. 南京理工大學學報,2018,42(4):503-510.
[13]王楚捷,王好賢. M-CORD下無線接入網絡資源分配研究[J]. 計算機工程與應用, 2018, 54(22): 92-98.
[14]劉良鳳,劉三陽. 基于權重差異度的動態模糊聚類算法[J]. 吉林大學學報(理學版),2019,57(3):574-582.
[15]孫力娟, 陳小東,韓 崇,等. 一種新的數據流模糊聚類方法[J]. 電子與信息學報, 2015, 37(7): 1620-1625.
[16]于爽,李淑梅. 圖書電子資源信息分布式多模塊檢索仿真[J]. 計算機仿真,2020,37(6):439-442.
[17]LIU Jinliang, XIAO Liang, LIU Guolong, et al. Active authentication with reinforcement learning based on ambient radio signals[J]. Multimedia Tools and Applications,2017,76(3):3979-3998.
[18]劉全, 翟建偉, 章宗長, 等. 深度強化學習綜述[J]. 計算機學報, 2018,41(1):1-27.
[19]姚哲,陶劍文. 多源適應多標簽分類框架[J]. 計算機工程與應用, 2017, 53(7):88-96, 170.
[20]趙國鋒, 黎軍, 王新恒, 等. 基于SDN的WLAN負載感知切換方案實現[J]. 計算機應用研究,2019,36(5):180-184
[21]ROWSHANRAD S,NAMVARASL S,ABDI V,et al. A survey on SDN, the future of networking[J]. Journal of Advanced Computer Science and Technology,2014,3(2):232-248.
[22]田保軍, 劉爽, 房建東. 融合主題信息和卷積神經網絡的混合推薦算法[J]. 計算機應用, 2020, 40(7): 1901-1907.
[23]SHU Jiangbo, SHEN Xiaoxuan, LIU Hai,et al. A content-based recommendation algorithm for learning resources[J]. Multimedia Systems,2018, 24(2):163-173.
基金項目: 2020年度廣東省普通高校特色人才創新項目(自然科學類) 項目(2019KTSCX223)。
作者簡介: 張 皓(1994-),男,博士研究生,主要研究方向:區塊鏈、計算機視覺。
通訊作者: 張 皓Email:540218310@qq.com
收稿日期: 2021-03-15`