摘 要:當前能源物聯網數據精準挖掘關聯規則多為獨立形式,數據處理及挖掘的限制效果較差,導致數據挖掘查準率下降,為此提出對基于灰靶理論與云模型的能源物聯網數據精準挖掘方法的設計與驗證分析。根據當前的測定需求及標準,先進行數據挖掘特征提取,采用多階方式,強化數據處理及挖掘的限制效果,制定多階數據挖掘關聯規則,以此為基礎,構建灰靶理論+云模型物聯網數據挖掘結構,采用遞歸處理實現數據挖掘。測試結果表明:對比于傳統屬性偏差控制能源物聯網數據精準挖掘測試組、傳統K-means測算能源物聯網數據精準挖掘測試組,此次所設計的灰靶理論與云模型能源物聯網數據精準挖掘測試組最終得出的數據挖掘查準率均可達60%以上,說明在云模型和灰靶理論的輔助下,當前的數據挖掘方法更加靈活、多變,自身具有較強的針對性,數據挖掘誤差可控,具有較大的實際應用價值。
關鍵詞:灰靶理論;云模型;能源物聯網;數據挖掘特征提取;精準挖掘;K-means
中圖分類號:TP301 文獻標識碼:A 文章編號:2095-1302(2024)06-0-03
0 引 言
能源物聯網的主要作用是進行外部信息的采集或者外部環境的應變性感知,所以多被應用在外部系統控制、運行計算等行業之中,初期取得了相對較好的效果。近年來,隨著能源物聯網應用的擴展與延伸,數據量逐漸龐大,難以實現更為精準的挖掘處理。為解決上述存在的問題,相關人員設計了能源物聯網數據精準挖掘方法,參考文獻[1]和文獻[2],設定傳統屬性偏差控制能源物聯網數據精準挖掘方法、傳統K-means測算能源物聯網數據精準挖掘方法。由于實際數據挖掘處理的需求、標準的變化,針對目前的數據處理任務,制定對應的挖掘方案。但是執行的單元目標無法協同處理,在不同的背景環境下,難以快速捕捉、采集能源物聯網所形成的海量數據與信息,穩定性較低,嚴重的還會導致網絡陷入癱瘓、崩潰,造成不可控的經濟損失[3]。此外,當前能源物聯網數據精準挖掘結構多為單向,整體數據處理效率及質量較低,在數據挖掘需求的背景下,也較難進行挖掘基準的制定,無法進一步保證挖掘結果的可靠性[4]。為此提出對基于灰靶理論與云模型的能源物聯網數據精準挖掘方法的設計與驗證分析。灰靶原理是一種復合式應用實踐理論,主要指灰色系統理論與模糊靶理論的結合體,將其與云模型融合,可以一定程度擴大當前數據挖掘范圍,從多個角度強化挖掘效率,逐步構建更為靈活、多變的挖掘結構,為后續相關技術的發展和完善奠定基礎[5]。
1 設計能源物聯網數據灰靶+云模型精準挖掘方法
1.1 數據挖掘特征提取
當前的數據挖掘一般為獨立處理,雖然能夠實現預期的挖掘任務及目標,但是缺少針對性與穩定性,對于數據的分類、整合以及存儲均難以達到預期效果,所以此次通過特征識別的發生,強化數據挖掘的應用效果,形成可控性更高的挖掘引導[6]。能源物聯網處于異構環境下,數據量較為龐大,需要先建立數據集,對多元化海量數據挖掘進行遞歸分布處理[7]。構建數據分布的遞歸迭代規則,具體如式(1)所示:
(1)
式中:c表示異構環境數據遞歸特征值;v表示轉換特征量;x表示自變量;π表示匹配均值;b表示數據挖掘范圍;t表示可控挖掘頻次。結合當前的測定,將上述得出的異構環境數據遞歸特征值作為特征提取的引導目標,結合初始的關聯規則,構建基礎的數據挖掘匹配結構,通過調整迭代次數和覆蓋單元形成數據處理的粗糙集,明確海量數據的熵信息特征量,相當于數據的提取特征目標,完成對基礎測試條件的搭建[8]。
1.2 制定多階數據挖掘關聯規則
關聯規則的制定是數據挖掘處理的重要支撐,一般可用于描述數據項之間有價值數據的處理過程,為后續數據挖掘處理提供便捷條件。現在能源物聯網和數據挖掘處理之間建立一個等效的關聯處理目標,作為定向的挖掘引導,測定計算出此時關聯規則的置信度,設計公式(2):
(2)
式中:Q代表規則置信度;δ代表挖掘距離;ω代表單元挖掘區域;l代表初始挖掘次數;ζ代表瞬態挖掘偏差;j代表挖掘定值。結合當前的測定,依據置信度的變化,設置一個關聯規則的項集,通過數據挖掘支持度及提升度的變化,將能源物聯網與數據挖掘之間建立對應的聯系,形成多階段的頻繁項集,設計各個階層項集的數據挖掘限制條件與規則,營造基礎的數據挖掘環境[9]。
1.3 構建灰靶理論+云模型物聯網數據挖掘結構
基于灰靶理論,先結合提取的數據挖掘特征,設定一個數據挖掘的序列,將最接近的特征值數據設定為標準模靶心,通過靶心度來衡量數據挖掘情況。當前可結合云模型進行數據挖掘極值標準的設置,具體如公式(3)所示:
(3)
式中:C0表示數據挖掘極值標準;表示基準值。結合當前的設定,綜合云模型對周期內的能源物聯網數據進行匯總與整合處理,同時構建對應的數據挖掘結構,如圖1所示。
根據圖1完成對灰靶理論+云模型物聯網數據挖掘結構的設計與實踐應用,將當前的數據挖掘目標逐一導入結構,在云模型的數據處理輔助下完成數據挖掘。
1.4 遞歸處理實現數據挖掘
所謂遞歸處理,主要指采用遞歸分布處理方式,在模型進行數據挖掘的過程中,將其分類匯總,簡化整體數據挖掘環節,縮短處理時間,提升整體效率。設定3個階段進行遞歸控制指標設置,見表1所列。
結合表1完成對階段性遞歸控制指標的設置,依據設定的控制規則及數據挖掘需求,結合模型完成數據挖掘任務,最終實現挖掘目標。
2 方法測試
為保證測試的真實性與實踐穩定,選擇對比方法進行多維測定與研究分析,對基于灰靶理論與云模型的能源物聯網數據精準挖掘方法作出多方向驗證。基于上述數據挖掘結構的設計,制定基礎性的處理挖掘測試計劃。設定傳統屬性偏差控制能源物聯網數據精準挖掘測試組、傳統K-means測算能源物聯網數據精準挖掘測試組以及此次所設計的灰靶理論與云模型能源物聯網數據精準挖掘測試組。根據當前的測定要求,進行基礎測試環境的關聯搭建[10]。
2.1 測試準備
結合灰靶理論與云模型對能源物聯網數據精準挖掘方法測試環境進行搭建與驗證分析。當前需要先明確能源物聯網實際的覆蓋控制范圍,并在選定的區域模塊之中布設定向云識別檢測節點。當前的節點一般設置為獨立形式,需要將節點采用特殊的方式關聯,營造穩定、具體的循環監測區域,便于采集數據和信息,以待后續使用。接下來,將云計算平臺與測試能源物聯網進行搭接,并設置基礎測試指標及參數,具體見表2所列。
根據表2,完成對測試云計算平臺基礎測試指標及參數的設置與實踐分析。依據能源物聯網,設定6個測試周期,每一個周期均需要進行數據、信息的采集,匯總整合后,以待后續使用。接下來,結合云模型和灰靶理論,設計一個數據挖掘多維矩陣,并測定計算出初始的數據挖掘頻譜值,具體如公式(4)所示:
(4)
式中:F表示初始數據挖掘頻譜值;k表示數據時域分布;β表示單元挖掘頻次;a表示周期數據量;y表示模糊聚類挖掘差值;l表示序列長度。結合當前的測定結果,將該數據挖掘頻譜值設置為可控限制的精準條件。當前完成對測試區域的劃分與指標的修正調整,隨即進行后續測定和驗證。
2.2 設計實驗過程且分析實驗結果
根據當前所設計的測試標準及要求,結合灰靶理論和云模型,對能源物聯網數據精準挖掘方法進行測定與驗證研究。選定的5個區域作為比對的目標對象,可以先根據當前的數據挖掘狀態,調整數據的采集標準。同時結合灰靶理論和云計算應變標準,設計數據挖掘流程,流程如圖2所示。
圖2 數據挖掘測試流程
綜合圖2的設計,實踐應用數據挖掘測試流程結構。針對選定的5個區域進行海量數據的處理與挖掘,通過云模型進行數據遞歸處理,并結合灰靶理論測定計算出數據挖掘靶心度,具體見公式(5):
(5)
式中:L表示數據挖掘靶心度;表示灰靶覆蓋范圍;S表示遞歸次數;D表示數據挖掘特征值;χ表示堆疊挖掘值;Q表示聚類函數;表示轉換比。結合當前的測定,完成對數據挖掘靶心度的計算。當數據挖掘靶心度達到1.5時,說明此時的數據處理及挖掘差值可控,隨即將當前5個區域采集的數據匯總轉換,設置單元性的數據挖掘目標,測算出最終的數據挖掘查準率,具體見公式(6):
(6)
式中:N表示數據挖掘查準率;表示核定挖掘差值;ε表示挖掘頻次;W表示數據整合范圍;η代表挖掘單元差值。對測試結果做出分析,通過圖3解析。
通過圖3的分析,可以得出以下結果:
對比傳統屬性偏差控制能源物聯網數據精準挖掘測試組、傳統K-means測算能源物聯網數據精準挖掘測試組,此次所設計的灰靶理論與云模型能源物聯網數據精準挖掘測試組最終得出的數據挖掘查準率均可達到60%以上,說明在云模型和灰靶理論的輔助下,當前的數據挖掘方法更加靈活、多變,自身具有較強的針對性,數據挖掘誤差可控,具有較大的實際應用價值。
3 結 語
綜合上述分析,完成對基于灰靶理論與云模型的能源物聯網數據精準挖掘方法的設計與驗證分析,與初始物聯網數據精準挖掘形式相比對,此次融合灰靶理論與云模型的測試組一定程度上能夠更好地延伸數據挖掘的實際范圍,不斷調整、轉換當前的數據挖掘目標,將其作為挖掘處理的引導,構建具體的數據挖掘結構。此外,還可以通過對數據特征的提取,明確多項挖掘目標,形成具體完整的挖掘結構,進行數據挖掘的分組與挖掘可靠性判斷,提升實際的數據挖掘查準率與查全率,強化挖掘效率。
參考文獻
[1]王茜,孟翔鵬,李文舉,等.基于屬性偏差控制的大數據挖掘方法研究[J].科技創新與應用,2023,13(12):63-66.
[2]袁蒙蒙,熊文靜.基于K-means算法的關聯規則數據挖掘方法[J].信息與電腦(理論版),2023,35(7):72-74.
[3]杜紅居,鄭志民,王永銓.大數據背景下高校精準育人路徑及實現策略[J].現代商貿工業,2023,44(9):119-121.
[4]杜玉昌.基于差分隱私的網絡圖像敏感數據挖掘方法[J].新鄉學院學報,2023,40(3):30-33.
[5]劉曉偉,謝楓,王莉,等.電力互聯網運行過程中重復需求數據挖掘方法[J].電子設計工程,2023,31(6):43-47.
[6]馮強,劉偉.基于庫岸邊坡監測的數據挖掘方法研究[J].水利技術監督,2023,31(3):46-49.
[7]陳婷婷,趙世忠.考慮模糊時間序列的高維大數據挖掘方法研究[J].計算機仿真,2023,40(3):467-470.
[8]劉張榕.基于E-OEM模型的Web數據精準挖掘研究[J].微型電腦應用,2021,37(10):146-149.
[9]李艷紅.基于云計算的分布式數據挖掘系統設計研究[J].電子設計工程,2019,27(11):141-145.
[10]潘立瓊,張健.基于優化蟻群算法的網絡流量數據精準挖掘仿真[J].佳木斯大學學報(自然科學版),2020,38(1):53-57.
基金項目:吉林建筑科技學院校級科研項目:能源管理系統的數據挖掘及決策支持系統研究(校科字[2023]015ZQKJ)
作者簡介:尚小晶(1987—),女,湖北宜昌人,研究生,副教授,任教于吉林建筑科技學院。