邵泳兵
(汕頭職業技術學院 廣東 汕頭 515000)
網絡大數據挖掘是在實際需求下對數據流轉進行分析與研究的過程,相關學者進行了一定的研究。陳福集等[1]采用大數據信息融合技術,根據網絡用戶登錄信息分布進行動態挖掘,使用結果進行信息融合和聚類分析,提高網絡用戶登錄信息的輿情管理能力,王楚捷等[2]基于M-CORD實現對網絡資源信息特征量化分析,構建無線網絡信息的優化挖掘模型,分析網絡聚類信息的動態特征量,提高網絡特征辨識能力。
隨著智慧圖書館建設的快速發展,需要進行圖書館用戶登錄信息管理,因此相關的圖書館用戶登錄信息動態管理和大數據挖掘技術研究受到人們的極大關注。為整合相關研究的優勢,將其運用到圖書館管理當中,提高圖書館用戶登錄信息動態檢測能力,本研究提出基于動態信息融合的大數據背景下圖書館用戶登錄信息動態挖掘算法,根據提取的圖書館用戶登錄信息的統計特征量進行關聯規則挖掘,實現圖書館用戶登錄信息挖掘和優化定位檢測。

設X,Y為項目集,且X∩Y=φ蘊含式X=>Y稱為關聯規則,X,Y分別稱為關聯規則X=>Y的前提和結論。項目集X∪Y的支持度稱為關聯規則X=>Y的支持度,記作support (X=>Y),簡寫為sup (X=>Y),將其應用到圖書館用戶登錄信息提取中,首先,將圖書館用戶登錄信息融合特征分布模型定義為:

結合語義特征提取方法進行圖書館用戶登錄信息的特征提取和統計分析[5],其中,設用戶登錄信息引導函數為:
式(2)中:ε為圖書館用戶登錄信息的模糊度k特征隨機分布系數;φ為任意函數。
其次,進行圖書館用戶登錄信息優化挖掘,當語義本體集為φ∈(Ω)且(0)=0時,可以得到圖書館用戶登錄信息挖掘的解算引導方程:
式(3)中:
根據自適應重組結果,進行圖書館用戶登錄信息空間特征的自適應加權,可得加權系數為:
根據圖書館用戶登錄+信息的時頻特征分布,得到圖書館用戶登錄信息檢測的變換關系有:
式(6)中,ω1和ω2表示信息登錄的二次頻率,并消除圖書館用戶登錄信息冗余特征,得到圖書館用戶登錄信息的融合特征輸出為:
由此實現圖書館用戶登錄信息檢測,提升信息檢索效率。
以下,根據對圖書館用戶登錄信息檢測結果進行信息融合和特征重構。
利用統計特征分析方法[6-7],進行圖書館用戶登錄信息的傳輸控制,設其標識位為:
利用圖書館用戶登錄信息的統計分布集,進行圖書館用戶登錄信息的自動融合跟蹤,得到圖書館用戶登錄信息輸出偏微分方程為:
采用梯度下降方法,引入時間變量t,可以得到圖書館用戶登錄信息融合模型:
圖書館用戶登錄信息挖掘的統計特征量定義為:
式(11)中:N表示圖書館統計特征,圖書館用戶登錄信息特征檢測的對應關系定義為:
利用本體信息融合方法,引入關聯程度系數v,進行圖書館用戶登錄信息的輸出特征重構[8],得到重構關系為:
此時,在圖書館用戶登錄信息的分區融合下,設互信息特征量為I(x,y),(x,y)∈Ω,并且假設圖書館用戶登錄信息的平均互信息量I(x,y)在X和Y軸方向相互獨立,圖書館用戶登錄信息檢測的模糊度函數為I(x,·),聯合圖書館用戶登錄信息融合模型,以融合特征輸出為輸入,圖書館用戶登錄信息特征提取模型為:
綜上所述,以圖書館用戶登錄信息特征提取模型為動態挖掘的基礎,減少整體數據計算量,便于用戶信息大數據配置。
結合圖書館用戶登錄信息配置數據存儲節點的分布式結構重組方法,進行圖書館用戶登錄信息的存儲結構分析,建立圖書館用戶登錄信息配置結構模型,結合大數據挖掘方法進行圖書館用戶登錄信息的存儲體系結構設計[9-10],用一個二元有向圖G=(V,E)表示圖書館用戶登錄信息配置數據的圖模型結構,其中,V是部署在圖書館用戶登錄信息配置圖模型分布節點的頂點集;E是圖書館用戶登錄信息配置數據在有限域分布區域G中所有邊的集合。假設M1,M2…MN為圖書館用戶登錄信息配置數據的Sink節點,圖書館用戶登錄信息動態挖掘目標函數定義為:
假設圖書館用戶登錄信息檢索的目標函數Cv(x)滿足:
當圖書館用戶登錄信息的平均互信息量x小于0時,則不進行登錄信息的檢索,當大于0或等于0時,滿足其中一種限制量時,采用對應的搜索函數,因此,將圖書館用戶登錄信息的融合特征量表示為:
于是,得到圖書館用戶登錄信息定位的BVv(Ω)空間的函數,可得圖書館用戶登錄信息動態挖掘的狀態分布集為:
令g'(0)=0,可以得到:
式(19)中,cv為分布信息狀態閾值。根據上述分析,進行圖書館用戶登錄信息的大數據配置。
1.4數據動態挖掘輸出
提取圖書館用戶登錄信息的統計特征量,根據圖書館用戶登錄信息的特征提取結果采用模糊C均值聚類方法進行大數據聚類,模糊調度點集滿足UT=U-1,VT=V-1,D∈Rm×M,且D=[∑0],得到圖書館用戶登錄信息配置并行化的融合性聚類輸出為:
構建圖書館用戶登錄信息配置查詢模型,圖書館用戶登錄信息最優檢索特征分量:
為了驗證本研究所提方法在實現圖書館用戶登錄信息動態挖掘中的應用性能,進行仿真測試分析。
實驗采用Matlab設計,數據來源為數據庫Pearson Database中的某網絡圖書館文化信息資源共享工程和公共報告內容,其中,所采集的數據樣本集大小為600,圖書館用戶登錄信息的訓練數據集規模為100,設圖書館用戶登錄信息動態挖掘的空間分布維數為12,將其進行圖書館用戶登錄信息動態融合,結果以信息域的形式表現出來,如圖2所示。
根據上述信息融合結果,進行大數據挖掘,得到挖掘結果如圖3所示。
式(22)中,ρSM計算圖書館用戶登錄信息配置的模糊聚類中心,ASM為對圖書館用戶登錄信息檢索的輸出幅值。
通過提取圖書館用戶登錄信息的聯合條件信息量,為圖書館用戶登錄信息并行規劃聚類自適應調節參數,通過上面的系統描述參數,基于動態信息融合方法,進行圖書館用戶登錄信息動態挖掘,算法流程圖如圖1所示。
分析圖3得知,本研究所提方法進行圖書館用戶登錄信息挖掘時,對特征點的融合程度較高,說明動態融合性較好。因為本研究所提方法采用動態信息重構方法進行圖書館用戶登錄信息的相空間重構,結合邊緣信息特征提取方法進行圖書館用戶登錄信息的關聯規則挖掘。
將本研究所提方法與陳福集等[1]和王楚捷等[2]方法進行對比,測試本研究所提方法的挖掘精度,設測試數據為200個,如果實現200個數據全部檢測完成,則記錄查詢準確率,得到對比結果如圖4所示。
分析圖4得知,在不同的時間迭代驗證下,本研究所提方法進行圖書館用戶登錄信息挖掘的精度較高,收斂性較好;且其實現100%查準率的所用時間不同,說明在同一檢測量下,有不同的檢測速度即檢測效率,證明本研究所提方法能提高信息動態挖掘效率。
本研究提出基于動態信息融合的大數據背景下圖書館用戶登錄信息動態挖掘算法。結合關聯規則挖掘方法進行圖書館用戶登錄信息的特征提取,結合圖書館用戶登錄信息融合模型,以融合特征輸出為輸入,基于動態信息融合方法,構建圖書館用戶登錄信息特征提取模型,進行圖書館用戶登錄信息動態挖掘,實現圖書館用戶登錄信息挖掘和優化定位檢測。分析得知,采用本研究方法進行圖書館用戶登錄信息挖掘的自適應性較好,挖掘精度較高,查準率較高。