摘 要:數據挖掘技術是大數據時代的產物,具有計算性能、功能性、可用性和輔助功能。圖書館使用數據挖掘技術,有助于充分發揮數字資源的價值,實現圖書館數字資源共享的目標。本文將簡單介紹數據挖掘技術和大數據的特征,分析大數據與高校圖書館的關系,并探討數據挖掘技術在圖書館系統中的應用策略。
關鍵詞:數據挖掘技術;大數據時代;圖書館系統;數字資源共享
數據挖掘技術即數據處理技術,該技術方法包括神經網絡法、遺傳算法、決策樹方法、粗集方法、覆蓋正例排斥反例方法、統計分析法和模糊集方法等。
目前,圖書館管理系統開始采用數據挖掘技術以實現數字管理和數字資源共享的目標。
一、數據挖掘技術和大數據的特征
數據挖掘技術是大數據時代的產物,挖掘的任務主要是關聯分析、聚類分析、分類、預測、時序模式和偏差分析等,基本流程有五個步驟:
第一步是定義問題,確定數據挖掘的目的;
第二步是做好數據準備工作;
第三步則開始進行數據挖掘;
第四步就要分析數據挖掘的結果;
第五步是將分析所得的知識編制到信息系統中。
數據挖掘的技術方法包括神經網絡法、遺傳算法、決策樹方法、粗集方法、覆蓋正例排斥反例方法、統計分析法和模糊集方法等。
神經網絡法是通過建立網絡模型來解決數據挖掘的問題,遺傳算法是一種隨機搜索算法,決策樹方法用于預測模型,粗集方法發揮著數學工具的作用,覆蓋正例排斥反例方法用于篩選有價值的數據信息,統計分析法能夠處理函數關系和相關關系,模糊集方法可以對數據信息進行基本評判與分析,并建立云模型,總結云理論。……