文/山東夏津縣圖書館 時海燕
數據挖掘在公共圖書館管理工作中的作用分析
文/山東夏津縣圖書館 時海燕
本文主要研究數據挖掘在公共圖書館管理工作中的作用,對數據挖掘的基本流程和主要功能進行了分析,并討論了數據挖掘在公共圖書館管理工作中的作用。
數據挖掘;公共圖書館;管理工作
信息技術與計算機網絡技術快速發展,改變了公共圖書館的管理工作形式,基于計算機技術的圖書館文獻信息編輯整理以及流通管理工作能夠為讀者保存并提供更加豐富全面的個人信息與文獻信息,數據完整性、規范性、結構性更強。分析數據挖掘技術在公共圖書館管理工作中的作用,對圖書館管理決策有著重要意義。
(一)概述。數據挖掘技術是在大量不完全、模糊、隨機數據中提取隱藏有價值信息的技術過程,傳統的線性數據報表工具、統計工具不能滿足數據價值信息提取的需求,數據挖掘技術隨著需求的增長而快速進步。數據挖掘技術能夠方便分類管理各種統計信息,充分挖掘、揭示數據模式、數據規律,從而更加準確地預測未來數據發展,是一種有較強交叉性的學科,涉及多方面知識,善于從海量看似隨機而沒有關聯的數據信息中提取關鍵數據信息,獲取知識。和傳統報表信息處理方法相比,數據挖掘能夠更加深刻的揭示事件發生原因,并為決策提供可靠依據。現階段,數據挖掘技術有WEB數據挖掘技術、數據挖掘技術以及文本數據挖掘技術三個主要方向。WEB數據挖掘研究對象為WEB頁面內容和不同頁面間的結構規律,數據挖掘則主要研究各類數據,并對數據價值進行進一步的聚類分析、關聯分析和偏差分析。文本數據挖掘主要用于文本信息的獲取,主要功能有提出文本特征信息、文本分類以及數據的探索性處理等。
(二)數據挖掘基本流程。數據挖掘主要有數據準備、數據挖掘和結果表述三個方面。數據挖掘的準備階段主要有數據集成、選擇和預處理三個步驟,將多文件和多個數據庫中的數據進行整合合并,清理數據遺漏項目,清理臟數據,提高數據質量。數據挖掘階段,首先建立挖掘目標,確定數據挖掘假設,用戶可以自己建立假設,或者由系統自動提出假設,之后選擇合適的數據處理工具進行數據處理,確定數據分析工具之后,分析工具能夠自動在海量數據中找尋合適的模型,從底部逐級向上搜索,找尋原始事實之間的聯系,也可以添加人機交互,工作人員發問,驗證假設的正確性。之后進行結果表述與解釋,根據用戶決策目標需求,分析提取的信息,區分有價值信息,使用決策工具將數據提供給決策者。
(三)數據挖掘基本功能。數據挖掘能夠通過預測來提供前瞻性的決策依據,從數據庫數據中找尋隱含的高價值知識。數據挖掘還能夠對趨勢和行為進行自動預測,從海量數據中找尋預測性信息,省掉大量傳統手工分析過程,從數據中快速得到結論。市場預測就是最成功的應用,通過過去的促銷數據就能夠快速找出投資回報最大的用戶,在各種商業行為的預測中,數據挖掘都有著廣闊的應用空間。關聯分析是數據挖掘另一個重要功能,通過大量數據的分析處理,數據挖掘能夠找出大量數據中有關聯的若干變量,生成可信度較高的規則。數據庫也可以視作有意義的系列子集,聚類是偏差分析和概念描述的前提基礎,劃分對象不僅要重視距離,還應該涵蓋類聚內涵描述。除此之外,數據挖掘還有概念描述、偏差檢測等功能,都是傳統數據分析技術所不擅長的。
(一)提供更加有效的教育功能。知識經濟時代,人才教育不只是知識教育,還應該側重于人的創造性思維和創新能力的培養,確保人才能夠適應時代變化。經濟建設和國家發展需要大批掌握扎實基礎知識同時具有創造性思維和創造能力的復合型人才,教育工作也應該逐漸從應試教育逐漸轉變為素質教育和創新性教育。對于讀者來說,學習為目的的閱讀有取證學習、學歷學習、職業學習和素質學習等不同形式,不同的人生階段有不同的學習重點,例如學生階段學習以獲取專業知識為主,就業之后熱衷于職業資格證考試。公共圖書館是獲取參考書籍最好的方式,也是學習的理想場所,如何為讀者提供相關書目,滿足讀者閱讀需求,是公共圖書館工作人員需要考慮的問題。使用數據挖掘技術,圖書館則能夠準確預測讀者的書目需求以及社會職業知識發展方向,該預測結果能夠對圖書館書目采購、期刊報紙訂閱起到指導作用,同時還能夠為人事勞動教育部門提供對應的數據,幫助相關工作人員提供研究數據。通過數據挖掘,能夠幫助確定不同行業、不同年齡、不同學歷背景讀者的書目差別,了解不同讀者對圖書的需求程度。分析用戶信息表和借閱歷史表,就能夠制定一個和實際情況非常符合的書目決策表,對公共圖書館優化館藏結構有著重要意義。
(二)優化公共圖書館信息服務功能。公共圖書館信息服務功能有公共公益性信息服務和產業公益性信息服務兩方面內容,其中公共公益性信息服務面向社會成員,公益性信息服務面向社會組織。公共公益性信息服務是圖書館、文獻信息服務機構、重要媒體提供的信息服務,公益性信息服務是國有企業、行業信息機構和行業協會提供的壟斷性信息服務。使用聚類數據挖掘方法,能夠對公共圖書館信息服務功能進行進一步優化。聚類分析使用了動態歸類標準,并進行定量描述,選擇多種不同相似性標準,能夠將數據劃分為多種不同層次類別,從而多層次文獻聚類。公共圖書館使用聚類方法,無須預先進
行信息分類,可以根據圖書館的實際需要,選擇合適的文獻情報門檻值,符合門檻值要求的信息就化歸為一類,上交給有關部門進行處理,多種不同的問題和門檻值將不同的信息劃分為多個類別,信息的類聚所有文獻情報都要參與,從而突破了當前情報分類方法的局限性。
(三)圖書文獻采購管理。公共圖書館地方文獻管理通常都選擇符合館藏地方文獻特點的分類方法,編制科學合理的館藏地方文獻分類細則,集中或者分散處理。分散處理方法不區別地方文獻和非地方文獻,不強調地方文獻特征,根據學科屬性分類,散布在多個學科不同的類目中,而集中處理方法首先突出地方特征,將地方文獻集中起來統一使用、管理。近些年,公共圖書館逐漸意識到自己在地方文化弘揚推廣中的重要作用,逐漸加大了對地方文獻數據館藏的建設與管理力度,但是實際工作中,仍然會出現地方文獻書籍采購經費不足的問題,需要采取一定的策略進行取舍。常規的采購策略是優先選擇熱門領域書籍,即便書籍可能并不很重要,而非熱門書訂購則比較困難,這樣的采購策略會導致熱門書目過多,非熱門書過少,圖書館館藏結構不健康。而數據挖掘遺傳算法能夠很好地解決這個問題,該技術能夠利用種群進化來主動尋優,根據不同領域熱度,給出不同的權重,為采購策略制定提供指導。
公共圖書館是一種社會化的實體館藏,在公共圖書館管理工作中應用數據挖掘技術,能夠充分利用其數據組織分析、知識發現和信息深層挖掘功能,為讀者提供更加人性化的閱讀服務,有利于公共圖書館的進一步發展。
[1]黃紅.圖書館績效指標數據挖掘方法研究[J].圖書館學研究,2014(15).
[2]陳海軍.數據挖掘在公共圖書館管理工作中的應用[J].中國管理信息化,2016(02).
[3]李仁玲,王建嶺.數據挖掘技術在中醫院校圖書館讀者的行為及研究[J].當代教育實踐與教學研究,2016(07).
[4]初景利,易飛,杜杏葉,等.持續推動圖書情報理論創新與實踐探索——《圖書情報工作》2014年發文評述[J].圖書情報工作,2015(01).
[5]俞錦梅.數據挖掘在國內圖書館應用領域研究綜述[J].圖書與情報,2015(02).