摘 要:文章通過研究公共圖書館圖書采訪模式,發現目前圖書采訪存在的問題,提出了基于決策樹算法的圖書采訪方法,對決策樹算法進行了詳細介紹,包括算法原理、構建過程和應用場景,著重分析了該方法在公共圖書館圖書采訪模型構建過程中的影響因素和變量,為后期決策樹圖書采訪模型的建立提供了理論依據,并對該方法的優缺點進行了總結,提出了未來研究的方向。
關鍵詞:決策樹算法;圖書采訪;模型;構建
中圖分類號:G258.2"" 文獻標識碼:A"" 文章編號:1003-1588(2024)08-0024-03
1 公共圖書館現有采訪模式及存在的問題
1.1 基于供給側:圖書采訪館員決策模式
目前比較常見的圖書館員采訪模式包含電子書目采購模式、大型書會現場采購模式、優先入藏等多種采購方式,在書目查重、出版社、出版時間、作者、館藏文獻建設需要等因素的綜合評估下,由采訪館員提出最終書目采購訂單。
圖書采訪館員決策模式對圖書采訪人員的要求極高,要求他們熟悉圖書館學理論和實踐,透徹理解圖書館的文獻建設政策、分類法以及圖書管理流程:首先要對各種圖書、期刊和其他資料有一定的了解,包括出版市場的動態、圖書評價標準及讀者需求;其次要能熟練使用圖書館檢索系統和其他信息資源,準確、高效地查找和獲取所需圖書信息;再次要具備市場調查和分析能力,能夠識別和評估圖書館的需求及圖書市場的趨勢和變化;最后要具備較強的責任心和細致的工作態度,能夠認真對待每一次采購任務,確保采購圖書的質量和數量符合要求。
圖書采訪館員決策模式對圖書采訪館員自身素質的依賴性較高,圖書采購質量不太穩定。在當前公共文化建設資金有限的情況下,對圖書采訪館員提出了更高的要求,也給文獻資源建設效率的提升造成了巨大的困難。
1.2 基于需求側:讀者決策圖書采訪模式
讀者決策圖書采訪模式涵蓋從采訪目的和形式選擇到策劃和執行的全過程,目的是有效地獲取、處理和傳播圖書信息,達到預期的目標和效果。“讀者決策采購”通常也被稱為“需求驅動采購”,是一種注重需求側數據挖掘的采購方式。隨著公共圖書館從傳統的藏書功能轉向更注重讀者服務水平時代的到來,許多圖書館已經將讀者決策圖書采訪作為購買圖書尤其是電子圖書的主要方式。
注重讀者數據挖掘的圖書采訪是圖書館圖書采訪的一種新方式,基于需求側的采訪方式可以緩解緊張的采購經費與讀者需求之間的矛盾,最大限度地滿足了當前讀者的需求,為智慧圖書館實現個性化服務提供了一種有效途徑,在一定程度上減輕了圖書采訪館員的工作量。
PDA(Patron-Driven Acquisition,讀者驅動采購)最初源自圖書館的館際互借服務,1990年左右開始在國外高校圖書館中流行起來。開放式圖書采訪是指圖書館根據自身館藏政策,篩選書商提供的書目,并將其導入特定的檢索系統,供讀者自行選擇和獲取。讀者可以通過點擊鏈接直接預約購買圖書,當圖書館預設的點擊量、時間或人數等指標達到一定數值時,系統會自動觸發圖書館向書商租借或購買圖書的指令。
近年來,我國圖書館積極探索新的資源采購模式,以提升服務效能和讀者滿意度。這些嘗試主要包括三種模式:第一種是“你選書,我買單”模式,即讀者可以在圖書館指定地點、書店或圖書展覽會等地選擇喜歡的圖書,由圖書館承擔購買費用。這種模式在多個地區得到實施,有效擴大了讀者的選擇權,提升了他們的閱讀滿足度。第二種是“讀者自主采購”模式。圖書館在書店指定區域或整體上架特定圖書,讀者可以直接借閱并進行簡單的數據著錄和處理;讀者歸還圖書后,圖書館再進行系統化的加工,最終與書商進行費用結算。這種模式強調了讀者的主動參與和圖書館后續服務的優化。第三種是“采訪流通系統”模式,這種模式集成了圖書館和書商的資源與服務,其代表性例子是內蒙古圖書館的“彩云服務”。通過這一系統,圖書館能夠更高效地獲取和管理圖書資源,提升借閱和服務的便捷性和質量。
馮慧在《學術型圖書館需求驅動采購效用分析——以華南理工大學圖書館DDA項目為例》一文中,用數據研究證實了需求驅動采購能夠提供比傳統文獻采購更高的讀者關注度、讀者參與量、文獻利用率[1]。總體而言,這些新的資源采購模式不僅豐富了圖書館的服務形式,還有效提升了讀者的閱讀體驗和滿意度。隨著技術和管理模式的進步,相信這些模式將在更多的圖書館得到推廣和應用,為廣大讀者提供更加優質的文化和知識服務。
1.3 存在的問題
公共圖書館作為社會文化服務機構的重要組成部分,承擔著向公眾提供圖書借閱、閱讀咨詢等服務的重要職責。圖書采訪作為圖書館服務的重要環節之一,直接影響了圖書館的服務質量和效率。傳統的圖書館采訪館員決策采購模式存在效率低、準確性差、借閱率低等問題;讀者決策采購模式在一定程度上提高了流通次數和借閱率,給讀者帶來了更好的主觀體驗。省級公共圖書館擔負著為政府提供參考咨詢的職責,也為科研人員、生產技術人員、學生、自學者提供文獻資源,在確保圖書正常流通的情況下還要整理和保存圖書資料。一方面,如果僅僅考慮讀者需求的采訪工作會造成圖書館館藏“你有我有,你無我無”的尷尬局面;另一方面,青少年、中老年人的參與度不會太高。因此,公共圖書館在資金有限的情況下有必要探索一種更加高效、準確的采訪方法。本研究嘗試構建基于決策樹算法的公共圖書館圖書采訪模型,通過數據驅動的方式實現讀者需求和館藏建設的有效平衡,這種方法不僅能夠提升讀者滿意度和資源利用率,還可以優化圖書館的資源配置和管理效率。
2 決策樹算法概述
決策樹是一種常見的機器監督學習算法,模擬人類的決策過程,通過一系列的決策節點構建樹形結構,從而實現對數據的分類或預測。其核心思想是將數據集逐步劃分為純度更高的子集,直到滿足停止條件為止。決策樹的構建過程主要包括特征選擇、決策節點劃分和停止條件設置三個步驟。特征選擇是指從所有特征中選擇最優的特征作為當前節點的劃分標準;決策節點劃分是根據選定的特征將數據集劃分為多個子集;停止條件設置是指確定何時停止樹的生長,防止出現過擬合現象。決策樹算法被廣泛應用于分類和回歸問題,包括醫療診斷、金融風控、客戶關系管理等領域,具有較好的解釋性和可解釋性,易于被理解和應用。
3 公共圖書館決策樹圖書采訪模型建立基礎
3.1 公共圖書館圖書采訪影響因素分析
筆者通過訪談在職的圖書采訪館員,總結了幾個比較重要的影響因素,即采購經費、館藏文獻建設方針、讀者需求、圖書館自身定位等。王巍在《新時代公共圖書館圖書采訪質量控制研究》一文中,將影響圖書采訪質量的因素歸納為以下幾點:政策因素、購書經費因素、圖書重印量大、書籍供應商管理、圖書采訪人員職業素養等[2]。胡育杏在《政府采購背景下公共圖書館采訪工作的思考》一文中提出采購資金、供貨書商、政府政策、加工流程繁瑣等都會給采訪工作帶來影響[3]。何靜等在《從實踐中探索提高藏書質量的有效方式》一文中提出館藏文獻統籌規劃、采訪原則、讀者需求、采訪人員素質等幾個方面有待提高[4]。陳軍在《基于公共圖書館閱讀推廣的中文圖書采訪模式探究》一文中從讀者需求、館藏文獻建設、優秀出版社優先入藏等方面總結了提高采訪質量的方式方法[5]。王衛霞在《基于用戶數據挖掘的圖書館圖書采訪決策模型研究》一文中將采訪決策影響因素歸納為館藏分布、學科熱點、用戶需求等,并認為用戶需求是最重要的影響因素[6]。孫明在《中文圖書采訪質量控制研究》一文中提出,宏觀政策、采訪經費、采訪人員素質、出版市場狀況復雜、供應商參差不齊、采訪模式多樣化等是當前影響采訪質量的主要因素[7]。
為更加全面地了解圖書采訪的影響因素,筆者分析了學術界相關研究文獻,經綜合訪談調研結果和文獻研究結果,匯總了公共圖書館圖書采訪的影響因素,即圖書采訪經費、館藏文獻建設方針、圖書自身價值、讀者需求、采訪人員職業素養。
3.2 決策樹圖書采訪模型特征變量分析
根據特征變量的選擇標準,筆者從圖書采訪實際出發,選取有分類效果的特征,以提高算法效率,最終構建更加高效的算法模型。
3.2.1 決策樹圖書采訪模型中的變量選取。一是作者。圖書的質量很大程度上取決于作者,從中文暢銷書排行榜也可以看出圖書編輯者的重要程度,特別是專業性比較強的圖書,對作者的要求更高,公共圖書館在采購圖書時也會優先選購專業領域優秀學者的書籍,因此作者可以選為變量特征。二是出版社。圖書的內容取決于作者,圖書的外在包裝取決于出版社,綜合實力強的出版社會在嚴格審核圖書質量的同時,精心設計圖書的外包裝。在資金允許的情況下,公共圖書館在圖書采訪過程中通常采用優秀出版社優先入藏的原則,能夠在一定程度上確保采訪圖書的質量,因此出版社也可以作為決策樹的另一個變量特征。三是價格。近年來,圖書出版規模增速明顯,國家新聞出版局2023年發布的數據顯示,2021年全國新出版圖書22.5萬種,重印書34.4萬種。在公共圖書館經費有限的情況下,價格也是圖書采訪決策樹模型構建中不可或缺的一個變量。四是出版時間。公共圖書館一般會選擇出版時間較新的出版物,尤其是專業數據類圖書出版時間越晚,其數據越準確,公共圖書館在圖書采訪過程中會對出版時間有明確要求。五是讀者借閱數據。公共圖書館的職能逐漸由傳統的收藏圖書轉變為服務讀者,讀者的需求不斷被放大,并成為圖書采訪的關鍵因素。讀者的借閱數據能夠真實反映讀者的需求,一般借閱數據包含讀者的基本信息、圖書的基本信息。公共圖書館將讀者借閱數據作為圖書采訪決策樹模型的變量特征,可以兼顧圖書采訪和讀者需求。
3.2.2 決策樹圖書采訪模型構建。圖書采訪決策樹模型的構建可以選取某公共圖書館近10年借閱數據中各學科排名前100的高借閱率圖書的作者、出版社、價格、出版時間作為因變量,電子書目中的圖書基本信息作為自變量,使用決策樹算法,建立公共圖書館圖書采訪決策模型,根據公共圖書館的資源建設方針確定判定條件,將預處理后的數據導入算法軟件,在最短的時間內給出兼顧文獻建設方針、采購資金、讀者需求的有參考價值的圖書采訪書單。
4 結語
本研究提出了一種基于決策樹算法的新方法,用于解決公共圖書館圖書采訪過程中存在的問題。該方法在結合圖書價值的同時引入讀者需求,減輕了圖書采訪館員的工作量,同時提高了圖書館的藏書質量,加快了圖書流通率,為未來公共圖書館圖書采訪工作提供了新的研究方向。圖書采訪決策樹模型還有更多的可供研究的空間,變量、因變量因圖書館性質不同、館藏政策不同也會發生變化,未來可以進一步優化決策樹算法,結合其他機器學習算法,探索更加高效、準確的采訪方法,為圖書館服務提升提供更多的思路和辦法。
參考文獻:
[1] 馮慧.學術型圖書館需求驅動采購效用分析:以華南理工大學圖書館DDA項目為例[J].圖書館研究與工作,2020(5):28-32.
[2] 王巍.新時代公共圖書館圖書采訪質量控制研究[J].黑龍江檔案,2023(3):322-324.
[3] 胡育杏.政府采購背景下公共圖書采訪工作的思考[J].河南圖書館學刊,2020(9):107-109.
[4] 何靜,黃杜鵑,劉洵.從實踐中探索提高藏書質量的有效方式[J].內蒙古科技與經濟,2019(8):129-130.
[5] 陳軍.基于公共圖書館閱讀推廣的中文圖書采訪模式探究[J].圖書館工作與研究,2018(S1):132-134.
[6] 王衛霞.基于用戶數據挖掘的圖書館圖書采訪決策模型研究[J].圖書館學刊,2017(10):1-4.
[7] 孫明.中文圖書采訪質量控制研究[J].圖書館學刊,2015(8):66-69.
(編校:崔萌)