丁玉東 姜 波 韓雪飛
(燕山大學圖書館,河北 秦皇島 066004)
復本或復本數是圖書館紙質文獻資源建設中的一個重要概念,是圖書館館藏發展政策中的重要內容之一。圖書的種類決定文獻保障率,而復本數的多少直接影響圖書的滿足率,進而影響讀者對圖書館的滿意度。但隨著時代的發展,預測復本數愈加困難。讀者興趣、閱讀載體、閱讀行為快速變化;開放存取、PDA采購、新媒體的發展等諸多因素降低了讀者對紙質圖書的依賴。同時,館藏空間不足、圖書出版價格快速上漲以及因新冠肺炎疫情帶來的經費縮減也對圖書館的館藏結構及圖書采購工作產生重大影響。
在較長時期內,圖書館依據經驗或計算等方式推測每個學科分類的圖書應配置的冊數。從閉架管理時期對復本概念的辨析和對復本數[1-2]的計算,到利用復雜的數學模型對影響復本量的因素以及圖書流通數據進行量化分析[3-10],以期給出未來一段時間采購圖書時應配置的復本數,筆者稱之為“預置復本”。但這種采購模式的缺點也非常明顯。如經費使用效益低、浪費空間和人力資源、館藏質量下降等[11]。另外,影響復本數的因素很多并且難以量化[12],學者提出的各種數學計算模型又非常復雜,無法廣泛用于采訪實踐[4];對學科分類進行平均復本數估算而不是具體圖書,也缺乏精準性。甚至有學者認為“傳統的復本采購方式以自我為中心,并非以讀者需求為中心”[13]。
隨著信息環境的變化,越來越多的高校圖書館采取“保種類,降復本”[14]或“單復本”[15]的采購策略以應對上述變化。如暨南大學[16]、復旦大學、上海海事大學、青島大學[17]、南京工業大學[14]等高校圖書館,普遍采取初訂時僅采購一個復本,后續根據讀者使用情況予以重訂的采購方式。在重訂復本時,如何更簡單有效地掌握讀者的實際需求成為精準采訪的首要問題。有學者提出應該抓住影響復本數的主要因素,簡化計算方法,利用圖書的流通次數和預約次數判斷圖書的緊缺程度[12-13],即通過圖書的實際使用情況所反映的讀者需求有針對性地重訂,既可以滿足讀者需要,又規避了上述預置復本采購模式的缺點。
但筆者在工作實踐中發現,如果僅憑借圖書的流通次數和預約次數作為重訂復本的參考依據,仍存在缺陷:(1)流通次數并不直接反映圖書的緊缺程度。對于人文、社科類非學術圖書,讀者閱讀速度快、周轉率高,但其學術價值較低;而需要細致研讀的圖書,讀者借閱后會傾向于長時間保留在手中,疊加寒暑假自動延長借期、續借等因素,其全年最大流通次數一般不會超過6次。另外,在一定時期內,流通次數與圖書的復本數量也呈正相關性[18]。因此,以流通次數來決定是否重訂復本會漏掉部分學術價值較大的圖書,失之偏頗。(2)預約數據不全面且包含偶發因素。預約行為主要發生在讀者需求明確且通過檢索發現圖書已借出時,而讀者在書架中隨機瀏覽時無法看到已借出的圖書,被迫降低期望選擇其他圖書,導致上述圖書無預約數據或預約量低;另外,受社會熱點、社團活動或個別推薦書單的影響,存在短期內大量預約而過后無人問津的情況,原則上這種情況無需補充復本。甚至有圖書館因為人員、技術等原因沒有開放預約功能,無法獲取這一數據。
紙質圖書目前仍然是館藏文獻資源建設的重要組成部分,是學生讀者的重要學術信息來源,也是閱讀推廣工作的重要載體,構建更加簡單、合理和實用的圖書復本策略仍有現實意義。為解決上述問題,筆者提出一種“單復本”采購模式下利用“圖書借出天數”與“圖書館藏天數”的比值來判斷圖書緊缺程度的方法,進而輔助圖書復本采購的策略,經過與讀者預約數據相互驗證,認為具有較高的可行性。為表述方便,筆者所述“復本”的概念采用日常工作和交流中常用的意思,即同一種圖書的其中一冊為一個復本,不再有意區分“正本”和“復本”,并且涉及復本數的內容均指流通復本數,不考慮保存本或樣本書。
復本策略的提出基于以下認知:
(1)圖書借閱是讀者間接參與館藏文獻資源建設的重要方式。讀者的需求、興趣及其所反映出的圖書主題、借還時點、持有時間等信息均隱含在圖書借閱日志中,對借閱記錄數據進行挖掘和分析,可以在很大程度上確定讀者的需求,比讀者抽樣調查數據更全面、更有意義。
(2)采購經費決定圖書采購數量。圖書館每年采購圖書的冊數受限于學校撥付的經費、圖書的平均銷售價格和采購折扣。其中采購折扣相對穩定,平均售價可由上一年度采購的圖書價格預估,因此采購經費直接決定年度采購冊數。
(3)緊缺的圖書會經常處于借出狀態。一種圖書,無論其復本數量多少、學術價值高低、讀者人數多少、半衰期長短以及學科主題和借閱制度,如果讀者需求明顯,那么同一個讀者或不同的讀者會盡可能地持有和使用,歸還后也會在短時間內再次被借出流轉,即在架時間短、借出時間長,呈現持續緊缺的狀態。所以,某種圖書在一個較長周期(如一年)內的累計借出時長可以反映圖書的被需求程度。但是考慮到不同種類圖書的復本量不一樣,或者圖書的多個復本入藏時間不一致,入藏時間早的復本,其累計借出時長一般要大于入藏時間晚的復本。所以累計借出時長同樣無法直接用于衡量某種圖書的緊缺程度。
因此,筆者引入“館藏時長”這一指標,即在考察周期內,圖書已經入藏的時間長短。如考察周期為2021年,則2020年及之前入藏的圖書在2021年的館藏時長為365天,2021年當年入藏的新書或新復本的館藏時長為從典藏時間起至2021年12月31日之間的天數。
綜合上述因素,對同一種書,其所有復本在一個周期內的累計借出時長,與這些復本在該周期內的館藏時長之和的比值,稱為“緊缺指數”。用公式可以表示為:
其中,累計借出時長指一種圖書的所有流通復本在考察周期內被讀者持有的天數之和。館藏總時長指一種圖書的所有流通復本在考察周期內的已典藏天數之和。“緊缺指數”值越大,說明總借出時長占館藏時長的比重越大,該圖書滯留在讀者手中的時間越長,其他讀者借到的可能性就越低,越需要補充復本。理論上其最大值為1,即從入藏當天起一直被借出,在讀者手中的時長等于館藏時長。綜上,在具體采訪實踐中,根據學校撥付的經費可以確定當年采購圖書總冊數;對于采訪館員認定會有較大需求的圖書,可以直接多復本采購,其他新增圖書只采購一個復本;通過計算上一周期流通圖書的“緊缺指數”估算需要重訂復本的數量。至此即可大致確定當年采訪的新增種類和復本數量,前者負責資源建設中的文獻保障率,后者負責文獻保障條件下的滿足率。
燕山大學圖書館使用江蘇匯文軟件有限公司的Libsys業務管理系統,可按時間段導出流通日志和館藏清單。每冊圖書具有唯一的財產號,每種圖書具有唯一的索書號。預約權限僅向研究生和教師開放,本科生的預約需求無法體現,導致預約數據只能在部分程度上反映圖書的緊缺程度。年采購新書約5萬冊,平均復本數約2.3冊,其中包括一冊保存本(除文學作品外)。
為計算方便,筆者以一年為周期進行考察。2020—2021年因新冠肺炎疫情、新館搬遷等因素影響,讀者在校時間短,部分圖書被打包存放,導致數據不完整,因此筆者選取2019年的流通數據進行分析。
第一步:導出2018—2019兩年的流通日志,但2018年的數據中僅需要保留2018年借出、2019年歸還的記錄,刪掉2018年當年借出當年歸還的記錄。
第二步:對于2018年借出、2019年歸還的圖書,借出時長從2019年1月1日開始計算;對于2019年借出、截至2019年12月31日尚未歸還的圖書,借出時長截至2019年12月31日。即得到2019年內全部有借出和歸還記錄的圖書的流通日志,只保留可以計入2019年內的借出時長。
第三步:利用歸還日期減去借出日期再加一天(日期均為上一步截取之后的日期),得到該次流通在2019年產生的借出時長。之所以“加一天”,是考慮日期之間的差值比圖書實際被占用的時間少一天。
第四步:按照財產號進行分組聚類,可獲得每冊圖書的借出次數(每冊圖書的一條流通記錄即為一次借出)、累計借出時長(對每冊圖書每次借出的天數求和),并保留索書號字段。聚類后生成的新表格內不再有重復的財產號。
第五步:導出2019年新入藏的圖書及入藏日期。利用“2019-12-31”減去當年入藏圖書的入藏日期,得到該冊圖書當年的館藏時長。
第六步:為第四步生成的新表格匹配第五步生成的每冊新入藏圖書的館藏時長。對于2018年及以前入藏的圖書,默認填充其在2019年的館藏時長為365天。
第七步:按照索書號對第六步的數據進行分組聚類,可獲得每種圖書的累計借出時長(對每個復本的累計借出時長進行求和)、每種圖書的館藏總時長(對每個復本的館藏時長進行求和),同時還可以得到每種圖書參與流通的復本數(每個索書號對應幾個財產號即為幾個復本)、每種圖書的流通總次數(對同一索書號的借出次數求和)。
至此,得到每種圖書在一年內的流通復本數、流通總次數、累計借出時長和館藏總時長。用借出總時長除以館藏總時長,即可得到緊缺指數。借助得到的流通復本數、流通總次數,還可計算出每個復本的平均館藏時長和平均借出天數,用于輔助采訪館員決策。同時,由于當年入藏圖書的館藏時長不足365天,因此如果館藏總時長不是365的倍數,即可判斷該種圖書的復本中含有2019年當年入藏的新書。用索書號匹配到圖書書名,可以更好地幫助采訪館員做出是否重訂的決定。
根據計算得到的緊缺指數,結合圖書采購工作實踐,在具體重訂時可分為以下幾種情況:(1)復本數已達最大值。對于復本數已達到館藏發展政策中規定的最大復本數的,可以直接忽略,或給予特殊重訂。(2)緊缺指數大于1,即平均借出時長大于365天。通過流通日志可以發現這類圖書僅有1個復本,均為特殊讀者長期占用,因其歸還后立即借閱,每次借閱會產生1天的借出時長,導致計算時累計借出時長超過365天。這種圖書數量極少,一般無需重訂,或需要結合學科特征單獨分析。(3)平均館藏時長小于365天。如果平均館藏時長小于一定時間,如60天(兩個借閱周期),說明該圖書入藏時間較短,借出時長和借出次數尚不足以考察其緊缺程度,則緊缺指數意義較小,在重訂時可忽略或酌情考慮。如果平均館藏時長大于60天,說明該圖書為2019年11月份及之前入藏的新書,或存在2019年新增的復本,該指數能體現圖書的緊缺程度,可供參考。(4)平均館藏時長為365天。說明該圖書的所有復本均為2019年以前入藏,該指數能體現圖書的緊缺程度,采訪館員可在館藏發展政策的控制下,結合已有復本數、分類號、借出次數等指標綜合判斷是否重訂。
為進一步檢驗上述復本策略的有效性,根據燕山大學圖書館2019年的流通日志計算出當年的圖書緊缺指數,并把得到的數據與當年讀者預約數據進行匹配和比較。
按照流通日志和上述計算得到的數據,2019年共有68908種圖書被借出,去除平均入藏時間60天以內的圖書890種,對剩余68018種圖書按緊缺指數分組(以0.9代指0.90~0.99區間,下同),各階段所包含的圖書種類及其比例分布如表1所示。

表1 2019年緊缺指數分布(種數,占所有種類的比例)
從表1可以看出,當年所有有流通記錄的圖書種類中,緊缺指數0.6以下的圖書占比超過90%,即絕大多數圖書有半年以上的時間是在架狀態,讀者使用頻次不高。
仍以2019年數據為例,共有996種圖書被預約1753次,單種圖書最大預約次數為20次,平均預約次數為1.76次,預約中位數為一次。相對來說,預約次數高的圖書種類少,被預約一次的圖書有659種,占總預約種類的66.2%,占預約次數的37.6%,如表2、表3所示。

表2 2019年預約次數分布及其平均緊缺指數

表3 2019年按緊缺指數分組囊括的預約次數
結合表1~3可以看出,緊缺指數越低的圖書種類越多,但被預約的次數越少,正符合日常工作的認知。同時也說明緊缺圖書相對較少,多數圖書擁有相當長的在館時間。隨著緊缺指數的減小,重訂這些圖書的復本對滿足讀者預約需求和借閱需求的邊際效益在降低。
筆者隨機選取了6種2019年緊缺指數超過0.9,2019年及之前采購且在2020年重訂復本至3冊的圖書,觀察其后續借閱情況(見表4)。

表4 重訂復本圖書在2020—2021年的借閱表現
3.4.1 緊缺指數可以作為復本重訂的重要判斷依據
以表1中的數據為例,考慮指數介于0.7~1之間的圖書需要補充復本,即全年365天平均每種圖書有110天(略大于寒暑假總天數)屬于在架狀態,則僅有1742種(約占流通種類的2.6%)的圖書需要考慮重訂。與預約數據相匹配,這些圖書包含493種圖書的1134次預約,即全年預約圖書種類的49.5%,預約次數的64.7%,在圖書館年度采購量中占比很小。
從表2的平均緊缺指數來看,被預約3次及以上圖書的平均緊缺指數均大于0.7。在詳細數據中,被預約3次及以上的153種圖書中僅有21種圖書的緊缺指數小于0.7,筆者進一步分析流通日志和預約時間,發現這21種圖書均屬于短期內較為集中的需求。即緊缺指數的高低與圖書預約次數有明顯的正相關性但覆蓋更加全面,可以作為復本重訂的重要判斷依據。同時也說明少量的預約次數并非圖書重訂的指征,圖書每個復本的在架時長更能反映圖書的緊缺程度。
從表4的借閱數據來看,重訂圖書的緊缺指數在2020—2021年仍然維持在高位,但隨著時間的推移,緊缺指數整體呈現下降趨勢,緊缺程度相對緩解。其中雖然有文獻老化、需求趨緩等因素的影響,但也反映了利用緊缺指數輔助重訂決策的有效性。
3.4.2 緊缺指數彌補了流通和預約數據的不足
根據計算,在2019年緊缺指數介于0.7~1之間的1742種圖書中,每冊圖書全年平均流通次數為6次及以下的圖書為1444種,占比82.9%;有預約記錄的圖書為493種,約占被預約圖書總量的50%。即讀者有明顯需求的圖書流通頻次反而不高,僅以流通次數或預約次數判斷圖書是否需要重訂存在缺陷,導致大量需要補充復本的圖書未被發現,并未真實反映讀者需求。而緊缺指數可以避免這一缺陷,引導采訪館員更有針對性地重訂復本。
利用同樣的方法,筆者進一步分析了2017—2018年流通圖書的緊缺指數,發現與2019年數據呈現的規律基本一致。
綜上所述,緊缺指數這一指標彌補了常用的復本重訂策略的不足,其優點在于:(1)對讀者實際需求和圖書緊缺程度的體現更加完全和準確;(2)針對每種圖書而非學科分類進行測算,更加精準和易于控制;(3)僅需要流通日志和當年入藏記錄,參與計算的變量少且易于獲取,無需考慮續借、超期歸還等因素;(4)淡化了復本入藏時間對流通次數的影響,館員日常工作中可以隨時重訂;(5)進一步提高經費使用效益,在經費不穩定的情況下兼顧圖書的保障率和滿足率;(6)計算簡單,易于使用和推廣。數據的獲取和計算利用Office軟件中的Access或Excel即可完成,并且使用的SQL語句或函數均為基本功能,如Left()、Count()、Sum()等函數及“GRORP BY”語句,便于館員理解和掌握。另外,獲取的數據也可以為電子圖書的PDA選購提供決策參考。對數據的進一步處理可以得到更多有價值的信息,比如提取索書號中的分類號進行聚類分析,可以判斷某一個學科分類圖書的需求和緊缺情況;或根據圖書出版社進行聚類分析,可以判斷館藏圖書的核心出版社。
其缺點包括:(1)未考慮寒暑假開館、因疫情而推遲返校等情況對流通日志的影響,但從整體數據上對所有圖書一視同仁;(2)未考慮同一種書多個版本的區別;(3)指數難以體現館藏時間較短的圖書的緊缺程度;(4)以一年為周期進行考察,少數圖書可能會因為售罄而無法補充復本。
需要說明的是,圖書采訪不是機械操作,算法和數據只能輔助決策,采訪工作需要發揮采訪館員或學科館員的主觀能動性,結合館藏發展政策采取經驗和定量相結合的方式進行,而不應教條地按照計算指標采購圖書。因此在重訂復本時需要根據采購經費和圖書館自身發展特點綜合判斷,必要時為不同的學科采用不同的緊缺指數閾值。