袁 帆,李 佳
(1.上海第二工業大學 圖書館,上海 201209;2.華東師范大學 教育學部,上海 200062)
二八定律也被稱為80/20法則,是一種基于“重要的少數與瑣碎的多數”原則的量化標準,該原理由19世紀意大利經濟學家維弗雷多·帕累托提出,他發現20%的產品或活動通常占用了80%的資源或收益。在管理學中,二八定律通常用于識別和優化關鍵的20%因素,以獲得80%的成果[1]。“長尾”一詞由克里斯·安德森于2004年在《連線》雜志上提出,與80/20法則的解釋截然不同,常用于解釋如亞馬遜和Netflix的在線商業和經濟模型,最初它指的是銷量較小或不被重視的產品或服務。由于它們的種類繁多,總銷量龐大,并且累計總收入超過主流熱門產品的收入,隨著互聯網和產品信息化的發展,數字產品存儲成本的壓力逐漸降低甚至抵消,當存貨存儲成本不再是一個重大問題時,長尾理論的應用就蓬勃發展[2]。
長尾理論在圖書館領域并不陌生,自2004年長尾理論提出以來,美國圖書館協會(American Library Association,ALA)多次邀請安德森進行演講,探討數字化和互聯網環境中的信息資源建設和用戶服務等問題,ALA確信長尾理論能夠對拓展信息用戶范圍、全面保障用戶需求產生積極作用。在以紙質圖書收藏為主的傳統圖書館文獻資源建設中即有學者提出要抓住20%具有特色的館藏資源進行重點建設以改變過去僅依靠經驗辦事的做法,避免信息資源建設中的盲目性和隨意性[3]。而進入信息時代后,隨著圖書館的數字化轉型,圖書館正通過提高數字資源的質量和數量逐步加強數字資源的建設,相關學者開始關注長尾理論在圖書館服務中的應用。倪娟等[4]認為圖書館應該積極應用長尾理論,拓展新服務,發掘新的服務增長點;周歡等[5]提出了圖書館利用長尾理論中生產普及、傳播普及和供需相連3種力量推廣全民閱讀的策略。
過去,數字圖書館在討論長尾理論時主要聚焦于數字資源,如電子期刊資源建設和電子圖書的利用情況等。隨著數字圖書館用戶群體的不斷增加,用戶需求逐漸呈現多元化,如何挖掘圖書館潛在的“長尾”,以擴大資源和服務的利用率,進而提升對讀者的服務質量,已成為數字化時代圖書館轉型與發展的重要使命[6]。而長尾理論在圖書館應用中的實證研究較少,可能缺乏準確、全面的數據證明其存在性,大部分研究停留在討論、分析和評論等方面。在數字環境中是否有確切證據表明圖書館信息資源利用情況呈現長尾現象?圖書館如何在資源建設或用戶服務中運用相關理論來有效提升其管理效率和服務質量?本文希望在以上問題上展開分析與探討。
長尾概念被廣泛應用于在線商務、大眾傳媒、知識管理、社交網絡傳播、市場營銷等領域,主要面向需求較低或不太受歡迎的產品,安德森認為這些產品實際上可以增加利潤率,因為消費者正在遠離主流市場。隨著互聯網的發展,電子商務平臺的出現打破了傳統的銷售模式,使得長尾產品也能夠獲得更廣泛的市場機會。通過互聯網和電子商務平臺,商家可以將長尾產品與潛在的小眾消費者連接起來,從而實現銷售和利潤的增長。這種模式可以為消費者提供更多元化的選擇,并為商家創造更多銷售機會[7]。長尾理論的數學模型體現在兩個變量之間的關系成為冪律。由于長尾非常長,長尾的面積與頭部的面積相同。在實際應用中,X軸通常表示產品種類/文獻資源種數,Y軸表示商品銷售量/文獻資源銷售量,傳統關注頭部(20%)的80/20法則在長尾細分市場則強調尾部(見圖1)。

圖1 長尾現象
過往圖書館在采購圖書和其他信息資源時通常更注重熱門和暢銷的文獻,對利用率較低的資源采購較少。然而長尾理論認為即使利用率較低的“長尾”資源也具有一定的使用價值,并可能在整體利用中占據重要比例。這與二八法則不同,但同樣適用于圖書館管理決策,即圖書館不僅應關注主流讀者、館藏資源和服務,還應善于挖掘潛在用戶需求。隨著讀者群體的多樣性增加,特別是綜合性研究型圖書館和大型公共圖書館,如何識別非主流圖書館讀者需求、進一步了解并滿足這一群體的需求以擴大圖書館資源服務的廣度與深度,已成為圖書館數字化轉型過程中信息服務的重要任務。
印度圖書館學家阮岡納贊(S.R. Ranganathan)于1931年提出了圖書館學五定律,被國際圖書館界譽為“我們職業最簡明的表述”。這五定律是:書是為了用的;每個讀者有其書;每本書有其讀者;為讀者節省時間;圖書館是一個生長著的有機體[8]。這五定律強調了圖書館的成長性、多樣性和以讀者為中心的核心理念。本研究即基于以讀者為中心的信息資源建設與服務視角,探索長尾理論在圖書館中的應用,基于讀者借閱數據以探索可能存在的“長尾分布”現象,并進一步分析其特征,為以讀者為中心的信息資源建設與服務模式提供參考依據。
本研究以大學數字圖書館國際合作計劃(China-America Digital Academic Library,CADAL)網站的用戶借閱數據為分析對象,CADAL是一個由國家投資建設的數字圖書館項目,旨在構建多學科、多類型、多語種的海量數字資源。目前,CADAL已經擁有近280萬冊(件)的數據,而本研究選取了2022年CADAL網站完整的322 084條借閱數據作為分析基礎。為了保護圖書館讀者的隱私,在獲取和分析數據之前,CADAL項目管理中心對由數據提供單位提供的41 587 374條涉及網站用戶、資源、檢索記錄、借閱記錄和瀏覽記錄等相關信息進行了預處理操作,刪除了能夠識別讀者隱私的數據,如讀者姓名、電話號碼等。
長尾理論旨在探討高流通率和低流通率產品,本研究將圖書館的文獻資源視為圖書館的產品,并將圖書的利潤定義為被讀者借閱的次數,因此借閱次數更多的圖書被視為高流通率的產品。本次研究對圖書的借閱次數進行排序,然后計算與借閱次數對應的圖書數量,從借閱次數最大和最小的端點開始累積圖書的借閱次數,并檢查當這兩個累積數字最接近或相等時的情況,以確定是否呈現長尾現象。
本研究以每本書的借閱次數作為衡量其受歡迎程度的指標,借閱次數越多表示該書越受歡迎,可以被視為熱門圖書。研究根據322 084條借閱記錄對圖書的借閱次數進行聚合,并得到了98 707種圖書的有效借閱量統計表。最高和最低的累計借閱次數分別位于兩端,如表1所示。

表1 CADAL圖書資源借閱統計
研究根據不同借閱圖書種類和對應的借閱量,統計了各區間圖書借閱總量及其占比,以確定CADAL的信息資源利用情況是否呈現長尾分布(見表2),并在表2數據基礎上繪制CADAL信息資源利用分布情況圖(見圖2)。

圖2 CADAL圖書資源利用情況
結合表1和圖2的數據分析,如果從借閱次數最高的312次開始并將借閱次數進行累積,在長尾曲線中會有一個頭部和長尾的分割點。因此,研究將322 084本借閱次數為6次的書籍分為兩部分,可以發現頭部區域的面積等于長尾的面積,也就是圖書館借閱的書籍數量和書籍借閱次數之間的累計借閱次(冊)數是相等的,因此可以確定CADAL的書籍借閱次數與圖書館借閱數量之間呈現長尾現象。
長尾理論認為通過優化資源的組織,可以提高資源的利用率。圖書館傳統觀念中那些低流通率的“冷門”文獻資源,雖然單個來看利用率很低,但由于其數量巨大,匯集起來的利用總量是巨大的。根據統計分析,本文認為圖書館不僅關注熱門的暢銷書和熱門話題,還應納入更多的冷門主題和專業領域的書籍,特別是對于綜合型圖書館,在不受復本數限制的數字文獻資源建設中,應優先考慮擴大館藏范圍,盡可能提供更多長尾資源的數字版本以滿足讀者多樣化的需求,提供更廣泛的知識覆蓋。
傳統圖書館通常根據熱門度或借閱量進行圖書推薦,本次研究表明用戶的興趣和需求是多樣化的,他們可能對某些較小眾的主題或領域感興趣。此外,為了建設更多元、更廣泛的信息資源,本文認為圖書館可與其他機構或資源平臺合作,提供更廣泛的信息服務,通過共享資源和知識,促進“長尾”需求的滿足。
圖書館的信息資源建設應將有限的經費和人力投入對讀者最重要和最有價值的資源建設上,通過分析讀者的借閱情況和反饋可以確定哪些資源最受讀者歡迎和最有價值,這些資源應成為圖書館重點建設的對象。本次研究可以確定CADAL的讀者對資源利用情況確實呈現長尾現象,因此本文認為圖書館應該盡可能擴展數字資源的范圍,提供多樣化的信息服務以滿足讀者“長尾”需求,不應忽視學習和研究的多樣性。
但通過進一步數據分析,本文還發現約20%的常用圖書可以滿足約61%的讀者需求,有70%的冷門信息資源利用率不到30%,借閱次數少于10次的書籍利用率約占89.92%,大約40%的書籍僅被借閱一次。因此本文還認為對于資源有限的圖書館,應將有限的采購經費優先用于購買占據讀者需求的重要資源,如對于需求量較大、借閱量較高的學科主題,可以加大資源采購力度,確保這些學科主題的資源建設得到更多的重視和投入,這樣能在有限的條件下最大限度地滿足讀者的借閱需求。而在圖書館的布局設計中,可以將重要資源、熱門區域或服務放置在易于訪問和吸引人的位置,對于數字資源平臺,可以將熱門資源放在首頁或推薦板塊,以提高資源的可獲取性和利用率。