陳可生 王彬
摘 要:為進一步了解山東省公共圖書館總體發展情況,文章收集整理了2021年山東省各地公共圖書館的從業人員、總藏量、每百人藏量等指標,采用主成分分析法和聚類分析法將山東省各地公共圖書館劃分為4類,以分析各類公共圖書館存在的差異,從而得出全省各地公共圖書館的發展狀況。
關鍵詞:山東省公共圖書館;主成分分析法;聚類分析法;發展不平衡;區域差異
中圖分類號:G258.2 文獻標識碼:A 文章編號:1003-1588(2024)05-0005-04
為更好了解山東省公共圖書館總體發展情況,筆者以2021年山東省地市公共圖書館報送文化和旅游部的數據為依據,選取代表性指標,包括從業人員、圖書總藏量、每百人藏量、主館建筑面積、讀者活動、累計借書證、分館及其他流動服務點、指導縣級圖書館數、年文獻外借量等,利用SPSS軟件,采用主成分分析法和聚類分析法,對各地市公共圖書館指標的總體情況進行量化分析,以揭示山東省公共圖書館的發展現狀及區域差異。
1 相關研究概述
筆者在中國知網以“圖書館+差異”“圖書館+不平衡”“圖書館+不均衡”為關鍵詞進行檢索,按文獻引用和下載進行排序分析后得到以下具有代表性的研究成果:鄭京華對31個省、市、自治區的公共圖書館進行主成分分析和聚類分析,把公共圖書館劃分為8個類型,認為我國公共圖書館發展存在較明顯的區域差異性[1];葉華等對浙江省11個地市公共圖書館進行主成分分析和聚類分析,將浙江省公共圖書館分為4大類型區,發現浙江省公共圖書館同樣存在發展不均衡問題[2];宋振玲等對我國公共圖書館藏書量在空間上的總體分布情況進行分析后發現,公共圖書館藏書量在南北、東西兩個方向上的分布呈現明顯差異,東西方向上呈單調遞減分布,南北方向上呈倒U形分布,認為區域經濟發展水平和財政投入是影響藏書量最大、最直接的原因[3];王婷等采用DEA-Malmquist指數模型對2010—2017年我國31省、市、自治區的省、市、縣三級公共圖書館面板數據進行了分析,發現各級公共圖書館效率總體呈上升趨勢,其中省級公共圖書館效率最高,縣級次之,市級最低,東部和中部普遍存在投入規模不合理問題,西部則面臨運營管理落后的困境[4]。上述全國性公共圖書館研究及區域性公共圖書館研究對于了解公共圖書館的發展狀況具有一定的借鑒意義。為更好了解山東省公共圖書館的總體發展情況,筆者選取山東省16家公共圖書館的相關指標,采用主成分分析法和聚類分析法對不同區域公共圖書館的發展情況進行研究,以期通過數據化方式呈現全省公共圖書館發展存在的差異。
2 研究方法
2.1 主成分分析法
主成分分析法(Principal Component Analysis,PCA)是在統計學和數據分析中常用的降維統計方法。PCA是將數據點投影到一個超平面,選取方差盡可能大、相互正交且互不相關的特征作為數據點的主成分,使數據點在超平面上的投影盡可能分開。該分析法的優勢是通過PCA映射得到若干主成分特征,既能消除冗余數據又能最大限度地保留原始數據信息[5]。
2.2 聚類分析法
聚類分析法是一種進行區域差異分析和劃分類型的數學方法,目的是把分類對象按照一定規則分成組或類,這些組或類不是事先給定或以經濟確定的,而是根據數據特征而定的。
3 指標選取
本研究以2021年山東省各地市公共圖書館報送文化和旅游部的數據為依據,選取其中反映圖書館事業發展的9項代表性指標,通過這9項指標反映公共圖書館的空間、基礎服務、拓展服務等內容,詳見表1。
4 主成分分析和聚類分析
4.1 主成分分析
4.1.1 適用性檢驗。筆者采用社會科學統計軟件(SPSS)對本次研究數據進行主成分分析,顯示KMO為0.782,大于0.6;數據通過球形度檢驗,p<0.05,滿足因子分析的前提要求,說明數據可用于主成分分析研究。因子分析共提取了2個因子,特征根值均大于1,前兩個主成分解釋了全部方差的73.279%,說明提取的兩個主成分能夠代表原來所有信息的73.279%,詳見表2。提取主成分對于評價公共圖書館發展情況具有一定作用,本研究提取的兩個主成分分別為Y1、Y2。
4.1.2 計算主成分系數。對表2的主成分分析模塊運行結果進行分析,計算得到Y1、Y2的線性組合:Y1=0.41*從業人員+0.42*總藏量+0.31*每百人藏量+0.27*主館建筑面積+0.34*讀者活動+0.35*累計借書證+0.30*分館及其他流動服務點+0.16*指導縣級圖書館數量+0.37*年文獻外借量。Y2=0.06*從業人員+0.01*總藏量-0.27*每百人藏量-0.13*主館建筑面積+0.02*讀者活動+0.11*累計借書證-0.04*分館及其他流動服務點+0.38*指導縣級圖書館數量。由此可知,主成分Y1是從業人員數量、總藏量、主館建筑面積、舉辦活動、借書證、每百人藏量、年文獻外借量等指標的綜合反映,主成分Y2則是指導縣級圖書館數量這一指標的單一反映,兩個指標能夠較好地反映山東省公共圖書館的發展狀況。
4.1.3 主成分得分和綜合得分。筆者根據主成分方程計算主成分得分,以各主成分方差貢獻率占比為權重計算綜合得分,結果顯示,濟南市圖書館、青島市圖書館的主成分Y1、Y2得分和綜合得分居于前列,而德州市圖書館、聊城市圖書館、濱州市圖書館的綜合得分和主成分Y1得分較低。從因子分析得到的各因子得分和綜合得分看,綜合得分受主成分Y1得分的影響較大,說明主成分Y1對各地市公共圖書館的發展影響較大。從得分情況看,濟南市圖書館無論是基礎建設(館舍面積、每百人藏量等)還是服務狀況(讀者活動等)都較好,在全省公共圖書館中處于領先地位;德州市圖書館、聊城市圖書館、濱州市圖書館的主成分Y1得分較低,亟須增加藏書量和活動舉辦次數,以吸引公眾走進圖書館。
4.2 聚類分析
筆者將因子分析的結果進行系統聚類分析,區間測度采用平方歐式距離,根據聚類分析譜系圖將圖書館分為4類,詳見表3。
4.2.1 第一類:濟南市圖書館和青島市圖書館。濟南市圖書館和青島市圖書館作為兩個副省級公共圖書館,各項指標均比較突出,尤其是濟南市圖書館,無論是主館建筑面積,還是從業人員數量、總藏量、舉辦活動次數、分館數量以及年文獻外借數量均處于全省領先地位。青島市圖書館的累計借書證、從業人員數量、總藏量以及讀者活動數量等也居山東省公共圖書館前列。
4.2.2 第二類:威海市圖書館、東營市圖書館、日照市圖書館、淄博市圖書館。相較于第一類圖書館,第二類圖書館除主館建筑面積和每百人藏量外,其他方面都存在一定差距,特別是總藏量和累計借書證,第二類圖書館的總藏量平均值為114.6萬冊,與第一類的375.47萬冊差了3倍;累計借書證平均值為10.66萬個,與第一類42.38萬個的平均值相比差了近4倍。需注意的是,第二類中累計借書證數量最多的是東營市圖書館(14萬個)、數量最少的是威海市圖書館(8.9萬個),可見即便是處于同一類的圖書館其差距也是相當大的。
4.2.3 第三類:濟寧市圖書館、煙臺圖書館、臨沂市圖書館、濰坊市圖書館。第三類圖書館與第二類圖書館相比差距不大,甚至在年文獻外借量、累計借書證等方面略有超出。第三類與第二類的主要區分指標是每百人藏量,據《山東統計年鑒2020》數據顯示,臨沂、濰坊、濟寧、煙臺位于山東省各地市2019年年末總人口數的前幾位[6],可見其每百人藏量低是由于人口基數大造成的,僅為第二類的34%,因而將其歸為第三類。
4.2.4 第四類:濱州市圖書館、菏澤市圖書館、泰安市圖書館、聊城市圖書館、棗莊市圖書館、德州市圖書館。第四類圖書館的各項指標數據都比較低,其總藏量、讀者活動、累計借書證分別為第一類的15%、19%、18%,差距極大,其他指標數據也都在第一類的23%~36%之間,可見第四類圖書館在山東省各地市公共圖書館中的發展相對較弱。
4.2.5 結論。第一類圖書館綜合實力最強,在山東省公共圖書館事業發展中具有標桿示范作用;第三類圖書館發展情況與第二類圖書館總體差別不大,但人均方面存在巨大差異,應以公平性、普惠性、便利性服務為標準促進圖書館事業發展;第四類圖書館在各方面都比較薄弱,應繼續完善基礎設施建設,提升基本服務能力。
5 結語
本次調查顯示,山東省各地市公共圖書館發展差異明顯,亟須均衡發展,提高服務效能。全省公共圖書館要適應高質量發展要求,將圖書館建設成為滋養民族心靈、培育文化自信的重要場所,爭取政府財政支持,保障建設資金和文獻資源穩步增長,通過開展更多高質量的閱讀活動匯聚讀者,擴大服務覆蓋面,逐步縮小區域間圖書館發展差異,推動圖書館事業健康持續發展。
參考文獻:
[1] 鄭京華.我國公共圖書館發展的區域差異分析[J].圖書館雜志,2006(5):36-40,43.
[2] 葉華,陳修穎.浙江省公共圖書館發展的區域差異分析[J].圖書館理論與實踐,2009(1):94-96.
[3] 宋振玲,楊奎奇.全國公共圖書館藏書量區域差異與成因分析[J].圖書館學刊,2013(1):10-13,17.
[4] 王婷,李少惠.我國公共圖書館效率的層級差異及其動因分析[J].國家圖書館學刊,2020(5):11-20.
[5] 劉敬浩,孫曉偉,金杰.基于主成分分析和循環神經網絡的入侵檢測模型[J].中文信息學報,2020(10):105-112.
[6] 山東統計年鑒2020[EB/OL].[2022-12-13].http://tjj.shandong.gov.cn/tjnj/nj2020/zk/indexch.htm.