孟志強 李慧



摘 要:高校各學部的讀者借閱特征不同,文章基于對應分析方法,選取吉林某高校2012—2014級本科生大學期間借閱數據進行多維度分析,揭示了不同專業不同年級本科生的借閱行為特征。研究結果有助于高校圖書館合理建設館藏體系,適時正向引導同方向讀者的閱讀行為,解決現有高校圖書館的館藏文獻與高校讀者需求不匹配的問題。
關鍵詞:圖書館數據;對應分析;借閱行為
項目基金:吉林省社科基金項目《基于語義的高校圖書館數字資源聚合研究》(項目編號:2019wt39)研究成果;吉林大學基本科研業務費哲學社會科學研究種子基金項目《廣度關聯與深度語義融合的數字圖書館資源聚合服務質量評價與提升策略研究》(項目編號:2017ZZ026)研究成果
引言
隨著目前的技術手段的完善,大數據分析已經不再構成技術瓶頸[1]。挖掘各院系(專業)讀者的需求,并對各院系(專業)讀者在不同年級的閱讀需求變化進行精細分析,已經提上日程。通過對讀者借閱行為特征進行分析研究,為圖書館文獻采購提供科學的依據,為相關讀者提供精準服務推送并對圖書分布進行合理規劃安排。這個問題是一種典型的屬性數據處理的問題[2]。所以本文采用屬性數據的處理方法——對應分析來進行分析研究。
本文研究了2012—2014級本科生的借閱行為特征,這些學生來源于8個不同學部(白求恩學部,地球科學學部,工學部,農學部,人文學部,社會科學學部,信息科學學部,理學部),涵蓋了該高校的主要學科類別,能夠確保研究數據具有較高的覆蓋面。所選學部學生的在校時間均為5年,相比4年的本學學部,可以提供更加穩定豐富的數據支持。
1.1 對應分析
對應分析方法是在r型和q型因子分析的基礎上發展出來的一種多元統計分析方法,又稱r-q型因子分析[3]。它比因子分析更適合樣本量大的數據。對應分析主要用于分析二維列表或可以表示為二維表的數據。它依賴于主成分分析中的降維方法,可以在低維空間中更直觀地觀察和分析行變量與列變量之間的關系[4]。通過對應分析,可以在二維分布圖上反映行變量和列變量的分布特征以及行變量和列變量的各類之間的關系[5]。如果不同類別的行變量有相同的特性,它們在對應圖上的分布會彼此接近,相似度越高。這同樣適用于不同類別的列變量的分布[6]。不僅如此,如果某些類別的行變量和列變量之間有密切的關系,它們在對應圖上也會彼此接近。
1.2 常規簡單統計方法及結果
為了分析不同學年學生的借閱行為特征,我們首先繪制了學年-圖書借閱量的折線圖。在考慮學年借閱行為特征的時候,為了消除學部屬性對圖書借閱量的影響,我們分別根據8個學部的數據獨立地做了不同折線圖。
折線圖表現如下:
第一,對于同一種書目,在不同學年它的借閱量是不同的。
第二,在相同學年不同書目的借閱量不同。
第三,對于同種書目,在相同學年里每個學部的借閱量也是有差異的。
第四,對于3個年級他們的折線的趨勢幾乎相同,這表明我們所發現的規律是具有穩定性的。
此外,我們可以看到每個書目的借閱量并得到其隨學年的變化趨勢。然而,正是這些書目使得其他書目的發展趨勢難以識別,所以我們刪除了這些比其他書目借閱量大得多的書目,重新做了折線圖,如圖1所示。
通過圖1我們可以看到每個書目的借閱數量并得到每個書目隨學年的變化趨勢。例如,對于地球科學學部,我們可以看到在移除書目‘i‘t‘o‘h后,書目“k”“p”“b”“f”“x”被學生借得較多,且呈現出不同的變化情況。可見:學生在不同學部和學年需要借用不同的書目。為了更好地發現潛在規律,對比內容整理成表格1。
1.3 對應分析在讀者借閱數據上的應用及結果
不同學年和不同學部的學生通常借用不同的書目,我們也在第1.2小節中做了一些簡單的分析。在這一部分,我們將通過對應分析進一步分析學生的借閱行為特征。首先,對各學部單獨進行了對應分析以反映各學部的借閱行為特征。數據組織結構如下:行變量為學年,列變量為22個書目。我們選擇所有書目和2012級、2013級、2014級學生的在校學年作為對應分析的屬性,發現不同學部的借閱行為特征是不同的,如:地球科學學部的學生在第一學年、第二學年和第三學年借書傾向是不同的,而在第四學年和第五學年借用同樣的書目。在第二學年更偏向借閱書目“s”“i”“d”“h”“j”“k”,在第三學年更偏向借閱書目“t”“f”“q”“d”“h”,在第四學年和第五學年則更偏向借閱書目“x”“t”“f”“n”“p”。
選擇2014年的圖書借閱情況進行進一步分析,分析結果如圖2和圖3所示。
在圖2中,我們找不到更多的東西,因為數據點太近,很難區分。因此,我們在移除白求恩醫學部后重新做了對應分析,得出了圖3。分析可知:首先,我們分析各學部之間以及各學年之間的關系。人文學部和社會科學學部是兩個獨立學部,不與其他學部產生交叉。工學部和信息科學學部有很強的相似性。這主要反映在他們的學生在第四、五學年借的書目非常相似。工學部、農學部和地球科學學部在第一學年和第二學年相互交叉。各學部間的具體聯系我們用圖4表示。單從書目的角度來看,我們發現22種書目聚集成了5個類別,第1類包含書目“f”“d”,第2類包含書目“a”“b”“c”“g”“i”“j”“k”“h”“z”,第3類包含書目“e”“n”“q”“o”,第4類包含書目“s”“x”“p”“r”,第5類包含書目“t”“u”“v”。
2 結論與討論
首先,通過對吉林某高校的圖書館的數據的分析,我們得出了一些結論。一是對于同一種書目不同學年的借閱量是有差異的;二是在相同學年不同書目的借閱情況也是有差異的;三是對于同種書目,在同一學年中每個學部的借閱情況是有差異的;四是在不同學部和學年里學生的借閱偏好不同;五是一些學部之間有關聯;六是根據某種規則書目可以被分成幾個類別。
然后,這些結論對圖書館的服務與管理產生一些幫助。一是我們建議圖書館在不同學年向學生推薦最合適的書,例如,對于工學部的學生,在第二學年向其推薦書目“i”“o”,在第三學年向其推薦“h”,在第五學年向其推薦“t”“u”。這種推薦體系將激發學生的閱讀興趣,提高圖書利用率。二是我們發現不同學部的學生借閱不同的書目,有些書目只被一個學部大量借閱,而有些書目則被許多學部大量借閱,還有一些書目幾乎不被任何學部大量借閱。三是從對應分析中我們知道一些書目聚集在一起,這表明聚集在一起的圖書有很強的聯系。因此,就圖書分布而言,我們建議將書目“f”“d”放在一起,書目“a”“b”“c”“g”“i”“j”“k”“h”“z”放在一起,書目“e”“n”“q”“o”放在一起,書目“s”“x”“p”“r”放在一起,書目“t”“u”“v”放在一起,使讀者更容易找到他們需要的書。
最后,高校圖書館可以根據相近閱讀特征的讀者需求將資源進行歸納整合,形成多個同類型資源子庫,進而合并成大學生就業指導數據總庫,并在圖書館服務網站掛出就業指導資源總庫鏈接,這樣相關專業的畢業生就可以根據需求,在高校圖書館獲得相應的資源支撐,進而幫助學生獲得提升。
參考文獻
[1]陳列柱.高校學生利用圖書館紙本資源現狀調查[J].中國報業,2019(12):46-47.
[2]ShiozakiR,Eisenschitz T.Role and Justification of Web Archiving by National Libraries:A Questionnaire Survey[J].Journal of Librarianship&Information Science,2009,41(2):90-107.
[3]Greenacre,Michael J.Multiple correspondence analysis and related methods[M].Chapman&Hall/CRC,2006:148-156.
[4]黃維玲,成全.基于Logistic模型的高校學生借閱行為影響因素分析[J].武漢理工大學學報(信息與管理工程版),2021,43(3):268-274.
[5]施國良,張瀟瀟,楊小莉.高校讀者群體差異對其借閱行為和閱讀偏好的影響研究[J].圖書館,2020(4):59-64,78.
[6]艾金勇.基于關聯規則的高校圖書館讀者借閱行為研究——以西藏民族大學圖書館為例[J].西藏民族大學學報(哲學社會科學版),2017,38(4):142-146.
作者簡介:孟志強(1976— ),吉林大學圖書館館員,研究方向:數據挖掘;李慧(1983— ),吉林大學圖書館副研究館員,研究方向:信息分析。