圖書館是知識傳播的載體。經過多年運行,圖書館系統積累了大量原始數據, 如圖書數據以及讀者數據等。在信息化時代,圖書館可以運用大數據技術對現有數據進行分析, 以掌握讀者的閱讀行為習慣和規律, 進而改進工作, 推動圖書館事業高質量發展。
一、大數據技術應用在圖書館建設和管理中的現實意義
在圖書館建設和管理過程中, 大數據技術可以對圖書館信息中一些隱藏信息進行檢索、提取和應用。這既能提升圖書館的管理質量,又能針對讀者的借閱信息進行系統分析。通過對讀者借閱情況的掌握與挖掘,可以精準地預測讀者的閱讀需求,進而為讀者提供個性化服務。
大數據技術在圖書館的廣泛應用, 可在一定的程度上推動圖書館服務功能革新。圖書館每天都有大量的圖書被來回借閱和歸還, 生成的數據信息非常之多, 在管理工作中使用數據挖掘技術可以給館內借閱工作帶來便利,提高工作效率。
當然, 數據信息技術的應用也需要滿足一些基本條件,如數據庫信息要真實、有效、全面,應當是讀者感興趣的信息,必須是有利用價值的信息等。
二、圖書館閱讀行為的類別
(一)讀者的到館行為
讀者為滿足自身的借閱需求, 主動到圖書館后發生的檢索、借閱等行為是讀者的到館行為。一般情況下,讀者會外借紙質圖書,也會主動尋找自己所需圖書,還有的讀者會在圖書館上自習。部分讀者進館是為享受圖書館優良的硬件設施以及安靜的環境,接受文化熏陶。基于以上讀者目的,圖書館應創新手段吸引讀者主動走進圖書館,如舉辦主題類活動、經典音樂電影解讀等。除傳統圖書館以外,近些年來還興起了24 小時借閱館和汽車圖書館以及臨時圖書館等,這些館外圖書館也同樣具有借閱文獻的功能,能夠滿足人民群眾的需求。
本文選取某大型公共圖書館作為研究對象,收集一年內的進出館記錄、借閱記錄、電子資源使用記錄等。數據預處理包括數據清洗、格式轉換和標準化等步驟。從讀者到館行為分析,主要有以下幾點:
(1)到館時間分布:根據進出館記錄,可以統計得出讀者每天、每周和每月的到館時間分布。結果顯示,工作日的高峰時段為18:00-21:00,周末的高峰時段為10:00-14:00 和16:00-20:00。這表明讀者在工作日下班后和周末的休閑時間更傾向于到訪圖書館。
(2)到館頻率分析:統計結果顯示,每月到訪圖書館1-3 次的讀者占比最大,為45%;其次是4-6次, 占比30%;7 次以上的高頻到訪者占比20%;而首次到訪的新讀者占比5%。
(3)到館目的分析:通過對讀者的借閱記錄和電子資源使用記錄進行分析, 發現65%的讀者主要目的是借閱圖書;20%的讀者使用電子資源;10%的讀者參加圖書館活動;5%的讀者為自習或休閑。
(4)服務使用情況:數據顯示,自助借還書機的使用率為75%, 人工服務窗口的使用率為25%。此外,電子閱覽區的使用時長平均每人每次為2小時。
(二)讀者的數字閱讀行為
隨著計算機技術和網絡技術的發展, 圖書館的形態已經由傳統的物理圖書館轉變為虛擬圖書館。圖書館的服務也由傳統的看得見、摸得著的服務轉變為虛擬性服務。讀者可以打破時間和空間限制,隨時隨地登錄圖書館網站, 在數字圖書館內享受所有的數字資源。在這種模式下,圖書館可以通過數字系統更精準掌握讀者的相關數據,包括登錄數據、瀏覽數據、閱讀數據等,可以據此給讀者提供更具個性化的服務。比如可以根據讀者閱讀興趣,給讀者推送他們感興趣的書籍,從而提升讀者滿意度。
(三)讀者的交互行為
在信息技術和計算機技術發展加持下, 圖書館可以主動為讀者提供更個性化服務。讀者通過微信公眾號等公共平臺給圖書館提出建議, 圖書館對讀者建議歸納總結,然后進行響應。這種有效交互行為能夠進一步優化館藏結構,進而為讀者更好服務。讀者之間也可發生互動交往行為。比如,圖書館組織讀書話劇社或者小型閱讀沙龍, 將有相同興趣愛好的讀者組織起來,提供更好服務。
本文選取某大型公共圖書館作為研究對象,通過圖書館管理系統、社交媒體平臺等渠道收集一年內的讀者交互數據。數據預處理包括數據清洗、格式轉換和標準化等步驟。在交互行為分析中,主要包含以下幾點。
(1)互動頻率分析:根據圖書館管理系統記錄的數據顯示,讀者之間的互動頻率較高,平均每位讀者每月與其他讀者互動次數為15 次。其中,通過社交媒體平臺進行的互動占比45%, 面對面交流占比55%。
(2)交流內容分析:通過對社交媒體平臺上的交流內容進行分析, 發現讀者之間的交流主要涉及圖書推薦、閱讀心得分享、學術討論等方面。其中,圖書推薦占比最大,為35%,閱讀心得分享占比25%,學術討論占比20%,其他交流內容占比20%。
(3)活動參與分析:圖書館經常舉辦各類活動,如講座、研討會、讀書會等。數據顯示,平均每次活動的參與人數為80人,活動參與率為75%。參與活動的讀者中,有60%的讀者表示通過活動結識新朋友。
(4)影響因素分析:運用回歸分析等方法,探討影響讀者交互行為的因素。結果表明,讀者的年齡、教育程度、興趣愛好等個人特征以及圖書館提供的社交環境和活動質量對讀者的交互行為具有顯著影響。
三、大數據技術分析圖書館讀者借閱行為的方法
對館內的讀者借閱行為進行分析是指圖書館獲取多結構的數據以后對數據信息進行融合分析,在關聯數據模型的構建下,分析讀者的借閱行為。圖書館可以從用戶的信息中發現用戶到訪規律, 然后對比讀者到館規律和館內服務政策, 找準服務中存在的問題,對服務方式進行改進。
在數據挖掘技術下分析讀者的借閱行為, 需要運用語義分析技術、信息感知技術、圖文轉換技術以及GIS技術,分三步對數據進行處理,分別是數據采集、摸索規律、規律養成。圖書館完成相關分析后以公眾能夠接受的方式表達出來。
數據收集需要用到的工具主要有chukka、sci(be、flume 等,而對數據進行挖掘需要運用的算法主要有packager、art、K-ea, 再用互聯網統計工具對數據進行處理。一般從數據預處理開始,經過降噪數據、篩選數據、轉換數據,直到合成數據。預處理數據和降噪數據既要挑選有價值的數據, 也要對部分數據進行修補。篩選數據和轉換數據應當在相關規則下進行,通過數據間的關系,將具有內在聯系的數據組提取出來,從而挑選出有價值的信息。
四、圖書館應用大數據技術為讀者提供服務的策略
數據挖掘技術能夠對館內讀者的借閱信息進行分析和處理, 還能按照統計出來的借閱信息分析讀者的借閱需求以及圖書館館藏情況。
在具體操作上, 首先要對讀者的借閱信息進行檢索,將檢索信息和現有讀者的閱讀數據進行對比,過濾無用信息, 按照固定的時間段對讀者的閱讀行為進行統計,然后再進行具體分析。對閱讀信息顯示的圖書進行分類處理。對圖書借閱分類的時候可使用統計的方法, 將T 類圖書按照二級類目進行分類, 然后將非T 類圖書按照一級類目進行分類,在分類結束以后, 數據挖掘技術可以自動地將不同類別的圖書借閱量和借閱圖書的比例統計出來, 還可將不同類別圖書借閱量和圖書館的館藏比例計算出來。
讀者數據采集完成后, 圖書館會對讀者的行為信息進行存儲,然后在適當的時候進行分析,進而采取有效措施提高圖書館的服務質量和效率。
首先, 圖書館在服務管理中可以有效運用這些數據分析讀者閱讀行為,為其制定適合的閱讀清單,讀者自己就能實時掌握自己的借閱情況, 還可以了解自己的借閱偏好和借閱頻率等。此外,讀者還能及時接收圖書館推送的相關信息。圖書館將閱讀報告推送給讀者具有多種形式。除移動圖書館、讀者自由活動空間以外,還可以借助電子郵件。讀者也可以通過媒體來分享,比如微博號和微信公眾號等。每個季度和年度, 圖書館還可以給讀者推送總結性閱讀報告。該報告不僅能反映借閱圖書的頻率,還能反映出平均借閱率最高的圖書, 達到為讀者推薦好書的效果。此外,圖書館可以按照讀者年齡分度情況進行系統統計,然后將其反映在閱讀清單上。
其次,要構建專業的數據推送系統。圖書館應當對現有的推送系統進行優化, 通過數據挖掘技術對讀者群體進行分析,將其分解為不同類型,標記讀者興趣愛好、閱讀習慣以及相關需求等,從而為讀者提供有針對性服務,提高讀者滿意度。
最后, 應當科學運用數字顯示墻。信息化條件下,圖書館要努力提升自身競爭力,首先必須加強新興技術應用, 近些年來, 數顯技術發展已經逐漸成熟,LEF屏幕和各類的液晶顯示屏廣泛應用。圖書館可以在內部構建數字顯示墻, 并和圖書館數據信息平臺進行對接。此外,還可以和微博、微信等結合起來,這樣,到館人數、信息公告和新書推薦就能夠在第一時間推薦給讀者。此外,圖書館還可利用自身館建優勢給讀者設置專門的個性化區域。圖書館可以對借閱歷史進行分析,推算出讀者的閱讀模型,讀者通過刷卡在數據顯示墻上找尋自己想要的書籍,數字顯示墻會自動顯示書籍在架情況。這樣,圖書館的管理會更加有條理,讀者到館的體驗度會得到提高。
綜上所述,在大數據的背景下,對讀者的閱讀行為進行分析具有重要的現實意義。隨著時代的發展和科學技術的進步,電子化是圖書館給人們提供文獻服務的未來趨勢。圖書館要將傳統圖書館中的特色保留下來, 然后給讀者提供更具個性化的服務。圖書館應當通過數據挖掘進一步精準掌握讀者需求,實現和讀者的良性互動,在互動中彼此成長,彼此進步。
作者單位:甘肅省圖書館