陳亮
(上海圖書館上??茖W技術情報研究所,上海200030)
當前,人工智能、無線網絡和大數據均獲得了極為快速的發(fā)展,人們的工作、生活均發(fā)生了一定改變。在大數據等先進技術的影響下,豐富的網絡資源得到了整合與優(yōu)化配置,無論信息的更新與傳遞速度有多快,人們總能夠便捷地通過各種途徑獲得所需要的信息和資料。傳統(tǒng)圖書館的發(fā)展在此背景下受到了越來越嚴峻的挑戰(zhàn),作為文獻信息的中心,圖書館應該如何將海量的、龐雜的網絡信息進行整合與精準推送成為其必須要思考的問題。
基于用戶行為的精準化推送服務平臺在構建時必須要將大數據作為基礎的理論,在大數據的支撐下實現復雜網絡資源的整合與優(yōu)化,繼而滿足大眾的個性化信息資源獲取與利用需求。
大數據亦稱為巨量資料,主要是指其所涉及的資料量的規(guī)模十分巨大,已經無法通過目前所能夠接觸和應用的主流軟件工具進行測量。與此同時,大數據亦是只在合理的時間內通過對先進技術加以科學應用后,促使人們更加便捷的獲取、管理與處理的資訊信息。
大數據的特點主要包括四個方面,即大量(Volume)、高速(Velocity)、多樣(Variety)和價值(Value)。其中,大量主要是指大數據中存在著巨大體量的數據,能夠從TB的級別升級到PB的級別;高速則主要是指數據的處理速度比較快,基本上為1s定律;多樣主要是指,大數據的類型十分繁多,包括網絡視頻、網絡圖片、網絡日志、網絡地理位置信息等內容;價值主要是指大數據具有比較低的價值密度,亦具有比較高的商業(yè)價值[1]。圖書館基于用戶行為并應用大數據技術,將能夠更加科學地構建并運行精準化推送服務平臺,為大眾創(chuàng)造更多便利的獲取資料信息的條件。
圖書館中資源發(fā)現過程與揭示過程均與元數據之間存在密切的關聯(lián),建設元數據庫即元數據倉儲系統(tǒng),更加有有利于整合并存儲各類型的元數據,為大眾進行一站式檢索提供便利條件。基于用戶行為的精準化推送服務平臺構建中進行元數據庫的建設,其數據的采編具有工作量大、長期等特點,且來源比較分散,主要包括互聯(lián)網、購置的電子數據庫和館藏數據等。
基于用戶行為的精準化推送服務平臺進行個人特征數據庫的建設和完善,將可以進一步提高個性化服務的質量,保證數據具有更高的精準性。創(chuàng)建個人特征數據庫時必須要求初次使用該平臺的用戶進行信息錄入,包括姓名、身份證號、職業(yè)等,圖書館內部平臺便根據該部分信息進行用戶注冊,將相同類別的用戶進行劃分,從而形成集成注冊用戶的資料信息痕跡[2]。在此基礎上,完善個人特征數據庫時必須要對用戶個體的閱讀行為加以分析,包括參與活動情況、借閱歷史、檢索方向等內容,以便更進一步地挖掘用戶個性化需求,保證精準化推送服務平臺的相關資料信息與需求之間產生更高的密切度。
基于用戶行為的精準化推送服務平臺屬于現今圖書館個性化服務的重要組成部分,其主要根據用戶的個人特征數據庫相關信息對用戶的個性化偏好、需求等做出準確的分析,并且科學地應用數據挖掘技術準確向用戶推送相關資料信息。在此方面,圖書館必須要進行精準推送模型的建設。精準推送模式主要包括基于相關用戶文獻推送和基于相關文獻的推送兩種[3]。以第二種為例進行精準推送模型的建設,首先要進行題目、關鍵詞、摘要、期刊等相關影響因素的選定;其次要對評估值P進行計算,P值越大代表各項影響因素與用戶需求信息的相似度越高,該P值的計算公式為式(1);最后,進行各項影響因素得分的計算。

該公式當中,ωi代表第i項影響精準化推送服務的因素權值,Fi則代表了第i項影響精準化推送服務因素的得分。根據上述計算最終可以得出相對精準的,符合用戶需求的,基于大數據技術的文檔。
圖書館進行基于用戶行為的精準化推送服務平臺構建后,必須首先確定開發(fā)平臺方能夠展開進一步的實行。該平臺當中應該包括基于主題的網絡爬蟲技術數據采集程序、基于移動端的應用系統(tǒng)和基于PC段的WEB應用系統(tǒng)。同時,該平臺需要將Boot Strap不同終端良好兼容性、Easy UI多控件和豐富功能等長處進行有效結合,繼而確定采用C#開發(fā)語言以及微軟開發(fā)的SQL Server 2008 R2數據庫作為整個精準化推送服務平臺實現的平臺支持[4]。
圖書館基于用戶行為的精準化推送服務平臺實現中亦需要展開功能設計。該平臺的使用人員包括了圖書館館員以及面向社會各界的大眾,其中,圖書館館員主要負責審核注冊用戶信息,統(tǒng)計系統(tǒng)自動采集數據并分析、提取精準化推送信息。社會各界大眾則需要通過PC段的WEB應用或者移動端應用進行資料、信息的瀏覽、下載、收藏等。整個服務平臺的功能基本上如圖1所示:

圖1 基于用戶行為的精準化推送服務平臺功能
在上述功能當中,應用服務平臺服務的對象為普通大眾,審核管理平臺面向的為圖書館館員,數據采集服務為一組數據采集程序,后臺服務程序則按照數據采集服務獲得的信息為用戶進行信息需求分類與精準化推送。
綜上所述,現代信息技術的快速發(fā)展為人們的工作和生活均提供了越來越便利的條件。同時,各個領域均逐漸滲入了以人為本的思想,均希望能夠制定個性化的發(fā)展方案。對于圖書館而言,其更需要在大數據技術與互聯(lián)網技術背景下積極構建基于用戶行為的精準化推送服務平臺,通過建設元數據庫,個人特征數據庫和精準推送模型,科學地確定開發(fā)平臺并展開平臺功能設計,為廣大平臺用戶提供更加精準化的推送服務,促使圖書館事業(yè)得到健康可持續(xù)發(fā)展。