999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校圖書館學科服務小數據系統的構建與優化*

2021-12-03 00:18:44張鳳斌
圖書館 2021年11期
關鍵詞:學科圖書館用戶

張鳳斌

(東北林業大學圖書館 哈爾濱 150040)

1 引言

近年來,“小數據”應用成為國內圖書館界的一個研究熱點。本文通過“中國知網”以主題詞“小數據+圖書館”進行檢索,從2015年1月到2020年12月,共計獲得76篇文獻,經過篩查后獲得相關文獻52篇。通過梳理分析發現,研究主題和內容主要集中于理論研究方面,如小數據概念及內涵[1-2]、圖書館小數據定義及內涵[3-4]、小數據應用策略[5-6]、小數據應用服務模式[7-8]等;實踐研究方面比較薄弱,缺乏對小數據應用涉及的實際問題及解決方案的深入探討,如小數據在圖書館中的技術角色定位、小數據在技術層面與圖書館現有技術系統的銜接等。從總體情況來看,目前還沒有形成比較成熟的理論體系和可以普遍推廣的應用模式。

小數據是在大數據環境下衍生出來的一類新興數據,是以個人為中心的全方位數據集合,具有鮮明的個體獨特性,也稱之為“量化自我(Quantified Self)”。美國學者德波哈爾·艾斯汀(D.Estrin)在2013年首次提出小數據概念,他認為小數據是“全部有關于‘我’的數據(small data where n=me)”[9],“個體用戶的小數據是其日常行為活動的全部表征”[10],他指出“從個體用戶數據中提取出的具有個性化特征的數據將有效地揭示個體用戶行為模式規律”[11]。由此可見,小數據思維與圖書館“以人為本”服務理念高度契合,這也是小數據應用成為圖書館界研究熱點的原因所在。但是目前研究成果主要集中于理論層面,在實踐層面探索較少。

小數據的產生源于實踐,具有很強的實踐性,小數據研究應從圖書館業務工作中尋找切入點,針對某項實際業務工作把理論知識與實踐研究相結合,探索構建符合實際業務需要的、具有可操作性的小數據應用系統。高校圖書館學科服務工作是一項核心業務,在一定程度上代表了圖書館服務能力和服務水平。目前學科服務存在的主要缺陷是服務精準程度不足,主要原因在于用戶提出的需求是顯性需求,只是實際需求的一部分;而另一部分是用戶沒有表達出來的隱性需求,這種潛在需求與其學習工作經歷、專業知識結構等因素密切相關。在傳統思維下,個人隱性需求存在于其潛意識中,外界無法識別。但是在小數據思維下,這個難題具有破解的可能性,即通過個人行為數據發現和預測個人需求特征,使隱性需求顯性化,從而為學科服務實現精準化創造前提條件。

2 高校圖書館學科服務用戶類型及小數據構成分析

2.1 學科服務用戶類型分析

高校圖書館學科服務用戶是在校師生,從群體特征來看,可以劃分為三個類型:教學型用戶、科研型用戶和學習型用戶。因為學科用戶類型和層次存在差異,其信息需求和服務需求方面也呈現出不同特點。

(1)教學型用戶:教師以授課為主,在教案準備和課程教學中,需要與教學相關的學科資源導航、課程建設相關資源及精品課件推薦、在線教學、學科最新信息推送,以及教參服務、教學支持服務、館際互借、文獻傳遞服務等。

(2)科研型用戶:科研人員需要把握學科前沿發展態勢,跟蹤學科研究動態,了解借鑒他人研究成果、先進方法和技術,包括文獻調研、查新查引、文獻傳遞、資源推薦、專利分析、深度學科咨詢服務、深層次學科信息加工服務等,以及科研成果發表、鑒定評價和獲獎等信息。

(3)學習型用戶:在校學生任務是學習專業知識和完成畢業論文,本科生的需求主要在學習支持方面,包括教學參考書、工具書、考級考證輔導資料,以及信息素養培訓、在線課程和在線閱讀等;研究生則對專業期刊、學位論文及投稿指導等的需求比較多。

2.2 高校圖書館學科服務用戶小數據構成分析

小數據應用具有明確的目的性,首先需要明確有待解決的實際問題,其次確定需要哪些數據支撐。就高校圖書館學科服務而言,小數據應用是為了解決準確發現用戶信息需求的問題,其相關數據蘊含在學習、教學、科研利用的各類信息管理系統中。通過文獻梳理與分析,學科服務用戶數據構成主要包括兩個方面:基本特征數據、各類行為特征數據,其具體內容如表1所示。

表1 高校圖書館學科服務用戶小數據構成

3 高校圖書館學科服務小數據系統構建

3.1 學科服務小數據系統開發應用的價值

小數據系統是圍繞個體的全方位數據及其配套的收集、處理、分析和對外交互的綜合系統[12],通過采集、分析學科用戶個人特征數據,動態地識別學科用戶個體的顯、隱性信息需求,在此基礎之上提供與學科用戶需求匹配的服務和資源,實現個性化、精準化的學科服務目標。進一步而言,高校圖書館學科服務小數據系統是大數據環境下的一個子系統,設計開發的根本目的是更加精準地描繪、預測與分析用戶需求,同時根據不同階段用戶行為的變化,通過聚類分析、協同過濾等技術手段,不斷調整推薦、決策參考方案,進而實現為用戶提供個性化強、精準度高的服務效能。此外,小數據系統是以“機器為主,人力為輔”的運行模式,各種應用系統和智能設備成為數據采集、存儲、傳輸和處理的主體,人力只在模型設計、參數設置、編輯矯正等環節發揮作用。因而,學科服務小數據系統將提高學科服務的精準度,并減輕學科館員在學科服務中的工作強度。

3.2 學科服務小數據系統的基礎組織結構

(1)數據采集、數據預處理、數據存儲。這一過程主要是利用Hadoop2.0分布式平臺的數據提取、轉換與加載的ETL(Extract-Transform-Load)工具與Hive數據倉儲工具實現操作處理。其中,Hadoop2.0是Apache軟件基金會基于Java語言開發的開源分布式計算平臺,主要包括數據存儲HDFS、作業調度與資源管理框架YARN、并行處理數據計算框架MapReduce。而Hive是Hadoop的一個數據倉儲工具,可將結構化數據文件映射為數據庫表并存儲到HDFS上,并提供了類似SQL查詢語言,可把SQL語句轉換為MapReduce程序運行。

數據采集是基于Hadoop2.0的學科服務小數據應用系統通過API接口或Heritrix網絡爬蟲采集獲取用戶的注冊信息、使用日志、咨詢交互等數據,依據采集路徑可分為靜態數據采集和動態數據采集:①靜態數據是存儲在高校各類信息管理系統中的個人信息,如基本特征數據(年齡、專業、學歷等)、教學行為數據(教學科目、課時數、學生人數等)、科研行為數據(發表論文情況、科研項目情況等)。②動態數據是高校圖書館學科服務用戶與圖書館的一切關聯行為數據,通過圖書館信息集成管理系統提取出來,如圖書期刊借閱、圖書館網頁查詢、查新查引、文獻傳遞、訪問移動圖書館 App等。

數據預處理、數據存儲是基于Hadoop2.0的存儲工具HDFS聯合HBase、DataWrangler等對采集的數據進行分類、去重、標引、關聯等,進而去除無關數據、平滑噪聲、填補遺漏數據,實現數據標準化、規范化,將其集成歸約并分布式存儲于用戶屬性庫、用戶行為庫,或者根據用戶畫像進行用戶需求分析,抽取出特定資源存儲到基礎資源庫。

(2)標簽模型建立、數據挖掘分析、畫像模型建立與質量評估:①標簽模型建立,在數據存儲的基礎上結合數據的分類特征建立用戶、資源的標簽庫,構建標簽體系,實現用戶與資源特征標簽化。②數據挖掘分析,運用Hadoop2.0+Mahout+RapidMiner數據挖掘工具進行分類、聚類、回歸、關聯規則等多算法多維度分析用戶需求、行為與資源標簽體系,建立相互關聯的基礎資源畫像與用戶畫像模型。③畫像模型建立與質量評估,畫像建模需要根據相關數據進行質量評估,不斷反饋、修正、優化與完善。而畫像質量評估包括服務收益率Pser、用戶滿意度Dsat兩個指標,其中Pser權重比例為r,Dsat權重比例為1-r,那么評估結果是W=rPser+(1-r)Dsat,0<W≤100[13]。

圖1 學科服務小數據應用系統與組織結構圖

3.3 學科服務小數據應用系統的主要功能

(1)個性化檢索與推薦:①個性化檢索,借助用戶畫像提供的信息需求、偏愛主題數據進行挖掘與可視化分析,為個體量身定制檢索式以實現用戶個性化檢索。在檢索結果排序與反饋上,根據用戶畫像對需求度的預判,實現檢索結果按相關度從大到小降序排列,并在每個檢索結果頁面設有“需要”“一般”“不需要”的快速選擇反饋模塊,動態修正用戶需求度,以持續優化服務效果。②個性化推薦,通過畫像模型完善Mahout協同過濾與推薦功能,解決評分難、稀疏性與冷啟動的問題,實現個性化推薦。用戶畫像深度挖掘分析、動態預測出用戶需求、興趣習慣,資源畫像對學科資源進行語義化、標簽化描述實現內容特征提取。兩類畫像相互匹配、關聯映射,輔以應用情境、協同等要素特征,優化完善子系統精準推薦性能,并構建了深度學習召回算法策略,有效提高了用戶服務滿意度和黏合度。

(2)精準營銷:①用戶分析與群組劃分,追蹤并采用數據挖掘工具對用戶行為、資源特征標簽及畫像數據進行多維度分析,實現群體需求差異化分類,把有共同背景、目的、興趣習慣的學者、專家與科研團隊精細劃分,形成不同的領域和主題組別,并對群組內成員的參與度和活躍程度進行分析。②服務精準推送及反饋,將學科服務產品或宣傳內容傳遞給指定用戶或群體,避免有關信息對其他用戶造成困擾。同時注重用戶評價與反饋意見,實現“傳遞—反饋—再傳遞—再反饋”的交互營銷過程,動態優化用戶畫像,并融合移動化、社交化與本地化SoLoMo服務內涵,發揮營銷效應,深化圖書館服務策略,樹立圖書館優質服務品牌。

(3)決策參考:①圖書館資源與服務,決策參考子系統對學科用戶、資源、業務服務等產生的數據進行全面融合、畫像智慧分析,揭示發現隱藏在數據背后的模式和規律,形成大量數據分析報告,可為圖書館進行資源采購配置、業務類型調整、規章制定等提供決策依據。②用戶認知,基于用戶畫像對用戶行為需求、興趣愛好等主題標簽進行長期跟蹤、變化分析解讀,可為學科用戶研究、教學、學習的發展方向提供參考依據,豐富用戶自我認知途徑。

(4)知識發現:①數據準備階段是數據采集、數據預處理、數據存儲環節。②數據挖掘階段,運用Mahout、RapidMiner數據挖掘系統以及SAS、SPSS、Matlab等統計與可視化工具,根據任務選擇合適算法對數據進行科學分析與知識發現。③結果評價與解釋階段,利用畫像模型分析用戶知識需求,關聯匹配去除無關和冗余內容,將所需成果展示給學科用戶。

4 高校圖書館學科服務小數據系統的優化

4.1 精確定位用戶,建立用戶需求模型

高校圖書館學科服務的邏輯起點是用戶信息需求,準確識別用戶信息需求是實現精準化學科服務的前提條件。目前高校圖書館在滿足學科服務用戶信息需求方面主要存在兩個問題:一是面向用戶群體的普適性服務,難以滿足學科用戶個性化的信息需求;二是僅能識別用戶提出的顯性信息需求,對于用戶未表述出來的隱性信息需求很難識別,用戶信息需求識別不完整,導致學科服務精準程度不高。

針對上述存在的問題,小數據應用系統從以下兩個方面提供解決方案:①精確定位個體用戶。通過小數據應用系統用戶入口進行注冊,個體用戶即可獲取系統唯一定位標記,同時授權高校圖書館采集其個人特征數據;②建立用戶信息需求模型。小數據應用系統通過個人特征數據分析發現其隱性信息需求,從而使其轉化為顯性信息需求,使用戶全部信息需求完整呈現出來。

4.2 強化技術導向,提升學科館員工作效能

學科館員是高校圖書館學科服務工作的主體,參與學科服務工作的各個環節,不僅包括分析用戶信息需求、制定服務策略、為用戶提供服務等,還要負責對口院系聯絡、學科服務平臺維護、學科信息資源建設等。由此可見,學科館員既要具有某個專業的學科知識背景又要精通圖書館業務。目前高校圖書館學科服務普遍存在學科館員數量配置不足的問題,由于人力資源成本限制,只有少數高校圖書館能夠做到按照院系配置學科館員,大多數高校圖書館學科館員都需兼顧兩個或以上的院系的學科服務工作。由此可見,學科館員面臨的工作任務比較繁重,導致工作效能降低。

針對上述存在的問題,從強化技術導向出發,可以采取的解決方案包括兩個部分:①小數據應用系統。通過用戶個體特征數據整合、分析,發現和預測其個性化信息需求特征,為精準化學科服務提供依據;②智能化學科服務平臺。根據小數據應用系統提供的用戶個體信息需求,自動進行信息資源挖掘與整合,然后精準推送給用戶。上述解決方案的最大特點是以“機器為主,人力為輔”,各應用系統和智能設備成為數據采集、存儲、傳輸和處理的主體,人力只在模型設計、參數設置、編輯矯正等環節發揮作用。學科館員可以充分利用數據技術發展成果,融入學科服務的業務流程中,提高學科服務工作的智能化、自動化水平,從而提升工作效能。

4.3 優化學科服務平臺功能,為用戶提供個性化智能服務

目前國內多數高校圖書館建立了學科服務平臺,但對其承擔的任務與實現功能的定位尚不夠清晰,大部分以信息資源組織與揭示為主體,以學科信息資源導航方式為依托,雖然具有一定的體系與功能,但缺乏精準的用戶劃分,沒有將用戶的知識背景、專業與信息行為、階段性需求等融為一體作為信息需求參照。小數據應用系統就是為了準確發現用戶信息需求,解決學科服務精準化程度低、針對性不強的問題。

針對上述存在的問題,從優化學科服務平臺功能出發,小數據應用系統的優勢體現在:①個性化檢索與推薦。通過引入用戶畫像模型、推薦技術,構建學科服務智能個性化檢索與推薦系統,過濾大數據通用檢索系統相同處理過程和無差別結果所包括的與需求無關的信息;②精準營銷。通過運用SoLoMo的社交網絡精準營銷服務模塊設計,實現用戶分析與群組劃分、服務精準推送及反饋,解決當前學科服務平臺專指度低、精準性差的問題;③決策參考。通過用戶行為特征標簽化、可視化、具象化呈現個性化的用戶需求,挖掘資源與用戶兩類畫像數據以指導圖書館資源、服務發展方向與用戶認知路徑,可對學科資源質量、服務內容評估提供定量到定性的驗證依據;④知識發現。通過數據準備、數據挖掘與結果評價揭示隱性科研知識,應用數據挖掘算法按特定方式和閾值挖掘抽取出有價值的知識和模式,并進行評價和解釋[14]。

5 結語

隨著時代發展和技術進步,高校圖書館學科服務理念也在不斷演變,從以圖書館為中心到以用戶為中心,從文獻服務到知識服務,從普適服務到精準服務。高校圖書館精準化學科服務是“在普適服務基礎上面向用戶個性化需求而建立的以用戶問題為導向的服務模式”[15],學科服務實現精準服務需要“準確識別和定位用戶,并緊貼用戶特征和環境,更細致而動態地識別用戶顯性、隱性需求,提供對接需求的更優質服務和資源配置方案”[16]。

小數據思維與學科服務精準化理念高度契合,本文選擇學科服務作為小數據應用實踐研究的切入點,在技術層面以用戶數據為核心元素,探索構建具有收集、處理、分析和對外交互功能的小數據應用系統。從技術角度來看,在高校圖書館現有技術設施和信息資源基礎上,學科服務小數據應用系統具有可行性和可操作性;從實施角度來看,主要取決于兩個因素,一是資金投入和技術人員配備,二是需要整合分散在高校不同管理部門的用戶數據。由此可見,學科服務小數據系統應該納入高校建設發展規劃,在高校統籌協調下分階段逐步實施。

(來稿時間:2021年4月)

猜你喜歡
學科圖書館用戶
【學科新書導覽】
土木工程學科簡介
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
“超學科”來啦
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
飛躍圖書館
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
論新形勢下統一戰線學學科在統戰工作實踐中的創新
圖書館里的是是非非
主站蜘蛛池模板: 全色黄大色大片免费久久老太| 中文字幕在线视频免费| 美女免费黄网站| 日本一区高清| 精品一区二区三区视频免费观看| 99热这里只有精品免费国产| 欧美午夜在线观看| 制服丝袜无码每日更新| 一级毛片免费播放视频| 国产视频大全| 在线日韩日本国产亚洲| 欧美日韩精品在线播放| 国产一二视频| 97国产在线视频| 无码高潮喷水在线观看| 99精品国产自在现线观看| 国产无码在线调教| 曰韩人妻一区二区三区| 亚洲成人77777| 欧美一区精品| 19国产精品麻豆免费观看| 亚洲va在线观看| 在线中文字幕网| 超碰aⅴ人人做人人爽欧美| 日韩av电影一区二区三区四区| 国产午夜精品一区二区三区软件| 蝌蚪国产精品视频第一页| 国产浮力第一页永久地址| 欧美性爱精品一区二区三区| 亚洲中文字幕无码爆乳| 亚洲V日韩V无码一区二区| 中文一级毛片| 欧美日本激情| 天堂成人在线视频| 亚洲第一成人在线| 波多野结衣中文字幕一区| 国产精品久久精品| 91无码人妻精品一区| 玖玖精品视频在线观看| 久久精品这里只有精99品| 青青网在线国产| 国产精品青青| 久久久91人妻无码精品蜜桃HD| 乱系列中文字幕在线视频 | 九九热精品视频在线| 色婷婷色丁香| 国产激情国语对白普通话| 美女啪啪无遮挡| 中日无码在线观看| 伊人久综合| 中文字幕日韩视频欧美一区| 亚洲精品无码高潮喷水A| 欧美国产综合色视频| 视频二区国产精品职场同事| av天堂最新版在线| 国产91特黄特色A级毛片| 国产欧美日韩在线在线不卡视频| 亚洲成人动漫在线观看| 久久精品人人做人人综合试看| 国产办公室秘书无码精品| 国产喷水视频| 草逼视频国产| 国产人免费人成免费视频| 国产乱码精品一区二区三区中文| 丰满的熟女一区二区三区l| 国产丝袜无码精品| 一级毛片a女人刺激视频免费| 久热精品免费| 四虎精品国产永久在线观看| av手机版在线播放| 57pao国产成视频免费播放| 亚洲色婷婷一区二区| 毛片网站免费在线观看| 小说 亚洲 无码 精品| 免费人成视网站在线不卡| 一本色道久久88| 无码视频国产精品一区二区| 高清无码手机在线观看| www.日韩三级| 国产成人精品高清在线| 久久无码av三级| 亚洲成人一区在线|