馮曉娜 沈亞婕 于元勛 馮 曉 付露瑤 劉文云
為進一步提高全民數字素養與技能,構建數字中國,建設教育強國,促進教育數字化轉型和智能化,中央網絡安全和信息化委員會于2021 年11 月5 日發布了《提升全民數字素養和技能行動綱要》,凸顯了國家對全民數字素養的重視。國際圖聯建議圖書館應全力以赴,為提升公民的數字素養做出貢獻,從規劃設計、經費和人員投入等方面予以充分支持,將培養讀者的數字素養能力納入圖書館服務的核心內容。在大數據技術應用和用戶需求多元化的背景下,我們需要深入了解用戶對數字素養知識的需求,并利用新型智能技術創新教育模式,以滿足用戶多元化的個性需求,從而提升用戶的數字素養能力。
用戶畫像技術具有準確預測用戶需求的能力,為圖書館的智慧化推送和個性化教育提供了新的思路。目前,基于用戶畫像的智慧化推送和個性化教育的研究主要關注學習者自身的知識需求和興趣愛好,但忽略了用戶可能存在的素養短板、知識盲區等方面的挖掘和推送。這導致學生只接觸到符合其偏好的教育資源,無法全面按照數字素養能力框架進行發展。因此,本文旨在構建基于全面數字素養需求的用戶畫像養成模型,以滿足用戶個性化數字素養教育和全面數字素養提升的目標。
文獻調研發現,已有數字素養教育的研究主要側重于調研數字素養教育現狀、挖掘數字素養教育影響因素、豐富數字素養教育內容、創新數字素養教育形式等方面。黃燕[1]對全國10 所高校883 位高校的數字素養進行了調研,結果顯示,當前高校圖書館數字檢索能力薄弱,存在數字檢索渠道不夠廣泛、數字安全意識不強、數字創新力不足等問題;耿榮娜[2]利用DEMATEL 方法識別了數字素養教育關鍵影響因素,研究發現,高校數字素養政策、數字素養教育環境、ICT 基礎設施、數字素養教學管理和數字素養評價體系等對高校數字素養教育起關鍵推動作用,以期對高校大學生數字素養教育的落實路徑的制定有所借鑒;馬捷[3]等人對公民的數字需求進行了探索,在此基礎上,從構建數字素養內涵體系、拓寬數字素養實踐的方式、構建數字素養應急教育系統三個方面,探討了構建我國高校數字的新途徑;董岳珂[4]將數字素養引入MOOC 課程學習,拓展了數字素養教育線上教育形式。
我國高校圖書館數字素養教育尚處于初步探索階段:第一,用戶數字素養學習需求表現出階段性、多樣性、層次性,以及滿足程度差異性,人們更加期望能夠獲得及時的、個性化的針對性訓練。第二,開設多種類型的教學,例如MOOC,線下課程、混合式課程,講座和微課等,但是內容統一、刻板,不具針對性,無法實時滿足用戶的個性化能力提升需求。第三,缺乏黏性,不適應用戶終身素養提升。高校圖書館數字素養教育的對象多是群體性和粗顆粒的受眾,其服務模式遠未達到個性化、及時化和精準化,數字素養教育往往停留在淺層次上而無法適應數字技術和數字環境的變化。
隨著用戶畫像在各場景中的應用,為解決上述問題,筆者認為要提升用戶數字素養能力,應結合用戶畫像技術來實現培育模式。
用戶畫像(User Profile)的概念最早由Alan Cooper 提出,是指以真實數據為基礎,對目標用戶進行建模,從大量數據中抽取用戶特征的圖像集合[5],其通過可視化分析技術快速、精準分析用戶行為模式、消費習慣等數據[6],能夠準確地預測用戶的實際需要和潛在需要,從而為各個產業提供精準的服務,提升用戶體驗奠定了基礎。在圖書館領域,用戶畫像準確的預測用戶需求并為之提供匹配度較高資源的特性為圖書館的智慧化推送與個性化教育提供了新的思路。
(1)智慧化推送:劉海鷗[7]等人利用多標簽分類算法,從用戶多維興趣特征標簽維度構建了用戶的興趣畫像,從而實現了信息資源推送結果的多樣化;盧思佳[8]等深度挖掘用戶全方位的知識需求,刻畫了圖書館知識服務中的用戶畫像,有效緩解了高校圖書館粗放式知識服務供給與用戶個性化知識需求之間的矛盾,從而推動了知識需求對應的知識產品的生成,大幅提升了知識資源服務效能;Mahak Dhanda和Vijay Verma[9]提出的高效項集挖掘技術(High Utility Itemset Minng Technique, HUIM),將論文內容和科研人員興趣偏好進行對比分析,為科研人員推送學術論文,滿足其個性化要求;吳智勤[10]等利用社交網絡分析法深度刻畫了用戶隱藏需求特征畫像,有效提升了圖書館隱性知識服務效率。
(2)個性化教育:徐暢[11]等人根據用戶的需求、興趣繪制用戶畫像實現用戶信息素養教育的精準化和個性化;朱青[12]等人提出基于異質性的用戶標簽體系設計層次分明的信息素養教育內容,動態契合用戶畫像與教學科研節點;尹婷婷[13]等人通過對學習者個性特征的描述、學習需求的識別繪制了學習者需求畫像,構建了教育資源個性化推薦服務模型。
通過分析國內外具有代表性的數字素養框架,進行合并整理相似能力領域,將數字素養基礎能力劃分為7 個層次,如表1 所示。

表1 數字素養核心能力框架
根據數字素養的能力要求,本文基于數字素養框架能力體系構建了動態多維度標簽的數字素養知識需求畫像方法。該方法主要包括兩個方面:首先,在畫像構建體系中構建實時數字素養知識需求畫像,動態跟蹤用戶閱讀行為,以解決用戶的實時數字素養知識需求,并實現教育資源的實時個性化推送。其次,引入機器學習等相關技術,實現數字素養能力測評、計算和分析模型。通過將用戶的原始數據與數字素養能力框架進行對比、分析和預測,識別用戶數字素養的短板和能力缺陷。這樣可以彌補用戶對數字素養的感知不足,提供有針對性的能力培養和教育資源,從而提高數字素養知識需求畫像的質量,實現用戶數字素養能力的全面發展,同時也促進圖書館數字素養教育的提升。通過這種方法,可以更準確地理解和滿足用戶的數字素養知識需求,為他們提供個性化的教育資源和能力培養,從而實現用戶數字素養能力的全面發展,并推動圖書館數字素養教育的提升。
在本研究中,用戶數字素養知識需求的數據收集和需求主題分析是構建和修正用戶畫像的基礎。由于不同用戶具有不同的知識結構、工作重點和情境,其數字素養知識需求的內容和層次各不相同。為了準確描述用戶的個性化需求和動態需求,并及時提升他們的數字素養能力,選擇能夠刻畫用戶實時數字素養知識需求的關鍵指標是用戶數字素養知識需求畫像指標體系的關鍵。
本研究主要從數據收集層、數據標簽層、畫像構建層和畫像應用層四個層次考慮了數字素養動態養成用戶畫像的構建流程,如圖1 所示。通過這個流程,可以收集用戶的個性化需求和動態需求,并準確描述用戶的數字素養知識需求,以滿足他們的需求并提升他們的數字素養能力。同時,為了加強對用戶隱私問題的審查和管理,以全面維護用戶數據的安全,必須將用戶隱私保護融入到用戶畫像構建的全過程中[8]。

圖1 用戶畫像構建模型
用戶數字素養知識需求包括用戶在學習、生活等場景中應具備的數字素養能力,涉及用戶的學習階段、興趣愛好及能力變化等因素,因而在用戶畫像數據搜集階段,本文融合Nasraoui[14]與Adomavicius[15]的用戶動態行為畫像模型構建方法,將用戶數字素養知識需求畫像的信息收集涵蓋了“靜態穩定”用戶基本信息及“動態可變”用戶行為信息、使用場景信息、用戶數字能力測評信息兩部分屬性,著重四類信息的收集。
(1)用戶基本信息。用戶數字素養知識需求畫像基本信息構成要素為:用戶的基本素養、學歷層次、專業類別、已有研究成果等。為了確保用戶畫像建設質量,可以依據學校歸檔范圍表制定學校大數據采集計劃,整合學校用戶大數據資源[16],大數據歸檔資源相比于用戶自己填寫的用戶基本信息,具有數據真實準確、齊全完整、及時迅速、安全可靠等優勢[16]。該階段要注意對用戶數據進行加密處理,確保用戶基本信息不被泄露。
(2)用戶行為信息。借鑒楊帆[17]的以畫像分析為基礎的圖書館大數據構建方法,提出用戶數字素養知識需求畫像行為信息構成要素為:在校園網內檢索、查閱、文獻傳遞、在線瀏覽、圖書收藏、最新關注、學術興趣、搜索渠道、檢索行為、檢索偏好、網站訪問等動態行為數據。由于用戶數字素養知識需求會隨著環境變化而有動態性改變,為滿足用戶數字素養行為的動態監測需求,利用嵌入系統的頁面行為監控插件收集用戶行為數據;同時為精確表達數字素養實時需求,可借鑒區塊鏈的時間戳技術[18]動態監測整個數字素養水平生命周期,清晰展示出數字素養知識需求整個生命周期發展路徑展示用戶的需求、偏好、意愿、觀點等數據。
(3)使用場景信息。借鑒《行動綱要》提出了全民數字生活、數字學習、數字工作、數字創新四大場景,基于在這四大場景中映射出現實場景內部的數字素養知識與技能,為用戶提供數字素養教育。在動態行為需求監控同時,利用傳感器和移動終端等設備,獲取用戶的情境數據,包括用戶在某功能頁面的操作交互和視覺、跨功能界面的操作路徑等,最終提取場景標簽。
(4)用戶數字素養能力信息。用戶實時數字素養能力信息是構建基于框架缺失能力框架的核心部分。為獲取用戶實時數字素養能力真實數據,主要分為以下幾個步驟:①基于數字素養核心能力框架構建數字素養能力評價指標體系。②依據數字素養能力評價指標體系設立測試模塊:分為初始測試和教育過程中的測試,以獲取用戶的初始數字素養能力和實時數字素養能力數據。將收集到的用戶數據及時同步至用戶信息庫中,為后續的數據預處理提供數據基礎。
在數據處理階段,主要涉及以下兩點:第一,用戶數據清洗。刪除與用戶需求服務不相關信息、過濾價值低的數據、刪除重復數據[19]。第二,用戶數據分析。首先實現潛在用戶數據的全流程挖掘,通過關聯分析、變異分析等技術手段剔除與數字素養教育不相關數據,通過語義分析等算法進行分類挖掘,提煉出用戶數字素養知識需求的語言表達形式。同時由于信息行為等半結構化數據和非結構化數據冗雜,且需要更多的時間進行預處理,為提高用戶數據分析效率應將多維度用戶數據轉化為維度一致的結構數據。在該階段,應注重用戶實際需求,避免對數據進行過度挖掘。該階段使用了數據的分類、聚類、合并、關聯等多種方法完成用戶識別與用戶多維信息采集工作,由此建立用戶信息數據庫,通過對用戶相關數據進行聚類與統計分析處理后,形成具有數字素養知識需求特質用戶畫像數據。
構建用戶畫像模型需要采集并處理用戶數據后,通過分析數據中關鍵詞匯及文本來抽取用戶特征標簽[7]。其中,用戶基本屬性維度標簽、場景維度標簽能夠不經加工直接生成;而需求主題特征維度數據及框架能力缺失主題特征維度數據需經過一定的加工過程才能夠確定標簽的屬性。
本文基于數字素養核心能力框架進行用戶畫像構建,因此在主題加工聚類方面,結合上表1 中“數字素養核心能力框架”將數字素養知識主題如下分類:數字信息源選取、數字技術的學習及操作、專業信息獲取與檢索技巧、數字信息處理與協作、數字信息批判性反思與創新、數字信息安全意識及數字倫理道德、數字實踐。
(1)需求主題標簽加工。LDA 模型以概率為基礎,善于利用文本發現用戶的需求主題,并對用戶的集中關注點和特征詞進行分析。在需求主題挖掘方面,本文以LDA 技術挖掘用戶的數字知識素養需求主題為例,對用戶行為中的搜索關鍵詞進行爬取,通過LDA 主題挖掘技術對這些關鍵詞進行搜索主題聚類,具體步驟如下:①對用戶的搜索語句進行爬取,歸檔后做分詞,并過濾掉無意義詞,得到語料集合W={w1,w2,…,wx}。②對這些詞做統計,得到集合p(wi|d)。③為語料集合W 中的每個wi,指定對應到某個主題t 中,作為初始主題。④通過Gibbs Sampling 公式,重新采樣每個w 的所屬主題t,并在語料中更新直到Gibbs Sampling 收斂。收斂以后得到主題—詞的概率矩陣,這個就是LDA 矩陣,而文檔—主題的概率矩陣也是能得到的,統計后,就能得到文檔-主題的概率分布。⑤得到XX 個主題,這些主題含有和文章列出的主題不相關的,以及具有噪聲的干擾的主題,經過人工判別,剔除掉不相干的主題,最終得到和本文相同或相近的主題。
本研究使用LDA 主題模型計算公式,如公式(1)所示:
(2)缺失主題類目加工。該階段首先應基于用戶數字素養能力評價體系對用戶數字素養能力測評進行分析,對比出用戶缺失能力數據,進行歸檔后做分詞,得出語料集合N={N1,N2,NX},下面步驟與上文中需求主題標簽加工②~⑤類似,剔除掉不相關主題,最終得到用戶缺失主題類目。
標簽體系構建是構建用戶畫像的關鍵一步,用戶畫像多維度標簽能夠體現用戶多變性,將其抽象成圖像,并與用戶動態需求相結合[20],從而實現圖書館個性化數字素養教育服務。如表2 所示為用戶數字素養知識需求標簽體系和框架能力缺失標簽體系。

表2 用戶畫像標簽指標體系
表2 使用了用戶畫像特征指標建立畫像標簽,其中用戶基本屬性維度標簽、場景維度標簽可直接生成,而主題特征維度數據需經過加工才能確定標簽屬性。在此階段,可采用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法進行標簽聚類,輸出用戶畫像。同時,需加強畫像隱私保護,對信息進行加密處理并限制使用權限。
在構建完成多維度的標簽體系后,通過標簽匹配構建出相應的用戶畫像。
(1)實時需求用戶畫像。通過分析用戶的基本屬性、場景屬性和需求主題特征,構建多維標簽的數字素養知識需求模型。匹配和整合這些標簽,創建用戶畫像模型,形成實時需求用戶畫像數據庫。用戶基本屬性數據來源于全流程數據集合深度挖掘的結果,而用戶場景維度根據人機交互行為確認。需求主題特征維度包括數字信息源選取、數字技術學習與操作、專業信息獲取與檢索技巧、數字信息處理與協作、數字信息批判性反思與創新、數字信息安全意識與數字倫理道德、數字實踐等。這些維度的分析有助于全面了解用戶需求和興趣,為提供個性化的數字素養教育服務提供依據。
(2)長時需求用戶畫像。利用大數據技術,可以通過動態行為監測對用戶的使用場景和行為信息進行標記,并準確提取用戶最新的訪問行為特征。通過挖掘具有相似興趣和偏好的知識需求之間的關聯度,可以揭示出知識需求之間的隱藏關聯。同時,結合用戶的基本信息和訪問節點(如備考階段、開題階段、論文撰寫階段等),可以分析收集到的用戶信息,從而預測用戶的需求偏好。通過對用戶需求的預測,可以構建出在某個特定節點內的長期需求的用戶畫像。這樣的用戶畫像能夠更好地滿足用戶的個性化需求。
(3)框架能力缺失用戶畫像。以上實時需求的用戶畫像描繪出用戶對數字素養和興趣偏好等屬性的實時需求,長時需求也是根據用戶行為信息對用戶某段時間節點的知識需求、偏好進行預測,這種基于需求推送的資源和服務,皆為顯性需求,用戶自身存在的數字素養短板、盲點,即用戶沒有感知到數字素養弱項不能根據顯性需求而獲得。因此,需要基于數字素養能力框架繪制框架能力缺失用戶畫像,如圖2所示。

圖2 框架能力缺失用戶畫像流程
框架能力缺失用戶畫像基于上述數字素養核心能力框架產生,分為以下幾個步驟:①基于以上數字素養能力測評結果與數字素養核心能力框架進行對比,找出測評數據與數字素養能力框架對比出能力欠缺部分,測評數據并能及時地反饋用戶的數字素養能力水平,有利于對用戶畫像進行優化并實現對用戶動態畫像模型的構建,準確掌握用戶需求動態變化情況。②根據欠缺部分對用戶數字素養能力二級指標進行全面對比分析,將缺失能力數據歸檔后,應用LDA 技術挖掘其欠缺能力主題,并打上缺失能力標簽。其中缺失能力主題依據核心能力框架主題類目產生,包括數字信息源選取、數字技術的學習及操作、專業信息獲取與檢索技巧、數字信息處理與協作、數字信息批判性反思與創新、數字信息安全意識及數字倫理道德、數字實踐7 個子維度。③依據以上缺失能力主題標簽,構建指標體系,最終應用DBSCAN 算法,實現標簽聚類,繪制成最終的基于核心能力框架的缺失能力用戶畫像。
(4)全面需求用戶畫像。全面需求用戶畫像不僅描繪了用戶興趣、及時的知識需求,還包含用戶未察覺的基于數字素養核心能力框架的知識短板。因此全面需求畫像沿著上述畫像的生成過程產生,將用戶缺失能力畫像與用戶實時、長時需求畫像進行反饋對比;最后將用戶欠缺的數字素養能力但是用戶自身未察覺的能力需求補齊,形成最終的全面需求用戶畫像。
基于用戶畫像可以同時開展實時精準型、長時養成型數字素養教育。其中,實時精準型數字素養教育基于實時用戶需求畫像與數字素養資源語義匹配后進行的知識推薦結果,解決實時用戶數字素養知識需求;長時養成型數字素養教育是基于全面需求用戶畫像,整合相關數字素養資源,對用戶實行長期穩定的個性化數字素養教育,既可以大幅提升數字素養精準化個性化效率,又能提升用戶全面數字素養能力,如圖3 所示。

圖3 數字素養教育優化模式
只有當知識精準服務于用戶需求時,“知識服務”才可以被認為是高質量的,高校實時精準型數字素養教育的核心就是把用戶需求精準銜接數字素養教育資源。僅對用戶數字素養需求畫像解剖還不夠,需要通過建立“畫像對接+服務匹配+反饋優化+畫像修正+畫像對接”的循環式畫像迭代和實時精準數字素養教育實施機制,進一步實現用戶需求與數字素養資源供給的精準對接。
4.1.1 畫像對接與服務匹配
在用戶畫像創建流程中,考慮到場景的多變性與常見性,故添加“使用場景”這一影響因素,創建了反映用戶的數字素養知識需求主題特征的畫像,進而將用戶畫像與使用場景所綜合呈現出來的用戶數字素養知識需求全貌與數字素養教育資源相對接,通過需求匹配、語義匹配、知識匹配、實體融合等算法途徑篩選出資源匹配的最優解,為其提供知識地圖、知識報告、知識定制、知識咨詢等知識產品及服務。
4.1.2 反饋優化與畫像修正
當用戶收到對應知識產品和服務時,可以通過評價反饋渠道將自身數字素養知識需求和數字素養知識服務匹配度,以及當前知識服務滿意度等指標量化評價并反饋。圖書館則運用關聯數據技術,通過對收集獲取到的用戶需求反饋節點及其內部的關聯進行標準化的語義表示,從而建立了用戶數字素養需求的語義網絡。用戶評估反饋數字素養需求語義網反作用到用戶畫像建立和數字素養教育資源庫中,對數據進一步修改和完善,細化用戶畫像,盡可能向用戶提供匹配度高的數字素養教育服務,極大提升問題解決效率,并增強用戶的依賴性與滿意度。當獲得新的知識服務時,用戶還會重新評估反饋并持續發揮作用到用戶畫像創建過程中去。及時得到用戶的反饋信息,并在此基礎上優化精準數字素養教育,有利于對用戶畫像進行優化并實現對用戶動態畫像模型的構建,準確掌握用戶需求動態變化情況,保持知識服務準確有效。在此過程中,高校圖書館數字素養教育的供給逐漸逼近其用戶的真實數字素養知識需求。
長時養成型數字素養教育不僅滿足用戶長時數字素養知識需求,還是一個基于數字素養能力框架不斷補齊用戶數字素養能力短板,為用戶長遠數字素養知識需求提供服務的方案集合。其在實時分析用戶畫像數字素養知識需求和用戶自主設置的知識需求基礎上,對用戶某節點的知識需求進行預測,同時將數字素養能力測評結果與數字素養能力框架對比,挖掘、預測追蹤用戶數字素養能力欠缺范疇,全面綜合勾勒出用戶相對長期的、穩定的且規律的知識需求。其演繹產生長效數字素養教育方案,結合用戶參與數字素養培訓、測試的結果,分析學生數字素養能力現狀,擬定符合用戶能力要求的漸進式數字素養培養計劃。自動啟動特定主題領域內的資源最新動態追蹤,將文本、圖像和音視頻等多模態資源整合查詢并深度加工,以實現多模態信息之間的相互轉換,向用戶端智能推送以主動更新。
數字素養教育是高校圖書館在數字環境下開展教育服務所肩負的一項新任務。本研究根據數字素養能力框架對用戶進行數字素養能力評估,彌補了用戶本身沒有感知到的對數字素養的認知要求,改變了過去單純依賴用戶本身興趣、喜好的用戶畫像建構過程,關注用戶所欠缺的數字素養,重構了一個較為完整的以數字素養能力框架為核心的需求畫像,提出了基于畫像的實時精準、長時養成數字素養教育,為提升圖書館知識服務能力及用戶數字素養能力提供了一定的理論基礎和應用借鑒。