999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校科研用戶畫像特征分析及案例研究

2020-07-23 06:38:02胡振寧龐弘燊
圖書館理論與實踐 2020年4期
關鍵詞:特征用戶信息

王 英,胡振寧,楊 巍,龐弘燊

(深圳大學圖書館)

1 科研用戶畫像研究概述

1.1 科研用戶特征研究的現狀和不足

國外圖書館界學者關于科研用戶特征的研究主要集中于用戶對資源的訪問及獲取、各類信息行為等方面,多采用訪談調查與實踐相結合的研究方式。如,在資源獲取方面,Hayman通過訪談得知讀者最關注的是專業數據庫全文獲取的便捷性;[1]在需求發現方面,Guo等通過研究提出瀏覽行為分析需求發現模型;[2]在查詢行為方面,通過對高校研究人員資源類型偏好、信息搜尋行為方式的調查,提出改善圖書館服務和技術等建議。此外還包括對數字行為、共享行為及影響因素、信息行為、學術行為等方面的研究。

國內同行同樣重視收集用戶需求、分析其行為偏好,部分學者面向讀者群體進行普遍信息行為特征研究。如,調查用戶需求并提出發展建議[3]、分析學術信息獲取偏好的影響因素[4]、構建移動圖書館用戶偏好模型[5]、基于偏好算法改善圖書館檢索系統等。[6]還有部分學者面向科研用戶進行科研信息獲取行為的各種專題研究。如,在行為特征方面,董欲超等采用自制科研人員信息量表調查不同級別項目中科研人員信息查詢行為特征及差異性;[7]在需求模型方面,王欣等從知識需求的獨特性和狀態多變性角度出發,構建隱式+顯式的科研用戶興趣模型,探究科研用戶知識推送服務模式;[8]在技術方法與實證方面,肖詩伯等通過分析科研用戶的各類特征,改進文獻推薦算法,并實證文獻推薦精準度的提高;[9]沙勇忠等分析特定科研機構的Web日志,揭示科研人員重要的網絡信息行為特征。[10]

總的來說,圖書館界對用戶行為特征和偏好的理論與實踐探索已較為豐富,對構建用戶畫像無疑具有很好的借鑒作用,但現有研究也存在不足。如,訪談調查和問卷調查偏多,存在一定的主觀性;研究內容集中于資源獲取、需求、偏好等方面,對一些客觀特征及網絡行為特征的揭示不夠全面;對用戶屬性特征的展示方式不夠直觀,用戶變化的動態性也未能充分表達。

1.2 用戶畫像技術研究和應用現狀

用戶畫像借助網絡技術和大數據方法,能夠捕捉用戶的“數據足跡”,對用戶屬性和行為特征的揭示更加全面和客觀,展示方式更為新穎獨特,廣泛應用于產品推薦和市場營銷。國外圖書館界在用戶研究中較早引入了用戶畫像的概念和方法,國內同行則在近三年以用戶畫像為熱點展開多方面的理論和實踐研究。

在理論研究方面,國內外研究都集中于用戶畫像的概念、構成要素、模型及構建方法。最早提出用戶畫像概念的是交互設計之父Cooper,他將用戶畫像定義為基于用戶真實數據的虛擬代表。Guimaraes等認為,用戶畫像的構成要素包括用戶的基本素養、文化水平、社會背景、社交情況、工作情況、交通情況、可支配時間等;[11]曾建勛指出,用戶畫像既包括學歷、職稱、職業等靜態信息,也包括搜索、瀏覽、點擊等用戶行為動態數據,并特別強調精準服務需要用戶畫像。[12]國內外學者根據對用戶畫像的理解和實踐探索,提出了不同的模型構建方法。Henczel提出,需求征集、數據采集與識別、問卷調查與訪談、初步成像、評估測試、動態反饋六階段來構建和持續維護用戶畫像的方法;[13]許鵬程等認為,通過從用戶多數據源中提取用戶標簽的形式來進行用戶畫像,是構建用戶畫像模型的核心,并從用戶的自然維度、興趣維度、社交維度構建三維多級用戶標簽體系;[14]高廣尚對用戶畫像的七種構建方法進行了綜述,并從邏輯思路、性能特點、局限性三個方面對用戶畫像構建方法進行了詳細的比較分析。[15]

在實踐應用方面,基于用戶畫像的圖書及資源個性化推薦在國內成為熱門的探索方向,并取得了實際效果。如,國家圖書館通過用戶畫像和資源畫像構建大數據平臺,[16]在特定讀者群和資源群內實現“以書找人、以人找書”。在科研學術大數據精準服務方面,謝靖等采集科研用戶的基本屬性信息、行為日志信息、發表文獻信息和社交活動信息,建立科研用戶數據組織架構,通過構建用戶畫像和資源內容畫像,將分類一致、標簽匹配度最高的內容推薦給用戶,從而實現千人千面的個性化資訊推薦服務。[17]國外研究者同樣把用戶畫像技術應用于信息推薦[18]或信息過濾[19]等方面。用戶畫像在應用過程中也存在難點問題,國外學者Nasraoui等提出用戶偏好演變是觀測難點,用戶畫像模型改進的重點是不斷增加或完善標簽項以提升畫像表達動態性的能力。[20]

綜上所述,用戶畫像作為一種較為成熟的技術和方法,應更深入地應用于圖書館對科研用戶的研究和服務中。本文從高校科研用戶的具體科研活動入手,全面總結科研用戶畫像涉及的各類特征,分析各類特征的數據來源和數據特點。同時以高校科研人員為研究對象,通過相關算法分析識別用戶特征,摹繪可視化的用戶畫像,為圖書館改進服務策略,實現有效精準的智慧化科研知識服務提供一定的參考。

2 高校科研用戶畫像特征分析

2.1 高校科研人員的科研活動

科研用戶是高校科研創造力的來源,研究科研用戶畫像的特征必須圍繞科研活動的全過程。科研活動主要包括科研管理活動和具體科研工作(見圖1)。科研管理活動一般由具有高學術水平的科研人員來領導和組織,包括對科研人員的指導、交流、評估和激勵等,是實施科研工作的根本保證。具體科研工作包括知識積累、科研立項、實驗或調研、成果形成、成果發布和保存等環節。在科研過程中,時刻伴隨著科研人員的各類需求,如開放獲取需求、課題查新需求、學術交流需求、學術價值評價需求等,這些主觀上的需求體現在科研人員圍繞科研所做的具體活動和行為上,如查詢信息行為、索取文獻行為、網絡交流行為、課題申報行為、發表文獻行為等。因此,對科研全過程相關行為及需求進行收集、整理、研究并摹繪成用戶畫像,有利于圖書館及其他科研服務機構識別科研用戶的需求、預測主客觀因素的變化,有利于實現個性化、專業化、精準化的科研知識服務。

2.2 高校科研用戶畫像屬性特征和數據來源

科研用戶畫像的特征隨科研工作和客觀信息環境的變動而變化。本文從高校科研活動的一般規律以及科研用戶的個人屬性、行為屬性和數據屬性等因素考慮,認為高校科研用戶畫像特征具體分為五個方面,即一般特征、角色特征、網絡行為特征、科研實地活動特征、科研數據特征。這五大特征可細分為12項要素(見表1),共同組成科研用戶畫像。

圖1 高校科研人員的科研活動過程及需求

表1 高校科研用戶畫像的屬性、特征和數據來源

科研用戶的特征兼具靜態性和動態性。靜態性是指在某一時間節點,我們可以較為準確地獲得某個科研用戶以上五項特征的完整數據,并摹繪出一幅科研用戶的靜態圖像。靜態性是相對的,而用戶的動態變化是絕對的,各項特征都有可能發生改變。在一般特征上,研究成果直接展現科研能力及科研狀態,研究方向會隨著科研用戶日積月累的科研綜合素質的提升而擴展或深入;當角色轉變時,其所關聯的科研任務及管理活動也隨著相應變動,還有可能同時承擔兩個以上的科研角色;隨著個人素質能力提升或研究深入,網絡行為特征中的瀏覽、共享、收藏、評論反饋、訪問、查詢、咨詢、學習等行為亦會變動或優化;科研實地活動特征中的團隊內部交流、學習、閱讀、會議參與、知識咨詢、經驗分享、科研空間位置等會受技術及方法創新優化的影響,其方式或流程會發生改變;科研數據特征會隨著科研進展和成果發布而產生較大的變化。總之,研究用戶特征必須追蹤用戶動態的、關聯的學習和研究過程,甄別全過程的動態實時數據,從而有效預測用戶的動態需求。

用戶畫像是用戶特征的直觀表達,“像不像”取決于用戶特征數據的準確性和完整性。為保證信息的真實性,應以用戶所屬單位的官方網站和科研成果數據庫為基礎,對各種數據來源進行判斷,形成可信信息來源庫。為提高信息的完整性,應多渠道、全方位、多層次地獲取碎片式的動態化特征信息,并結合客觀數據進行分析甄別。各類數據源可互相補充、關聯,形成數據鏈條,佐證數據的真實有效性。

2.3 科研用戶畫像的數據特性

科研用戶畫像建立在數據及用戶特征的基礎上,構建科研用戶畫像的數據特性體現為科學性、全面性、融合性和實時性。科學性代表著科研用戶的客觀特點,畫像模型相關特征標簽源于與科研用戶工作密切相關的渠道,且為非主觀者提供的可公開、客觀的數據。因此,以密切程度與客觀數據為基礎,挖掘分析出的各類特征具備客觀科學性。在全面性上,與科研活動相關的渠道皆可劃入收集監測范圍,且表現為科研工作的全過程,數據及特征范圍皆具備全面性。在融合性上,多個特征對應多個數據來源,在多源數據的融合中面臨數據異構問題,且各類特征具備不同動靜屬性,因此注重數據融合、屬性融合,并對應需求的融合,更加體現用戶畫像模型的融合性。在實時性上,由于科研用戶的科研過程是一個動態發展的過程,其科研特點和科研活動中的各類屬性都會因客觀的科研環境以及個人主觀的科研活動而變化,因此在用戶畫像數據的獲取上,需要實時獲取數據進行分析。

3 構建科研用戶畫像的技術思路和實踐探索

3.1 高校科研用戶畫像獲取模式框架

高校科研用戶畫像的數據以具體系統、人員及因特網為數據研判來源,采取動態監測以收集更新的特征信息。在具體特征信息處理后,析出科研用戶個性化特征標簽集,并據此實現精準高效的科研服務。由圖2可知,高校科研用戶畫像獲取模式框架主要由數據來源模塊、數據解析模塊、特征匹配模塊和可視化模塊組成。在數據來源模塊中,通過對所屬單位、圖書館和因特網所關聯的信息源采取動態監測方式進行數據挖掘或人員訪談來收集原始數據。在數據解析處理模塊中,對主要的網絡數據如Web網頁結構數據、訪談人員得到的文本數據或其他異構數據進行解析,其過程包括對原始數據的信息抽取、分詞及文檔融合。在特征匹配模塊中,科研用戶畫像特征庫根據五大特征,建立特征詞庫,并將解析完成的文本與建立好的特征詞庫進行匹配,得到科研用戶畫像特征集。在可視化模塊,利用可視化技術如標簽云將科研用戶畫像的特征集標準地表示為標簽云圖或科研用戶的具體畫像特征集合表,實現可視化。最后根據可視化結果,提供具有針對性的精準化的科研知識服務決策。

3.2 用戶畫像數據的獲取和分析

科研用戶畫像的特征數據主要呈現在因特網上,但獲取網絡數據需要技術支撐。目前,網絡爬蟲技術在Web文本挖掘分析方法中的應用最為廣泛,可廣泛收集用戶個人信息、網絡行為及狀態屬性等網頁,分析對象網頁文檔的主要文本摘要結構及信息字段,并進行信息抽取和解析。爬蟲方法可聚焦某一特定目標,排除其他無關內容,提高信息的針對性和爬取效率。爬蟲方法支持增量爬取方式,可及時監測到網絡信息的改變,并洞察目標內容的最新動向,同時通過頁面排序優先策略,獲取指定爬取頁面的更新量和新網頁,這種方式有利于監測科研用戶特征的動態變化。

本次案例以深圳大學化學與環境工程學院LJH教授為研究對象,選取并設定以下信息源,采用聚焦和增量爬蟲相結合的方式獲取網絡數據(見表2)。

表2 主要數據來源

表3 爬取結果(部分數據)

爬取結果如表3所示。其中,F表示更新信息所占百分比,f為爬取頻次。可見,通過頻率1次和2次的遍歷爬取,獲得前后一個月設定內的網頁更新變化,可見ID為2-4的網站更新較快,便于獲得科研用戶特征的動態演變。

數據解析主要是一個去噪的過程,因特網來源的數據多以HTML為架構,分析獲取化學與環境工程學院科研人員的網站URL結構,對結構化文本數據進行解析,抽取數據中與標簽庫相關的信息,因此數據去噪是對內容正文的抽取。在抽取網頁中的內容時,需要分析頁面的HTML結構,解析頁面的DOM數據模型,與科研用戶特征標簽庫進行匹配,從而解析到所需要的科研用戶特征值。

如表4中的科研人員研究興趣HTML片段,通過文本匹配到科研用戶特征組成中的具體特征如“職位”“研究領域”,解析其后的節點即可得到標簽對應的數據。

表4 HTML節點解析(部分)

除了獲取網絡數據,還應注意用戶本身也是非常重要且可靠的信息源。對于實地科研活動,可通過用戶訪談或郵件、社交網絡獲得科研人員的科研狀況和最新動態,形成原始資料文檔,用于網絡分析的補充與驗證。以LJH教授為例,學院官網“現任領導”和“師資隊伍”里有關信息不一致,經核實,LJH教授職務標簽內容應更正為“院長(2006-2010年)”。

3.3 可視化呈現

通過對LJH教授進行的信息采集、增量爬取以及抽取解析等規范化過程,整理出相關信息(見表5),通過標簽化得到LJH可視化的用戶畫像標簽(見圖 3)。

表5 收集用戶畫像實例特征信息

圖3 科研用戶畫像標簽云圖(前、后)

本次探索只選取了部分信息來源,摹繪出一個化學教授的簡易畫像。比較兩個時間點用戶畫像的不同,可追蹤到LJH教授在學術研究上的兩個變化,一是新發表1篇學術論文,二是新研究方向為單原子催化劑設備與應用。

4 研究總結與應用展望

4.1 研究總結

文章通過文獻調研法分析國內外圖書館關于科研用戶特征及用戶畫像技術應用現狀,歸納高校科研用戶的特征屬性及用戶畫像組成要素,構建用戶畫像獲取模式框架。案例探索選取了高校具體科研人員具象,通過網絡爬蟲技術獲取該科研用戶的特征數據并進行整理,以特征標簽摹繪科研用戶的科研狀況,嘗試表現用戶畫像的動態性。通過研究與實踐探索,已能夠采用用戶畫像技術摹繪單個科研用戶的主要特征,并跟蹤特征的動態變化。但研究尚處于初級階段,不足之處體現在4個方面:① 信息的全面性和準確性有待提高,需在合法合規的前提下加強用戶網絡行為特征的采集;② 標簽信息的規范化有待研究,應考慮以本體技術和受控詞表建立特征詞庫,對大量標簽數據進行管理,以便建立用戶之間的關聯性;③ 科研用戶群體有待深入研究,需根據用戶標簽聚類,抽象一類用戶群體的共同特征并摹繪科研群體畫像;④ 個性化服務有待開展,需進一步開展文獻資源畫像研究,并通過用戶畫像技術實現精準服務和智慧服務。

4.2 應用展望

通過對科研用戶個體或群體畫像特征標簽的精準標注、聚類分析,有利于圖書館向用戶提供匹配度較高的科研服務,輔助科研人員進行高效率和高水平的科研活動。用戶畫像技術應用于高校科研服務,可從以下4個方面開展。

(1)應用于文獻資源的智能推送。利用科研用戶畫像洞察個體或群體行為,為用戶提供不同程度、熱度、新穎度的資源文獻推薦。如,根據該畫像重點研究方向及其近期科研聚焦的主題熱點,并通過如郵箱、機構官網、科研群聊、圖書館智能系統等交互渠道向具體科研用戶推送相關學科領域的研究態勢、重大項目、熱點前沿、學術會議的文獻資源或資訊。

(2)應用于科研項目生命周期服務。針對科研特征,掌握過程狀態,依據過程提供具體需求。如在立項前提供相關研究的主題或選題定題情況,并進行選題查新;在項目申報中提供申報規范、注意事項和渠道信息;在立項后提供優質的撰文規范、相關主題或最新文獻推送、刊物投稿信息等。

(3)應用于學術合作與交流。利用用戶畫像技術分析科研用戶行為以促進群體合作,不僅可以促成學術講座與交流活動,還可以促進實現不同部門、地區及專業領域潛在的合作、交流或競爭等。

(4)應用于便捷的科研管理與評估,包括人才評估與引進、成果評估等。科研用戶畫像由權威渠道獲取而來,其客觀地展現了科研人員的科研及成果信息,直接體現了科研人員科研經驗是否豐富、學術能力的強弱,科研管理人員可以有針對性地對經驗少、能力弱勢的科研個體進行學術指導和鼓勵,激勵經驗豐富、能力較強的個體突破和進取,在評估科研人員科研質量以及引進科研人員時,可以利用用戶畫像技術便捷、高效地進行評估。

猜你喜歡
特征用戶信息
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 国产精品天干天干在线观看| 亚洲欧美在线综合一区二区三区| 色综合天天视频在线观看| 波多野结衣无码中文字幕在线观看一区二区| 亚洲第七页| 国产91透明丝袜美腿在线| 亚洲福利片无码最新在线播放| 久久精品国产精品青草app| 亚洲av无码片一区二区三区| 久久久久免费精品国产| 一级毛片在线播放| 色网站免费在线观看| 久久美女精品| 四虎在线高清无码| 极品尤物av美乳在线观看| 东京热一区二区三区无码视频| 中文字幕佐山爱一区二区免费| 国产成人一区二区| 国产视频只有无码精品| 亚洲αv毛片| 无码福利日韩神码福利片| 日韩无码精品人妻| 免费全部高H视频无码无遮掩| 无码丝袜人妻| 亚洲日本一本dvd高清| 99er精品视频| 国产一区二区色淫影院| 亚洲制服丝袜第一页| 国产AV无码专区亚洲A∨毛片| 成人av手机在线观看| 国产欧美日韩在线在线不卡视频| 国产99视频在线| 国产一在线| 久久亚洲AⅤ无码精品午夜麻豆| 国产成人8x视频一区二区| 欧美精品伊人久久| 国产精品免费入口视频| 中文字幕有乳无码| 日韩在线1| 久青草网站| 国产激情在线视频| 亚洲欧洲日韩久久狠狠爱| 91一级片| www.亚洲一区| 69综合网| 国产精品久久久久久搜索| 伊在人亚洲香蕉精品播放| 亚洲第一成人在线| 久久精品一卡日本电影| 啪啪永久免费av| 麻豆国产在线观看一区二区 | 久久无码av一区二区三区| 91青青视频| 精品人妻一区二区三区蜜桃AⅤ| 国产精品三区四区| 9999在线视频| 国产流白浆视频| 色噜噜久久| 试看120秒男女啪啪免费| 91成人免费观看在线观看| 欧美不卡在线视频| 国产一区二区精品福利| 免费人成视频在线观看网站| 国产乱肥老妇精品视频| 国产性精品| 亚洲国产亚综合在线区| 亚洲国内精品自在自线官| 狠狠躁天天躁夜夜躁婷婷| 毛片基地视频| 国语少妇高潮| 不卡午夜视频| 国产69精品久久久久孕妇大杂乱| 国产尤物jk自慰制服喷水| 99国产在线视频| 在线播放真实国产乱子伦| 亚洲午夜天堂| 国产精品一区二区不卡的视频| 亚洲色图另类| 成人午夜网址| 亚洲欧洲美色一区二区三区| 国产一区二区三区免费| 亚洲国产日韩在线观看|