999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶畫像的科學數據管理模型研究

2019-10-09 05:49:06王顯斌
電子技術與軟件工程 2019年17期
關鍵詞:科學用戶模型

文/王顯斌

現階段國內外圖書館領域用戶畫像研究主要以技術為主,主要包括了兩個層次,即User Persona和User Profile,使用的算法模型大致可分為3大類:

(1)基于概率主題的用戶文本建模推斷模型;

(2)基于排序的啟發式函數推斷模型;

(3)基于分類器結合特征工程的預測模型。

Gauch S等將用戶畫像描述為一組加權標簽、概念層次結構或語義網的集合,包括用戶基本素養、文化水平、社會背景、社交情況、工作情況、可支配時間等因素[1]。Zaugg H認為圖書館的空間與服務的設計應該關注用戶需求,可以借鑒營銷領域和產品設計中用戶畫像的應用,進行圖書館空間與服務的設計[2]。國內曾建勛認為圖書館精準服務需要用戶畫像,用戶畫像可以更好地認識網絡中的用戶、改善網絡信息組織、發現信息傳播規律[3]。胡媛認為數字圖書館知識社區用戶畫像可分為讀者基本信息、用戶興趣愛好、用戶活躍度三類標簽模型,提出了數字圖書館知識社區綜合服務能力評價指標體系[4]。

現階段國內圖書館領域用戶畫像研究主要以個案研究為主,針對具體不同應用場景和目標,構建不同用戶畫像模型,針對科學數據管理場景的用戶畫像研究目前還非常少。本文綜合心理學、信息學等多學科知識,從科學數據用戶畫像概念和內涵分析出發,構建用戶數據驅動相結合的科學數據用戶畫像模型和系統,深入探討用戶畫像在科學數據管理領域的應用。

1 科學數據用戶畫像內涵分析

1.1 科學數據用戶群體邊界具有動態性

用戶畫像的目的是通過對特定行為群體特征的總結和提煉,為精準化服務提供量化支撐。因此,用戶畫像對目標用戶群體邊界的界定越明確,畫像結果越有針對性。在科學數據管理中,學術行為和學科背景對科研用戶群體邊界的界定產生重要影響,導致科研用戶群體邊界處于動態變化中,原因有兩個:

(1)科研人員跨學科研究行為越來越頻繁,所跨學科對象也處于動態變化中;

(2)科研人員研究方向也處于變化當中。

1.2 用戶畫像關注的是“典型用戶”

用戶畫像關注的是“典型用戶”而不是“平均用戶”,其結果具有明顯的區分度和針對性,可以更精準地識別特定用戶的動機及行為偏好。在科學數據管理中,科研用戶畫像有效性體現在對目標用戶群體的用戶屬性特征的提煉與總結。

1.3 科學數據用戶屬性包含知識屬性

典型用戶畫像屬性包括靜態屬性和動態屬性。靜態屬性是相對穩定的用戶信息,如人口屬性、職業等;動態屬性是用戶不斷變化的信息,如場景、媒介、路徑等。在科學數據管理中,科研用戶畫像解決的是知識服務的精準化問題,關注的焦點和最后的評價不是“我是否提供了您需要的信息”,而是“是否通過我的服務解決了您的問題”。因此,科學數據用戶屬性應突出知識的特性,可劃分為靜態屬性、動態屬性和知識屬性。

圖1

圖2

2 科學數據用戶影響因素分析

2.1 科學數據用戶知識屬性具有半動態性特征

科研人員的學科背景一般相對固定,但是隨著跨學科研究的開展和研究方向的不斷變化,科研人員往往需要具備多學科知識,需要不斷了解新領域,補充新知識以支撐其研究活動。因此,科研用戶知識屬性的核心(學科背景)相對穩定,但其外延一直處于動態變化中,即一種半動態化狀態。

2.2 科學數據用戶知識屬性的分類

科學數據用戶知識屬性可分為外知識屬性和內知識屬性兩類。外知識屬性是指外部環境作用于個體身上的各種與知識有關的元素集合,包括:學歷學位、畢業院校、學術職務、學術兼職、參加學術團體、專業職稱、學術榮譽等。內知識屬性是指個體自身具有的各種與知識有關的元素集合,參照顯性知識與隱性知識的概念,可分為內在顯性知識屬性和內在隱性知識屬性。內在顯性知識屬性包括:研究領域、學術專長、著作論文、非正式成果等。內在隱性知識屬性包括:心智水平、文化素養、學術思想、學術影響力等。科研用戶的知識屬性蘊含著較多的語義信息,需要在標簽基礎上引入語義表達。

2.3 科學數據用戶受場景驅動和心理影響

不同的時間、地點、研究階段等知識場景下,用戶需求會有差異。例如:撰寫論文時,會關注當前研究熱點;而教學時,更想要梳理出該學科的知識體系。同時,用戶心理狀態不同,其知識需求也存在差異。例如:剛進入新研究領域時,一般對研究工作持樂觀心理;隨著研究的深入,會出現困惑或迷茫,心理上會變得焦慮,體現在行為上就是大量盲目地學習和收集資料;度過失望期之后,心理上才會逐步的平穩。這種心理和情感上的變化可以通過社會心理學進行分析。

3 科學數據用戶畫像建模

用戶畫像建模就是構建用戶標簽體系,可分為結構化標簽體系和非結構化標簽體系兩類。非結構化標簽體系彼此之間無層級關系,各個標簽反應各自的用戶興趣,不僅能夠涵蓋結構化標簽體系,更能細致地表達語義上的分類,如資源發現系統中的關鍵詞、學術社區中的文檔主題模型(Topic Model)等。科學數據用戶非結構化標簽體系可分為四個層級:即事實標簽、模型標簽、預測標簽和業務標簽。每上層標簽都由下層標簽抽象計算組合生成,其中業務層標簽需要人工進行定義。如圖1所示。

4 科學數據用戶畫像算法及系統設計

用戶的靜態屬性反映著用戶的基本情況,是連接線上和線下的紐帶,定義函數表示其在一定場景下對標簽的影響權重,則公式如下:

同理,可以推導出用戶動態屬性在一定場景下對標簽的影響權重

5 結語

本文從科學數據用戶畫像內涵出發,對科學數據用戶影響因素進行分析,最后構建了科學數據用戶畫像模型和系統。其中的重難點有兩個:

(1)多源異構數據導致數據融合困難,必須設計合適的降維方法、特征選擇方法、模型融合方法;

(2)數據稀疏性較高導致屬性特征組合困難。這將是下一步研究的重點。

猜你喜歡
科學用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
科學
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
科學拔牙
主站蜘蛛池模板: 试看120秒男女啪啪免费| 亚洲va在线∨a天堂va欧美va| 国产精品三级专区| 99精品国产自在现线观看| 福利姬国产精品一区在线| 午夜啪啪福利| 狠狠干欧美| 欧美亚洲一二三区| 亚洲精品国产首次亮相| 国产资源免费观看| 亚洲欧美另类中文字幕| 国产打屁股免费区网站| a天堂视频| 亚洲视频四区| 18禁不卡免费网站| 亚洲无码视频喷水| 国产玖玖玖精品视频| 国产丰满成熟女性性满足视频| 亚洲香蕉久久| 国产性生大片免费观看性欧美| 亚洲色偷偷偷鲁综合| 国产精品一线天| 国产精品太粉嫩高中在线观看| 91 九色视频丝袜| 国产成人亚洲欧美激情| 精品无码视频在线观看| 欧美激情视频一区| 色天堂无毒不卡| 久久久久88色偷偷| 国产91特黄特色A级毛片| 中文字幕丝袜一区二区| 日韩经典精品无码一区二区| 亚洲国产精品日韩专区AV| 精品久久香蕉国产线看观看gif| 久久青草免费91线频观看不卡| 欧洲在线免费视频| 四虎成人免费毛片| 日本成人一区| 午夜激情福利视频| 成人一区在线| 欧美另类精品一区二区三区| 伊人91视频| 亚洲国产黄色| 国产精品流白浆在线观看| 色综合五月| 精品午夜国产福利观看| 亚洲精品无码专区在线观看| 国产美女精品在线| 99福利视频导航| 中文无码精品A∨在线观看不卡 | 国产成人无码播放| 亚洲资源站av无码网址| 成人无码一区二区三区视频在线观看 | 一区二区三区国产| 福利在线一区| 色网站在线免费观看| 国产18在线| 无码日韩人妻精品久久蜜桃| 国产网站黄| 国产迷奸在线看| 波多野结衣一区二区三区88| 青青操视频在线| 日韩视频免费| 综合色亚洲| 九九这里只有精品视频| 国产视频a| 国产成人高清精品免费软件| 精品久久蜜桃| 国产亚洲精品资源在线26u| 国产在线视频福利资源站| 国产理论一区| 精品福利网| 国产成人无码综合亚洲日韩不卡| 不卡视频国产| 国产在线精品香蕉麻豆| 亚洲无码日韩一区| 国产不卡在线看| 欧美精品三级在线| 伊人色在线视频| 欧美亚洲国产精品第一页| 波多野结衣视频网站| 欧美日韩一区二区三区在线视频|