999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

UGC網站用戶畫像研究①

2017-02-20 07:45:34陳志明胡震云
計算機系統應用 2017年1期
關鍵詞:用戶能力模型

陳志明, 胡震云

?

UGC網站用戶畫像研究①

陳志明, 胡震云

(河海大學商學院, 南京 211100)

近幾年, 社交網絡的高速發展使人們的工作、生活、學習方式發生了重大改變, 人們獲取知識的方式呈現明顯的網絡化趨勢. 人們通過網絡獲取信息的同時, 也在其上留下了個人的痕跡, 考慮到現實中獲取個人信息成本高昂, 捕捉其在網絡中留下的痕跡, 研究其在網絡社會中的“映射”, 不失為一種可行的方法. 用戶畫像作為真實用戶的虛擬代表, 是建立在一系列真實數據之上的用戶模型. 通過對“知乎”網站的深入挖掘, 構建了基于用戶基本屬性、社交屬性、興趣屬性和能力屬性四個維度的動態用戶畫像模型, 并對“知乎”網站PM 2.5話題下1303位用戶進行實證分析.

知乎網; 用戶畫像; 社交影響力; h指數

近十年, 隨著Web2.0概念的成熟應用, 社交網絡獲得了“井噴式”發展, 影響著人們的學習、生活、工作等方式, 每一個“觸網”的人都在發生著潛移默化的改變. 人們縱情遨游網絡的同時, 也在網絡中留下的大量的個人“痕跡”. 隨著社交網絡規模的不斷擴大, 個人的“痕跡”也在不斷增多. 在學術界與產業界, 如何獲取這些“痕跡”, 如何利用這些“痕跡”的討論不絕于耳. 社會學家需要這些“痕跡”來剖析網絡結構的演變、網絡傳播學等; 網站的擁有者希望利用“痕跡”為用戶提供更好的網絡體驗; 社交網絡上的商家希望利用“痕跡”進行精準的廣告投放; 政府部門需要對社交網絡上的用戶言論進行監管, 尤其是對輿情的控制和非法言論的處理. 用戶畫像模型為解決這些問題提供了可能的方法.

隨著技術的發展和數據資源的累積, 碎片化的“痕跡”才慢慢組合為用戶畫像. 用戶畫像作為真實用戶的虛擬代表, 是建立在一系列真實數據之上的用戶模型. 目前有許多關于用戶畫像的實際應用, 比如趙曙光[1]基于對高轉化率的社交媒體用戶研究重要性的認識, 通過一對一的深度訪談的方式對用戶的社交媒體使用動機和行為進行總結概括, 對社交用戶進行分類. 劉海[2]等基于4C理論構建了“用戶畫像”數據庫, 通過對數據庫的挖掘來進行消費者群體細分. 在此基礎上, 從營銷的角度構建了精準營銷細分模型. 此外,在個性化推薦系統[3]、產品研發[4]、廣告投放[5]等領域也有用戶畫像的應用. 對用戶畫像的分析不僅可以更好的認識網絡中的用戶, 從而低成本、高效率的完成公眾參與社會活動, 還可以對現有網絡進行更好的完善, 推動社交網絡的進一步發展. 因此, 用戶畫像的構建, 在學術界與產業界都具有重大意義.

1 用戶畫像模型

用戶畫像又稱用戶角色, 在模型的構建過程中往往會以最為淺顯和貼近生活的話語將用戶的屬性、行為和偏好聯結起來, 作為實際用戶的虛擬代表, 用戶畫像所形成的角色模型并不能脫離實際場景之外被構建出來. 一個用戶可以從多個方面去刻畫, 即用戶模型可以從多個維度去考慮. “知乎”作為社交化問答網站, 用戶在平臺上通過某些行為(如回答問題、點擊圖片、瀏覽信息流、關注等)生產或獲取信息, 也通過其它一些行為(如轉發、點贊、評論等)將信息傳播出去. 由此, 我們依據社交網絡的特性, 結合“知乎”網用戶的特點, 將用戶畫像模型進行四個維度的劃分, 即用戶的自然屬性、社交屬性、興趣屬性和能力屬性. 同時, 用戶在網絡社會中的“痕跡”越多, 用戶畫像模型越能準確反映現實社會中該用戶的特征. 但是, 考慮到成本及隱私, 構建“完整”的用戶模型幾乎不可能, 要結合實際的應用場景, 構建滿足條件的用戶畫像模型即可.

1.1 自然屬性

自然屬性是指人的肉體存在及其特性, 是人存在的基礎. 自然屬性指相對穩定和靜態的人口屬性, 例如: 性別、地域、受教育程度、職業經歷等, 由于用戶對個人隱私的有意保護, 這些信息的收集主要依靠網站自身的引導、調查、第三方提供等, 并在此基礎上進行補充和交叉驗證.

以“知乎”為例的自然屬性指標如表1所示.

表1 自然屬性指標

用戶的自然屬性指標在不同的應用場景下對用戶畫像的描述具有一定程度影響力, 但出于隱私保護的考慮, 往往獲取成本較高, 多用于對樣本整體進行評價. 其中, 如性別、居住地、行業和簡介等指標不具備等級差別, 如果用戶的以上指標與用戶畫像的應用場景相關, 則定義一個函數表示用戶的這些屬性對構建用戶畫像的影響:

(2)

對于用戶自然屬性中的教育經歷, 不僅影響著用戶畫像的構建, 還具有等級之分. 本節選用三角模糊數兩級比例法對定性指標進行量化.

雖然由于各種原因, 獲取完整的用戶的自然屬性信息困難重重, 但用戶的自然屬性反映著用戶的基本情況, 是連接線上社交網絡和線下真實社會的紐帶, 其重要性不言而喻. 通過以上幾個方面的分析, 定義函數表示用戶的自然屬性, 則:

1.2 社交屬性

本文所探討的用戶的社交屬性, 主要通過用戶的社交影響力進行衡量, 即用戶由于和其他人或團體之間的交互而改變自身觀點、情感、態度和行為的現象[6]. 本節基于社交影響力的定義, 綜合考慮網絡拓撲結構及社交節點的相互影響程度, 對社交影響力進行如下因素分析:

1) 用戶的活躍度. 反映了用戶的活躍程度, 用戶越活躍, 影響其他用戶的機會就越大. 包括用戶關注的人數、關注的話題數、關注的專欄數、提問及回答的數量等. 這些都是UGC網站中用戶活躍度的直接體現. 考慮到這五個指標有可能不在一個數量級上, 給用戶活躍程度的對比帶來困難, 因此, 需將它們進行歸一化.

;;;;

2) 用戶“鄰居”的影響力. 定義“鄰居”為用戶的關注者, 等同于“粉絲”. 社交網絡中信息的流動離不開“鄰居”, 鄰居節點作為傳播的載體, 本身的影響力同樣重要. 對于“鄰居”的影響力, 我們使用“鄰居”的關注者數量及“鄰居”與用戶的親密度進行度量.

(6)

(8)

借鑒PageRank的核心思想, 本節關于用戶“鄰居”影響力的定義如下:

(10)

綜合考慮用戶本身的活躍度與用戶“鄰居”的影響力, 且這兩者均與社交影響力成正比, 則可得用戶在網絡中的全局社交影響力, 即用戶的社交屬性為:

1.3 興趣屬性

網站會在用戶注冊時要求其選擇自己感興趣的話題, 并依此進行相關內容的推薦, 因此用戶所關注的話題可以看作是其顯性興趣; 用戶在瀏覽網站的過程中, 會對自己感興趣的話題進行提問、回答與收藏, 因此用戶的這些行為也能反映其興趣, 稱之為隱性興趣. 下面我們對興趣屬性進行建模:

1) 顯性興趣建模

用戶會對自己感興趣的話題進行關注, 以方便獲取這方面的相關內容, 所以我們可以將用戶的關注話題看作顯性興趣的反映. 對于興趣標簽的權重計算, 我們使用TF-IDF方法, TF-IDF是一種經典的信息加權技術, 其值常用來度量一個詞語在文件中的地位[7]. 通過用戶的話題標簽表示用戶的興趣模型, 標簽映射的回答數即為標簽被使用的次數, 利用TF-IDF方法計算用戶的興趣標簽的權重:

2) 隱性興趣建模

用戶的關注話題, 直觀體現了用戶的顯性興趣. 然而話題標簽是用戶注冊時人為設定的, 很多用戶為了節省注冊時間, 會任意勾選話題, 又或者選擇很多話題, 這就造成了用戶興趣度量的準確性不高. 隱性興趣不同于顯性興趣, 興趣標簽無法根據用戶的關注話題直接獲得, 而是通過用戶的交互行為獲取. 我們通過分析用戶的提問、回答和收藏來構建用戶的隱性興趣. 關于它們的定義如表2所示.

表2 用戶行為定義

則用戶的隱性興趣標簽權重為:

用戶的隱性興趣權重通過提問、回答和收藏來度量, 通過對三個行為所涉及的內容進行標簽提取, 用戶的隱性興趣模型表示為:

(15)

3) 用戶興趣建模

(17)

1.4 能力屬性

本文中的能力屬性特指用戶輸出優質內容的水平. 用戶生產內容(user generated content, UGC)是在Web2.0環境下出現的一種新興的網絡信息資源創作與組織模式, 泛指以任何形式在網絡上存在的由用戶發表的文字、圖片、視頻等內容, 也就是說, 用戶既是網絡內容的瀏覽者, 也是網絡內容的生產者與傳播者[8]. “知乎”作為典型的UGC網站, 用戶優質內容的產出能力極其重要, 它是網站的核心競爭力. 本節綜合考慮內容的質與量, 借鑒Hirsch教授設計的科學計量評價指標h指數(highly cited index)[9]與金碧輝等人提出的R指數[10], 進行用戶能力屬性的度量. 其中, Hirsch將h指數定義為: 一位作者的h指數等于其發表了h篇至少被引h次的論文, 即一個作者的h指數表明其至多有h篇論文被引用了至少h次.

H指數具備簡潔新穎的特點, 但也有自己的不足. 首先, h指數對高被引論文的影響力反映不足; 其次, h指數對普通研究者缺乏區分度, 對于大量普通研究者來說, 他們擁有相同的h指數, 且h指數的值都比較低; 最后, h指數受自引和合作發文的影響, 大量自引可以顯著改變h指數. 針對h指數的缺陷, 金碧輝提出了R指數. R指數表示的是h核內論文的總被引頻次的平方根. R指數的數學公式如下:

本節通過分析h指數與R指數各自的特點后, 將兩種指數配對使用, 將會有效彌補h指數的不足, 對用戶的能力屬性進行度量如下所示:

贊同的h指數和R指數理論上就是:

(19)

同理: 討論的h指數和R指數理論上就是:

同理: 關注人數的h指數與R指數為:

提問能力與回答能力在UGC網站中同等重要, 故本節關于用戶的能力屬性定義如下:

1.5 用戶畫像模型構建

以上四節分別從用戶的自然屬性、社交屬性、興趣屬性及能力屬性四個方面對用戶畫像模型進行構建, 該模型可以較為全面的對用戶進行模型抽象, 但是眾所周知, 用戶畫像模型的應用離不開實際的應用場景, 在面對不同的場景時, 用戶畫像所側重的屬性是不同的. 這就要求模型具有動態特征, 定義函數表示用戶的畫像模型, 則:

2 用戶畫像實證分析

眾所周知, 用戶畫像的應用離不開使用場景的設置, 沒有使用場景, 空談用戶畫像是沒有實際意義的. 我們對用戶畫像模型的構建過程有了深刻的理解, 接下來我們將結合實際的場景設置, 對用戶畫像模型的實際應用進行研究. 本文所用數據集為“知乎”網站關注PM2.5話題的用戶的數據信息. 截止到2015年12月, 共有1318人關注該子話題, 數據由Gooseeker爬蟲抓取, 其中成功抓取1303位用戶數據, 成功率為98.9%. 本文的實證即對這1303位用戶進行分析.

場景一: 網站核心用戶甄別

對于UGC網站而言, 其核心用戶應具備輸出優質內容的能力, 即用戶的能力屬性值排名靠前. 由1.4節可知, 用戶的能力屬性包括用戶的提問能力及回答能力, 分別通過提問能力指數和回答能力指數進行度量. 令,, 可得用戶能力屬性的散點圖如圖1所示.

圖1 用戶能力屬性散點圖

分析上圖可知, 數據集中絕大部分用戶的能力屬性值比較小, 主要原因是其提問與回答數都比較小, 或者其少量的提問與回答中, 質量并不高, 所以并沒有得到網絡中用戶的認同; 在圖中, 有一位用戶的能力屬性h值高達268.4, 該用戶在網絡中的回答數量為1417, 提問數量為106, 而其得到的總贊數為653528; 同樣, 用戶AreYouKiddingMe的h值為61.8, 可其回答數量為2031, 提問數量為505; 可見h值可以更好的反映用戶的能力, 它不僅考慮了用戶輸出內容的量, 還考慮了內容的質.

場景二: 公眾參與環保政策的制定

公眾參與環保政策的制定, 需要考慮兩個方面的問題, 一方面是公眾的選擇問題, 另一方面是公眾的高效參與問題.

關于公眾的選擇, 可以應用用戶畫像模型得到結果. 首先, 評估用戶的教育經歷, 選取學歷為本科及以上的用戶; 其次, 分析用戶能力屬性, 能力屬性值越大, 表示其輸出的內容質量越高; 然后, 結合用戶的興趣屬性, 判斷其輸出內容是否與環保相關; 最后即可確定該用戶是否適合參與環保政策的制定. 根據以上分析, 式(24)轉變為:

分析數據集可得到部分結果, 如表3所示. 需要注意的是, 表格中的能力值是結合興趣屬性后在環境保護相關話題下的能力, 是對環保相關的提問、回答的度量.

表3 場景二分析結果

由上表可以看出, 教育經歷在一定程度上影響著用戶的興趣. 在確定了哪些公眾適合參與政策制定的情況下, 需要考慮公眾的高效參與問題. 本文以目前我國公民的主要參與方式為出發點進行論述.

1) 關鍵公眾參與法. 即尋找與政策制定相關的公民進行咨詢, 上表中選取的關鍵公眾, 有效彌補了傳統選擇方法中只關注精英分子的缺陷, 真正做到讓普通大眾參與到環保相關政策的制定中.

2) 公民調查法. 即運用問卷調查或現場訪談的形式, 了解公眾對于相關政策的態度和看法. 在新媒體時代, 利用用戶畫像模型將網絡問卷發放給特定的公眾, 既提高了調查的有效性, 又降低了相關工作人員的時間成本.

3) 民眾論壇. 即將網絡中適合參與環保政策制定的民眾組織起來, 構建專業的民眾論壇. 首先, 為公眾參與提供通道; 其次, 引導輿論走向, 構建官方與民間的溝通渠道; 然后, 搭建專業型平臺, 為普通公眾的環保問題提供解決方案; 最后, “取之于民”的政策更利于推行.

1 趙曙光.高轉化率的社交媒體用戶畫像:基于500用戶的深訪研究.現代傳播:中國傳媒大學學報,2014,(6):115–120.

2 劉海,盧慧,阮金花,田丙強,胡守忠.基于“用戶畫像”挖掘的精準營銷細分模型研究.絲綢,2015,52(12):37–42.

3 邢星.社交網絡個性化推薦方法研究[博士學位論文].大連:大連海事大學,2013.

4 余孟杰.產品研發中用戶畫像的數據模建——從具象到抽象.設計藝術研究,2014,(6):60–64.

5 Bakshy E, Eckles D, Yan R, Rosenn I. Social influence in social advertising: Evidence from field experiments. Proc. of the 13th ACM Conference on Electronic Commerce.ACM. 2012. 146–161.

6 Rashotte L. Social influence. The blackwell encyclopedia of social psychology, 2007, 9: 562–563.

7 宗成慶.統計自然語言處理.北京:清華大學出版社,2008.

8 朱慶華.新一代互聯網環境下用戶生成內容的研究與應用.北京:科學出版社,2014.

9 Hirsch JE. An index to quantify an individual’s scientific research output. Proc. of the National academy of Sciences of the United States of America, 2005, 102(46): 16569–16572.

10 金碧輝.R指數,AR指數:H指數功能擴展的補充指標.科學觀察,2007,2(3):1–8.

User Portrait Study on UGC Website

CHEN Zhi-Ming, HU Zhen-Yun

(Business School, Hohai University, Nanjing 211100, China)

In recent years, the rapid development of social networks has significantly changed the styles of people’s work and life. The way people acquiring knowledge shows a clear trend of the network. When people acquire information through the Internet, it also leaves personal traces. Taking the high cost of obtaining personal information in reality into account, it’s a good idea to catch people’s leaving traces in the network and study its “mapping” in the network society. User portrait as a virtual representative of real users is based on a series of real data on the user model. Based on dynamic modeling of user portrait, the user is defined as the basic attributes, social attributes, interests, and abilities by digging the “ZhiHu” site. Then we make an empirical analysis of the 1303 users who follow the topic of PM 2.5.

“ZhiHu” site; user portrait; social impact; h-index

2016-04-21;收到修改稿時間:2016-05-26

[10.15888/j.cnki.csa.005543]

猜你喜歡
用戶能力模型
一半模型
消防安全四個能力
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
你的換位思考能力如何
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 成人日韩欧美| 日韩第九页| 幺女国产一级毛片| 91麻豆精品国产高清在线| 日本欧美一二三区色视频| 亚洲 日韩 激情 无码 中出| 在线免费a视频| 亚洲男人的天堂网| 99久久亚洲精品影院| 国产福利拍拍拍| 国产成人精品一区二区不卡| 欧美性猛交一区二区三区| 麻豆精品在线视频| 天天色综合4| 色哟哟国产精品| 久草视频精品| 婷婷色一区二区三区| 国产综合在线观看视频| 午夜精品区| 看你懂的巨臀中文字幕一区二区 | 欧美人人干| 欧美高清日韩| 91成人免费观看在线观看| 亚洲 欧美 日韩综合一区| 又黄又湿又爽的视频| YW尤物AV无码国产在线观看| 国产成人综合亚洲欧洲色就色| 在线观看精品国产入口| 99re热精品视频国产免费| 国产精品人莉莉成在线播放| 尤物国产在线| AV熟女乱| 亚洲va在线观看| 国内精品久久久久鸭| 亚洲妓女综合网995久久| 乱色熟女综合一区二区| 欧美特黄一免在线观看| 亚洲成a∧人片在线观看无码| 欧美色综合久久| 国产精品99久久久| 99在线视频网站| 欧美精品在线免费| 国产成人av一区二区三区| 精品久久国产综合精麻豆| 亚洲人成网站在线播放2019| 久无码久无码av无码| 亚洲国产天堂久久九九九| 亚洲三级网站| 99视频精品全国免费品| 91免费在线看| 精久久久久无码区中文字幕| 国产精品嫩草影院视频| 免费不卡在线观看av| 精品国产免费观看一区| 亚洲婷婷六月| 亚洲日本在线免费观看| 亚洲国产综合精品一区| 免费国产无遮挡又黄又爽| 精品视频免费在线| 无遮挡国产高潮视频免费观看| 国产精品国产三级国产专业不| 四虎成人在线视频| 亚洲综合久久一本伊一区| 久久性妇女精品免费| 亚洲综合九九| 日韩欧美国产精品| 亚洲第一极品精品无码| 午夜国产精品视频| 香蕉久久国产精品免| 国产成人a毛片在线| 日韩中文字幕亚洲无线码| 农村乱人伦一区二区| 欧美日本在线一区二区三区| 一级一级一片免费| 国产一在线观看| 中文字幕在线一区二区在线| 亚洲aaa视频| 91成人试看福利体验区| 无码一区二区三区视频在线播放| 日韩国产另类| 亚洲综合欧美在线一区在线播放| 国产成年女人特黄特色毛片免 |