虞得賢 李強(qiáng) 王錦濤
摘要:標(biāo)簽系統(tǒng)作為信息過濾的重要工具,已經(jīng)廣泛運(yùn)用于生活中。文章提出了一種運(yùn)用于校園社交平臺(tái)的標(biāo)簽系統(tǒng),用來描述自身的興趣,并基于標(biāo)簽系統(tǒng)進(jìn)行信息流推薦,為大學(xué)生在校園內(nèi)形成依托于自身興趣的社交囤,尋找志同道合的朋友提供了可能。
關(guān)鍵詞:標(biāo)簽系統(tǒng);推薦算法;校園社交平臺(tái)
隨著Web2.0技術(shù)的興起與發(fā)展,互聯(lián)網(wǎng)從信息傳播的媒介逐漸轉(zhuǎn)變?yōu)樾畔①Y源共享和社會(huì)交流的平臺(tái),社交網(wǎng)絡(luò)的發(fā)展和壯大給人們的生活帶來了巨大的影響。然而,網(wǎng)絡(luò)的普及和發(fā)展也帶來了數(shù)據(jù)量的飛速增長(zhǎng),社交平臺(tái)中經(jīng)常出現(xiàn)與自身興趣無關(guān)的內(nèi)容。因此,如何從海量信息中準(zhǔn)確地找到感興趣的內(nèi)容顯得尤為突出。
另一方面,大學(xué)生進(jìn)入大學(xué)校園之后,渴望能夠拓展新的社交網(wǎng)絡(luò),能夠?qū)ふ抑就篮系呐笥眩l(fā)掘自己的興趣所在。大學(xué)生社交圈通常比較局限,主要是通過班級(jí)、學(xué)生組織和社團(tuán)等強(qiáng)關(guān)系,很難接觸到校園內(nèi)其他可能感興趣的人、事、物。使用傳統(tǒng)校園社交平臺(tái)的時(shí)候,由于用戶之間缺乏直觀認(rèn)識(shí),難以直接與自己有相同興趣的人建立社交聯(lián)系,從而使得社交復(fù)雜化和表層化。
文章提出了一種運(yùn)用于校園社交平臺(tái)的標(biāo)簽系統(tǒng),實(shí)現(xiàn)了高效的校園需求信息連接匹配,為大學(xué)生們快速準(zhǔn)確地檢索到所需信息提供了一種新的可能,使社交平臺(tái)滿足大學(xué)生基于興趣的個(gè)性化社交需求。標(biāo)簽系統(tǒng)可以動(dòng)態(tài)地捕捉用戶的興趣,并且通過標(biāo)簽,既反映用戶興趣取向,又反映了資源本身的特征屬性,使得標(biāo)簽成為連接用戶與用戶,用戶與資源的橋梁,使個(gè)性化推薦更加準(zhǔn)確、快捷。用戶通過標(biāo)簽系統(tǒng)獲得真正感興趣的內(nèi)容,有效地節(jié)約了時(shí)間成本,滿足了用戶尋找共同興趣的人、事、物的需求。
1 相關(guān)研究
標(biāo)簽是一個(gè)有意義的片段,具有信息量,是用來描述信息的關(guān)鍵詞,可以被用戶理解和使用。社會(huì)化標(biāo)簽系統(tǒng)中,標(biāo)簽是利用普通用戶提供的關(guān)鍵詞進(jìn)行信息組織的一種新興方法。標(biāo)簽系統(tǒng)已經(jīng)廣泛地應(yīng)用于人們的生活中,很多網(wǎng)站憑借它取得了巨大的成功。標(biāo)簽系統(tǒng)主要運(yùn)用于管理個(gè)人信息、社會(huì)化書簽標(biāo)注、數(shù)字媒體的整合分享和提升電子商務(wù)體驗(yàn)等方面。其中,標(biāo)簽系統(tǒng)在數(shù)字媒體和電子商務(wù)的運(yùn)用尤為突出。
在數(shù)字媒體整合分享方面,標(biāo)簽系統(tǒng)用于對(duì)數(shù)字媒體的標(biāo)記和收集。這些數(shù)字媒體包括照片、視頻或者任何其他可以數(shù)字化展示的東西。熱門視頻分享網(wǎng)站YouTube是最早使用標(biāo)簽的網(wǎng)站之一,用戶可以為自己上傳的視頻添加標(biāo)簽,使視頻的內(nèi)容更加直觀,便于用戶對(duì)視頻的整理與分享。
在提升電子商務(wù)用戶體驗(yàn)方面,標(biāo)簽系統(tǒng)用于電商的導(dǎo)購。以淘寶為例,淘寶的商品導(dǎo)航通過標(biāo)簽系統(tǒng)將其商品分隔成層級(jí)化的類別;熱門的商品以標(biāo)簽的形式出現(xiàn)在商品搜索下方,方便了用戶對(duì)商品的查找;淘寶賣家為其商品添加標(biāo)簽化的標(biāo)題以提高買家的關(guān)注度和商品被搜索的概率;商品的評(píng)論以標(biāo)簽化展示,方便買家快速了解商品的特性,從而提高用戶的購物體驗(yàn)。
綜上所述,標(biāo)簽系統(tǒng)在各大網(wǎng)站都有著廣泛應(yīng)用,文章所研究的標(biāo)簽系統(tǒng)允許用戶自行對(duì)信息或資源加上標(biāo)簽,給人們對(duì)信息過濾帶來了極大的幫助,另外,用戶也可以通過標(biāo)簽系統(tǒng)為自身添加標(biāo)簽,用以描述自身的興趣,使基于標(biāo)簽系統(tǒng)的社交平臺(tái)的信息流展示更加個(gè)性化,推薦更加精準(zhǔn)。
2 標(biāo)簽系統(tǒng)建立
文章通過搜狗輸入法詞庫、維基百科等資源,借鑒門戶網(wǎng)站的分類導(dǎo)航,整理了大學(xué)生校園中可能感興趣的各個(gè)方面,建立了一套分類標(biāo)簽體系,如圖1所示。標(biāo)簽體系分為4級(jí),分別稱為版塊、領(lǐng)域、主題和話題,包括校園生活,興趣愛好,知識(shí)技能三大版塊。在三大板塊下,又包含情感、學(xué)習(xí)、工作等19個(gè)領(lǐng)域,友情、科研、求職等180個(gè)主題和知己、專利、校園宣講會(huì)等5000多個(gè)話題。基于此標(biāo)簽體系,構(gòu)建了標(biāo)簽系統(tǒng)。
為了使標(biāo)簽系統(tǒng)涵蓋的話題更加全面,提升用戶使用標(biāo)簽系統(tǒng)的體驗(yàn)感,文章提出的標(biāo)簽系統(tǒng)還支持用戶自定義標(biāo)簽。如果用戶在標(biāo)簽系統(tǒng)中沒有找到感興趣的標(biāo)簽,用戶可以自己定義標(biāo)簽。只要自定義標(biāo)簽通過了管理員的審核,就能加入到標(biāo)簽體系中,增加了系統(tǒng)的科學(xué)性。
3 校園社交平臺(tái)中標(biāo)簽系統(tǒng)的用途
大學(xué)生群體的興趣需求存在豐富的多樣性,他們不滿足于單一地依靠人與人聯(lián)系的“強(qiáng)關(guān)系”社交所帶來的社交連接,更希望能夠在大學(xué)校園內(nèi)形成依托于自身興趣的“弱關(guān)系”社交連接。標(biāo)簽系統(tǒng)的運(yùn)用使得校園社交平臺(tái)能夠精準(zhǔn)匹配不同大學(xué)生的興趣需求。
用戶通過標(biāo)簽系統(tǒng)可以為自身添加標(biāo)簽,用戶的個(gè)性化標(biāo)簽是對(duì)自身興趣的一種描述方式,使其他用戶對(duì)自身的認(rèn)識(shí)更加直觀,增強(qiáng)用戶的個(gè)性化特征,從而更好地為用戶提供個(gè)性化服務(wù)。用戶可以自主地給自己添加標(biāo)簽來表明自己的興趣愛好,也可以為發(fā)的帖子來添加標(biāo)簽,便于與他人分享。標(biāo)簽系統(tǒng)使得對(duì)用戶興趣的挖掘更加便利。基于標(biāo)簽系統(tǒng)為用戶推送與自己興趣愛好相似的用戶和自己感興趣的帖子、活動(dòng),不僅有利于在平臺(tái)中快速找到志同道合的好友,還為用戶從海量信息中找出自己真正感興趣的內(nèi)容,提升了推送內(nèi)容的準(zhǔn)確性。
4 基于標(biāo)簽系統(tǒng)的推薦算法
結(jié)合常用的推薦算法,文章提出了兩種基于標(biāo)簽系統(tǒng)的推薦算法用于校園社交平臺(tái)中:一種把標(biāo)簽系統(tǒng)與基于內(nèi)容的推薦算法相結(jié)合,使得校園社交平臺(tái)能為用戶提供個(gè)性化信息流;另一種則結(jié)合協(xié)同過濾推薦算法,為用戶尋找可能感興趣的人,發(fā)現(xiàn)身邊熱門的事情。
基于內(nèi)容的推薦算法是信息過濾技術(shù)的延續(xù)與發(fā)展,它不需要了解用戶對(duì)項(xiàng)目的評(píng)價(jià),是根據(jù)項(xiàng)目的內(nèi)容屬性的相似性作出推薦的。結(jié)合標(biāo)簽系統(tǒng),不僅根據(jù)用戶添加的標(biāo)簽為用戶推薦含有此標(biāo)簽的帖子、活動(dòng),還為用戶推薦含有與此標(biāo)簽相似度高的標(biāo)簽的帖子、活動(dòng)。根據(jù)標(biāo)簽系統(tǒng),處于同一層級(jí)且父級(jí)相同的標(biāo)簽認(rèn)為與此標(biāo)簽相似度最高,含有這類標(biāo)簽的帖子、活動(dòng)的內(nèi)容與已知用戶感興趣內(nèi)容的相似度也最高,最可能符合用戶的興趣。從而在過濾無用信息的同時(shí),發(fā)掘用戶潛在的興趣,使得信息流的推薦更具新鮮感。
協(xié)同過濾推薦算法是推薦系統(tǒng)中被認(rèn)為是最有前途的個(gè)性化推薦技術(shù)之一。根據(jù)不同用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)來預(yù)測(cè)用戶的相似性,通過相似用戶的偏好信息產(chǎn)生對(duì)目標(biāo)用戶的推薦。它的依據(jù)是任何人都不是孤立的,都有自己的社交圈,都應(yīng)該處在某個(gè)興趣相同的群體之中,如果用戶具有共同的興趣,那么這些用戶對(duì)不同項(xiàng)目的評(píng)分應(yīng)該比較相似,其他用戶感興趣的當(dāng)前用戶很有可能也感興趣。基于協(xié)同過濾的推薦算法考慮用戶的行為來進(jìn)行相應(yīng)推薦的,充分運(yùn)用了集體智慧,考慮了用戶的歷史習(xí)慣,使推薦的個(gè)性化程度更加高。把協(xié)同過濾推薦算法與標(biāo)簽系統(tǒng)相結(jié)合,大大簡(jiǎn)化了對(duì)用戶興趣模型的建模。通過標(biāo)簽系統(tǒng),可以獲知不同用戶的偏好信息。不同用戶間具有的共同標(biāo)簽即共同的興趣點(diǎn),從而可以有效地分析出用戶間的相似性,社交平臺(tái)為用戶推薦感興趣的人也更加精確。與用戶具有共同標(biāo)簽的用戶群體中的熱門話題更能符合用戶的興趣,使得熱門話題的推薦更具人性化。
5 結(jié)語
文章根據(jù)標(biāo)簽的特性,建立了一套運(yùn)用于校園社交平臺(tái)的標(biāo)簽系統(tǒng)。通過標(biāo)簽系統(tǒng),挖掘用戶興趣并對(duì)信息進(jìn)行過濾。另外,運(yùn)用推薦算法結(jié)合標(biāo)簽系統(tǒng),文章提出了兩種基于標(biāo)簽系統(tǒng)的推薦算法,使得校園社交平臺(tái)更能滿足用戶基于興趣的個(gè)性化社交的需求。