徐漢青 滕廣青 王東艷 韓尚軒



〔摘 要〕[目的/意義]社會化標注系統(tǒng)為用戶檢索提供便利的同時也面臨一些困擾,標簽推薦研究有助于解決資源檢索中精確度與召回率之間的兩難抉擇。[過程/方法]借助網(wǎng)絡科學的理論與方法,通過對標簽網(wǎng)絡的模塊化聚類處理獲得主題聚類,采用度數(shù)中心度對主題聚類內(nèi)部標簽進行排名,根據(jù)特定規(guī)則選取Top-N標簽數(shù)量。[結果/結論]實驗結果顯示,研究中提出的模塊化Top-N標簽推薦方法,具有可逐層細化的精確度和良好的召回率。該方法的彈性機制可為不同的檢索要求提供差異化服務。
〔關鍵詞〕社會化標注;標簽推薦;模塊化聚類;標簽排序
DOI:10.3969/j.issn.1008-0821.2018.04.008
〔中圖分類號〕G254.97 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)04-0058-07
〔Abstract〕[Purpose/Significance]Social tagging system is also facing some inconvenience while facilitating the retrieval of users.Tag recommendation research can help solve the dilemma between the accuracy and the recall rate in resource retrieval.[Process/Method]With the theory and method of network science,the topic clusters were obtained through the modularity clustering on tag network,the degree centrality was used to rank the tags in the topic clusters,the numbers of the Top-N tags were selected according to a specific rule.[Results/Conclusions]The experimental results showed that the modularity Top-N tag recommendation method had the accuracy of level-by-level refinement and the good recall rate.The flexible mechanism of this method could provide differentiated services for different retrieval requirements.
〔Key words〕social tagging;tag recommendation;modularity clustering;tag rank
Web2.0環(huán)境下,網(wǎng)絡用戶不僅是信息的接受者,同時也成為信息的組織者與架構者。文獻網(wǎng)站、社交網(wǎng)站、圖片網(wǎng)站、音樂網(wǎng)站等各種類型的網(wǎng)站紛紛采用社會化標注資源組織模式,允許并鼓勵用戶對網(wǎng)絡資源進行標注,并根據(jù)標簽向用戶提供檢索服務,從而使得社會化標注系統(tǒng)在互聯(lián)網(wǎng)上迅速蔓延。與此同時,廣大用戶在享受社會化標注系統(tǒng)所帶來的福利的同時,不得不面對其平層結構在資源檢索中所造成的困擾。因此,以資源精確定位和有效覆蓋為目的的社會化標注系統(tǒng)中的標簽推薦研究引起了學術界的關注,并嘗試建立多種推薦方法以滿足上述目標及要求。
本研究采用網(wǎng)絡科學的理論和方法,基于標簽之間的關聯(lián)關系構建標簽網(wǎng)絡。……