999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社會化標簽特性及研究進展綜述

2013-12-23 04:16:06徐志瑋鄭建瑜中山大學圖書館廣東廣州510275
圖書館建設 2013年5期
關鍵詞:信息檢索圖書館用戶

徐志瑋 鄭建瑜(中山大學圖書館 廣東 廣州 510275)

用戶本位(user-centered)理念正在改變圖書館本位的分類工作:標簽嵌入圖書館系統以拓寬分類檢索;編目工作將目光瞄準圖書館以外的更大空間,如網絡用戶將信息資源的分類融入傳統圖書館分類中的嘗試;大眾分類法(Folksonomy)成為信息組織的新選擇,同時出現了 “社會編目(Social Cataloging)”、“社會元數據(Social Metadata)”和“標簽園藝(Tag Gardening)” 等新術語。

作為大眾分類法的基本要素,標簽的歧義性、同義性、模糊性和平面性被認為是標簽的主要特性,對信息檢索質量具有很大的影響。為此,筆者分別于2012年5月15日和2012年10月8日,以科學引文索引(Science Citation Index Expanded,簡稱SCI)和社會科學引文索引(Social Science Citation Index Expanded,簡稱SSCI)為依據, 以“Folksonomy”、“Social Tagging”、“Collaborative Tagging”、“Social Classification”、“Web of Science”為主題, 以“Information Science Library Science” 為檢索范圍, 以“Article”和“Review”為文獻類型檢索得出英文文獻;以CNKI(中國知網)為數據來源檢索得出中文文獻。筆者對所得文獻進行瀏覽和總結,最后以標簽的平面性、寬泛性、個性化、社會性和動態性等5個特性進行綜述。

1 標簽的平面性

目前,社會化標簽的研究熱點依然是標簽平面性的層次化改善,主要包括兩方面內容:與傳統信息組織模式的比較和融合,與本體、語義網等信息技術的整合研究。由于篇幅有限,而且傳統信息組織與圖書館的聯系更加緊密,所以本文僅對標簽和傳統信息組織的比較和融合進行綜述研究。

標簽和主題詞表之間存在很大的差異,標簽可以彌補主題詞表在信息檢索中的不足。與美國國會圖書館主題詞(Library of Congress Subject Headings,簡稱LCSH)、美國醫學主題詞表(Medical Subject Headings,簡稱MeSH)等傳統圖書館主題詞表的比較分析是研究論文最常用的方法,研究表明,最簡單、直觀的方法是從流行的社會標注系統選取小樣本,進行手工比較[1-3],也有學者利用支持向量機、文本分類法和Upper Tag Ontology等信息技術[5-7]對標注者和專家使用的詞語進行比較。例如,Lee等人采用大樣本數據的挖掘,將收集到的1 975 538篇論文、50 832個用戶、394 126個唯一標簽與MeSH進行比較,重合度僅為3%[4]。

除此以外,將標簽與國家信息標準組織 (National Information Standards Organization,簡稱NISO)標準、國際十進制分類法(Universal Decimal Classification,簡稱UDC)和在線詞表等進行比較可知,標簽基本符合信息組織標準,這為標簽和傳統信息組織的融合提供了理論依據。Kome對Delicious網站的標簽進行NISO層次化研究發現,大量標簽都表現出在ANSI/NISO(American National Standards Institute/National Information Standards Organization,美國國家標準學會/國家信息標準組織)和ALCTL(Association for Library Collections and Technical Services,美國圖書館學會的圖書館館藏和技術服務協會)分類法中的層級關系[8]。Spiteri利用NISO制定的針對受控詞匯的6個標準對Delicious、Furl和Technorati3個網站最近30天的標簽進行分析發現,Folksonomy可以增加OPAC(Online Public Access Catalogue,聯機公共目錄查詢系統)在信息的儲存、組織和管理方面的價值,并且標簽都非常接近NISO標準[9]。Sauperl收集了Amazon、 LibraryThing、Delicious和43Things網站上的標簽發現,Folksonomy中有80%的標簽可以歸類到UDC的9個類別中,尤其是UDC的Topic、Genre、Form、Medium、Audience、Time、Place等類別與Folksonomy標簽最匹配[10]。Min等人認為,利用Wordnet工具可以把標簽進行層次化處理,他們利用Flickr數據進行驗證,表明標簽和Wordnet的融合能很好地揭示標簽之間的語義關系[11]。Kolbitsh開發了WordFlickr,提出了基于使用語義術語數據庫WordNet來擴展查詢標簽的方法,當用戶向WordFlickr提交檢索時,可以選擇以哪種類型的關系擴充他們的原始檢索[12]。

2 標簽的寬泛性

用戶選擇的標簽能否準確描述資源所包含的內容將會影響其檢索質量。研究表明,用戶往往選擇有寬泛意義的詞語作為標簽,而這樣的標簽不能有效地描述一個具體的信息資源[13]。對社會標簽系統與搜索引擎、網絡字典進行信息檢索查準(全)率的比較實驗,結果表明,搜索引擎的檢索效果是最好的,社會標簽系統其次;在搜索新聞等大類方面,標簽檢索質量更好;而當搜索某個具體的網站或者某個簡短而實際的問題時,社會標簽系統表現很差[13-14]。對中文標簽進行研究也同樣發現,用戶會使用簡單、概括性的中文詞匯的頻次遠遠高于具體性詞匯(如新聞、素材這類詞成為高頻詞),從頻率分布圖來看,這些集中在圖形頭部的高頻詞并無實際意義,而真正顯示用戶個性差異的是圖形尾部的中低頻詞[15]。Park以信息覓食理論(Information Foraging Theory)研究了標簽的寬泛性為信息檢索帶來的優勢,她認為,對具體信息的標簽搜尋不會取得有效的結果,標簽的優勢在于探索和意外發現未知的信息,具有啟發性作用,標簽更適合瀏覽(Browsing)而不是查詢(Searching)[16]。

3 標簽的個性化

標簽的個人傾向(Personal tendency)很嚴重[17-18],標注者有自我檢索、記憶、評論或者只是為了獲得關注等標注目的,而且標注者選擇標簽依賴于個人對標簽的愛好、對技術的熟悉程度、個人的興趣和知識認知程度等,也可能依賴于用戶在其他標簽系統所獲得的經驗,因此標簽消費者和標注者不能共享相同的標簽,簡單地說,標簽只是一個個體的方式,而不是為檢索準備的。標簽的content reuse(內容復用)和shared interest(共享興趣)標準都很低[19],而用戶增加新標簽的速度遠遠高于內容復用的速度,大部分用戶之間的共享是孤立而非共享的,這必將影響推薦系統的有效性。

根據標簽詞義的特點,標簽被分為主觀和客觀標簽[20-21],客觀標簽對信息檢索更加有效,而主觀標簽由于代表標注者的個人意愿,在檢索中往往被忽略。Khasfariyati等人利用測量查全率和查準率的標準F-measue值把標簽分為“主觀/高水準”、“客觀/高水準”、“主觀/低水準”和“客觀/低水準”4種,選擇了Delicious提供的8個熱門標簽(見表1)進行分析發現,主觀和客觀標簽一樣重要,如“interesting”和“funny”等主觀標簽的F-measure值很高,這些標簽反映了所標注文檔的特有屬性,可以幫助用戶對文檔進行判斷[6]。

表1 8個Delicious的熱門標簽分類

4 標簽的社會性

標簽是個人在社會化環境下共享的產物,目前對標簽的社會性研究還停留在表象上,研究成果不多。崔景昌提到,用戶能夠在網絡社區中共享個人使用的標簽,因此標簽、信息及用戶相互之間就聯結起來,構成由標簽和信息組成的社會網絡[22]。魏建良等人指出,標注是對用戶標簽的行為的描述,當多個用戶對多個對象添加標簽時,標簽就具有了社會性,也就成了社會化標簽[23]。標簽的個性化和社會化是相輔相成的關系[24],如圖1表明,標注者根據自己的喜好對資源進行知識管理,在共享的社會化環境下,豐富信息內容和知識創造;而通過社會化網絡和知識共享,可以對個人用戶提供個性化推薦,獲取個人知識信息。

圖1 標簽的個性化和社會化的關系圖

首次從社會學角度詳細闡述標簽社會性特性的論文發表在2011年的《Journal of Documentation》[25],作者從知識社會學、認識論和信息科學3個跨學科領域的視角出發,依據經典范疇理論(Classical Theory)以及后現代社會學和人類學方法,對大眾分類法和傳統分類法進行了比較。作者認為,傳統樹形的知識分類法(Taxonomy)是一個對自然類(natural kinds)的客觀性、結構性和受控性的分類;大眾分類法則明顯是對一個社會環境下主觀和個體的分類,這揭示了科學實用主義不再是一個“簡單”的結構,而是一個多元化結構。此外,作者從社會學角度探討了傳統分類法和標簽的大眾分類法融合的可行性,認為兩者不僅可以平行存在,而且還可以混合存在。

5 標簽的動態性

描述網絡資源的標簽數量是隨時變化的,標簽的頻次分布、語言、語義、標注者的人數等的變化形成了標簽的動態性。對標簽動態性進行研究,了解標簽的分布規律,可以提高推薦系統的準確性,也能為信息檢索算法提供理論依據。

傳統受控詞匯對資源的描述權重基本是平等的,而在大眾分類法中,某些標簽會比其他標簽更加流行,權重更大,標簽的頻次遵循冪律分布規律。并且,隨著標簽數量的增加,新標簽增加的規律呈現Heap分布規律[26],標簽還存在Cold-Start現象,即越是新增加的標簽關注度越低[4]。最近由于大數據的流行,對標簽動態性的研究也開始使用大樣本,如利用UTO(Upper Tag Ontology,上位標簽本體)的爬行軟件工具收割Delicious、Flickr、YouTube3個網站2003—2008年的標簽數據[27],共得到5 759 755個目標。以這些目標為實驗數據,Lin Nan等人通過自己構建的一個基于時間計時變量的動態標簽成長模型,按照3個不同算法,對宏觀標簽成長、微觀標簽成長和標注者活動的動態性分別進行了研究。結果表明,從宏觀角度的研究來看,3個系統遵循指數小于1的冪律分布規律,從微觀角度的研究來看,遵循相似冪律分布規律;標簽數達到某個規模后,新標簽的成長呈現了Heap分布規律;對標注者活動的軌跡進行研究發現,早期標注者的活動非常嘈雜,當標簽數量達到流行規模的數量后,標簽的增長軌跡趨于穩定。同時,利用TTR-LDA模型可以研究社會性詞語(標簽)對話題浮現的演變軌跡,筆者分析了2005—2008年Delicious的1 000多個流行資源的標注者——話題——鏈接——標簽的分布軌跡發現,一個大的話題會隨著時間演變成幾個子話題。

6 結 語

筆者對標簽的5個特性進行了相關研究進展的綜述,標簽的獨有特性給信息檢索帶來了困難,但也為圖書館帶來了契機,這可以拓寬傳統信息組織的模式,拉近與用戶的距離。從綜述也能看出,國內的相關研究還不夠,大部分實證研究選取的都是國外網站和美國的主題詞表,筆者認為我國需要加強這方面的研究。

[1]Bartley P. Book Tagging on LibraryThing: How, Why, and What are in the Tags?[J]. Proceedings of the American Society for Information Science and Technology,2009, 46 (1):1-22.

[2]Xia Lin, Beaudoin J E, Desai K,et al. Exploring Characteristics of Social Classification[EB/OL].[2012-06-14].http://journals.lib.washington.edu/index.php/acro/article/download/12491/10990.

[3]Yi K, Chan L. Linking Folksonomy to Library of Congress Subject Headings: An Exploratory Study[J]. Journal of Documentation,2009,65(6):872-900.

[4]Lee D H, Schleyer T. Social Tagging is no Substitute for Controlled Indexing: A Comparison of Medical Subject Headings and CiteULike Tags Assigned to 231,388 Papers[J]. Journal of the American Society for Information Science and Technology,2012,63 (9):1747-1757.

[5]Sun A, Suryanto M A, Liu Y. Blog Classification Using Tags: An Empirical Study[J].Lecture Notes in Computer Science, 2007,4822:307-316.

[6]Khasfariyati R, Goh D H, Alton Y K,et al. Social Tags for Resource Discovery: A Comparison Between Machine Learning and User-Centric Approaches[J]. Journal of Information Science, 2011,37(4):391-404.

[7]Ding Y, Jacob E K, Zhang Z, et al. Perspectives on Social Tagging[J]. Journal of the American Society for Information Science and Technology, 2009(12): 2388-2401.

[8]Kome S H. Hierarchical Subject Relationships in Folksonomies[EB/OL].[2012-05-23] .http://etd.ils.unc.edu/dspace/bitstream/1901/238/1/samkome.pdf.

[9]Spiteri L F. The Structure and Form of Folksonomy Tags: The Road to the Public Library Catalog[J].Information Technology and Libraries, 2007(3): 459-467.

[10]Sauperl A. UDC and Folksonomies[J]. Knowledge Organization, 2010,37(4):307-317.

[11]Min Q X, Uddin M N, Jo G S.The WordNet Based Semantic Relationship Between Tags in Folksonomies[J].The 2nd International Conference on Computer and Automation Engineering(ICCAE),2010(2):815-819.

[12]Kolbitsch J. WordFlickr: A Solution to the Vocabulary Problem in Social Tagging Systems[EB/OL].[2012-05-10].http://i-know.tugraz.at/wp-content/uploads/2008/11/9_wordflickr.pdf.

[13]Morrison J P. Tagging and Searching: Search Retrieval Effectivenss of Folksonomies on the World Wide Web[J]. Information Processing and Management 2008,44(4): 1562-1579.

[14]Brooks C H, Montanez N. Improved Annotation of the Blogosphere Via Autotagging and Hierarchical Clustering[C].15th International Conference on World Wide Web. New York: ACM, 2006:625-632.[15]賈君枝, 王東元,王永芳. 基于 Delicious 中文標簽特征分析[J]. 情報科學, 2010,28(10):1565-1568.

[16]Park H. A Conceptual Framework to Study Folksonomic Interaction[J].Knowledge Organization, 2011,38(6):515-529.

[17]Golder S, Huberman B A.The Structure of Collaborative Tagging Systems[EB/OL].[2012-05-23].http://arxiv.org/ftp/cs/papers/0508/0508082.pdf.

[18]Goh D H, Chua A, Lee C S,et al. Resource Discovery Through Social Tagging: A Classification and Content Analytic Approach[J]. Online Information Review, 2009(3): 568-583.

[19]Santos-Neto E, Ripeanu M, Iamnitchi A. Content Reuse and Interest Sharing in Tagging Communities [EB/OL].[2012-05-23].http://arxiv.org/abs/0711.4142.

[20]Golder S A, Huberman B A. Usage Patterns of Collaborative Tagging Systems[J].Journal of Information Science,2006,32(2):198-208.

[21]Kipp M E. Exploring the Context of User, Creator and Intermediate Tagging[EB/OL]. [2012-05-23]. http://www.bibsonomy.org/bibtex/2904d826cdf2349f8b6ec802eddd6d0c4/dbenz.

[22]崔景昌,劉德洪.自由分類法的社會性及其利用[J]. 圖書情報工作,2007,51(2): 41-43,138.

[23]魏建良,朱慶華.社會化標注理論研究綜述[J].中國圖書館學報,2009,35(11):88-96.

[24]Lee Baozhen, Ge Shilun. Personalisation and Sociability of Open Knowledge Management Based on Social Tagging[J].Online Information Review,2010(4):618-625.

[25]Keshet Y. Classification Systems in the Light of Sociology of Knowledge[J]. Journal of Documentation, 2011(1):144-158.

[26]Serrano M A,Flammini A,Menczer F. Modeling Statistical Properties of Written Text[J]. PLoS ONE, 2009,4(4):1-8.

[27]Lin Nan, Li Daifeng, Ding Ying, et al. The Dynamic Features of Delicious,Flickr,and YouTube[J]. Journal of the American Society for Information Science and Technology,2012,63(1):139-162.

猜你喜歡
信息檢索圖書館用戶
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
飛躍圖書館
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于神經網絡的個性化信息檢索模型研究
圖書館里的是是非非
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
去圖書館
主站蜘蛛池模板: 四虎国产精品永久在线网址| 在线看片国产| 色男人的天堂久久综合| 爱色欧美亚洲综合图区| 日韩大乳视频中文字幕| 久久精品一卡日本电影| 无码在线激情片| 57pao国产成视频免费播放| a级毛片在线免费观看| 精品国产欧美精品v| 欧美色亚洲| 91精品最新国内在线播放| 国产成人精品一区二区三区| 国产成人精品视频一区二区电影 | 热久久国产| 99久久免费精品特色大片| 美女扒开下面流白浆在线试听 | 重口调教一区二区视频| 99精品国产电影| 狠狠综合久久| 国产激情国语对白普通话| 58av国产精品| 亚国产欧美在线人成| 国产一区二区精品福利| 国外欧美一区另类中文字幕| 久久99精品久久久久纯品| 9啪在线视频| 日韩精品久久无码中文字幕色欲| 人妻无码一区二区视频| 欧美日韩91| 中文字幕天无码久久精品视频免费| 国产无吗一区二区三区在线欢| 亚洲成人精品| 久久永久视频| 日本国产一区在线观看| 国产成人91精品| 亚洲免费三区| 国产亚洲欧美在线中文bt天堂| 久无码久无码av无码| 国产成年无码AⅤ片在线| 国产成在线观看免费视频| 中文字幕佐山爱一区二区免费| 91无码人妻精品一区| 午夜福利无码一区二区| 国产精品第页| 欧洲成人在线观看| 日本人又色又爽的视频| 国产亚洲高清视频| 亚洲无码一区在线观看| 五月六月伊人狠狠丁香网| 国产视频一区二区在线观看| 免费在线色| 老司机久久精品视频| 国产无码在线调教| 狠狠色狠狠色综合久久第一次| 国产精品刺激对白在线| 中国成人在线视频| 国产一级视频在线观看网站| 青青操国产视频| 无码福利视频| 4虎影视国产在线观看精品| 亚洲一区精品视频在线| 98超碰在线观看| www.亚洲一区| 日韩亚洲综合在线| 国禁国产you女视频网站| 91午夜福利在线观看| 亚洲精品国产精品乱码不卞 | 91福利在线看| 国产97视频在线| 日本黄网在线观看| 国产福利不卡视频| 亚洲色图欧美激情| 天天色综网| 亚洲综合二区| AV无码无在线观看免费| 91精品综合| 日韩a在线观看免费观看| 全午夜免费一级毛片| 亚洲精品国产综合99久久夜夜嗨| a级毛片免费看| 亚洲香蕉在线|