摘 要 網絡信息組織方法——大眾分類法,能夠彌補在網絡信息時代智能化信息處理系統的不足,在網絡信息組織工作中加入大眾偶然的、非理性的活動,這讓網絡信息的傳播與使用更具個性化,更符合用戶需要。現在很多的博客網站、信息服務網站、高校等都會運用到這一技術,為廣大用戶提供更多具有參考價值的信息標簽,方便大家找到更多符合自己要求的信息。當然這種方法也有其自身的優勢與不足,但就長遠的發展來看,還是值得借鑒的。在信息技術時代的背景下,大眾分類法會逐步完善,會更好地服務于更多信息用戶。
關鍵詞 大眾分類 網絡信息組織 標簽
中圖分類號:G356.6 文獻標識碼:A
一、引言
隨著社會化軟件的發展,web2.0的出現讓用戶的角色發生了改變,信息用戶不再僅僅是信息的使用者,更擔當起信息創造者的角色。Web2.0的主要特征就是注重用戶的交互作用,它的出現給用戶帶來了真正的個性化、去中心化和信息自主化。 網絡中有大量由用戶創建的各種信息內容如:創建的網頁、圖片、鏈接、音頻、視頻等。網絡用戶在不斷創造等信息的同時,也需要按照自己的需求,以不同的方式有效地組織各類信息。鑒于此,完全出于個人喜好的標注方式,逐漸成為人們推崇的數字信息組織的主要方式。本文主要闡述大中分類這種web2.0的信息組織與檢索方式。
二、大眾分類法的概念
(一)大眾分類的含義。
網絡信息組織不能只依靠計算機自動化處理,也不能完全依靠網絡大眾偶然的、非理性的信息行為,還需要有網絡個體之間的社會性協同機制。Web2.0給網絡帶來了更加強大的社會性,為網絡信息自組織的形成提供了可能性。因此,網絡信息自組織存在的條件可以歸納為三個,即:龐雜無序的信息,大量自由個體和自由信息行為以及社會協同機制。大眾分類法則是web2.0出現以后,網絡信息組織中重要的信息組織分類方式。
大眾分類法,也叫公眾分類法(Folksonomy)在2004年被Thomas Vander Wal首次使用,由“folk”和“taxonomy”組合而來,并稱它為“由下而上的社會分類法”,是“社會創造的典型平面化命名空間”。他還認為Folksonomy包含3個重要組成部分:用戶、被描述的資源(具有唯一的標示符,如URL或ISBN)和標識符或標簽(用來描述信息資源)。 具體而言,Folksonomy就是網絡信息用戶對特定信息資源通過添加一個或多個標簽來組織網絡信息資源的過程, 并最終根據標簽被使用的頻次選用高頻標簽作為該類信息類名的方法。
(二)大眾分類法的運行機制。
大眾分類法便是由用戶以協作的方式、為具有協作標注特點的共享信息空間建立的一個概念表述體系,如圖1所示。
圖1
在支持Folksonomy的網站中,用戶可以對自己感興趣的信息按照自己習慣和喜歡的方式加注標簽——Tag,上圖中不同的信息用戶都可以加注標簽,因此會形成標簽1、標簽2、標簽3、標簽n。目的是便于自己管理和與其他用戶共享資源,由于用戶的個性差異,對于同一信息不同的人可能使用相同或不同的標簽進行描述,當描述這類信息的某一個或幾個使用頻次較高時,這里我們假定T3的使用頻次c為最高,那么c就被確定為該類信息的類名。可以供其他的社會成員參考和使用。可見,Folksonomy的體系是一種基于用戶提交關鍵字的分類,它反應的是整個社群的群體意識傾向和知識背景。
三、基于Folksonomy的信息組織應用實例——社會化書簽Del.icio.us網站
Folksonomy最早應用與社會化書簽,并迅速在博客、社區、分享類網站得到廣泛應用。
Del.icio.us網站是國外第一個推出Tag標簽功能的網站。其注冊用戶可以將感興趣的網頁保存在Del.icio.us網站上,并對每個網頁增加描述性的標簽,(如圖2)其他有同樣興趣的用戶可通過該標簽找到此用戶保存的網頁。
四、大眾分類法的特征
由以上Folksonomy的應用實例可以知道,大眾分類法是在互聯網時代下產生的一種比較新的分類方式,因此與傳統分類方式相比,它具有一些特征。
(一)大眾分類的優勢。
與傳統網絡信息分類方法相比,大眾分類最大的不同之處在于,它并不采用嚴格的分類標準,其分類全部由用戶直接提交,分類的形成過程完全是自發的。大眾分類的主要機制基于“開放性元數據標準”和“自然語言社群聚類”。
1、動態性和適應性。
用戶一旦有閱讀或創建內容和主題的需要,就可以立即創建標簽,并保存下來,還可以隨著需求的變化做出相應的修改;另外,用戶也不需要遵守固定的語法結構,可以用自然語言向大眾分類系統中添加詞匯,使其能夠隨著動態的知識環境變化而迅速變化。如此一來,使用頻率低的標簽就會逐漸淡出人們的視野,而那些使用頻率高的標簽則會在標簽云中以字號變大的形式反映出來。
2、信息的充分共享。
大眾分類為用戶提供了共享標簽的功能,用戶既可以自己建立一個標簽來標引自己的信息文本,也可以使用別人提供或定義的標簽進行標引。任何人對內容進行標注后,他人可立刻看到這些標簽,也可以點擊這些標簽,進而看到更多使用這個標簽的信息內容,或是與此相關的內容。用戶既能夠共享同一標簽下的各種信息,也能共享同一信息下的各種標簽。
3、多維度揭示信息資源。
大眾分類是由自由的信息用戶自發的對信息資源加注標簽,不同的用戶會采用不同的關鍵詞來表達同一主題的信息資源。標簽是在對文章進行概括和理解的基礎上產生的,是對內容的個人理解上的私人標注,未必針對主題,可能是時間、內容或與文章主題無關的詞匯,因此標簽的設定要比關鍵詞自由和方便,它可以從多個維度來揭示信息內容。
總之,大眾分類法在一定程度上解決了專業人員無力應對龐大數字資源的標引和分類問題,能適應靈活多變的網絡信息增長,滿足網絡信息用戶的動態要求,并使得未來對網絡信息的分類基于協同機制向著由網絡信息發布者、管理者和使用者三方共同承擔的方向發展。
(二)大眾分類的局限法。
與傳統的等級是分類法相比,大眾分類目前也存在一定的局限性,具體表現在以下兩點。
1、標簽的模糊性。
標簽的模糊性大眾分類是一種基于標簽語法層次的簡單聚合分類,因此,同一標簽可能映射出不同語義的資源,而系統卻不能識別出各個語義的不同。這種缺陷在以縮略語作為標簽時表現得更加明顯,因為有的縮略語能代表幾個含義。例如,在Del.icio.US網站中搜索SWIG標簽,WIG既可以代表c++程序設計,也可以代表語義網興趣組織。用戶雖然可以找到與檢索標簽相關的記錄,但這需要更多的時間和精力,如果記錄的標題模棱兩可或有其他標簽與記錄匹配時,檢索過程會更加困難。
2、系統間的交互性很低。
系統間的交互性很低很多網絡系統都具有標注資源和分享標簽的能力,但是目前各個大眾分類系統在語義表達和格式規范上并不一致。例如,有些系統區分字母的大小寫,而另一些系統默認為大小寫一樣,這不僅阻礙了各個系統之間的信息交互和代理軟件的自動化處理,同時也引發了一系列檢索方面的問題。另外,受語言、文化背景等因素的影響,跨國界、跨文化的大眾分類系統之間的交互性更低。
五、大眾分類法的發展趨勢
公眾分類法自2005年初被提出以來受到廣泛的關注,并在快速演化和升級,隨著大眾持續的需求和新的技術手段的加盟,它推陳出新的速度要快于目前元數據,成為目前海量網絡資源組織的熱點研究方向。
標簽正在開始web環境下對信息“分類”的一種革命性的改變,這是一種廣大民眾參與信息分類的規模化作業。在用戶充分參與的前提下,公眾分類法可提高知識組織效率,成為網絡資源組織和信息檢索的重要輔助手段。
六、結語
目前,Folksonomy在對網絡信息資源分類中表現出來的優勢已經越來越突出。Folksonomy以其非常低的入門門檻,即刻的反饋和異步的交流,動態更新和個性化等特點給用戶在標注網絡資源方面帶來極大便利的同時,伴隨而來的其標簽的隨意性、標簽垃圾等問題給用戶信息檢索帶來了難題,盡管有些系統和網站使用推薦標簽等標簽控制措施,系統卻有可能因為對資源內容缺乏全面準確的自動識別而未能推薦出準確的標簽,甚至有可能因為推薦的標簽不當進而影響到用戶使用其他標簽進行標注。所以如何在不增加用戶使用成本的前提下,應用系統可以采用一定的技術手段,通過與其他信息組織方法相結合或借鑒其他信息組織方法的理念,對Folksonomy進行優化,以改善瀏覽和檢索的效果,提升用戶體驗,是Folksonomy亟待解決的問題。
(作者單位:雷鳴,湖南工程學院圖書館閱覽部;檀朝桂,湘潭大學研究生院)
參考文獻:
[1]李鏡鏡.基于標簽的網絡Folksonomy研究[J].科技情報開發與經濟,2009(31):71-74.
[2]李文舉.公眾分類法(Folksonomy)基礎性理論研究[J].圖書館學研究,2008(9):78-80.
[3]羅昊.博客信息自組織模式研究[J].情報資料工作,2009(5):57-60.
[4]陳潔,司莉.社會分類法(Folksonomy)特點及其應用研究[J].圖書與情報,2008(3):27-30.
[5]賀芳.社會分類法(Folksonomy)研究綜述[J].網絡財富,2009(12):210-212.