999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Folksonomy知識組織模式中領域知識動態演化規律研究*

2016-10-21 09:26:46滕廣青常志遠劉雅姝趙汝南張利彪
圖書與情報 2016年4期

滕廣青 常志遠 劉雅姝 趙汝南 張利彪

摘 要:Folksonomy知識組織模式在眾多的圖書館和文獻數據庫中被應用,其特有的演化發展規律也一直是圖書情報學界關注的重點。文章借助復雜網絡理論,基于標簽之間的共現關系構建了領域知識網絡。從領域知識網絡的基本屬性、中心性和群聚性三個方面,對領域知識的演化過程進行了動態跟蹤與時序分析。研究結果顯示,Folksonomy模式中領域知識網絡逐漸向小世界網絡演化;領域知識的中心性并非完全協同一致;領域知識的群聚性與標簽關聯關系相關。

關鍵詞:Folksonomy;領域知識;知識網絡;時間序列分析;演化規律

中圖分類號: G254 文獻標識碼: A DOI:10.11968/tsyqb.1003-6938.2016082

Dynamic Evolution Rules of Domain Knowledge in Folksonomy Knowledge Organization Mode

Abstract As a kind of knowledge organization model, folksonomy is applied in many libraries and literature databases and the evolution rules of folksonomy are one of the focuses of library and information academic community. With the theory of complex networks, this article constructed domain knowledge networks based on co-occurrence relationship between tags. From the basic properties, centrality and aggregation of domain knowledge network, the evolution process of domain knowledge was tracked and time-series analyzed. The results show that domain knowledge network evolves to small-world network; Centralities of domain knowledge are not entirely concerted; Aggregations of domain knowledge are associated with the relationships of tags.

Key words Folksonomy; domain knowledge; knowledge network; time-series analysis; evolution rules

1 引言

Folksonomy[1]知識組織模式自誕生以來就受到了圖書情報學界的極大關注,特別是在學術性圖書館實踐中得到廣泛的應用。如賓夕法尼亞州立大學圖書館、北卡羅來納州立大學圖書館、新澤西理工學院圖書館、廈門大學圖書館、上海交通大學圖書館,以及Bibsonomy、CiteULike等學術文獻資源網站。與此同時,學術界也對Folksonomy知識組織模式的相關問題展開了研究,并取得了較為豐富的成果。

雪城大學的M Weaver[2]基于公共圖書館Folksonomy知識組織模式的研究表明,現實中的標簽集可以被分解為不同的分面結構,能夠幫助用戶獲取所需要的內容;德國曼海姆大學的K Eckert[3]對著名的學術型文獻數據庫Elsevier中的三種經典期刊文獻進行了分析,發現Folksonomy模式下的用戶標注是最適合塑造文獻注釋的方法之一,并在此基礎上開發了相應的開源軟件工具用于主題詞表和知識分類的分析;紐約城市大學的K Ma[4]采用冪律分析和邏輯回歸分析對文獻數據庫CiteULike的Folksonomy知識組織模式七年的使用情況進行了跟蹤,研究結果表明特定文獻的突出標簽具有鮮明的統計顯著性和穩定的增長模式;阿姆斯特丹大學的H Voorbij[5]基于荷蘭烏特勒支大學圖書館的600條隨機樣本對標簽性質和標簽與關鍵詞關系進行了研究,通過對主題標目和其他關鍵詞學科差異的分析,發現大多數標簽與主題相符,大約將近一半的記錄能夠基于標簽豐富語義內容。與此同時,國內學者也對Folksonomy知識組織模式相關問題展開了研究,比較典型的研究主要集中在Folksonomy與受控詞表結合[6]或者Folksonomy與本體結合[7]的研究方向上,也有部分學者對Folksonomy模式中的標簽緊密性[8]、標簽聚類[9]、層級結構[10]等問題進行了研究。

綜上所述,盡管隨著Folksonomy知識組織模式在圖書情報領域中的應用,學術界關于Folksonomy相關問題的研究取得了較為豐富的成果,但是其中大多數研究工作仍然停留在靜態分析的層面,僅有極少數成果采用了動態的研究視角,更缺少對Folksonomy模式中知識演化規律的揭示。鑒于此,本研究以復雜網絡理論為指導,基于標簽之間的共現關系構建特定領域的知識網絡。從時間序列的角度對Folksonomy模式中領域知識的動態演化過程進行跟蹤。以期為Folksonomy知識組織模式下領域知識演化規律的揭示做出有益的嘗試和探索。

2 研究方案與思路

2.1 整體研究方案

領域知識往往限定于特定的學科領域或者具體的學術方向,既帶有一定程度的專指性也含有知識之間的關聯性。本研究中借助復雜網絡科學[11]的理論與方法,主要從領域知識網絡的基本屬性、中心性和群聚性三個方面,對Folksonomy模式中領域知識的演化過程展開時間序列分析。

研究首先針對特定領域的文獻數據,按照不同的時間窗口根據標簽之間的共現關系構建了標簽鄰接矩陣,并進行二值化處理以獲得相應的二值鄰接矩陣;然后基于二值鄰接矩陣構建領域知識網絡,以此作為時間序列分析的基礎;再對時間序列領域知識網絡的標簽及其關聯關系、網絡密度、聚類系數、特征路徑、點度中心勢、中介中心勢、緊密中心勢、派系、k-叢等指標進行動態跟蹤分析;最后對分析結果進行討論、歸納和總結其中隱含的領域知識動態演化規律(研究思路見圖1)。

2.2 數據采集與領域知識網絡構建

研究以卡塞爾大學、維爾茨堡大學和德國L3S

研究中心共同資助的Bibsonomy文獻出版共享系統作為基礎數據源。以“semanticweb(語義網)”為檢索標簽進行檢索,共獲得領域知識相關文獻1002篇。所獲得的文獻共被287個標簽標注過,時間跨度為2006-2015年。以年份為時間刻度,將2006-2015時間區間劃分為10個時間窗口,匯總各個時間窗口中文獻數量與標簽數量的統計結果(見表1)。

進一步對標簽之間的共現(共同標注)關系進行提取,即如果2個標簽被用于同一篇文獻的標注,則這2個標簽之間具有共現(共同標注)關系。由此獲得標簽之間的共現關系總量為1508對。以標簽為節點,標簽之間的共現關系為連線構建各個時間窗口的領域知識網絡。首先基于文獻與標簽之間的隸屬關系構建隸屬關系矩陣,然后基于標簽之間的共現關系將隸屬關系矩陣轉換為鄰接矩陣。對鄰接矩陣進行二值化處理,獲得二值鄰接矩陣。基于二值鄰接矩陣構建10個時間窗口下的時間序列領域知識網絡(見圖2)。

3 領域知識演化分析

3.1 基于網絡基本屬性的演化分析

從領域知識網絡演化發展的時間序列(見圖2)可以發現,在時間軸的起始階段網絡規模較小,而且結構相對簡潔。隨著領域知識的發展,領域知識網絡的規模沿著時間軸逐漸擴大,網絡結構越來越復雜。將不同時間窗口領域知識網絡的節點(標簽)數量與連線(共現關系)數量進行對比,得到時間序列領域知識網絡節點數量與連線數量對比折線圖(見圖3)。

可以看出,起始階段領域知識網絡的節點數量與連線數量比較接近,隨著領域知識的發展二者逐漸拉開差距。領域知識網絡中的連線數量遠遠大于標簽節點數量,《信息簡史》的作者J Gleick[12]所強調的知識之間的連通性通過標簽間的共現關系逐漸凸現出來。從曲線的發展形態上看,節點曲線與連線曲線都經歷了由緩慢發展到高速增長并最終逐漸趨穩的過程,曲線存在理論上的極值和拐點,整體形態趨近于邏輯斯蒂曲線(Logistic Curve)[13]。

進一步對10個時間窗口中領域知識網絡的密度和聚類系數分別進行計算,得到時間序列領域知識網絡密度和聚類系數(見表2)。

可以看出,領域知識網絡的密度較低,并且隨著時間軸的延展呈現下降趨勢,即隨著領域知識的發展網絡逐漸稀疏。反映出領域知識發展進程中,大量的新知識不斷涌入到領域內部,既包括相關領域的知識滲入也包括領域內部的知識新生;另一方面,表2中領域知識網絡的聚類系數雖然存在波動,但始終保持在較高的水平上(>0.78)。這一現象說明,在領域知識發展過程中,基于標簽共現關系構建的領域知識網絡一直保持較高的聚類性。領域知識網絡的稀疏性和高聚類性比較符合小世界(Small World)[14]的特征,因此,進一步對領域知識網絡的特征路徑長度進行探查,獲得時間序列領域知識網絡的路徑距離分布(見表3)。

從領域知識網絡特征路徑距離分布可以發現,在領域知識發展過程中距離為2步的情況占據絕大多數,且比例逐漸增大,除去起始階段(2006、2007)外,都保持在90%以上。而且盡管隨著領域知識的發展網絡節點不斷增加,但是平均路徑長度始終保持在較短的范圍內(1.6-2.0)。這一現象說明領域知識網絡中任意2個標簽節點之間最多需要2步就可以實現連接,而且Folksonomy模式中基于標簽共現關系的領域知識網絡的特征路徑長度相比傳統的基于關鍵詞共現關系的領域知識網絡的特征路徑[15]更

短。結合前述領域知識網絡的網絡密度、聚類系數綜合考察可以發現,隨著領域知識的不斷擴容,領域知識網絡的密度逐漸下降,網絡越來越稀疏。同時,網絡始終保持著較高的聚類性和較短的特征路徑長度。根據D J Watts[16]的理論可知,領域知識網的演化越來越符合小世界網絡的判定標準,演化的結果向小世界網絡趨近。

3.2 基于網絡中心性的演化分析

傳統知識組織體系中都帶有鮮明的中心性,Folksonomy知識組織模式的中心性[17]則隱含于離散的外在表象之后。出于對Folksonomy知識組織模式中領域知識演化規律進行揭示的目的,研究中采用L C Freeman[18]提出的網絡中心性測度方法,對時間序列領域知識網絡(見圖2)的中心性進行測算。所獲得的點度中心勢(Degree Centralization)、中介中心勢(Betweenness Centralization)、緊密中心勢(Closeness Centralization)的相關指標數據(見表4)。

可以發現,領域知識網絡的點度中心勢呈現高位(2006年時間窗口中點度中心勢為78.57%,其余年份窗口中點度中心勢都大于90%)震蕩發展態勢。由于網絡的點度中心性反映節點在網絡中的核心聚集程度,因此,點度中心勢的高位波動現象說明領域知識發展過程中領域核心焦點比較鮮明,知識的擴充與核心的凝聚交叉伴生。一般情況下,知識領域內的核心焦點總是處于不斷地凝聚過程中,但是當領域中新知識擴充的步伐超越核心凝聚的腳步時,領域中原有的核心焦點會在一定程度上被淡化,網絡的點度中心勢就會下降。當然,隨著領域知識的發展

核心焦點也會被重塑,進而表現出網絡點度中心勢的起伏波動。

領域知識網絡的中介中心性反映的是知識節點對網絡資源的橋接控制程度,表4中的網絡中介中心勢表現出一定程度的波動起伏。與點度中心勢不同的是,在時間軸的前半段(2006-2010)點度中心勢與中介中心勢同步增長,即在領域知識核心逐漸顯著的同時,越來越多的標簽節點通過中間節點拉近彼此間關聯關系,此時中介中心性與點度中心性二者是互促關系。在時間軸的后半段(2011-2015)領域知識核心再次逐步凝聚(除2015時間窗口外點度中心勢總體上升),領域知識網絡的橋接程度卻逐步下降(除2011年時間窗口外中介中心勢總體下降),此時中介中心性與點度中心性二者是互擾關系。顯然,領域知識的核心性與橋接性的演化規律并不一致,表4中前后兩個階段中介中心勢演化發展的差異說明,前期領域知識網絡中連線數量的高速增長(見圖3)提高了領域知識之間的中介橋接程度;后期領域知識網絡中連線數量的緩慢增長沒能彌補網絡規模擴張造成的領域知識之間中介橋接程度的衰減。

領域知識網絡的緊密中心性反映網絡中個體知識與其他所有知識的距離遠近程度。如果網絡中的標簽節點都只需要通過很少的節點就能夠連接到其他所有標簽節點,則該網絡具有較高的緊密中心性。表4中時間軸的前半段領域知識網絡的緊密中心勢呈上升趨勢,與點度中心勢、中介中心勢同一時間段內的演化發展趨勢相一致。2011年時間窗口中由于新增標簽節點形成局部網絡碎片,故而不能計算全網絡的緊密中心勢。2012-2014年時間窗口的網絡緊密中心勢再次上升,此時的標簽間關聯關系將碎片區域與網絡主體部分連通。2015年時間窗口再次出現網絡碎片。縱觀領域知識網絡的緊密中心勢演化過程可以發現,隨著連線數量的增長標簽節點之間的關聯彼此拉近,領域知識的緊密性逐漸趨于增強;另一方面,領域知識網絡演化發展過程中也可能會出現網絡非聯通狀況,新增節點有時會構成局部碎片,此時全領域范圍內網絡的緊密中心性也就無從談起。

3.3 基于網絡群聚性的演化分析

本文分析的領域知識網絡的高聚類系數說明,領域知識網絡具有較高的群聚性,能夠在網絡內部形成知識群落[19]聚類。研究中分別從互惠性、穩健性兩個方面,采用盧斯—佩里(Luce-Perry)[20]派系(cliques)概念和賽德曼-弗斯特(Seidman-Foster)[21]k-叢(k-plex)概念對領域知識網絡的群聚性進行分析。設上述兩類凝聚子群的最小成員數量為3,獲得時間序列領域知識網絡群聚性(見表5)。

表5中,派系與k-叢的時間序列呈現總體上升趨勢,除2015年時間窗口中領域知識網絡的派系與k-叢數量有所回落外,都經歷了由緩慢發展到高速增長并最終逐漸趨穩的發展過程,與邏輯斯蒂曲線生長模型相類似。由于派系是領域知識網絡中最大的完備子圖,因此,其概念的嚴格性決定了數量相對較少。派系的完備性要求子群內部標簽節點之間相互完全連接,進而使標簽所代表的知識之間形成完全地相互支撐關系。表5中的數據顯示,在領域知識的發展演化過程中,這種具備完全相互支撐關系的知識群落(子群)數量呈現總體遞增趨勢。特別是與圖3結合考察可以發現,網絡連線數量高速增長的階段也是派系數量上升最快的階段。由此可知,領域知識演化過程中派系數量的增長與標簽共現關系(連線)數量的增長密不可分,并且隨著領域知識的發展領域內知識之間的相互促進性越發顯著。

由于派系的概念過于嚴格,因此知識領域中完全符合派系界定標準的子群條件比較苛刻,現實中更多的情況是知識群落內大部分知識之間具有相互支撐關系。因此,進一步使用更穩健的k-叢的概念對領域知識網絡的群聚性進行考察,只要子群內每一個標簽節點與不少于n-k個節點具備關聯關系即可。表5中k-叢指標的k取值為2,即子群內任意節點至少與n-2(n為子群內節點總數)個節點連接具備相互支撐關系。通過表5中的數據可以發現,由于k-叢的穩健性使得同一時間窗口中k-叢的數量遠遠大于派系的數量,這一現象在時間軸的中后期尤為明顯。而且k-叢的高速增長期同樣對應著圖3領域知識網絡中連線的高速增長期,顯然領域知識網絡演化過程中標簽共現關系(連線)數量的增長促進了k-叢數量的增長。

由于領域知識網絡中連線數量的增長直接對派系和k-叢產生影響,因此派系和k-叢在數量增加的同時容量也在擴充。當網絡節點數量不變連線數量持續增長,或者節點數量增加的速度落后于連線數量增長的速度時,子群容量的擴充就有可能導致子群數量的減少。表5中2014-2015年時間窗口的數據就說明了這一點(參照表1中2014-2015節點數量不變連線數量繼續增加的情況)。這一現象從知識群落容量(而不是數量)方面反映出領域內知識之間相互支持與相互促進的特征隨著領域知識的發展日漸顯著,也再一次印證了知識之間的關系比知識點本身更為重要的觀點。

4 結果與討論

研究中以復雜網絡分析為基本方法,基于Folksonomy知識組織模式中標簽共現關系構建特定領域知識網絡,以動態發展的視角對領域知識的演化規律展開時間序列分析,初步得出如下結論:

(1)隨著領域知識的發展,Folksonomy模式中領域知識網絡逐漸向小世界網絡演化。領域知識網絡演化過程中網絡連線(標簽共現關系)的數量遠遠超過標簽節點數量,其生長曲線趨近于邏輯斯蒂曲線模型。由于演化過程中新知識和新關聯關系的產生和加入,領域知識網絡密度遞減的同時又保持較高的聚類系數和較短的特征路徑長度。因此,領域內不同知識之間僅需要較短的路徑就能夠彼此建立連接。

(2)領域知識演化過程中網絡中心性并非完全協同一致。領域知識網絡演化過程中網絡的點度中心性、中介中心性、緊密中心性在時間軸的前半段保持同步增長。在時間軸的后半段點度中心性和緊密中心性在經歷了短暫回落后再次遞增,中介中心性則表現出遞減趨勢。而且緊密中心性還會受到局部網絡碎片的影響。因此,領域知識網絡中心性的演化并非完全協同一致。

(3)領域知識演化過程中網絡群聚性與標簽關聯關系相關。領域知識網絡的凝聚子群(派系、k-叢)數量隨著領域知識的發展逐漸遞增,特別是在網絡連線(標簽共現關系)的高速增長階段增幅最大。高速增長階段也是增長曲線斜率最大的階段,這一階段中連線數量的增速與標簽節點數量的增速迅速拉開差距,急劇豐富的標簽關聯關系推動領域內凝聚子群數量迅速上漲。當兩種曲線增速差距縮小或者逆轉時,領域知識中內部相互支持的知識群落的數量會出現回落。

5 結語

本研究基于標簽共現關系構建特定領域知識網絡,從時間序列的角度對領域知識網絡演化過程進行了跟蹤與剖析,對Folksonomy模式中領域知識演化規律的揭示做出了探索。研究工作中也存在一些尚不完善之處,對網絡特征屬性指標的考察還不夠全面,研究數據尚不能窮盡所有的領域知識資源。這些工作有待于在未來的研究中進一步探索和完善。

參考文獻:

[1] Peters I,Stock G W.Folksonomy and information retreval[J].Proceedings of the American Society for Information Science and Technology,2007,44(1):1-28.

[2] Weaver M.Contextual metadata:faceted schemas in virtual library communities[J].Library Hi Tech,2007,25(4):579-594.

[3] Eckert K,H葬援nger C,Niemann C.Tagging and automation:challenges and opportunities for academic libraries[J].Library Hi Tech,2009,27(4):557-569.

[4] Ma J.The sustainability and stabilization of tag vocabulary in CiteULike[J].Online Information Review,2012,3(5):655-674.

[5] Voorbij H.The value of LibraryThing tags for academic libraries[J].Online Information Review,2012,36(2):196-217.

[6] 邰楊芳,賈君枝,賀培風.基于受控詞表的Folksonomy優化系統分析與設計[J].情報科學,2014,32(2):112-117.

[7] 熊回香,王學東.大眾分類體系中標簽與本體的映射研究[J].情報科學,2014,32(3):121-126.

[8] 滕廣青,畢達天,任晶,等.Folksonomy中用戶標簽的語義緊密性研究[J].現代圖書情報技術,2013,29(12):48-54.

[9] 吳江.自由分類標簽類聚成網狀分類結構研究與實現[J].圖書情報知識,2011(1):75-81.

[10] 陳麗霞,竇永香,秦春秀.利用社會化標簽實現P2P語義推薦[J].圖書情報工作,2011,55(22):110-113.

[11] Lewis T G.陳向陽,巨修煉,等譯.網絡科學:原理與應用[M].北京:機械工業出版社,2011:1-14.

[12] Gleick J.高博譯.信息簡史[M].北京:人民郵電出版社,2013:409-421.

[13] Pearl R,Reed L J.The logistic curve and the census count of 1930[J].Science,1930,72(1868):399-401.

[14] Milgram S.The small world problem[J].Psychology Today,1967,1(1):61-67.

[15] 趙汝南,常志遠,姜博,等.基于網絡演化的領域知識發展趨勢研究[J].數字圖書館論壇,2016(3):24-29.

[16] Watts D J.Network,dynamics and the small-world phenomenon[J].American Journal of Sociology,1999,105(2):493-527.

[17] 滕廣青,畢強.領域本體與社群分類法結構中心性的比較研究[J].情報學報,2013,32(10):1037-1045.

[18] Freeman L C.Centrality in social networks conceptual clarification[J].Social Networks,1979,1(3):215-239.

[19] 滕廣青,楊明秋,田依林,等.Folksonomy模式中的知識群落及其核心知識分析[J].圖書情報工作,2015,59(22):124-129.

[20] Luce R,Perry A.A method of matrix analysis of group structure[J].Psychometrika,1949,14(2):95-116.

[21] Seidman S B,Foster B L.A graph theoretic generalization of the clique concept[J].Journal of Mathematical Sociology,1978,6(1):139-154.

a

作者簡介:滕廣青(1970-),男,東北師范大學計算機科學與信息技術學院信息管理系副教授;常志遠(1989-),男,東北師范大學計算機科學與信息技術學院碩士研究生;劉雅姝(1993-),女,東北師范大學計算機科學與信息技術學院碩士研究生;趙汝南(1991-),女,東北師范大學計算機科學與信息技術學院碩士研究生;張利彪(1974-),男,東北師范大學計算機科學與信息技術學院副教授。

主站蜘蛛池模板: 亚洲国产看片基地久久1024| 全色黄大色大片免费久久老太| 香港一级毛片免费看| 日韩欧美中文字幕在线精品| 色视频国产| 日韩精品一区二区三区大桥未久 | 99视频国产精品| 高清欧美性猛交XXXX黑人猛交| 国产精品jizz在线观看软件| 日本精品视频| 欧美有码在线观看| 亚洲黄色高清| 亚洲精品在线影院| 欧美国产三级| 久久一色本道亚洲| 亚洲男人的天堂在线| 亚洲欧美国产五月天综合| 久久精品亚洲热综合一区二区| 正在播放久久| 国产在线一区二区视频| 国产一级毛片网站| 无套av在线| 欧美日本在线| 波多野结衣一区二区三区88| 精品国产欧美精品v| 九九久久精品国产av片囯产区| 草草影院国产第一页| 国产天天色| 人妻精品久久无码区| 欧美不卡视频在线观看| 福利在线不卡| 91福利一区二区三区| 亚洲精品自在线拍| 狠狠v日韩v欧美v| 国产高清毛片| 国产精品lululu在线观看| 国产免费a级片| 亚洲一区二区三区麻豆| 国产浮力第一页永久地址| aa级毛片毛片免费观看久| 1769国产精品免费视频| 久青草免费视频| 国产白浆一区二区三区视频在线| 婷婷亚洲视频| 亚洲成人免费在线| 正在播放久久| 日本不卡在线视频| 国产精品七七在线播放| 免费人成黄页在线观看国产| 18禁黄无遮挡免费动漫网站| 91区国产福利在线观看午夜| 亚洲成人一区二区三区| 成人伊人色一区二区三区| 日日拍夜夜嗷嗷叫国产| 久久精品国产亚洲麻豆| 欧美成人在线免费| 99热免费在线| 91精品专区| 日韩欧美视频第一区在线观看| 久久久久青草线综合超碰| 毛片一区二区在线看| 国产91精品调教在线播放| 日韩精品毛片| 色综合天天综合| 高h视频在线| 一级不卡毛片| 日本影院一区| 国产精品视频导航| 99在线观看精品视频| 97人人做人人爽香蕉精品| 激情成人综合网| 中文字幕第1页在线播| 狠狠色婷婷丁香综合久久韩国| 香蕉久久国产超碰青草| 国产精品冒白浆免费视频| 国产麻豆精品在线观看| 国产成人超碰无码| 激情五月婷婷综合网| 色综合婷婷| 蜜臀av性久久久久蜜臀aⅴ麻豆| 日韩av高清无码一区二区三区| 欧美日韩国产系列在线观看|