999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于UCINET的詞匯共現網絡可視化研究

2014-07-27 06:20:00周拴龍
創新科技 2014年20期
關鍵詞:可視化語義詞匯

周拴龍

(鄭州大學信息管理學院,河南 鄭州 450052)

基于UCINET的詞匯共現網絡可視化研究

周拴龍

(鄭州大學信息管理學院,河南 鄭州 450052)

詞匯按照一定規則相互聯系形成的網絡結構呈現出復雜網絡特征。本文首先給出了詞匯共現網絡的構造方法,分析詞匯網絡的復雜網絡特征,然后利用復雜網絡可視化工具UCINET對詞匯共現網絡進行可視化研究,從可視化網絡圖中獲取詞匯聚類的涌現。

UCINET;詞匯網絡;共現;可視化;涌現

1 引言

近年來,隨著復雜網絡研究的不斷深入,人們發現現實世界中存在著許多具有相同特征的網絡拓撲結構,如萬維網、社會關系網、科學研究合作網絡、流行病傳播網絡等,這些網絡具有與規則網絡不同的統計特性,其中最重要的就是小世界特性和無標度特性。研究表明作為自然語言中能夠獨立活動的最小語義單位的詞匯按照一定規則相互聯系形成的網絡結構按照規則的層次可分為:共現網絡、語法網絡和語義網絡,無論在哪個層次上都體現出了復雜網絡特征。

詞匯網絡可視化屬于復雜網絡可視化的范疇。由于復雜網絡規模很大并且結構復雜,不但難于組織和管理網絡中的信息,而且包含在其中非常豐富的信息資源也將難于被發現,可視化技術提供了有效的方法來理解復雜網絡的結構并從中挖掘有效信息[1]。本文利用復雜網絡可視化工具UCINET對詞匯共現網絡進行可視化研究,目的在于從可視化網絡圖中獲取詞匯聚類、文本主題詞的涌現。

2 詞匯共現網絡及其特性分析

2.1 詞匯共現網絡定義。詞匯的共現網絡是最簡單的一種自然語言網絡。在網絡圖中,每一個詞匯作為一個節點,若兩個詞匯出現在同一個窗口(句子、段落、篇、領域等)中,則認為它們之間有一定相關關系,它們之間存在一條邊,邊具有權值表示兩個詞匯共現程度的大小。網絡圖中的邊可以是無向邊也可以是有向邊,分別表示是否忽略詞匯順序情況下的詞匯關系。根據圖論知識給出詞匯共現網絡的定義。

定義1 詞匯共現網絡

詞匯網絡WN=<Wd,Rl,Dt>,其中

Wd={w1,w2,…,wn}是一個非空集合,稱為詞匯集,其中元素Wi(i=1,2,…,n)稱為詞匯節點;

Rl={(wi,wj)|wi,wj∈Wd}是無序集Wd&Wd的子集,稱Rl為WN的詞匯節點之間共現邊的集合,集合中的元素(wi,wj)稱為共現邊。此時Rl為忽略了詞匯之間出現順序的共現邊集合,因此,(wi,wj)=(wj,wi)。

D={di|dij∈R∧i,j=1,2,…,n}是實數集合的子集,對于任意的共現邊(wi,wj)=都有D中一個元素且僅有一個元素dij與之對應,元素dij稱為共現邊(wi,wj)的權值。

從定義中可以看出詞匯網絡屬于標定的無向帶權圖。

從以上定義不難看出詞匯共現網絡構建方法主要有三個步驟:

2.1.1 確定W集合中的詞匯結點。

2.1.2 確定詞匯結點之間的共現邊。應用窗口機制選擇一定數量的詞匯建立詞匯網絡,該窗口可以是一篇文章、某個時間段內的所有領域文獻、某一個專題的文獻等,詞匯結點如果處于同一個窗口就將兩個同現的詞匯結點用共現邊連接起來,得到詞匯網絡。

2.1.3 確定邊的權值。最簡單的可以選擇詞匯共現頻率的倒數作為邊的權值,共現頻率越大,權值越小,則表明兩個詞之間的距離越近。權值d的計算公式為:

其中P(wi)表示詞匯集合中詞匯wi出現的概率,P(wj|wi)表示詞匯wi出現的條件下詞匯wj出現的概率,P(wi,wj)表示兩個詞匯同時出現的概率??紤]到詞匯出現某一個窗口是獨立的,所以公式(1)也可以用以下公式代替:

2.2 網絡特性分析。詞匯共現網絡除了具有小世界特性以及無標度特性以外,還具有其他一些復雜網絡的共同性質。

2.2.1 非線性。具有非線性性質的系統不服從疊加原理,即兩次獨立的輸入與兩個聯合的輸入產生的系統效果不同,用數學公式表示為:f(x1)+f(x2)≠f(x1+x2)。在詞匯網絡中任意兩個單獨出現的詞匯語義之和一定弱于這兩個詞匯同時出現的語義,例如在標引文獻時,利用兩個不同的關鍵詞所標引的文獻數量之和一定多于用兩個詞共同標引的文獻數量。

2.2.2 存在著社團結構。整個網絡由若干個社團構成,每個社團內部的節點之間的連接相對非常緊密,但是,各個社團之間的連接相對來說卻比較稀疏。詞匯網絡中的社團結構體現在詞聚類上,通常的詞聚類結果也可以利用復雜網絡的社團結構發現算法獲得。

2.2.3 涌現現象。由于非線性特征,復雜網絡中會出現涌現現象,即宏觀行為是在復雜系統中微觀組件的非線性相互作用下而自發涌現出來的表現。詞匯網絡中的單個詞匯只具有詞匯各自的語義,兩兩詞匯間的關系只能局限于共現(語法、語義)相關關系,但是,作為復雜網絡的詞匯網絡能夠涌現出具有檢索和標引功能的關鍵詞,甚至是具有層次結構的分類。

3 詞匯共現網絡的UCINET可視化

3.1 UCINET介紹。UCINET6是一款功能全面的復雜網絡分析工具,該軟件主要用以分析社會網絡,它包含了相當豐富的網絡分析工具,是社會網絡分析領域最著名同時也最為常用的一款網絡分析軟件包。它能讀取文本文檔(*.txt)和excel文檔(*.exl),能夠對表示關系的數據做中心性分析、子群分析、角色分析和基于置換的統計分析等這些社會網絡分析法所包含的主要分析。

3.2 詞匯共現網絡的可視化過程

3.2.1 采集詞匯和確定共現邊

采集詞匯最直觀的方法是利用分詞算法將窗口(句子、段落、篇、領域等)中具有語法、語義的字串分為獨立的詞匯,這些詞匯兩兩之間具有相同窗口的共現關系。

本文實驗選取的數據來自中國知網www.cnki.net圖書、情報與檔案領域的核心期刊文獻。實驗未涉及分詞,為簡單起見僅選取文獻關鍵詞,并確定窗口為“篇”。這樣確定了同一窗口中詞匯節點以及節點間的邊。表1給出7個窗口中的詞匯節點。

3.2.2 確定共現邊的權值。利用CAJViewer中的“搜索”功能查找關鍵詞在文獻中出現的次數并計算其在詞匯集合中出現的頻率。在UCINET6中輸入詞匯矩陣。

3.3 可視化結果的分析及應用

表 1 7個窗口中的詞匯節點

圖 1 共現詞匯網絡可視化結果

圖 2 詞匯共現網絡的聚類結果

詞匯網絡的可視化結果。以上數據在UCINET6中得到可視化的共現詞匯網絡圖,如圖1所示。圖中每個詞匯以節點表示,出現在同一個窗口的節點之間有邊相連,邊上標注的數字是兩點的共現頻率的倒數,作為兩點之間的距離。UCINET允許選擇不同的網絡顯示方式,圖1是圓形顯示方式。

UCINET針對各種不同的社會網絡提供中心性分析、子群分析、角色分析和基于置換的統計分析等分析工具[2]。例如,圖2給出了利用層次聚類法得到的詞匯網絡中的詞匯聚類結果,詞匯聚類結果有助于用戶得到相關性較高的詞匯簇,在檢索應用中,可利用相關詞匯依次查找,提高查全率。

4 結語

本文提出了一種建立共現詞匯網絡的方法,分析了詞匯網絡所具有社會化網絡特征,然后利用復雜網絡可視化工具UCINET對詞匯共現網絡進行可視化研究,從可視化網絡圖中獲取詞匯聚類的涌現。由于本文主要工作是實驗性的考察該方法的可行性,因此文中所選數據量較小,下一步的工作主要集中在數據的收集和整理,選擇3 000個以“篇”為單位的窗口,以此得到更精確的詞匯聚類。

[1]克勞斯.邁因策爾.復雜性中的思維[M].北京:中央編譯出版社,2000.

[2]約翰.斯科特著,劉軍譯.社會網絡分析法[M].重慶:重慶大學出版社,2007.

G203

A

1671-0037(2014)10-74-2

周拴龍(1964-),男,碩士,副教授,研究方向:復雜網絡、數字圖書館。

猜你喜歡
可視化語義詞匯
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
基于CGAL和OpenGL的海底地形三維可視化
語言與語義
本刊可直接用縮寫的常用詞匯
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
主站蜘蛛池模板: 不卡午夜视频| 国产精品自在自线免费观看| 91精品小视频| 成人午夜视频网站| 亚洲中文字幕无码爆乳| 国产在线91在线电影| 成人精品视频一区二区在线| 国产内射一区亚洲| 美女无遮挡拍拍拍免费视频| 麻豆精品在线| 青青青草国产| 国产在线98福利播放视频免费| 午夜不卡视频| 国产一区二区三区在线观看视频| 精品乱码久久久久久久| 国产又色又刺激高潮免费看| 91啪在线| 高潮毛片免费观看| 欧美久久网| 免费国产高清精品一区在线| 国产国拍精品视频免费看| 欧美午夜久久| 国产精品开放后亚洲| 亚洲中文字幕精品| 日韩欧美国产另类| 欧美成人综合在线| 国产精品成人一区二区不卡| 婷婷综合在线观看丁香| 草逼视频国产| 成人国产精品一级毛片天堂| 欧美性精品| 国产极品嫩模在线观看91| 一本大道香蕉高清久久| 国产爽妇精品| 91视频99| 中文字幕亚洲无线码一区女同| 女人18毛片水真多国产| 欧洲精品视频在线观看| 日韩午夜伦| 久久久久久高潮白浆| 亚洲AV无码乱码在线观看代蜜桃 | 精品无码日韩国产不卡av| 国产精品香蕉在线| 毛片视频网址| 天堂成人av| 精品一区二区三区自慰喷水| 99ri精品视频在线观看播放| 91精品网站| 国产在线拍偷自揄观看视频网站| 国产欧美日韩另类| 欧美日韩91| 国产国拍精品视频免费看 | 国产精品毛片一区视频播| av在线人妻熟妇| 在线视频97| 天堂av高清一区二区三区| 波多野衣结在线精品二区| 看av免费毛片手机播放| 亚洲综合欧美在线一区在线播放| 全部无卡免费的毛片在线看| 青青青草国产| 天堂网亚洲综合在线| 久久精品91麻豆| jizz国产视频| 国产成人精品综合| 久久国产亚洲偷自| 免费无码网站| 97在线碰| 欧美一级高清视频在线播放| a级毛片在线免费| 国产91在线免费视频| 午夜久久影院| 亚洲首页在线观看| 久久一本日韩精品中文字幕屁孩| 亚洲av无码专区久久蜜芽| 999精品在线视频| 免费A级毛片无码免费视频| 亚洲免费毛片| 欧美性猛交xxxx乱大交极品| 在线观看亚洲精品福利片| 精品一区二区三区自慰喷水| 久久久久久国产精品mv|