999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

唐詩宋詞中的超網絡特性分析

2021-09-09 08:09:12王高杰冶忠林趙海興
計算機應用 2021年8期

王高杰,冶忠林,趙海興,4*,朱 宇,孟 磊

(1.青海師范大學數學與統計學院,西寧 810008;2.青海省藏文信息處理與機器翻譯重點實驗室(青海師范大學),西寧 810008;3.藏文信息處理教育部重點實驗室(青海師范大學),西寧 810008;4.青海師范大學計算機學院,西寧 810016)

0 引言

最近幾年,隨著以中央電視臺《中國詩詞大會》為代表的綜藝文化類節目的熱播,全國掀起一陣全民皆詩的文化熱潮。唐詩代表了中國古典詩歌創作的最高成就,從“初唐四杰”到“盛唐氣象”,從中唐詩歌“元白詩派”“韓孟詩派”到“晚唐余暉”,無不代表著唐朝詩歌在中國傳統古典文學上的地位。宋詞是我國古典詩詞的又一創作高峰,從豪放派詞人蘇軾的“大江東去,浪淘盡,千古風流人物”,到文天祥的“人生自古誰無死,留取丹心照汗青”的感人詩句,這些詩詞對后世有著深刻的影響。唐詩宋詞作為中國優秀傳統文化的重要組成部分,學者們歷來從文學、文化角度對詩詞進行研究分析,本文提出一個使用復雜超網絡的方法,對唐詩宋詞構建超網絡,并分析了唐詩宋詞的超網絡拓撲特性,這些網絡特性能折射出唐宋時期詩人的用字用詞和審美傾向。

復雜網絡[1-2]從發展之初就引起人們極大的關注。目前,復雜網絡已經廣泛應用到交通網絡、生物網絡、社會網絡、新陳代謝、引文網絡等各種現實網絡的研究中。隨著復雜網絡的發展,在研究一些實證問題時,學者們發現基于普通圖的網絡不能完全刻畫現實網絡中的很多特征,或者不能充分說明要研究的問題。比如在科研合作網絡中,普通網絡只能表示任意兩個科學家的合作情況,但無法準確刻畫多個科學家合作的情形。以往處理這類問題用二部圖來解決,即用一組不相交的點集來表示論文,用另一組不相交的點集來表示作者,但此種方法失去了“點”定義下的同質性,于是人們尋求對網絡更為合適和準確的描述方法——基于超圖[3]的超網絡。超網絡節點與超邊有多對多的關系,能更多維度、多樣化地進行分析,超網絡可以將多個同質節點構成的集合看作一個超邊,而非基于普通圖的網絡將節點與節點直接連接,能更清晰表現節點之間的關系。超邊的引入,不僅降低了網絡結構的復雜度,而且很好地刻畫網絡中的復雜關系。這種獨特的優勢可以描述網絡節點之間的高階關系,是一般普通網絡方法所不及的[4]。

另外,在以普通圖為基礎的復雜網絡模型構建時,采用普通的點邊關系構建唐詩宋詞網絡,字與字之間的邊難以定義,從復雜網絡指標分析該唐詩宋詞網絡較難挖掘出具有鮮明的時代印記的用字、用詞、句法特征。因此,本文從超網絡視角建立唐詩超網絡和宋詞超網絡,該方法將每一首唐詩、宋詞分別作為一個超邊,唐詩語料和宋詞語料中出現的每一個漢字作為超網絡中的節點,從而分析唐詩宋詞超網絡中的相關拓撲指標和蘊含的更多的信息,而不僅僅對每首詩詞的分析或某個主題的研究。

超網絡的結構特性決定了本文采用超網絡模型,這可以將唐詩宋詞中的漢字表征為超邊中的節點,而非普通網絡的邊關系。這種高階特征對網絡的分析非常有用,例如,字與字之間的一階關系、二階關系等高階關系無法采用普通網絡的結構進行表示。此外,采用超網絡表征唐詩宋詞網絡,并用超網絡指標分析唐詩宋詞網絡,可以挖掘出更具有時代背景的專業知識。從唐詩超網絡和宋詞超網絡的定性分析中,不僅定量揭示了唐詩宋詞超網絡中的相關拓撲指標和網絡特性,而且從側面反映出唐代詩人和宋代詞人作品中用詞的審美傾向。

王眾托[5]對超網絡的理論和應用進行了評述,提出超網絡是高于而又超于現存的網絡,或者是網絡組成的網絡,存在于物流網絡、信息網絡等相互交織系統中,并對基于變分不等式和超圖的超網絡分析方法進行了探討。Liu等[6]根據知識傳播的特點提出了知識傳播超網絡模型。Wang等[7]在超網絡理論和微信在線社會關系的基礎上,提出了一個具有競爭力和節點年齡的進化超網絡模型,利用泊松過程理論和連續技術對模型進行了分析,并得到了超網絡的平穩平均超度分布。胡楓等[8-9]構建了BA(Barab’asi-Albert)無標度網絡的擴展超網絡演化模型,將BA網絡視為特例模型,并對科研超網絡進行了建模分析,發現隨著網絡規模的增大,超網絡的動態演化模型超度分布遵循無標度分布。索琪等[10-11]和Suo等[12]將電視節目定義為節點,播出時間段定義為超邊,對基于超網絡模型的電視節目競爭關系相關拓撲指標進行了研究;基于傳染病學建模思想,模擬超網絡中的輿情傳播過程,探討了輿情的傳播時間和傳播范圍,揭示了網絡輿情的傳播規律;在SIS流行模型的基礎上,構建了兩種傳播模型,從信息傳播動力學以及超網絡以及內在驅動力等問題進行了分析。Motter等[13]研究發現英語語言概念網絡具有小世界特性。

目前,對唐詩宋詞的研究也有一些重要的研究成果,例如,劉宇凡等[14]研究了唐代以來漢語文學作品的字頻演變;李良炎等[15]研究了基于詞聯接的詩詞評價技術;趙建明等[16]研究了基于機器學習的宋詞風格識別;龔嵐[17]研究了唐詩宋詞中的高頻字;申資卓等[18]研究了基于主題模型的古典樂器詩詞文本挖掘;冶忠林等[19-20]采用神經網絡矩陣分解的方法進行詞表示學習,這種方法可以較方便地推廣到唐詩宋詞的字向量學習領域。傳統上對唐詩宋詞的研究雖然豐富,但是仍然存在不足:1)對唐詩宋詞的研究大多是將每首詩或每首詞分開賞析,來解讀詩人或詞人要表達思想感情,很少從現代計算機和統計的層面進行分析;2)往往選取一個主題進行研究,忽視了唐詩語料和宋詞語料整體上所蘊含的知識;3)未能采用超網絡模型對唐詩宋詞進行建模分析,通過觀察和計算超網絡中的相關指標和特性來分析唐詩宋詞。

針對上述問題,本文提出一種基于復雜超網絡的唐詩宋詞研究方法。首先,用唐詩語料和宋詞語料建立超網絡,并給出了相應的算法偽代碼。計算了唐詩超網絡和宋詞超網絡中每一個節點的超度,節點超度大小不僅能反映出該節點所覆蓋的超邊數目,而且能表現出節點在超網絡中的重要程度,側面反映出節點在超網絡的核心地位。此外,本文計算了唐詩超網絡和宋詞超網絡的平均超度,平均超度是一個很好地刻畫超網絡稀疏性的指標,意味著平均而言超網絡中每個節點與多少個超邊相連。超邊節點度和超邊節點度分布能較好地表現出超網絡超邊中節點的分布特性,這不僅蘊含每首詩和每首詞的字數,而且從唐詩和宋詞兩個大規模語料庫整體上認識超邊分布情況。

再次,得到唐詩超網絡和宋詞超網絡的每個節點超度之后,可以進一步得到超網絡中的一些性質。把超網絡中的超度按從小到大的順序排列,從而統計超度為k的節點數占整個超網絡節點數的比例。從概率統計角度來看,超度分布視為超網絡中隨機選擇一個節點,該節點超度所對應的概率。實驗結果表明,唐詩宋詞超網絡的超度分布為冪律分布,呈現無標度特性。最后,基于超網絡的拓撲結構,將超網絡的超邊對應于投影網絡中的節點,超邊之間的公共節點對應于投影網絡的連邊,計算了投影網絡的平均路徑長度和聚類系數,結果顯示,唐詩宋詞超網絡超邊較高的重疊程度,發現了其網絡的小世界特性。

本文主要工作包括:1)基于超圖、復雜網絡性質的思想,用復雜網絡分析手段構建了唐詩宋詞超網絡關聯矩陣,對唐詩宋詞提出新的研究方法。2)計算得到唐詩宋詞超網絡中每個節點的超度,并發現超度分布近似為冪律分布,揭示了唐詩宋詞超網絡的無標度特性;計算唐詩宋詞超網絡超邊的超邊節點度,對超邊節點度分布進行了分布特性研究。3)最后,選取中國文學史上四位偉大詩人、詞人的作品集(李白詩集、杜甫詩集、蘇軾詩詞集、辛棄疾詩詞集)構建超網絡,對比發現,其超網絡有較小的平均最短路徑長度和較大的聚類系數,發現了其中的小世界特性。

1 超網絡的概念及其相關統計指標

1.1 超網絡的概念

圖1 一個簡單的超圖示例Fig.1 One simplehypergraph example

V={v1,v2,v3,v4,v5,v6,v7,v8}

E={e1={v1,v2,v3},e2={v2,v3},e3={v3,v4,v5},e4={v6,v7},e5={v1,v7,v8}}

1.2 超網絡的統計特性

定義1 關聯矩陣。超圖H=(V,E)是一個n×m階關聯矩陣Mij,其中:

定義2 超邊節點度[25]。超邊中的節點采用全連接方式,定義為一個超邊中節點的個數。在唐詩宋詞超網絡中,超邊節點度為一首詩或一首詞中包含的漢字個數。記為|ej|。在超圖的關聯矩陣Mij中,超邊節點度是列中非零元素的數目,即:

定義3 節點超度[26]。超圖H=(V,E)的節點超度為包含該節點的超邊數目,記為dHhd(vi)。在超圖的關聯矩陣Mij中,節點超度即是對應的行中非零元素的數目,即:

定義4 超度中心性。在普通網絡中,認為一個節點鄰居數目越多,影響力越大。超網絡中,同樣認為節點所在的超邊數越多,影響力就越大,節點vi的超度記為ki,代表節點vi所在的超邊的數目,N為超網絡中節點的數目,超度中心性是節點最基本的靜態特征。一個節點的超度值越大,能影響的鄰居就越多。為了進行比較,定義節點vi的歸一化度中心性指標為:

定義5 超邊節點度分布。超圖H=(V,E)的超邊節點度分布是指超圖H中超邊節點度的概率分布或頻率分布。

定義6 節點超度分布[27]。超圖H=(V,E)的節點超度是指超圖H中節點超度的概率分布或頻率分布。節點超度分布p(k)為超度k的節點占整個網絡的比例,即:

同時可以計算出超網絡中所有節點的超度的平均值,即平均超度為:

其中:Nk表示為超度為k的節點個數。

定義7 平均路徑長度[27]。復雜網絡的平均路徑長度L為任意兩個節點距離的平均值。在超網絡中,超網絡中的平均路徑長度的定義為任意兩個超邊的距離的平均值。在超網絡中,超邊對應于投影網絡中的節點,超邊中的公共節點對應于投影網絡中的連邊,兩條超邊的距離對應于投影網絡的距離。

定義8 集聚系數[28]。集聚系數是描述網絡中節點集聚程度的參數。節點的集聚系數定義為它的相鄰節點之間的連接數與它們可能存在的連邊數之比。網絡中度為ki的節點i的集聚系數Ci定義為:

其中,Ei是節點i的ki個節點之間實際存在的邊數,即節點i的ki個鄰接節點之間實際存在的邊數。一個網絡的集聚系數C定義為網絡中所有節點的聚類系數的平均值:

超網絡的集聚系數表示一條超邊與其他超邊的重疊程度。在超網絡中,超邊對應投影網絡的節點,超邊之間的公共節點對應于投影網絡中的連邊。因此,計算超網絡的集聚系數可以轉化為計算投影網絡的集聚系數。

2 唐詩宋詞超網絡的構建

2.1 唐詩宋詞超網絡構建方法

對于古漢語,尤其詩詞的分詞處理并不簡單,古漢語微言大義,字字千鈞。此外,現有的分詞系統是基于現代文本語料進行訓練而得,不能直接用于對古詩詞進行分詞,且目前沒有很好的古詩詞分詞解決方案,因此,筆者通過將詩詞逐字切分的方式,將每一個漢字視為超網絡中的節點。

本文采用的唐詩語料為清朝康熙年間曹寅主持編修的《全唐詩》,采用的宋詞語料為從http://www.zqshu.com網址上下載的《全宋詞》。在構建唐詩超網絡和宋詞超網絡時,首先將唐詩語料和宋詞語料進行了清洗,去除了《全唐詩》和《全宋詞》有缺失的詩詞或僅有殘句的詩詞,將唐詩語料中出現的每個漢字作為節點,唐詩語料中每一首唐詩作為超網絡中的每一個超邊。如果第i個漢字出現在了第j首詩中,那么超邊j就包含節點i。對41 281首唐詩和18 841首宋詞分別構建了超網絡關聯矩陣。

在唐詩語料中,將文本中7 460個漢字作為節點,41 281首唐詩作為超邊構建唐詩超網絡。同樣,在宋詞語料中,每首詞做一條超邊,詞中出現的5741漢字作為節點構建宋詞超網絡。于是就構建了5 741個節點和18 860條超邊的宋詞超網絡。

本節對本文中超網絡模型構建方法、超網絡超度和超度分布給出了算法流程和算法偽代碼,由于宋詞超網絡與唐詩超網絡構建方法相同,本文僅給出唐詩超網絡構建方法。

構建唐詩超網絡關聯矩陣的算法偽代碼如下:

輸入:唐詩字詞語料庫C;

輸出:唐詩超網絡關聯矩陣A。

Begin:

1)k=getlength(C1);

/*設置C,每行一首唐詩或宋詞,詩設為C1*/

2)i=0;

/*構建字詞典*/

3)whilei

4)list(i)=getword(k); /*每首詩的單個字存于一個數組中*/

5)for(j=0j

6) if(worddic.contain(list(i).get(j)))

7) worddic.put(list(i).get(j));

8) end if

9)end for

10)i=i+1;

11)end while

/*開始構建關聯矩陣A*/

12)i=0;

13)whilei

14)list(i)=getword(k); /*將每首詩的漢字存于數組中*/

15)for(k=0;k

16)for(p=0;p

20) if(worddic(k)==list(i).get(p)))

22)A(p,k)=1;

23) elseA(p,k)=0;

24) end if

25)end for

26)end for

27)end while

28)returnA;

2.2 唐詩宋詞超網絡分析方法

在研究超網絡特性時,超度和超度分布是衡量超網絡特性的重要指標。節點超度反映了超網絡中節點的重要性,節點的超度越大,節點在網絡中的地位越高。在唐詩超網絡中,節點的超度表示該漢字單元在唐詩語料中所屬唐詩超邊的數目。此外,超邊節點度指超網絡中超邊所含節點個數,即一首詩所含漢字個數或一首詞中所含漢字個數,考慮超邊節點度,能很好反映超網絡超邊中節點規模。這不僅可以從總體上表現出唐代詩人宋代詞人的作品長度,而且能反映出每首詩詞中的句數、字數特征。超邊節點度分布則體現了超邊的分布規律。

算法1 生成超度算法。

輸入:關聯矩陣A;

輸出:超度關聯矩陣P。

Begin:

1)A=AT;

2)P=zero(1,size(A;1));

3)for(i=0;i

4)num=0;

5)for(j=0;j

6) {if(A(i,j)!=0)

7)num++;

8) end if}

9)end for

10)end for

11)returnP;

算法2 生成超度分布算法。

輸入:超度矩陣P;

輸出:超度分布矩陣Q。

Begin:

1)Mapmap=new Hach Map);

2)for(i=0;i

3) {if(map.contain(P(i))

4)map.set(P(i),map.get(P(i)+1));

5) else

6)map.put(P(i),1);

7) end if

8)end for}

9)Q=zeros(2,map.size()); /*初始化漢字矩陣*/

10)m=0;n=0;

11)for(Integerkey:map.keyset())

12)Q(1,m++)=key;

13)end for

14)for(Integervalue:map.value())

15)Q(2,n++)=value;

16)end for

17)returnQ;

3 實驗與結果分析

3.1 超度與超度分布

超度是研究復雜超網絡特性重要指標之一,它指節點所在不同超邊數目。節點超度在唐詩超網絡和宋詞超網絡中的意義分別是,每個漢字所在不同唐詩數目和每個漢字所在不同宋詞數目。

超度的大小不僅能夠反映出節點在超網絡的核心程度,而且能反映出該節點在整個超網絡中的地位。由式(3)得到了超網絡節點的超度,由于篇幅有限,表1只給出了排名前20的節點超度。

表1 唐詩宋詞超網絡節點超度前20名Tab.1 Top 20 of hyperdegreesof nodes in Tang poem and Song lyric networks

由表1可知,唐詩超網絡中超度最大值達到了驚人的26 616,即便是排名第20名的超度也達到了9 805,這說明在唐詩超網絡中,超度排名靠前的大度節點超度值較大,其節點在超網絡中占有核心的位置,能夠推測其節點的重要程度高。

圖2(a)和(b)是唐詩超網絡和宋詞超網絡中排名前20的超度所對應的漢字節點,“人”“山”“花”“月”等漢字節點為超網絡中超度較大節點。這與詩人和詞人用詞、用字是一致的,不僅融合了詩人和詞人主體情感和物象表達的傾向,更體現了詩人詞人所在時代的作品風格。例如在唐朝,孟郊登科后寫道:“春風得意馬蹄疾,一日看盡長安花”;杜甫的“曉看紅濕處,花重錦官城”的喜悅詩句,是詩人看到春雨潤物后頓生的歡呼雀躍;李白的“花間一壺酒,獨酌無相親”,則寫透了詩人在理想與現實之間的掙扎沉浮的孤獨。宋詞中“春花秋月何時了?往事知多少。”抒發了南唐后主李煜身居囚室,亡國后頓感生命落空的悲哀;“起舞弄清影,何似在人間?”則是蘇軾中秋望月懷人對胞弟蘇轍的無限思念。

圖2 唐詩宋詞超網絡中超度前20名對應的漢字Fig.2 Characters with top 20 hyperdegrees in Tang poem and Song lyric hypernetworks

得到了唐詩宋詞超網絡中排名前20名的超度以后,計算超網絡中所有節點的平均超度,得到唐詩超網絡中所有節點超度的平均值為354,宋詞超網絡中所有節點的平均值為229,這表明在唐詩宋詞超網絡中,平均而言,唐詩超網絡和宋詞超網絡一個節點分別能跟354和229個超邊鄰接,這比一般科研超網絡、公交超網絡等超網絡稠密,說明唐詩宋詞超網絡超邊重疊度較高。

確定了超網絡中各個節點的超度之后,可進一步得到超網絡的一些性質。可以把超網絡中節點的超度按從小到大排序,從而統計得到超度為k的節點占整個網絡節點數的比例p(k)。從概率統計角度看,p(k)可以視為從網絡中隨機選擇節點的超度為k的概率,這就是超度分布的概念。從表2所示的超度分布前20名的超度可看出:超度越小的節點在超網絡中所占的比例越大,且隨著超度k的增大,該超度值的節點在網絡中所占比例的下降趨勢較為明顯。

表2 唐詩宋詞超網絡超度分布排名前20名Tab.2 Top 20 of hyperdegree distribution of Tang poem and Song lyric hypernetworks

本文對唐詩超網絡的總共7 460個節點的超度進行了統計分析,超度為1的節點有驚人的962個,超度分布為12.90%,遠遠多于排名靠前的大度節點,統計發現,超度小的節點在網絡中所占比例大,超度較大的節點在超網絡中所占比例小。圖3為唐詩超網絡中所有節點超度分布圖像,圖像呈現明顯的長尾分布,這意味著超網絡中大部分節點取值較小,少部分節點取值較大。圖3(b)是取雙對數坐標后的超度概率分布圖像,圖像中近似有一條直線,可以推斷唐詩宋詞的超度數據近似符合冪律分布。

圖3 唐詩超網絡超度分布Fig.3 Hyperdegree distribution of Tang poem hypernetwork

對于存在常數C和冪指數為λ的冪律分布公式:P(k)=Ck-γ,對上式兩邊取雙對數,從而有:lnP(k)=lnk-γlnk,即lnP(k)是lnk的線性函數,其中斜率為-γ,截距為lnC。通過線性擬合,得到唐詩超網絡超度分布線性方程為:y=-1.84-0.61*x,表明了唐詩超網絡的無標度特性。

同樣地,本文圖4(a)和(b)為宋詞超網絡超度分布圖像,其中圖4(a)的超度分布呈現長尾分布,取雙對數坐標后,超度分布表現為冪律分布。線性擬合得到的宋詞超網絡超度分布線性方程為:y=-1.67-0.66*x,同樣表明宋詞超網絡呈現無標度特性。

圖4 宋詞超網絡超度分布Fig.4 Hyperdegree distribution of Song lyric hypernetwork

以上實驗的超網絡拓撲指標和統計指標表明,在唐代詩歌中,只有很少的漢字被詩人使用,而絕大多數漢字很少被使用。實際上這種漢語的特點,不僅僅體現在現代漢語文學作品中,而且表現在唐詩宋詞的文本作品中。

3.2 超邊節點度與超邊節點度分布

表3為唐詩宋詞超網絡中超邊節點度分布排名前10名的超邊。通過計算,唐詩超網絡中超邊節點度為40的超邊11 590個,概率分布為28.08%;超邊節點度為28的超邊有6 770個,概率分布為16.40%;超邊節點度為56的超邊有6 743個,概率分布為16.33%;平均超邊節點度為65;最大超邊節點度為13 210。唐詩超網絡的最大超邊節點度對應詩為寒山的《詩三百三首》,全詩共13 210個漢子,1 306句。最小超邊節點度為3,其對應詩為《桂管童謠》,全詩共3個字。表3實驗中的唐詩超網絡超邊節點度反映了唐朝每首中漢字數量,這就使定量發現了五言絕句、七言絕句、五言律詩、七言律詩等為唐代主流詩歌的體裁形式。

表3 唐詩宋詞超網絡超邊節點度分布前10名Tab.3 Top 10 of hyperedgenode degree distribution of Tang poems and Song lyrics

在宋詞超網絡中,超邊節點度為44的超邊有1 363個,概率分布為7.23%;超邊節點度為56的超邊有973個,概率分布為5.16%;超邊節點度為60的超邊有850個,概率分布為4.51%;平均超邊節點度為70;超邊節點度最大超邊所含節點1 464個,其對應作品為史浩的《采蓮舞》;超邊節點度最小超邊所含節點8個,其作品名為《失調名》。宋代詞作品中,58字以內為小令,59至90字為中調,91字以外為長調。從超邊節點度分布來看,宋詞超網絡超邊節點度分布很好地表現了宋朝詞人作品體裁,即小令中菩薩蠻、卜算子、采桑子等44字詞牌,鵲橋仙、虞美人、南鄉子等56字詞牌,蝶戀花、一剪梅等60字詞牌為詞人主流填詞詞牌。

圖5(a)和(b)進一步顯示了唐詩超網絡和宋詞超網絡超邊節點度的分布情況,由圖像可知,超網絡的超邊節點度分布明顯,從語料庫整體上表現出唐詩宋詞中每首詩詞中的字數,一般來說,唐詩和宋詞語料中作品長度不會過長,但是也不乏少部分作品的規模較大,長度較長。

圖5 唐詩宋詞超網絡超邊節點度分布Fig.5 Hyperedge node degree distribution of Tang poem and Song lyric hypernetworks

3.3 平均路徑長度和集聚系數

本文最后對我國古代偉大的詩人詞人作品集(李白詩全集、杜甫詩全集、蘇軾詩詞全集、辛棄疾詩詞全集)作為實驗數據集,分別構建超網絡并計算相關網絡參數,其結果如表4所示。節點數|V|、超邊數|E|分別代表詩人詩詞創作的漢字使用情況和作品數量數目。如果兩個漢字同時出現在一個超邊中,這時認為這兩個漢字是有連邊的,通過這種方式,將超網絡轉化為普通的復雜網絡,進而計算了網絡的平均路徑長度和集聚系數,平均路徑長度和集聚系數能夠很好地說明網絡的稠密程度。

由表4可知,蘇軾的詩詞作品最多有3 531首,同時他的用字也最豐富,全部詩詞集中共出現了5 336個漢字;辛棄疾的詞作品最少有612首,詞集中出現的漢字也是最少的,有2 822個漢字。另外,看到在四位詩人數據集上的網絡平均路徑長度接近于1,聚類系數接近于1,即有較小的平均路徑長度和較大的聚類系數。這意味著平均而言,四位名家作品集超網絡所對應的投影網絡極為稠密,這說明此網絡中的節點近似于全連接網絡,這是小世界效應的典型代表。這一定程度上體現了詩歌間漢字的同現性。也說明從詩歌的用字角度考慮,像李白和蘇軾這樣偉大的文學家,也是只有少數的字被使用,而絕大多數的字未被使用,側面反映了他們的詩歌更多地瞄準幾個主題進行創作。

表4 唐詩超網絡與宋詞超網絡參數比較Tab.4 Comparison of parameters of Tang poem and Song lyric hypernetworks

4 結語

本文以唐詩宋詞為研究對象,分別將一首詩或一首詞定義為超邊,將唐詩和宋詞中出現的漢字定義為節點,建立了唐詩關聯矩陣和宋詞關聯矩陣,構建了唐詩超網絡和宋詞超網絡。該文列出幾個關鍵的算法——超網絡關聯矩陣構建算法、生成超度算法和生成超度分布算法。其次,實驗中給出了超網絡中重要的節點超度,并發現唐詩宋詞超網絡中的節點超度分布具有無標度特性;研究還發現唐詩宋詞的超邊節點度具有明顯的分布特性,唐詩超網絡的超邊節點度大多分布在20~100,宋詞超網絡超邊節點度大多分布在30~130。定量反映了以絕句、五律、七律等體裁的作品在唐詩語料中占有主體地位;宋詞中以小調中菩薩蠻、卜算子等44字詞牌,鵲橋仙、虞美人等56字詞牌,蝶戀花、一剪梅等60字詞牌為詞人喜歡的主流填詞詞牌。最后,對我國古代四位偉大詩人、詞人的詩詞作品構建超網絡,發現了其中的小世界特性。后續工作可以考慮根據唐詩宋詞構建的超網絡,對不同參數來定量分析詩歌的情感分類問題,比如不同情感的詩歌他們的關鍵節點超度分布如何;也可以從時間序列角度探究唐詩宋詞超網絡演化特征與整個唐宋朝代興衰關系的規律。

主站蜘蛛池模板: 在线看免费无码av天堂的| 亚洲香蕉在线| 人妻精品久久无码区| 亚洲国产精品人久久电影| 亚洲视频在线观看免费视频| 少妇精品久久久一区二区三区| 一本综合久久| 亚洲国产系列| 91青青草视频在线观看的| 久久久久无码精品| 日本欧美中文字幕精品亚洲| 在线无码私拍| 亚洲福利片无码最新在线播放| 国产在线一区视频| 久久精品一品道久久精品| 91探花在线观看国产最新| 亚洲码在线中文在线观看| 99久久国产精品无码| 无码网站免费观看| 亚洲国产天堂久久九九九| 日韩少妇激情一区二区| 亚洲无码电影| 亚洲一级毛片免费观看| 性色在线视频精品| A级毛片高清免费视频就| 亚洲中文精品人人永久免费| 夜夜操狠狠操| 亚洲人成高清| 午夜日本永久乱码免费播放片| 久久久久夜色精品波多野结衣| 亚洲国产日韩在线成人蜜芽| 国产成人免费| 尤物精品视频一区二区三区| AV不卡国产在线观看| 91原创视频在线| 国产精品第三页在线看| 国产黑丝视频在线观看| 欧美 国产 人人视频| 狠狠色噜噜狠狠狠狠色综合久| 在线观看精品自拍视频| 亚洲免费三区| 国产成人欧美| AⅤ色综合久久天堂AV色综合| 色偷偷一区| 啪啪永久免费av| 欧类av怡春院| 国产福利小视频高清在线观看| 亚洲精品在线91| 国产丝袜无码精品| 在线观看视频99| 久久福利片| 日本a级免费| 国产成人综合网| 国产精品太粉嫩高中在线观看| 99成人在线观看| 日韩a级毛片| 欧美色视频日本| 亚洲成a人片77777在线播放 | 国产综合亚洲欧洲区精品无码| 国产精品无码久久久久久| 第九色区aⅴ天堂久久香| 亚洲AV无码久久天堂| 国模私拍一区二区三区| 国产精品人人做人人爽人人添| 国产免费自拍视频| 国产成人精品男人的天堂| 露脸国产精品自产在线播| 激情无码视频在线看| 久久人搡人人玩人妻精品 | 国产内射在线观看| 国产精品视频猛进猛出| 蝴蝶伊人久久中文娱乐网| 国产亚洲精品97在线观看| 亚洲精品久综合蜜| 久久美女精品| 亚洲婷婷六月| 国内熟女少妇一线天| A级毛片无码久久精品免费| 亚欧美国产综合| 四虎AV麻豆| 58av国产精品| 十八禁美女裸体网站|