王奕人 張緣緣
一、引言
《說文解字》是我國歷史上第一部系統(tǒng)分析漢字字形和字源的漢語字典,也是我國第一部文字學專書。但由于漢字部首數(shù)量多、關系雜,純人工統(tǒng)計整理漢字部首間的關系非常困難,所以到目前為止都沒有形成一個全面系統(tǒng)的部首間關系整體框架。因此,本研究在數(shù)字化時代大背景下,基于Pajek社會網(wǎng)絡分析技術,從可視化和計量性兩個方面對漢字部首關系進行深入研究,旨在探索社會網(wǎng)絡分析技術與傳統(tǒng)文字學科結合的最優(yōu)模式,挖掘新興信息科學技術在傳統(tǒng)人文學科中的應用價值與學術價值。
二、相關研究現(xiàn)狀
數(shù)字人文是將計算機網(wǎng)絡技術與傳統(tǒng)人文學科結合起來,進行交叉研究而形成的新興跨領域學科。在數(shù)字化時代的大背景下,社會網(wǎng)絡分析技術與傳統(tǒng)人文學科結合的研究領域有著廣闊的應用空間。比較具有代表性的是南京師范大學陳小荷和許超(2014)等人以網(wǎng)絡科學為視角研究《左傳》的文章,其構建了春秋時期人物關系網(wǎng)絡,以此來探查《左傳》中反映的春秋社會歷史;趙薇(2018)運用社會網(wǎng)絡分析技術對小說《大波》“三部曲”中的人物關系和社會網(wǎng)絡進行了可使用性分析等。
本研究以許慎的《說文解字》540部漢字部首為研究對象,在此領域中的研究成果數(shù)不勝數(shù),歷代學者從不同角度對其進行了深入的研究。經(jīng)查閱文獻資料,可大致將以往對《說文解字》的研究概括為兩方面內容:一方面,是對部首分類方面的研究,另一方面,是以某部為切入點的部首字形義方面的研究。前者在部首分類方面進行了著重考察研究,后者針對具體的某一個部首進行深入全面研究,包括發(fā)展歷史、研究現(xiàn)狀、研究思想與方法等。
前人對《說文解字》的研究涉及方方面面,取得的成果也十分顯著。但目前學界還沒有學者對漢字部首間的關系進行可視化和計量性研究,不能很好地滿足部首關系研究、漢字研究等方面的學術需求。不僅如此,由于社會網(wǎng)絡分析技術與傳統(tǒng)人文學科結合的應用在國內起步較晚,仍在探索和發(fā)展階段,對于人文性更強的項目研究還處于相對起步階段,尚未形成系統(tǒng)的研究方法理論。綜上所述,本研究借助Pajek社會網(wǎng)絡分析技術,旨在為傳統(tǒng)人文學科知識的呈現(xiàn)與傳播提供新的方法與形態(tài)。面對目前傳統(tǒng)人文學科所面臨的挑戰(zhàn),借助新興數(shù)字化技術,從不同角度對傳統(tǒng)人文學科進行再挖掘和進一步整合,使傳統(tǒng)人文學科伴隨著科技的發(fā)展而更加完善。
三、《說文解字》部首關系的可視化研究
(一)網(wǎng)絡文件
在Pajek社會網(wǎng)絡分析技術中,一張圖和附加在圖的點線之上的信息可以構成一個網(wǎng)絡。利用Pajek研究《說文解字》部首關系時,可以借頂點表示部首,連線表示部首間關系,并改變顏色加以區(qū)分,通過新建網(wǎng)絡文件,把540個部首之間錯綜復雜的關系以網(wǎng)絡圖的形式進行可視化展示,更加清晰直觀,為部首關系的全面研究提供了便利。通過系統(tǒng)地收集和整理資料,本文將《說文解字》部首間的關系分為五類。
1.意義相近
意義相近指在形符互換的異體字中,充當形符的兩個或多個部首承擔角度和內容相同或相近的表義功能。
例如《說文解字》中提到:“蔦,寄生也。從艸,鳥聲。《詩》曰:‘蔦與女蘿。樢,蔦或從木。”“蔦”與“樢”即為一組形符互換的異體字,“蔦”的形符為“艸”,“樢”的形符為“木”,而“艸”與“木”的本義又同屬植物,屬性相近,故判斷艸部和木部的關系為意義相近。
2.意義相關
意義相關指在形符互換的異體字中,充當形符的兩個或多個部首承擔角度和內容相關的表義功能。
例如《說文解字》:“祝,祭主贊詞者。從示,從人、口。”而《集韻》中又提到“祝,或從食”,這說明“祝”還有一個異體字,即把示部替換為食部。“祝”的形符示部表示“祝”的意義與祭祀有關,而異體字的形符食部則表示祭祀之禮起源于飲食。雖然示部和食部在這組異體字中可以互換,但二者承擔的表義功能并不完全相同,只是在內容上有一定的相關性,故判斷示部和食部的關系為意義相關。
3.同源分化
同源分化指取形對象相同,但由于字形分化,演變?yōu)榱瞬煌渴椎姆只F(xiàn)象。
例如很多部首在造字之初都選取人的圖形,但取形的角度則不盡相同。人部、尸部是依據(jù)人的側面圖形而造,其中,人部源于人的側面站立之形,尸部在《說文解字》中的釋義為“尸,陳也。象臥之形”。說明尸部源于人的側面屈臥之形。大部、子部是依據(jù)人的正面圖形而造,其中,大部源于成人的正面圖形,子部源于幼兒的正面圖形,《漢語大字典》中也提到子部的金文“象小兒頭上有發(fā)及兩脛之形”。故判斷這些取人之形造字的部首之間存在同源分化的關系。
4.異體部首
異體部首指部首及其異體字分別作部首,并且各有其從屬字。
根據(jù)朱強的《<說文解字>異體部首探析》一文,可以了解到《說文解字》的540部中共有五組異體部首,出現(xiàn)這種情況是由于五個異體字單獨立部,并沒有像通常情況那樣歸入與其對應的五個正體部首中。例如《說文解字》中明確提出了“亣,籀文大,改古文”,認為“大”是古文,“亣”是對應的籀文。然而,亣部并沒有合并進大部,而是單獨立部,有自己的從屬字,并且二者的從屬字在結構上呈現(xiàn)出了不同的特點。故判斷大部和亣部之間存在異體部首的關系。
5.訛變
訛變指在漢字的演變和使用過程中,由于使用者出現(xiàn)失誤,導致漢字形體的突變。
漢字的訛變在其漫長的演變過程中并不少見,但部首的訛變則沒有那么豐富。《說文解字》540部中較為典型的訛變出現(xiàn)在月部和肉部之間。觀察“月”和“肉”的字形演變可以發(fā)現(xiàn),二者甲骨文和西周金文的字形都有著非常明顯的區(qū)別,但從戰(zhàn)國時期開始,字形趨于相同,到了篆文,已經(jīng)十分接近,很難區(qū)分,人們在寫作時將二者混淆也是情理之中。
(二)分區(qū)文件
分區(qū)文件主要用于保存網(wǎng)絡頂點的分類或聚類信息,使每個頂點都能被確切地劃分到某個分區(qū)類別中。在研究漢字部首關系時,可以利用分區(qū)文件的特點對540個部首進行意義和功能方面的分類,從而更有針對性地進行討論。
關于部首的意義分區(qū)文件,鄒曉麗的《基礎漢字形義釋源》將540部分為七個意義類別,分別是:以人體為內容的部首、以器用為內容的部首、以動物為內容的部首、以植物為內容的部首、以自然界為內容的部首、以數(shù)字為內容的部首和以干支字為內容的部首。用不同顏色的頂點表示歸屬于不同意義類別的部首,并給予它們不同的分類號,最終呈現(xiàn)在網(wǎng)絡圖上會更加清晰直觀,也方便研究者分析相同和不同意義類別部首的分布情況。
部首的功能分區(qū)文件參考了王晴的《<說文解字>五百四十部首研究》對部首進行的分類,根據(jù)部首從屬字的數(shù)量及其造字能力,分為高能部首、中能部首、低能部首和無能部首,并同意義分區(qū)文件一樣,用不同顏色的頂點和不同的分類號加以區(qū)分。
(三)矢量文件
矢量文件負責保存頂點的連續(xù)特征,可以為網(wǎng)絡中的每一個頂點賦予一個實數(shù)值,并最終反映在頂點面積的大小上。在研究《說文解字》部首關系時,矢量文件的應用主要體現(xiàn)在計量化研究中。
四、《說文解字》部首關系的計量化研究
(一)計量化方法
如何對《說文解字》540部進行計量化分析,也是一個非常重要的問題。根據(jù)上述的可視化操作,這樣部首之間的關系通過網(wǎng)絡圖能夠直觀地展示出來,然而網(wǎng)絡圖同樣需要數(shù)據(jù)支撐,這樣部首間關系才會更加明確。對此,可以選擇兩種計量化方法進行研究。
點度,即一個頂點所擁有的連線數(shù)量。一個頂點所擁有的連線越多,它的點度越大,在能化排列時更靠近部首網(wǎng)絡的中心,在部首網(wǎng)絡關系圖中占據(jù)更重要的位置,在矢量文件中,該頂點的面積也相對較大。點度較小的部首在能化排列時則較為邊緣化,它所對應的頂點也較小。一般高點度頂點也更容易出現(xiàn)在網(wǎng)絡中的高密度區(qū)。
斯皮爾曼等級相關系數(shù)用于分析頂點某種特征的秩次與頂點另一種特征秩次是否相符。在統(tǒng)計學中,兩種現(xiàn)象的關系往往用相關系數(shù)來衡量。相關系數(shù)的取值范圍為-1到1。相關系數(shù)為正,意味著一種特征的高得分與另一種特征的高得分相關;相關系數(shù)為負,意味著一種特征的高得分與另一種特征的低得分相關。如果相關系數(shù)的絕對值小于0.05,意味著不相關,絕對值為0.05-0.25為弱相關,絕對值為0.25-0.60為中度相關,絕對值為0.60-1.00為強相關。
(二)實驗和分析
為了驗證上述的計量化方法,本文選取《說文解字》540部中與口部相關的28個部首進行可視化展現(xiàn),并對此進行點度和斯皮爾曼相關系數(shù)的計量化分析。
1.點度
計算點度需要用到分區(qū)矢量文件。需要先得到與口部有關部首的點度分區(qū)文件(Net>Partitions>Degree>All),執(zhí)行此指令后,便可以得到點度分區(qū)文件。接著,需要得到矢量文件(Partition>Make vector),最后進行可視化展現(xiàn)。
根據(jù)分區(qū)矢量網(wǎng)絡圖可知:口部的連線數(shù)量為12,即口部的點度為12。口部在網(wǎng)絡圖中占據(jù)中心位置,且口部對應頂點的面積也最大,根據(jù)可視化分析,同樣可以知道亣部在部首網(wǎng)絡圖中與其他部首的連線數(shù)量為1,即亣部的點度為1,亣部在部首網(wǎng)絡圖中也就處于邊緣位置,所對應頂點的面積也最小。
2.斯皮爾曼等級相關系數(shù)
為了驗證部首點度和其功能的相關性,本文運用Pajek軟件進行了斯皮爾曼等級相關系數(shù)的計算。
計算斯皮爾曼等級相關系數(shù)需要用到的是兩個分區(qū)文件,即點度分區(qū)文件和功能分區(qū)文件。前文均有提及,此處就不過多贅述。
下面將對其操作步驟進行簡述:在分區(qū)列表框的第一欄和第二欄中分別選擇點度分區(qū)文件(由Net>Partitions>Degree>All指令生成)和功能分區(qū)文件,二者先后順序并不重要。在指定兩個分區(qū)文件后,執(zhí)行Partitions>Info>Spearman Rank指令便可計算斯皮爾曼等級相關系數(shù)。
根據(jù)上述操作所得出的數(shù)據(jù)進行分析:斯皮爾曼等級相關系數(shù)所得出的結果約為0.15,也就是說,以口部為中心的部首網(wǎng)絡圖的點度和以口部為中心的部首的功能的相關系數(shù)為0.15。根據(jù)上述相關系數(shù)的取值范圍可知,斯皮爾曼等級相關系數(shù)位于0.05-0.25之間時,表明兩種關系呈現(xiàn)弱相關,即部首在網(wǎng)絡圖中的點度與其功能呈現(xiàn)弱相關。
五、結語
本文分析了《說文解字》540部部分部首之間的關系,并將Pajek社會網(wǎng)絡分析技術融入其中,通過可視化和計量化方法,旨在更加準確地展示漢字部首間關系。實驗證明,本文所提出的將社會網(wǎng)絡分析技術與傳統(tǒng)語言學結合研究的方法是切實可行的。本文選取的方法,除了用于研究漢字部首關系外,還可以為辭書編纂、對外漢語教學、古代漢語教學等領域提供參考。由于知識結構的限制,本文只對目前的研究結果進行闡述,不敢隨意妄下定論。但這也說明社會網(wǎng)絡分析技術與傳統(tǒng)語言學結合的研究是大有可為的。工作目前偏向技術性嘗試,今后仍有許多工作需要完善。
參考文獻:
[1][荷蘭]沃特·德·諾伊,[斯洛文尼亞]安德烈·姆爾瓦,[斯洛文尼亞]弗拉迪米爾·巴塔蓋爾吉,著.蜘蛛:社會網(wǎng)絡分析技術[M].林楓,譯.北京:世界圖書出版公司,2012.
[2]鄒曉麗.基礎漢字形義釋源——《說文》部首今讀本義[M].北京:中華書局,2007.
[3]王玉新.漢字部首認知研究[M].濟南:山東大學出版社,2009.
[4]王晴.《說文解字》五百四十部首研究[D].江西師范大學,2009.
★基金項目:本文系西南民族大學省級大學生創(chuàng)新訓練項目“《說文解字》部首關系的可視化與計量性研究”(項目編號:S202210656147)的階段性成果。
(作者簡介:王奕人,女,本科在讀,西南民族大學中國語言文學學院,研究方向:漢語國際教育;張緣緣,女,本科在讀,西南民族大學中國語言文學學院,研究方向:漢語國際教育;<通訊作者:李涵宇>)
(責任編輯 王瑞鋒)