許英慧
根據《中國語言地圖集(第2版)》(2012),中國方言官話區包括東北官話區、北京官話區、冀魯官話區、膠遼官話區、中原官話區、蘭銀官話區、西南官話區、江淮官話區。東北方言作為北方方言的一個分支,在普通話的形成過程中起著非常重要的作用。東北方言在語音、詞匯、語法等方面保持著高度的一致性,與某些方言“十里不同音”的狀況不同,東北方言的使用范圍非常廣泛,不僅在東三省,甚至在與其相鄰的內蒙古都有可能通用。這種現象在其他方言中是很少見的[1]。
本研究是以 CiteSpace 軟件作為主要的數據處理工具,從中國知網(CNKI)數據庫中檢索與東北方言詞匯相關的研究文獻,然后對以上數據利用CiteSpace軟件進行處理和分析,繪制1984年1月至2022年7月間東北方言詞匯相關研究的發文作者、關鍵詞、關鍵詞聚類等內容的可視化圖譜和表格,旨在說明圖譜與表格背后所隱藏的信息,揭示東北方言詞匯的研究現狀。
本文采用關鍵詞檢索的方式,通過在中國知網(CNKI)數據庫中設定關鍵詞,收集與東北方言詞匯研究相關的文獻。主題詞檢索邏輯最終確定為“主題=東北方言詞匯 or 主題=遼寧方言詞匯 or 主題=黑龍江方言詞匯 or 主題=吉林方言詞匯(題名=東北方言詞匯 or 題名=遼寧方言詞匯 or 題名=黑龍江方言詞匯 or 題名=吉林方言詞匯)”。于2022年7月25日,在中國知網(CNKI)數據庫中檢索到131條符合檢索條件的文獻,文獻的時間跨度為1984—2022年。后期經人工篩選,剔除與東北方言詞匯研究無關的論文,最終得到有效文獻為116篇。
本文在中國知網(CNKI)數據庫中收集了1984—2022年間國內東北方言詞匯的相關研究文獻,并借助Excel進行統計分析,按年份繪制成折線圖(見圖1)。結果如圖1所示,國內東北方言詞匯的研究論文開始于1984年,總體上呈現波動性增長趨勢,大致可分為以下三個階段:緩慢發展期(1984—2003),曲折發展期(2004—2015),穩步增長期(2016—今)。
圖1 國內東北方言詞匯研究年度發文量統計(1984—2022)(注:未標明發文量即發文量為0)
自1984年第一篇研究論文發表起,其后7年一度出現發文空白,直到1992年才有第二篇研究論文發表,之后連續三年每年有一篇研究論文發表,隨后,關于東北方言詞匯的研究論文產出又停滯了7年。1984—2003年間,關于東北方言詞匯的研究論文僅有5篇,且有15年時間無論文產出。由此可見,1984—2003年間東北方言詞匯的研究處于緩慢發展期。
自2004年之后,除2006年無論文發表外,基本每年都有相關的研究論文發表,2007年有5篇研究論文發表,達到第一個峰值。隨后,2008至2009年發文數量較2007年有所下降。2010至2015年發文數量快速增長,并在2015年達到第二個峰值,年度發文量高達15篇,是發文量最多的年份。由此可見,2004—2015年東北方言詞匯的研究處于曲折發展期。此時正是東北方言詞匯研究發展的關鍵時期,該時期為東北方言詞匯研究的繁榮奠定了基礎。
隨后,2016—2019年發文數量雖較2015年有所下降,但總體仍呈現增長趨勢,在2020年達到第三個峰值,年度發文量達到11篇。需要特別說明的是2022年發文量的不足是數據收集尚不全面導致的。由此可見,2016年至今東北方言詞匯的研究處于穩步增長期。
總體而言,東北方言詞匯研究的相關論文發表數量呈快速增長的趨勢。可見,研究東北方言詞匯的相關學者的數量在不斷增加,這反映出這一領域的研究仍然有很大的發展空間,學者們需要關注和利用新的研究內容和新的研究視角。
筆者在CiteSpace軟件中選擇節點類型(Node Type)中的“機構”(Institution),并運行軟件,最終生成N=71、E=15的可視化圖譜(見圖2)。圖譜中N表示的是本文在中國知網(CNKI)中收集的116篇論文出自71個研究機構,E代表各研究機構之間的合作關系,圖中研究機構字體的大小與該機構的發文量呈正相關。
圖2 國內東北方言詞匯研究發文機構知識圖譜
通過圖2我們可以清楚地看到發文最多的是遼寧師范大學文學院,共發文13篇,占文獻總量的11.27%;排名第二的是遼寧師范大學,發文12篇,占比10.345%。由此可見,遼寧師范大學文學院研究成果豐碩,居于首位,遼寧師范大學緊隨其后,通過搜索文獻發現,其作者也主要為文學院人員。究其原因,這與遼寧師范大學文學院承擔的“中國語言資源保護工程”密不可分,這也是遼寧師范大學文學院學者踐行語言保護,學以致用最好的見證。
根據軟件運行生成的可視化圖譜(見圖2)得到的數據N=71和E=15可知,東北方言詞匯研究機構之間的合作程度不高,需要進一步加強機構間的科學合作。科學合作的增加可以促進研究成果產出數量的快速增加。因此,東北方言詞匯研究機構應加強合作,共同促進東北方言詞匯的進一步發展和繁榮。
關鍵詞可以反映一篇文獻中表達的核心主題和內容,如果一個關鍵詞在這個研究領域的文獻中反復出現,則說明“該關鍵詞所表征的研究課題是該研究領域的研究熱點”[2]。本文分析了1984年1月至2022年7月間國內東北方言詞匯研究的關鍵詞,并在CiteSpace中利用關鍵詞的共現功能與中介中心性,揭示了東北方言詞匯相關研究的熱點問題。將CiteSpace“時間”設置為1984年1月至2022年7月,以1年為一個時間分區(slice),Term Type中選擇Noun Phrases,Node Types中選擇Keyword,其他參數不變,選擇尋徑(Pathfinder)算法。將Threshold值設為2,運行后顯示出現兩次及以上的關鍵詞,形成東北方言詞匯的關鍵詞共現網絡知識圖譜。為了更加直觀,本文統計出東北方言詞匯研究中出現5次及以上的高頻關鍵詞(見表1)。
表1 高頻關鍵詞及其中心性表(1984—2021年)
由表1可知,東北方言詞匯研究的高頻關鍵詞有東北方言、詞匯、方言、方言詞匯、語音、吉林方言、語法、特點、構詞、比較等。在CiteSpace中,中介中心性大于0.1的節點被視為關鍵節點。節點越大表示該研究點越受歡迎,關鍵節點的中心性越高越能體現出它的核心地位。由表1可知,東北方言、詞匯、方言、方言詞匯、比較、普通話、東北官話和來源這些節點的中心性均為0.1或以上,表明它們是東北方言詞匯研究的關鍵節點,在該研究中占有重要地位。
從表1可以看出,關鍵詞出現的頻次與中心性并不一定呈正比。關鍵詞“語音”“吉林方言”“語法”“特點”“構詞”出現頻率高,但其中介中心性卻較低。“比較”“普通話”“東北官話”“來源”出現頻率沒有前面的高,但其中介中心性卻較高。兩種排序中關鍵詞前三位都是“東北方言”“詞匯”“方言”。中介中心度越高,所控制的關鍵詞之間的信息流越多。因此可知,出現頻率較高且中介中心性值高的關鍵詞可被認定為東北方言詞匯的研究熱點。筆者通過對比分析關鍵詞出現的頻數和中介中心性發現,“東北方言”“詞匯”“方言”“方言詞匯”“比較”“普通話”“東北官話”“來源”等關鍵詞為東北方言詞匯的研究熱點。
文獻中關鍵詞的共現關系和強度決定聚類的標準,共現關系密切的文獻被自動劃為一個聚類,且每個聚類都有明確的主題。對關鍵詞進行K聚類后,可以得到關鍵詞聚類知識圖譜(見圖3)。根據網絡結構及聚類的清晰度,可以CiteSpace給出的兩個指標作為評價繪制效果的依據,指標分別是平均輪廓值(Silhouette,簡稱S值)和模塊值(Modularity,簡稱Q值)。如果S大于0.5,聚類一般認為是合理的,S值大于0.7說明聚類是高效率且令人信服的;Q值一般在(0,1)區間,Q值大于0.3說明劃分出來的聚類具有顯著性。圖3的S值為0.9182,Q值為0.6752,說明聚類是合理的。[3]
圖3 國內東北方言詞匯研究關鍵詞聚類知識圖譜
時間軸視圖(Timeline View)是CiteSpace的一種可視化選擇方式,它側重于從歷時的維度來呈現某一研究領域的知識演進情況。為了能夠更好更全面地從歷時角度來考察東北方言詞匯這一研究領域的知識動態,本文在CiteSpace中制作了1984年1月至2022年7月間東北方言詞匯研究關鍵詞時間軸圖譜(見圖4)。
圖4 國內東北方言詞匯研究關鍵詞聚類時間線圖譜
圖4能夠清楚地展示東北方言詞匯研究相關領域文獻的更新情況和走勢。圖4中顯示的9個主要聚類標題為東北方言(#0)、方言(#1)、方言詞匯(#2)、詞匯(#3)、來源(#4)、附加式(#5)、構詞(#6)、詞義(#7)、前瞻(#10)。在每個聚類的時間軸上,相應的高頻關鍵詞按年份顯示,高頻詞的變化直接反映了該聚類下研究熱點的歷時變化。東北方言(#0)、方言(#1)、詞匯(#3)、和來源(#4)這4個聚類在2007年前后文獻數量明顯增多。方言詞匯(#2)和詞義(#7)這兩個聚類在整個時間跨度上來看,文獻數量較少。附加式(#5)和構詞(#6)這兩個聚類在2018年左右文獻數量驟減,說明該研究領域開始趨冷,關注度逐漸降低。前瞻(#10)這一聚類在2019年才興起,文獻數量呈現迅速增高態勢,說明該領域很有可能成為今后幾年的研究熱點。
通過一定的算法探測文獻或關鍵詞的突變系數(Bustness)是CiteSpace的一個重要功能,突變是指某個學科或某個領域內研究興趣突然增加的現象,這一指標可以作為衡量文獻或關鍵詞是否具有前沿性的一個參考。為了更加清晰地觀察東北方言詞匯研究的新興研究熱點,下文對關鍵詞進行了突發性探測,并將突發性關鍵詞依照突發起始年份進行排序,從而得到圖5的探測結果。
圖5 東北方言詞匯研究關鍵詞突現圖
圖5顯示,共探測到16個發生突變的關鍵詞,這些關鍵詞是1984年以來東北方言詞匯研究的研究熱點和研究前沿。由圖5可知,16個突變關鍵詞為:詞匯、色彩、吉林方言、特點、方言、吉林、東北官話、句法、移民、普通話、語音、來源、構詞、研究綜述、比較、方言詞匯。其中,關鍵詞“吉林方言”的突變強度最高,表明該主題的研究文獻數量激增幅度最大。關鍵詞“特點”的突變始于2012年,結束于2014年;關鍵詞“東北官話”的突變始于2014年,結束于2016年;“句法”和“移民”兩個關鍵詞的突變始于2015年,結束于2017年。上述4個關鍵詞的突變持續時間為兩年,時間較長。總體而言,關鍵詞突變的持續時間相對較短,大多數突變持續時間為一年。
CiteSpace根據突發開始的時間,按照從遠到近的順序排列突發性關鍵詞序列,得到如圖5所示的列表。因此,圖5中的研究主題位置越靠下前沿性就越強。要確定一個主題是否為新興的研究熱點,需要同時滿足兩個條件:首次突現時間和突發起始時間近。列表中來源、構詞、研究綜述、比較、方言詞匯的突發起始時間都晚于2018年(即近5年),是東北方言詞匯的新興研究熱點和研究前沿。第二個前沿性較強的研究主題是比較,這類主題的文獻研究主要是東北方言詞匯和普通話詞匯的比較,包括三個方面,一是從微觀層面對東北方言中的某個詞和普通話中的某個詞進行比較;二是從中觀層面對東北方言中的某類詞和普通話中的某類詞進行比較;三是從宏觀層面對東北方言詞匯和普通話詞匯進行比較。第三個具有前沿性的研究主題是方言詞匯的研究,方言詞匯研究在東北方言詞匯研究中所占比重最大,這些研究可分為以下幾類:第一類是從宏觀上研究整個東北地區的方言詞匯,第二類是從中觀上研究東北三省中某個省份的方言詞匯,第三類是從微觀上研究東北某一個地區的方言詞匯。
本文利用CiteSpace軟件對中國知網(CNKI)中,東北方言詞匯研究文獻進行了全面、系統的梳理,繪制了1984年1月至2022年7月東北方言詞匯的科學知識圖譜,并全面介紹了東北方言詞匯的研究現狀和發展脈絡的演變。在圖譜的解讀和文獻的分析基礎上,本文廓清了東北方言詞匯研究的高產發文機構、關鍵詞共現、關鍵詞聚類,并探測了新興研究熱點與研究前沿。此外,本文尚有不足之處,如對文獻的收集可能不夠全面,但希望本文能對東北方言詞匯的后續研究發展能有些許幫助。