摘 要: 運用計量分析法研究方言關系已經取得了一定的成果,計量分析結果可以和傳統的特征比較法相結合,使得研究更具精密性和科學性。
關鍵詞:計量分析 方言 定性分析
中圖分類號:H07 文獻標識碼:A 文章編號:1003-9082(2016)08-0374-01
方言關系計量分析結合計算機信息處理功能和統計學方法,可用于共時方言親疏關系、歷時方言親緣關系、方言分區和方言溝通度等研究。其歷史可以追溯到上個世紀五六十年代流行的歷史語言學分支——語言年代學,創始人是斯瓦迪士。而后,施萊赫爾受達爾文生物進化論的啟示,在語言學中最早使用譜系樹圖來表示語言的分化情況。
20世紀70年代起,方言學界就有學者運用計量分析法研究漢語方言分類問題,比如:鄭錦全(1973)利用陰調和陽調的不同調高計算漢語方言差異,陸致極(1986)對閩方言內部差異程度及分區進行了計算機聚類分析。此后,漢語方言關系計量研究先后出現了一些頗有影響的文章和專著:《漢語方言間親疏關系的計量描寫》(陸致極1987),《漢語方言親疏關系的計量研究》(鄭錦全1988),《比較方言學中的計量方法》(馬希文1989),《方言關系的計量研究》(王士元、沈鐘偉1992),《談漢語方言的定量研究》(沈榕秋1994),《聚類分析在漢語方言研究中的運用》(項夢冰2015)。鄭陸二人通過各方言詞匯的對比排列和古音在現代各方音里分化狀況的排列,使用“皮爾遜相關”(Pearson)和“非加權平均系聯法”(Non-weighted)來計算出詞匯、聲母、韻母、聲調等變量之間的相關系數,并用樹形圖顯示出它們的親疏關系。鄭錦全(1988)采用了平均系聯法(Group-average clustering),馬希文(1989)介紹了最短系連法(Minimun spanning tree)和主分量分析法(Principal components analysis),并用這些方法對鄭錦全的相關系數作了分析。王士元、沈鐘偉(1992)提出了分詞目計算的方法和計算方言間相關系數的Jaccard計算法公式。總的來說,過去的研究成果首先確立了計量分析法在漢語方言關系研究中的地位和作用,也明確了計量分析在漢語方言關系比較研究中所需要的材料、計量單位以及步驟和方法,同時也討論了相關系數的計算問題和嘗試了不同計量方法的實踐研究。
可以看出,用計量分析法研究漢語方言關系可以在一定程度上彌補以往“方言特征比較法”的主觀局限性,可以從數據上直觀地看出方言之間的相關系數。李如龍(2001):“共時的分類有時應該以一定的數量為界線的,量是區分不同質的依據;歷時的演變則往往是量變的積累引起質變的飛躍。這便是現代系統十分重視計量研究的原因。研究語言時重視計量研究這是現代的漢語研究工作的一大進步,但是這種方法還沒有得到應有的推廣。”
但是不是說定量分析就能解決所有問題,計量分析的結果可以和描寫比較的定性分析相結合,使得研究更具精密性和科學性。正如馬希文(1989)提到:“數理統計方法所做出的分析總是帶有隨機性的,不能把它和理論的、邏輯的分析同樣看待。在理論研究的預備階段,統計方法可以用來整理數據,以求發現規律性的東西。在理論研究暫時做不到定量化的階段,統計方法可以用來作為理論研究的補充。好的、合理的統計方法應該根據理論研究的成果來設計,在反復嘗試中逐步確立下來。”項夢冰(2015)也指出:“聚類分析雖然可以給漢語方言研究中的分類工作提供重要的參考,但倘若奉之為圭臬則未免失于偏頗。恰當的分類常常需要在綜合考慮各種因素之后在定性和定量之間取得平衡。”
目前,用計量方法研究方言的關系已被廣泛應用,見于不少單篇論文和學位論文中,如:《閩方言分區的計量研究》(楊鼎夫1994),《苗瑤語方言親疏關系的計量分析》(黃行1999),《吳語五地詞匯相關度的計量研究》(楊蓓2003),《湖南方言語音相關度計算與親疏關系聚類分析》(肖雙榮2004),《廉江市粵客詞匯相似度的計量分析》(邵慧君,秦綠葉2008),《梧州粵語和周邊勾漏粵語詞匯相似度的計量分析(粟春兵,王文勝,2011),《興安縣城話與周邊漢語方言語音親疏關系計量分析》(鄧盼2015),《廣州地區粵語的聲韻計量分析》(秦綠葉,2015)。學位論文有:《粵西三地粵語客話方言詞匯分析計量研究》(秦綠葉,華南師范大學碩士論文,2007),《廉州話與周邊粵語客話語音分析計量研究》(梁小玲,廣西民族大學碩士論文,2008),《梧州廣府粵語方言島與周邊方言詞匯相似度的計量研究》(粟春兵,杭州師范大學碩士論文,2012)。
綜上所述,方言計量分析結合計算機信息處理功能和統計學方法,在科技日益發達的今天,將是一個前景廣闊的領域。但是目前利用計算機從事方言研究的成果還是特別少,一個方面是因為很多研究人員已經習慣了傳統的研究方法,不愿再做進一步突破,甚至懷疑新的方法;另一個方面是研究人員知識有限,因為利用計算機研究方言需要研究人員首先需要一定的語言學功底,其次是相關的數理知識,同時還需要具備一定的計算機應用能力,但是我國傳統教育培養的人才很難兼具,如何突破這個瓶頸,需要研究人員做更多的努力。
語言計量研究本身也還存在一些問題。目前多數研究只在方言之間在語音和詞匯上的相關性和差異性上做了不少努力,從而對方言區的劃分以及親疏關系的梳理提供了不少有益的想法。但是比較方言關系選取什么語言特征,采用什么計算方法,是否考慮加權,如何確定語言之間的親緣或者接觸關系等等問題都是值得商榷的。總的來說,計量分析法在我國方言研究中剛剛起步,想取得更大的發展還需要更多的努力。
注釋
1秦綠葉.粵西三地粵語客話方言詞匯分析計量研究[D].華南師范大學,2007.
2李如龍.漢語方言的比較研究[M].北京:商務印書館,2001.
3劉玉屏.計算機在漢語方言研究中的應用[J]. 寧夏大學學報.2002(1).
參考文獻
[1]陸致極.漢語方言間親疏關系的計量描寫[J].中國社會科學.1987(1).
[2]鄭錦全.漢語方言親疏關系的計量研究[J].中國語文.1988(2).
[3]馬希文.比較方言學中的計量方法[J].中國語文.1989(5).
[4]王士元,沈鐘偉.方言關系的計量表述[J].中國語文.1992 (2).
[5]沈榕秋.談漢語方言的定量研究[J].語文研究.1994(2).
[6]邵慧君,秦綠葉.廉江市粵客詞匯相似度的計量分析[J].中國語文.2008(2).
[7]項夢冰.聚類分析在漢語方言研究中的運用[J].語文研究.2015(4).
作者簡介:曹慧萍,女,首都師范大學文學院2013級語言學及應用語言學專業。