如何使用Ｅｘｃｅｌ處理方言數據

2007-12-31 00:00:00朱濤胡雷

現代語文 2007年10期

Excel是微軟公司開發的表格數據處理軟件，具有強大的數據統計功能，在方言數據處理中經常用到的有“排序”“查找”“求和”“復制”“剪切”“粘貼”“插入”“刪除”等。

綏寧縣位于湖南省西南部，歷史沿革多變和多民族等原因導致綏寧方言的歸屬眾說不一，或認為湘語（李藍 1994），或認為西南官話(《湖南省漢語方言地圖》 1960，1985)，或認為贛語或土話(鮑厚星、顏森 1986，胡萍 2005)。為了弄清綏寧縣境內的方言分布情況，我們收集了以鄉為單位的24個語言點的字音材料，并輸入Excel數據庫中。數據庫的標題欄由例字、聲類、韻攝、調類及24個語言點組成。下文就談談如何處理這些數據。

一、理清思路

數據處理切忌頭緒不清、手忙腳亂，所以在數據處理之前作一些準備工作是十分必要的。

（一）備份好原始數據

原始數據是一切工作的基礎，其正確與否直接關系到今后工作的價值：一個建立在錯誤數據上的結論必然也是錯誤的。由于數據處理中要做一些排序分類、刪減合并的工作，這必然改動原有數據，如果沒有備份的原始數據，一旦發現數據處理失誤再想恢復就難了。所以不僅原始數據要備份好，而且最明智的做法是操作一段就做一個備份，這樣可以避免從頭做起，節省大量時間和精力。

（二）搜集一些與語言點有關的資料，諸如地圖、方言志和相關文章，這對數據處理工作有指導作用。因此，在考察綏寧縣的方言材料前，應熟悉一下該縣的地理位置，讀讀有關討論綏寧方言特點及其歸屬的文章。

（三）根據工作目標制定詳細的工作計劃

李如龍（2003:111）指出，語音—尤其是古全濁字的今讀，是執行分區的重要標準。而且，合理的分區要使用聲、韻、調三類標準。鮑厚星、陳暉（2005）提出的湘語分區標準便是如此。至于在實踐中，哪類標準更重要，要視具體情況而定：劃分湘語和贛語，古濁聲母今讀是否送氣是首要標準；分別湘語和客家話，要注重古入聲塞尾是否保留；區分湘語和官話，聲調類型是首選。(候精一 2002)

由于綏寧縣在湖南省，故依據湘語的特點制定了如下計劃：

⑴利用Excel的排序功能，分別就聲、韻、調進行排序，制成三個工作表，取名為“聲序”“韻序”“調序”。

⑵利用Excel的復制、粘貼功能，從“聲序”表中調出24個語言點的全濁聲母數據，制成“全濁聲母”表。并從“全濁聲母”表中調出“濁塞音”表和“濁塞擦音”表。

⑶按“調”給“全濁聲母”表排序，選出其中的入聲字，復制成“濁入”表。

⑷從“韻序”表中調出24個點的蟹假果三攝的數據，合成一個“蟹假果攝”表。

⑸對各表進行觀察分析，尋找出各點間的共性和差異。

⑹統計各表的數據特征，建立特征分布表。

⑺分析“特征分布表”，根據各語言點聲韻特征的接近度作綏寧縣的境內方言分區。

⑻將所得結論寫成論文。

二、分類建表、分析數據

建立分類表是為了合理有效地管理數據，避免數據的丟失和混雜。分析數據時，要始終堅持實事求是的態度，切忌以少充多、以偏概全。比如“古全濁聲母清化后送氣”的字例是“個別”“部分”，還是“全部”，要在充分調查統計的基礎上才能確定，不能主觀臆斷。

（一）先建立兩個文件夾，命名為“共性”和“差異”。這樣，在數據處理過程中，可以隨時將各語言點的共性或差異儲存到文件夾中，論文寫作時又可以循類提取數據。

（二）建好“聲序”表、“韻序”表和“調序”表后，就可以做初步的觀察。當發現任何顯著特征時，可以使用Excel的“字體顏色”或“突出顯示”功能標示出來；然后按照所標顏色，利用“剪切”“插入”功能把具有共同特征的語言點移動到一塊，再作進一步觀察。

1.觀察“韻序表”。楓木團、樂安、河口、麻塘、聯民和金屋塘都存在“遇合一模韻”念［ou］的現象，把這些點的“遇合一模韻”字集中成一表進行觀察，會發現念［ou］的只是該韻的部分字，且各點字例的多寡不一。另外，紅巖、瓦屋、水口、黃土、白玉、關峽、武陽、田心、金屋塘九個點存在“鼻化韻”的現象。可以將這些點集中成“鼻化韻”表進行深入觀察。

由此，從“韻序表”中得到了兩個差異表：“遇合一模韻念［ou］”表和“鼻化韻”表。

2.觀察“聲序表”。各點普遍存在泥來兩母混讀、曉匣母與非組混讀的現象。把這樣的例字集中起來，建立“泥來母混讀”表和“曉匣非母混讀”表，共同存入“共性”文件夾中。

另外，部分點存在舌葉音，把這些點的數據合在一起，建立“有舌葉音的點”一表；部分點的“精見組”字在細音前不混”，又建“分尖團的點”一表。并將兩個表保存到“差異”文件夾中。

3.觀察“調序表”。注意“平、上、去、入”四者在各點中的今讀是否按古調類分化，是否有陰陽之分，這樣可以初步確定各點的調類數目。綏寧縣除白玉、金屋塘、關峽和田心村四個點去聲不分陰陽，只有四個調外，其他點去聲都分陰陽，調類5至7個，其中瓦屋、紅巖和黃土礦三個點上聲也分陰陽，水口和黃土礦還有一入聲調。

（三）鮑厚星、陳暉（2005）將“古全濁聲母今逢塞音、塞擦音時，無論清濁，一般都念不送氣音”作為確認湘語的第一條標準，所以有必要建立“全濁聲母”表來考察綏寧方言是否符合湘語的特征。

經觀察，綏寧24個點的濁音都已清化。但由于全濁聲母有塞音、塞擦音之別，今讀又有清濁之分和送氣與不送氣之分，送氣、不送氣又可能與調的舒促有關，所以，必須分別建表觀察才能真正弄清綏寧各點全濁聲母的今讀情況。

（四）建立“濁塞音”表和“濁塞擦音”表，是為了觀察各點是否存在送氣成份。如果存在送氣字，就要統計字例數。例如，把送氣塞音[p‘]、[t‘]、[k‘]等分別復制到Excel的“查找”欄中就可以得到送氣字數，再將塞音字總數減去送氣字數便得到了不送氣字數。這樣送氣與不送氣的比例就較為精確了，用“個別”“部分”，還是“全部”來形容便有了依據。

通過以上方法得知，綏寧方言的濁聲母今讀是否送氣可分為三類：（1）瓦屋、紅巖、水口和黃土礦基本上讀送氣；（2）長鋪鎮、樂安、河口、麻塘、楓木團和聯民基本上不送氣；（3）其余各點部分送氣部分不送氣。將第（3）類各點集中成一表觀察，發現送氣的多為平聲字。

（五）“濁入表”用于考察入聲今讀的分化情況。綏寧24個點都有部分字讀陰去（或去聲），但另一部分分化的情形不一樣。長鋪以讀陰平為主，黃桑、黨坪、白玉、關峽、田心、金屋塘、唐家坊、李熙、紅巖、在市以讀陽平為主，樂安、麻塘、楓木團、瓦屋、河口、聯民、鵝公、東山、朝儀鄉、朝儀村以讀陽上（或上聲）為主，水口、黃土以讀入聲為主，武陽讀陽去。

（六）由于《湘語的分區（稿）》一文提出了“蟹、假、果攝主要元音形成[a]、[o]、[U]序列”的標準，故建一“蟹假果攝”表。結果發現，綏寧各點蟹、假、果三攝主要元音一般形成[e]、[a]、[o]序列，與湘語的特征存在一定差異。

三、提取規律、進行分區和寫作

在提取規律、進行分區時，既要注重“差異”的分析，弄清某一語音特征的分布情況，又要對分析有“共性”的點在字例上的差異。

（一）根據前面的觀察分析，制作出綏寧縣各語言點的聲韻特征分布表，并按特征的相近度對各點進行移位整理。

（二）分析“特征分布表”，將綏寧縣境內的語音點分為六個區域：

⑴水瓦區：水口、黃土礦、紅巖、瓦屋；

⑵黃黨區：黃桑、在市、黨坪；

⑶長聯區：長鋪、楓木團、樂安、麻塘、河口、聯民；

⑷李唐區：李熙、唐家坊；

⑸白武區：白玉、關峽、田心村、金屋塘、武陽；

⑹朝鵝區：朝儀村、朝儀鄉、東山、鵝公。

結合湘語、贛語、西南官話的語音特征，可以試著將綏寧境內的六區歸入各大方言區中。本文認為：⑴為贛語；⑶為湘語；⑷和⑸為西南官話；⑵和⑹是湘語、贛語與西南官話色彩并現的區域。

（三）論文寫作中最重要的是把觀點表述清楚，并能引用相關數據來證實自己的論斷。比如，要說明“綏寧方言各點普遍存在泥來兩母混讀的現象”，我們可以引用“共性”文件夾中“泥來母混讀”表的數據。

四、小結

（一）本文以綏寧縣24個語言點的數據處理為例來談Excel對方言數據的處理，目的是使方言初學者學會利用Excel來提高數據處理的效率，從而快捷地搜尋到數據中的規律。從整個數據處理過程來看，數據的分類、命名和歸檔是極為重要的，這一工作做好了，可以確保整個過程有條不紊，并能在論文寫作中提高數據引用的效率。

（二）本文重在示范，建立表類和分析數據時主要以湘語的特征為依據。至于按照贛語和西南官話的特征可以建立哪些表類，可以仿照湘語的情形進行。

（三）Excel不是萬能的，它只是數據統計的輔助工具，整個統計過程離不開人的指導。因此，Excel最大的缺限就是智能不夠，不能按我們的計劃自動從數據中去發現規律，難以尋找共性和差異。

參考文獻：

[1]鼎言商旅網.綏寧概況[N].查詢日期：2007年4月2日.網址：http://www.d0086.com/flm/hunan/slm/shaoyang/

tlm/suining/bskk/gk.htm.

[2]鮑厚星顏森.湖南方言的分區[J].方言，1986，(4).

[3]湖南省地方志編纂委員會.湖南省志·方言志[M].長沙：湖南人民出版社，2001.

[4]李藍.湖南方言分區述評及再分區[J].語言研究，1994，(2).

[5]鮑厚星陳暉.湘語的分區[J].方言，2005，(3).

[6]胡萍.試論綏寧“關峽平話”的系屬[J].邵陽學院學報（社會科學版），2005，(4).

[7]侯精一.現代漢語方言概論[M].上海：上海教育出版社，2002.

[8]李如龍.漢語方言的比較研究[M].北京：商務印書館，2003.

（朱濤胡雷，湘潭大學文學與新聞學院）

現代語文2007年10期

現代語文的其它文章: 漢語量詞與修辭格; “差點兒Ｐ”系列句式的結構與功能淺析; 語法測試發展的新趨勢——交際語法測試; 姓名與成語; 簡析《論語》中的數詞; 探析中西思維方式差異與品牌名稱漢譯的關聯