Excel是微軟公司開發的表格數據處理軟件,具有強大的數據統計功能,在方言數據處理中經常用到的有“排序”“查找”“求和”“復制”“剪切”“粘貼”“插入”“刪除”等。
綏寧縣位于湖南省西南部,歷史沿革多變和多民族等原因導致綏寧方言的歸屬眾說不一,或認為湘語(李藍 1994),或認為西南官話(《湖南省漢語方言地圖》 1960,1985),或認為贛語或土話(鮑厚星、顏森 1986,胡萍 2005)。為了弄清綏寧縣境內的方言分布情況,我們收集了以鄉為單位的24個語言點的字音材料,并輸入Excel數據庫中。數據庫的標題欄由例字、聲類、韻攝、調類及24個語言點組成。下文就談談如何處理這些數據。
一、理清思路
數據處理切忌頭緒不清、手忙腳亂,所以在數據處理之前作一些準備工作是十分必要的。
(一)備份好原始數據
原始數據是一切工作的基礎,其正確與否直接關系到今后工作的價值:一個建立在錯誤數據上的結論必然也是錯誤的。由于數據處理中要做一些排序分類、刪減合并的工作,這必然改動原有數據,如果沒有備份的原始數據,一旦發現數據處理失誤再想恢復就難了。所以不僅原始數據要備份好,而且最明智的做法是操作一段就做一個備份,這樣可以避免從頭做起,節省大量時間和精力。
(二)搜集一些與語言點有關的資料,諸如地圖、方言志和相關文章,這對數據處理工作有指導作用。因此,在考察綏寧縣的方言材料前,應熟悉一下該縣的地理位置,讀讀有關討論綏寧方言特點及其歸屬的文章。
(三)根據工作目標制定詳細的工作計劃
李如龍(2003:111)指出,語音—尤其是古全濁字的今讀,是執行分區的重要標準。而且,合理的分區要使用聲、韻、調三類標準。鮑厚星、陳暉(2005)提出的湘語分區標準便是如此。至于在實踐中,哪類標準更重要,要視具體情況而定:劃分湘語和贛語,古濁聲母今讀是否送氣是首要標準;分別湘語和客家話,要注重古入聲塞尾是否保留;區分湘語和官話,聲調類型是首選。(候精一 2002)
由于綏寧縣在湖南省,故依據湘語的特點制定了如下計劃:
⑴利用Excel的排序功能,分別就聲、韻、調進行排序,制成三個工作表,取名為“聲序”“韻序”“調序”。
⑵利用Excel的復制、粘貼功能,從“聲序”表中調出24個語言點的全濁聲母數據,制成“全濁聲母”表。并從“全濁聲母”表中調出“濁塞音”表和“濁塞擦音”表。
⑶按“調”給“全濁聲母”表排序,選出其中的入聲字,復制成“濁入”表。
⑷從“韻序”表中調出24個點的蟹假果三攝的數據,合成一個“蟹假果攝”表。
⑸對各表進行觀察分析,尋找出各點間的共性和差異。
⑹統計各表的數據特征,建立特征分布表。
⑺分析“特征分布表”,根據各語言點聲韻特征的接近度作綏寧縣的境內方言分區。
⑻將所得結論寫成論文。
二、分類建表、分析數據
建立分類表是為了合理有效地管理數據,避免數據的丟失和混雜。分析數據時,要始終堅持實事求是的態度,切忌以少充多、以偏概全。比如“古全濁聲母清化后送氣”的字例是“個別”“部分”,還是“全部”,要在充分調查統計的基礎上才能確定,不能主觀臆斷。
(一)先建立兩個文件夾,命名為“共性”和“差異”。這樣,在數據處理過程中,可以隨時將各語言點的共性或差異儲存到文件夾中,論文寫作時又可以循類提取數據。
(二)建好“聲序”表、“韻序”表和“調序”表后,就可以做初步的觀察。當發現任何顯著特征時,可以使用Excel的“字體顏色”或“突出顯示”功能標示出來;然后按照所標顏色,利用“剪切”“插入”功能把具有共同特征的語言點移動到一塊,再作進一步觀察。
1.觀察“韻序表”。楓木團、樂安、河口、麻塘、聯民和金屋塘都存在“遇合一模韻”念[ou]的現象,把這些點的“遇合一模韻”字集中成一表進行觀察,會發現念[ou]的只是該韻的部分字,且各點字例的多寡不一。另外,紅巖、瓦屋、水口、黃土、白玉、關峽、武陽、田心、金屋塘九個點存在“鼻化韻”的現象。可以將這些點集中成“鼻化韻”表進行深入觀察。
由此,從“韻序表”中得到了兩個差異表:“遇合一模韻念[ou]”表和“鼻化韻”表。
2.觀察“聲序表”。各點普遍存在泥來兩母混讀、曉匣母與非組混讀的現象。把這樣的例字集中起來,建立“泥來母混讀”表和“曉匣非母混讀”表,共同存入“共性”文件夾中。
另外,部分點存在舌葉音,把這些點的數據合在一起,建立“有舌葉音的點”一表;部分點的“精見組”字在細音前不混”,又建“分尖團的點”一表。并將兩個表保存到“差異”文件夾中。
3.觀察“調序表”。注意“平、上、去、入”四者在各點中的今讀是否按古調類分化,是否有陰陽之分,這樣可以初步確定各點的調類數目。綏寧縣除白玉、金屋塘、關峽和田心村四個點去聲不分陰陽,只有四個調外,其他點去聲都分陰陽,調類5至7個,其中瓦屋、紅巖和黃土礦三個點上聲也分陰陽,水口和黃土礦還有一入聲調。
(三)鮑厚星、陳暉(2005)將“古全濁聲母今逢塞音、塞擦音時,無論清濁,一般都念不送氣音”作為確認湘語的第一條標準,所以有必要建立“全濁聲母”表來考察綏寧方言是否符合湘語的特征。
經觀察,綏寧24個點的濁音都已清化。但由于全濁聲母有塞音、塞擦音之別,今讀又有清濁之分和送氣與不送氣之分,送氣、不送氣又可能與調的舒促有關,所以,必須分別建表觀察才能真正弄清綏寧各點全濁聲母的今讀情況。
(四)建立“濁塞音”表和“濁塞擦音”表,是為了觀察各點是否存在送氣成份。如果存在送氣字,就要統計字例數。例如,把送氣塞音[p‘]、[t‘]、[k‘]等分別復制到Excel的“查找”欄中就可以得到送氣字數,再將塞音字總數減去送氣字數便得到了不送氣字數。這樣送氣與不送氣的比例就較為精確了,用“個別”“部分”,還是“全部”來形容便有了依據。
通過以上方法得知,綏寧方言的濁聲母今讀是否送氣可分為三類:(1)瓦屋、紅巖、水口和黃土礦基本上讀送氣;(2)長鋪鎮、樂安、河口、麻塘、楓木團和聯民基本上不送氣;(3)其余各點部分送氣部分不送氣。將第(3)類各點集中成一表觀察,發現送氣的多為平聲字。
(五)“濁入表”用于考察入聲今讀的分化情況。綏寧24個點都有部分字讀陰去(或去聲),但另一部分分化的情形不一樣。長鋪以讀陰平為主,黃桑、黨坪、白玉、關峽、田心、金屋塘、唐家坊、李熙、紅巖、在市以讀陽平為主,樂安、麻塘、楓木團、瓦屋、河口、聯民、鵝公、東山、朝儀鄉、朝儀村以讀陽上(或上聲)為主,水口、黃土以讀入聲為主,武陽讀陽去。
(六)由于《湘語的分區(稿)》一文提出了“蟹、假、果攝主要元音形成[a]、[o]、[U]序列”的標準,故建一“蟹假果攝”表。結果發現,綏寧各點蟹、假、果三攝主要元音一般形成[e]、[a]、[o]序列,與湘語的特征存在一定差異。
三、提取規律、進行分區和寫作
在提取規律、進行分區時,既要注重“差異”的分析,弄清某一語音特征的分布情況,又要對分析有“共性”的點在字例上的差異。
(一)根據前面的觀察分析,制作出綏寧縣各語言點的聲韻特征分布表,并按特征的相近度對各點進行移位整理。
(二)分析“特征分布表”,將綏寧縣境內的語音點分為六個區域:
⑴水瓦區:水口、黃土礦、紅巖、瓦屋;
⑵黃黨區:黃桑、在市、黨坪;
⑶長聯區:長鋪、楓木團、樂安、麻塘、河口、聯民;
⑷李唐區:李熙、唐家坊;
⑸白武區:白玉、關峽、田心村、金屋塘、武陽;
⑹朝鵝區:朝儀村、朝儀鄉、東山、鵝公。
結合湘語、贛語、西南官話的語音特征,可以試著將綏寧境內的六區歸入各大方言區中。本文認為:⑴為贛語;⑶為湘語;⑷和⑸為西南官話;⑵和⑹是湘語、贛語與西南官話色彩并現的區域。
(三)論文寫作中最重要的是把觀點表述清楚,并能引用相關數據來證實自己的論斷。比如,要說明“綏寧方言各點普遍存在泥來兩母混讀的現象”,我們可以引用“共性”文件夾中“泥來母混讀”表的數據。
四、小結
(一)本文以綏寧縣24個語言點的數據處理為例來談Excel對方言數據的處理,目的是使方言初學者學會利用Excel來提高數據處理的效率,從而快捷地搜尋到數據中的規律。從整個數據處理過程來看,數據的分類、命名和歸檔是極為重要的,這一工作做好了,可以確保整個過程有條不紊,并能在論文寫作中提高數據引用的效率。
(二)本文重在示范,建立表類和分析數據時主要以湘語的特征為依據。至于按照贛語和西南官話的特征可以建立哪些表類,可以仿照湘語的情形進行。
(三)Excel不是萬能的,它只是數據統計的輔助工具,整個統計過程離不開人的指導。因此,Excel最大的缺限就是智能不夠,不能按我們的計劃自動從數據中去發現規律,難以尋找共性和差異。
參考文獻:
[1]鼎言商旅網.綏寧概況[N].查詢日期:2007年4月2日.網址:http://www.d0086.com/flm/hunan/slm/shaoyang/
tlm/suining/bskk/gk.htm.
[2]鮑厚星 顏森.湖南方言的分區[J].方言,1986,(4).
[3]湖南省地方志編纂委員會.湖南省志·方言志[M].長沙:湖南人民出版社,2001.
[4]李 藍.湖南方言分區述評及再分區[J].語言研究,1994,(2).
[5]鮑厚星 陳暉.湘語的分區[J].方言,2005,(3).
[6]胡 萍.試論綏寧“關峽平話”的系屬[J].邵陽學院學報(社會科學版),2005,(4).
[7]侯精一.現代漢語方言概論[M].上海:上海教育出版社,2002.
[8]李如龍.漢語方言的比較研究[M].北京:商務印書館,2003.
(朱 濤 胡 雷,湘潭大學文學與新聞學院)