計算機技術(shù)將人類社會帶入了信息時代。信息時代的語言學(xué)要求充分運用計算機技術(shù)推動學(xué)科的發(fā)展。計算機輔助漢語方言研究極大地推動了該學(xué)科的發(fā)展。以下我們將對計算機技術(shù)在漢語方言研究中的應(yīng)用作簡要述評。
一、漢語方言資料的數(shù)字化
方言資料的數(shù)字化是將方言資料轉(zhuǎn)化為計算機能夠處理的數(shù)據(jù)的過程,主要包括以下兩個方面:
(一)國際音標(biāo)的數(shù)字化。國際音標(biāo)研究存在著譯名規(guī)范化、編碼標(biāo)準(zhǔn)化、字形統(tǒng)一化等理論問題。隨著國際音標(biāo)研究的逐步深入和計算機編碼標(biāo)準(zhǔn)的不斷完善,不少研究機構(gòu)研制了適合漢語方言研究使用的Unicode編碼的國際音標(biāo)字體,并開發(fā)出便捷的國際音標(biāo)輸入法。其中使用較廣泛的有IpaPanNew字體和云龍國際音標(biāo)輸入法①。華中科技大學(xué)、南開大學(xué)、南昌大學(xué)等單位也有相關(guān)的研究成果。但有些國際音標(biāo)沒有Unicode碼位,個別音標(biāo)的字形標(biāo)準(zhǔn)也存在一定的爭議,這些問題都需要進一步的探討。
(二)漢字的數(shù)字化。漢語方言研究離不開中國古代小學(xué)著作及相關(guān)古文獻,涉及到一些不常用漢字顯示、輸入和處理問題。隨著漢字信息處理技術(shù)的發(fā)展,一系列漢字字符集標(biāo)準(zhǔn)和大字符集字庫相繼發(fā)布,在此基礎(chǔ)上開發(fā)的四角號碼、五筆字型、手寫輸入等多種超大字符集輸入法較好地解決了漢字的數(shù)字化問題②。
除了充分利用上述成果外,方言工作者還應(yīng)對數(shù)字化資料的格式、標(biāo)準(zhǔn)等問題形成操作性、兼容性強的規(guī)范,這將極大有利于學(xué)術(shù)成果的交流與共享。目前在這方面還鮮見相關(guān)的研究成果。
二、漢語方言數(shù)據(jù)庫
漢語方言數(shù)據(jù)庫是利用數(shù)據(jù)庫技術(shù)整合各種數(shù)字化方言資料的數(shù)據(jù)集合,能進行查詢、排比、比較、計算等復(fù)雜工作。方言數(shù)據(jù)庫多采用Foxpro、Access等關(guān)系型數(shù)據(jù)庫建庫,可分為不同的類型:從整合的資料來看,可以分為語音數(shù)據(jù)庫、詞匯數(shù)據(jù)庫、聲學(xué)參數(shù)數(shù)據(jù)庫等;從研究用途來看,可分以綜合數(shù)據(jù)庫和特定數(shù)據(jù)庫;從涉及的方言數(shù)量來看,可分為大型數(shù)據(jù)庫和中小型數(shù)據(jù)庫。學(xué)者可以根據(jù)自己的研究目的建立不同類型的方言數(shù)據(jù)庫。以下是幾種有代表性的方言數(shù)據(jù)庫:
(一)DOC(漢語方言計算機字典)。DOC是漢語方言數(shù)據(jù)庫建設(shè)的早期成果,它整合了《漢語方音字匯》中17個方言點的讀音資料③,在此基礎(chǔ)上開展的“詞匯擴散論”、方言關(guān)系等研究取得了豐碩的成果。
(二)“漢藏語同源詞數(shù)據(jù)庫檢索系統(tǒng)”。收集12個漢語方言點數(shù)據(jù)。該數(shù)據(jù)庫將語言的語言信息、結(jié)構(gòu)屬性、描述屬性等整合在一起,信息量極大④。
(三)“漢語方言聲調(diào)數(shù)據(jù)庫”。將已發(fā)表的漢語方言文獻中的聲調(diào)資料制作成數(shù)據(jù)庫,可對調(diào)類、調(diào)值、調(diào)型、連調(diào)和變調(diào)等進行查詢⑤。
(四)潘悟云在其開發(fā)的“漢語方言計算機處理系統(tǒng)”的基礎(chǔ)上制作了方言語音和詞匯數(shù)據(jù)庫,并在東方語言學(xué)網(wǎng)上開放了部分查詢服務(wù)。
從方言數(shù)據(jù)庫發(fā)展的現(xiàn)狀看,語音數(shù)據(jù)庫發(fā)展最早、成果最多,理論和技術(shù)已比較成熟,但在數(shù)據(jù)庫字段及數(shù)據(jù)結(jié)構(gòu)設(shè)計等問題上需要進一步優(yōu)化和規(guī)范;方言詞匯和語法數(shù)據(jù)庫仍處于起步階段,日益受到語言學(xué)家的重視,如麥耘主持的“漢語方言詞匯數(shù)據(jù)庫”、劉丹青主持的“方言語法語料庫”等,須加強此類方言數(shù)據(jù)庫的理論和技術(shù)研究。此外,不少語言學(xué)家制作了方言音檔,并將其與方言數(shù)據(jù)庫整合起來,如侯精一主持的“現(xiàn)代漢語方言音庫”,劉俐李主持的“漢語方言語音詞匯庫”等,這也是方言數(shù)據(jù)庫發(fā)展的一個趨勢。
三、方言自動處理軟件
方言自動處理軟件是計算機輔助方言研究的一項重要內(nèi)容,它能使方言學(xué)者從繁復(fù)的整理工作中解脫出來,將精力放在分析和解決問題上。方言自動處理軟件多以處理方言語音為主,它利用漢語方言之間及方言與中古音的對應(yīng)規(guī)律編制計算機程序,實現(xiàn)研究工作的自動化,提高研究的準(zhǔn)確度,拓展研究的廣度和深度。方言自動處理軟件應(yīng)具有方言音系整理,方言音韻比較,機助建庫和相關(guān)圖表輸出等主要功能。
常見的漢語方言自動處理軟件有如下幾種:吳道勤主持研制的“方言微機處理系統(tǒng)”及其后續(xù)版本“方言音系整理系統(tǒng)”⑥,廣西師范大學(xué)劉村漢利基于EXCEL開發(fā)的“方言字音處理系統(tǒng)”、復(fù)旦大學(xué)中文系開發(fā)的“漢語方言研究助手”等。這些軟件基本實現(xiàn)了預(yù)定的功能,但界面的友好性,操作的便捷性都存在一些問題,而且難以勝任大規(guī)模的方言比較研究。上海師范大學(xué)潘悟云教授基于Visual Foxpro開發(fā)“漢語方言計算機處理系統(tǒng)”較好地克服了上述問題,代表了此類軟件的最高水平。
目前,漢語方言處理軟件已經(jīng)能夠基本滿足方言整理工作的需要,但在通用性、簡便性上仍需進一步改善,使更多的方言學(xué)者能夠順利應(yīng)用相關(guān)成果。
四、計算機技術(shù)與方言實驗語音研究
隨著計算機技術(shù)的發(fā)展,先進的電子實驗儀器不斷涌現(xiàn),給方言實驗語音研究的普及和發(fā)展創(chuàng)造了有利的條件。
(一)方言語音聲學(xué)研究。傳統(tǒng)的語音聲學(xué)研究多使用語圖儀,而隨著數(shù)字化的語音分析軟件的出現(xiàn),在個人電腦上就可以開展語音實驗研究。現(xiàn)在較常用的語音分析軟件有KAY公司的CSL系列軟件,南開大學(xué)開發(fā)的“桌上語音工作室”,荷蘭語音學(xué)家開發(fā)的PRAAT軟件以及美國暑期語言學(xué)院制作的SA軟件等。利用這些軟件,學(xué)者在方言語音特別是聲調(diào)、元音的研究上取得了豐碩的成果。
(二)方言語音生理實驗。方言語音生理研究是對方言語音發(fā)聲、調(diào)音器官具體性質(zhì)的研究,對方言語音的特性和一些疑難問題的解決具有重要的價值。實驗使用的電子設(shè)備主要有鼻流計、動態(tài)腭位(EPG)、電磁發(fā)音儀(EMA)等。這些設(shè)備較為昂貴,使用范圍不廣,取得的成果主要集中于對上海、寧波等地方言的研究。
五、計算機技術(shù)與漢語方言地圖繪制
漢語方言地理學(xué)是漢語方言研究的重要部門,而方言地圖則是漢語方言地理學(xué)的必要內(nèi)容。傳統(tǒng)漢語方言地圖的繪制存在周期長,成本高,不利于推廣等缺點,計算機技術(shù)使方言地圖的繪制更為便捷、功能更強大。
(一)圖像處理軟件在繪制方言地圖中的運用。主要是利用Window畫圖工具、Coraldraw、Photoshop等圖像處理軟件對方言地圖進行繪制、處理和修改。
(二)方言地圖繪制軟件的開發(fā)和應(yīng)用。20世紀(jì)80年代就有學(xué)者在DOS系統(tǒng)下開展這項研究⑦,現(xiàn)在較常用的方言地圖軟件有“漢語方言計算機處理系統(tǒng)”中附帶的方言地圖軟件,日本學(xué)者福嶋秩子開發(fā)的SEAL軟件等。自行開發(fā)的方言地圖軟件功能少、繪圖信息量不大,但操作較為簡便,適于在一般學(xué)者中推廣。
(三)利用MapInfo和Arcview等地理信息系統(tǒng)開發(fā)方言地理信息系統(tǒng)。方言地理信息系統(tǒng)突破傳統(tǒng)方言地圖的形式,功能強大,成為未來方言地圖的發(fā)展方向。
六、計算機輔助漢語方言教學(xué)
漢語方言教學(xué)包括國際音標(biāo)的教學(xué),聽音記音訓(xùn)練以及田野調(diào)查練習(xí)。傳統(tǒng)漢語方言教學(xué)多為口耳相授,隨著計算機多媒體技術(shù)的發(fā)展,計算機輔助漢語方言教學(xué)逐步開始普及。
中國社會科學(xué)出版社出版的《音路歷程》光盤中有趙元任和周殿福的國際音標(biāo)發(fā)音,但國際音標(biāo)錄音不太全;瞿靄堂、勁松制作了漢語方言教學(xué)軟件,不僅有完備的國際音標(biāo)發(fā)音和唇型資料,還有上海話方言調(diào)查的練習(xí)程序;此外還有一些單位制作了國際音標(biāo)學(xué)習(xí)軟件或多媒體教程。
現(xiàn)有的計算機輔助漢語方言教學(xué)軟件解決了方言教學(xué)中的幾個難點問題,得到廣泛的應(yīng)用。但存在互動性較差、學(xué)習(xí)中缺乏相應(yīng)的指導(dǎo)等缺點,使得教學(xué)效果欠理想。有必要在教學(xué)軟件中實現(xiàn)自動判斷發(fā)音準(zhǔn)確度的功能,并加強訓(xùn)練及互動的環(huán)節(jié)。
七、結(jié)語
目前,計算機技術(shù)輔助漢語方言研究的發(fā)展方興未艾。我們認為需要在以下幾方面引起足夠的重視:
(一)計算機技術(shù)與漢語方言研究的結(jié)合不是簡單的技術(shù)問題,同樣也是涉及到了研究理論、方法等諸多問題。在引入計算機技術(shù)的同時,也需要對相關(guān)問題的屬性、特點、方法等問題進行深入研究。
(二)方言數(shù)字化、方言數(shù)據(jù)庫和方言處理軟件的建設(shè)亟需統(tǒng)籌規(guī)劃、制定和完善相應(yīng)的規(guī)范和標(biāo)準(zhǔn),避免重復(fù)勞動和學(xué)術(shù)資源的浪費。在相關(guān)意見尚未統(tǒng)一之前,有必要采取一些過渡性的措施。
(三)計算機技術(shù)是漢語方言研究重要的工具,但它不能替代研究者的創(chuàng)造性思維。所以必須正確處理技術(shù)與學(xué)術(shù)的關(guān)系,使計算機技術(shù)更好地為方言研究服務(wù)。
基金項目:華中科技大學(xué)優(yōu)秀博士學(xué)位論文基金資助項目(D0647)
注釋:
①李龍,潘悟云.國際音標(biāo)輸入法及其實現(xiàn)[J].語言研究,2006,(3):67-70.
②尉遲治平,湯勤.論中文字符集、字庫及輸入法的研制[J].2006,(3):63-66.
③陸致極.漢語方言數(shù)量研究探索[M].北京:語文出版社,1992:12-14.
④江荻.漢藏語數(shù)據(jù)庫檢索軟件研制報告[A].漢藏語同源研究(三)[M].南寧:廣西民族出版社,2004:401-485.
⑤蔣平.“漢語方言聲調(diào)資料庫”的設(shè)計及其理論基礎(chǔ)[J].方言.1999,(3):187-196.
⑥吳道勤.方言音系自動整理系統(tǒng)“FYCL系統(tǒng)”[J].湘潭大學(xué)學(xué)報社科版.1990,(4):112-115.
⑦熊正輝.電子計算機繪制方言地圖的實驗[A].慶祝呂叔湘先生從事語言教學(xué)與研究六十年論文集[M].北京:語文出版社,1985:138-141.
(周 楊 ,華中科技大學(xué)中文系)