




摘要:土家語作為我國少數民族語言的一支,有著自己獨特的語言系統與研究價值,一直以來對土家語詞匯領域的研究成果豐富,本論文也旨在運用詞匯計量研究方法對土家語詞匯進行統計研究,為土家語詞匯研究注入新的活力,為未來的土家語詞匯領域的研究提供參考示例。
關鍵詞:土家語;Access;詞匯;計量研究
前言
詞匯計量研究是語言學里研究詞匯的重要方法,將數據庫技術引進語言學研究尤其是詞匯領域的研究,是追求定量研究與定性分析相結合,探求更深層次詞法規律的重要一步。“計量方法的引進,特別是數據庫技術引進到漢語語言學,引進到漢語詞匯學,有著特別的意義。”[1]根據蘇新春先生在《詞匯計量及實現》一書中的概括,將計量方法引入詞匯研究有著以下的優勢:
首先是詞匯作為語言最重要的基本要素之一,其數量也最為龐大,龐大的詞匯量使得對詞法的研究分析,對其背后規律的探索需要投入大量的人力、時間,而將數據庫方法引入語言學研究,運用數據統計工具對其進行分析,可以大大節省我們的時間和成本。
其次是對于計量研究而言,詞語詞形辨認方便,這樣就更便于統計,得出的結果也更為精確客觀。
最后是方便進行查詢和對比分析。相比于傳統的詞典查詢,這種方式更易于查詢,且能夠有效進行各種對比分析,如通過對一個詞在不同時代收錄的例子進行對比分析進而得出其背后更為廣闊的社會意義與時代背景等。
而土家語作為我國重要的民族語言之一,因其只有語音無文字,且其詞匯、句子等都是以國際音標的形式記音標注保存,將詞匯計量方法引入土家語詞匯研究,可以更有效地對土家語詞匯進行歷時對比研究與共時對比研究,這不僅可以更為直接地看出土家語語音語調的發展變化,其詞性與意義的改變也會得到一個更為直觀的展示。
本論文通過Access建立一個簡單的土家語詞庫,在此基礎上運用Access數據庫中的查詢重復選項對詞表中的詞匯進行重復查詢篩選,將篩選出的結果進行對比分析,力求為土家語詞匯計量研究提供一個示例,為未來的土家語詞匯研究提供一些參考思路。
基于Access建立土家語詞庫
“Microsoft Access是小型桌面關系數據庫,主宰著整個桌面數據庫市場,與Word、Excel、PowerPoint、Outlook等一起構成了Microsoft Office 系列辦公室軟件。”[1]與其他的數據庫軟件相比,Access的優點非常明顯:首先是它的建庫、查詢等常用功能無需編程,非常直觀,可操作性強;其次是與其他office系列軟件相互兼容,格式轉換方便;再次是潛在開發能力強,數據存儲方便,單表可處理的數據量大;最后是安全可靠,管理方便,操作容易。
本文利用Access建立土家語詞庫主要是以導入表的方式完成數據庫的建庫。首先需要確認的是詞表,為了更方便進行對比研究,本文分別從田德生、何天貞等編著的《土家語簡志》(1986版)、葉德書所著的《土家語研究》(1995版)和陳康所著的《土家語研究》(2006版)中選取部分基本核心詞匯進行對比,本文所選取的詞匯量不多,旨在呈現出整個計量研究的方向與過程。
為了方便研究,本文首先利用Excel建立好詞表,再將詞表導入Access數據庫。本文中數據庫操作所使用的版本為Access2016版本,詞表及其導入流程如下圖所示:
如圖所示,詞表導入首先需要點開Access,點擊新建空白數據庫,根據出現的界面,點擊外部數據,選擇新數據源,從出現的選項中選擇文件并從文件中選擇Excel表格進行導入,選擇將源數據導入當前數據庫的新表中,可以對導入的詞表的字段信息如字段名稱、數據類型等進行修改,并且還可以根據提示操作選擇定義主鍵,最后對表格進行命名,完成表的數據導入與建立。
該表有5個字段如下圖所示:
主鍵是tjid,5個字段的內容與數據類型如下:
由于土家語的特殊性,在設置字段的時候我們主要根據漢語詞匯條目去進行設置,這樣在進行對比研究時我們也可以更為直觀地得出它們語音上的不同,進而分析其背后可能存在的原因,從而實現我們的研究目的。
最后是窗體的設置,“數據庫里的數據信息都是儲存在‘表’中,‘窗體’是數據庫的顯示窗口,它能對表中的數據起到顯示、錄入、屏蔽、分類的作用。”[1]本文中所建立的窗體較為簡單,由于沒有更多的復雜應用的需要,本文中也僅做一個展示。
基于Access建立土家語詞庫,將計量研究方法引入土家語詞匯研究,不僅有助于我們在對土家語詞匯進行整體上的定量分析,也更方便我們對其進行歷時性研究與共時性對比分析,這也是我們建庫的重要目的。
詞庫統計結果分析
基于上文中所建成的土家語詞庫,本部分內容將對其進行簡要統計分析,由于詞庫中所選取的樣本數量有限,本文也僅根據所選取的部分進行歸納總結,所得出的結果的依據為本次統計分析以及所選取的語料的背景。
首先打開“土家語詞庫”,點擊“創建”中的“查詢向導”,選擇查找重復項查詢向導,設定“重復值字段”,有需要的話可以根據提示對“查詢設計”進行修改,本文主要目的是對擁有同樣漢語釋義的土家語詞匯進行對比分析,所以主要選擇對詞目、國際音標等進行重復查詢,將所得出的結果保存至數據庫,命名為“tujiayu的重復項”,所得出的結果如下圖所示:
如圖所示,通過對表進行重復項查詢后可以獲得在本表中所有重復漢語釋義的土家語詞匯及其來源,根據重復項查詢得出的結果,結合本文中所選擇的土家語詞匯來源背景,我們可以做出如下的判斷:
首先,我們可以從上述結果中非常明顯地看出不同詞匯在不同著述中語音語調上的明顯區別,本文所選擇的詞分別來自田德生、何天貞等編著的《土家語簡志》(1986版)、葉德書所著的《土家語研究》(1995版)和陳康所著的《土家語研究》(2006版),其中《土家語簡志》中的語言描寫主要是以湖南湘西土家族苗族自治州龍山縣靛房鄉(今為靛房鎮)為田野調查點[2],葉德書版的《土家語研究》則是以龍山縣苗市公社(現苗兒攤鎮)星火大隊(現星火村)的土家語為代表[3],而陳康版的《土家語研究》則是對其于上世紀八十年代初進行調查研究所寫出的《土家語簡志》(草稿)作進一步的修改進而成書,語音描寫也是北部方言龍山土語的語音系統[4],三本著作都是以土家語北部方言區龍山縣為語音點。
從上面重復項查詢結果中我們可以非常明顯地看出陳版的《土家語研究》與《土家語簡志》中的基本詞匯重復較多,除了極少數的語調與元音略有區別外,其余發音大都相同,考慮到陳康老師也曾參與《土家語簡志》編寫調查工作,以《土家語簡志》里面所記載的語音為基礎也不足為奇,但有意思的是陳康老師在近二十年后的著述中對聲調和部分記音所做的修改,以“太陽”為例,陳版中“太陽”的發音為“lau21tshi21”,而《土家語簡志》中則是記為“?au21tshi21”,將鼻音變成了邊音,陳版中“魚”的發音為“so?3?”,《土家語簡志》中則為“su3?”,以及一些音調上的變化。
其次,根據重復選項的統計結果我們可以更易分辨出葉版的《土家語研究》與《土家語簡志》中漢語釋義相同的詞匯在語音上的差別,二者所選取的語音點在同一縣的不同鄉鎮,從對比中我們可以看出二者在語音語調上略有區別,如“天”的發音在《土家語簡志》中為“ne??”,而在葉版的《土家語研究》中為“me3?”,將這二者進行對比研究可以很清楚地看到一些詞匯在不同地域間發音的差別,對于我們進行不同地域的同一語言的對比研究提供范例。
最后,計量研究的優勢就在于可以對大量的詞匯進行統計分析,于土家語而言,這種統計分析更方便進行一定數量的對比研究,在定量研究的基礎上對其作出定性判斷,本文所選取的詞匯量有限,若是在詞匯量充足的基礎上進行此項研究,可以得出非常直觀的對比結果,從而對不同著述中所記載的土家語語音、詞義的變化進行概括總結,探究這種變化背后折射出的社會背景及時代變遷。
土家語詞匯計量研究的難點分析
將詞匯計量研究方法應用于土家語詞匯研究,可以方便我們對土家語詞匯進行統計分析,發掘其背后更深層次的規律,尤其對于土家語歷時性研究和共時性研究而言,這種方法會為其提供更為客觀、科學的結果。但在土家語研究中應用這種方法也有著自己的難點,并且這些難點會對我們最終的統計結果造成一定的影響,是我們最后進行分析作出判斷時需要特別去注意的點。
第一個難點就是土家語記音有著一定的主觀性,這種主觀性會對我們最終分析出來的結果的客觀性造成一定的影響。由于土家語只有語音無文字,所有的詞匯都是以國際音標的形式保存,不同的田野調查人員的記音會存在著一定的主觀性偏差,這種主觀性偏差也會對我們最終的分析結果造成一定的影響。而目前所能想到的最好的解決辦法就是盡可能多地去分析詞語數量,盡量減少這種偏差。
其次是計量研究是我們進行詞匯研究的一種手段,它只能為我們提供統計的結果,是我們實現研究目的過程中的重要一環,而要想實現最終的研究目的仍然需要依靠我們自身對結果進行思索與判斷。像土家語這種以國際音標形式保存的語言在進行分析研究時相比較漢語而言更具有難度,尤其是在對于具體詞匯做分析時,對除本身的統計結果外的其他背景信息依賴較高,這種依賴性也意味著單純從量的統計分析去實現研究目的是比較難以達到的,必須進行綜合考量。
最后需要注意的是對土家語進行詞匯計量研究更需要以研究目的為導向。研究目的決定了我們以何種方式統計得出結果,進而也決定了結果的指向性,這是我們在分析研究前就需要著重思考的問題,也是我們在對土家語進行詞匯計量研究時需要關注的地方。
對土家語進行詞匯計量研究的成果還較少,總的來說這種方式對土家語研究來說還較為新穎,新的事物的嘗試總是伴隨著失敗與挑戰,但是依然擁有著巨大的可發掘的空間,逐步解決研究過程中碰上的難點,更好地將詞匯計量方法與土家語詞匯研究相結合,推動土家語詞匯研究向前發展,也是我們未來面臨的挑戰。
結語
隨著計算機技術的迅速發展,很多的軟件技術可以應用于我們的語言學研究,這也是學術研究跟上時代發展的必然選擇。將計量研究方法引入土家語詞匯研究領域,是對土家語詞匯研究領域的進一步拓展,為土家語詞匯研究尤其是詞匯對比研究提供了莫大的助力,本文也僅對這種研究范式作了新的嘗試,更為深入的探索仍需要后續的不斷跟進摸索。土家語研究任重道遠,在新的時代背景下探索新的方式也是推進土家語研究的必要選擇。
本論文為“四川省高校重點實驗室-民族語言文字信息處理實驗室建設項目”的階段性研究成果
參考文獻:
[1]蘇新春.詞匯計量及實現[M].北京:商務印書館,2010.
[2]田德生,何天貞.土家語簡志[M].北京:民族出版社,1986.
[3]葉德書.土家語研究[M].吉首:吉首大學湘楚文化研究所,1995.
[4]陳康.土家語研究[M].北京:中央民族大學出版社,2006.
作者簡介:劉冬亞(1992-),女,土家族,湖北利川人,西南民族大學中國少數民族語言文學2019級碩士,研究方向:語言文字信息處理