陸葉
(中國傳媒大學文學院,北京 100000)
語言研究的實證性傾向
陸葉
(中國傳媒大學文學院,北京 100000)
研究方法可以說是語言學研究最重要的要素之一,也是語言學學科建立和發展必不可少的支撐。語言學發展至今,研究方法呈現動態的發展的趨勢,隨著與其他學科的交叉融合,定量的、實證性的研究方法越來越多地被運用到語言研究中。語言研究逐漸呈現實證性的傾向。
語言發展;研究方法;實證性
語言學家從不同視角對語言進行觀察和研究,對語言的認識也各不相同,形成了不同的語言觀。根據語言觀的不同,在具體研究語言時往往采用不同的研究方法并根據研究對象形成新的理論,進而形成各種語言學流派。現代語言學之父索緒爾的語言觀對現當代的語言研究產生了深遠的影響。他提出語言是一種表達觀念的符號系統以及語言一系列的二元對立。從此,語言研究變成了真正現代科學意義上的語言學。后來發展起來的現代語言學不同流派展開了對語言結構、功能、運用及演變等諸多方面的描述和探討,試圖揭示語言的規律。
從歷時角度看,語言學研究是一個歷時的動態的研究范疇,語言研究方法也具有動態發展的特點。當代語言學研究呈現跨學科、多元化的傾向。語言學與其他學科交叉產生的分支學科中研究方法則更加多樣化。數學、自然科學和系統科學等學科定量的、實證性的方法被廣泛借鑒運用在語言研究中。科學的方法和系統的研究也使語言學被公認為是人文科學中最接近自然科學的人文社會學科。而近年借助計算機和定量統計方法進行語言研究也豐富了傳統的語言觀:語言不僅是人類最重要的思維和交際工具、一種音義結合的符號系統,是人類積累信息的儲存庫,也是信息的加工原料,在當代語言還是人類和計算機共同的表達知識、傳遞信息、實施控制的符號系統。
運用科學方法的漢語研究起步較晚,從1898年馬建忠先生的《馬氏文通》才開始進入理性主義的研究。20世紀中葉西方結構主義描寫語言學、轉換生成語法和系統功能語法等研究理論和方法被引入漢語語法研究中來。迄今為止,漢語研究還是以借鑒西方語法研究理論為主要傾向。面對這種現狀,陸儉明先生提出漢語語言研究要樹立三種意識:多元意識、理論意識和假設意識。許多科學研究的重要理論的產生都離不開科學的假設。
西方科學的哲學基礎是邏輯實證主義,因此有“科學即實證”的說法,而邏輯實證主義也是定量研究的哲學基礎。雖然系統、比較、描寫、歸納、內省以及各種語言學派的理論方法等都是語言學研究中常用的研究方法,但語料庫法和實驗法更能為研究者提供客觀性的數據。因此,對當今的語言學研究者來說掌握科學的、前沿的研究方法顯得尤為重要。
(一)語料庫方法。
互聯網時代,海量信息撲面而來,承載信息的大量語言材料和現象令語言研究者應接不暇,語料庫成為語言研究者的田野調查的沃土,為研究者實證取例和分析提供方法、材料和數據。語料庫方法成為語言實證性研究的重要手段之一,影響了當代語言學研究傾向,使得定量定性相結合、尤其是計量的研究方法成為主流的研究方法。
語料庫語言學采用的是以語料統計為基礎的方法,即基于概率的方法。通過對大量語言數據的定量化統計分析,得出語言成分分布和語言成分之間關系等的概率,以數據的形式展現語言的規律。語料庫的方法實際是一種以定性研究為基礎的定量方法,進行定量研究還涉及數據的后續處理,包括分類和比較等。當代語言研究中不僅是語音、文字、詞匯、語義、語法、語篇,在方言和古代漢語的音韻學方面定量的方法也逐漸受到重視,而且語料庫方法對語言的應用研究也有一定的輔助作用。比如,在詞典編纂時詞與非詞的確定方面,通過語料庫的方法考察詞語的使用和分布,可以為研究者提供客觀的可參考的數據。下面舉具體實例簡要說明。
漢語表序數“第一”義的“首”常以“首+量詞”出現在書面語中,“首+量詞”是詞還是短語在學界一直有很大爭議。因為漢語中數詞和量詞通常都不單獨使用,數詞和量詞組合后在句子中充當句法成分,作定語或補語、狀語等。對于“數詞+量詞”黃伯榮等稱之為數量短語,胡裕樹、袁毓林等稱為數量詞。詞典編纂時如何處理也是一個問題。《現代漢語詞典》的編纂規范之一是以能單用的詞為基本立目單位。不同版本《現漢》中“首+量詞”的收錄情況如下:《現代漢語詞典(修訂本)》(1996)和《現代漢語詞典(增補本)》(2000)只收錄了“首屆”;《現代漢語詞典第6版》收錄了“首次、首度、首屆、首例和首位”并做了詞性標注,其中“首次、首度、首屆”標注為數量詞,“首例和首位”標注為名詞。由此可見,個別“首+量詞”在詞典中已經占據了一席之地,具有了詞的身份。“首”具有附著性,與量詞組合時只位于量詞前,可以和很多量詞組合,《現漢第6版》僅收錄五例,在語言實際使用中“首+量詞”的情況是怎樣的呢?
我們用定量統計的方法在中國傳媒大學媒體語言語料庫(語料規模34039個文本,包含241316530字符)中對數詞“首”和漢語主要常用量詞的搭配使用情況進行檢索,結果如下:

表1 表序數的“首”與量詞的共現情況
根據檢索結果,從實際文本分布和使用頻率來看,“首批、首個、首場、首輪、首例、首家、首位”等詞也應考慮收入詞典中。然而由于詞典不能無限增容,因此在收錄詞目時必須界定一個標準。我們認為可以根據詞目在實際使用中的分布和使用頻率來決定,分布和使用頻率達到一定標準的詞可以收錄為詞典詞,這樣既可以為輔助詞典編纂提供實證材料,也可以做到客觀反映語言的使用情況。另外,該定量考察結果也可以為語言自動檢測系統提供一定參考。由于漢語量詞是個相對封閉的類,因此根據上面的分布和使用頻率,面向語言監測的分詞系統標注時,“首”字后面如果出現漢語固有量詞時,可以視為一個詞標注為數量詞。
(二)實驗室方法。
上面提到,科學具有客觀性、可驗證性和系統性的特征,科學研究的實證過程與分析論證必須透明,其他研究者才能從系統或邏輯上判斷其是否正確。現代自然科學研究方法中最核心、基本的方法便是“實驗室方法”。在語言學的一些分支學科如心理語言學、認知語言學等學科中實驗法已成為基本方法之一。金立鑫提出將“實驗室方法”用于語言學研究,并給出了語言學的實驗室方法的完整表述。通過實驗法對語言進行形式化的研究,而形式化研究也有自己具體的方法——形式化方法(formal methods),它原指在邏輯科學中分析、研究思維形式結構的方法,在語言學研究中就是分析、研究語言形式結構的方法。目前結構主義語言學、轉換生成語法、形式語義學等學派都采用了形式化的研究方法。通過實驗的方法對語言進行形式化的研究,使語言研究具有實證性和可驗證性,進而擺脫文學欣賞式的主觀研究。
近年隨著計算機技術的普及和發展,人們使用的大量信息以語言為載體通過電子文本和文件的方式大量存儲,我們已經進入 了一個大數據的時代。楊惠中先生有這樣的解讀“所謂大數據時代,實際上就是用語料庫語言學的方法處理海量語言信息……”。對于語言研究來說,借助計算機通過定量統計等方法來自動發現語言學知識將極大地提高研究的效率、擴大研究的規模。定量統計和實驗等實證方法可以為語言理論研究和應用研究提供客觀、科學的數據,確保研究的科學性和實證性,實證方法也是語言研究提高科學性、可靠性的需要。
[1]中國社會科學院語言研究所.現代 漢語詞典第6版[M].北京:商務印書館,2012
[2]費爾迪南·德·索緒爾著,高明凱譯.普通語言學教程[M].北京:商務印書館,2010
[3]馬建忠.馬氏文通[M].北京:商務印書館,2010
[4]楊慧中.語料庫語言學與中國外語教學[ J].現代外語,2010
[5]金立鑫.將“實驗室方法”用于語言學研究[J].中國社會科學報,2014
[6]黃昌寧.語料庫語言學[M].北京:商務印書館,2002
C03
A
1671-864X(2016)08-0132-02