施書宇
(南京師范大學 文學院,江蘇 南京 210097)
通常認為,元語言這一概念肇始于波蘭邏輯學家Alfred Tarski。1933年,他在《演繹科學語言中的真理概念》中,提出解決悖論的“對象語言”、“元語言”、“元元語言”的分層理論。但這一邏輯學的元語言與語言學的元語言還是不同的?,F代語言學接受了邏輯學的元語言概念以后,從語言學立場出發探索元語言,最終形成了“邏輯學元語言”和“語言學元語言”的分野,本文所講的屬于語言學的元語言,指用來分析和描寫另一種語言的語言或一套符號。
元語言研究對語言本體和應用研究都有一定價值。目前的元語言研究主要集中于基元的提取或元語言的釋文分析,如以A.W ierzbicka為代表的波蘭語義學派,多年來一直致力于具有普遍意義的人類語義基元的求解。到目前為止,共提取了15大類61個語義基元,并認為這61個基元適用于目前所有民族語言(李炯英,2005)。而以Ю.Апресян為代表的莫斯科語義學派主要致力于元語言的釋文研究,基于機譯系統的研制和俄語詞典的編撰,由俄語的基本詞匯和基本句法構成的語義元語言主要用來描寫俄語的意義。
實際上,對元語言的層級性問題,莫斯科語義學派也進行過探討,但這種研究是與民族性的探討糾結在一起的。他們主要研究了語義元語言(相當于釋義元語言),認為語義元語言體系包括深層語義結構和表層語義結構兩個層級,其中表層語義結構包含了民族語義因素。所以他們對元語言的層級研究,主要是在釋義元語言的民族性問題的宏觀范圍內進行的,從根本上講,這種層級劃分也是為元語言民族性的闡釋服務的。
李葆嘉(2002)提出了面向信息處理的現代漢語元語言研究這一課題,并從層級性角度對語言學的元語言問題進行了研究,認為元語言包含三個層級,即詞匯元語言、釋義、析義元語言。之后,增加了認知元語言,最終形成了詞匯、釋義、析義和認知元語言四層級分野。
其中,詞匯元語言是進行日常交際的最低限量詞匯,主要功能是用于語言教學的擇詞依據。最低限量詞匯反映了基本事物、基本動作及生活中的基本關系,是衍生詞語的基元,也是日常交際和語言能力發展的基礎。從這種意義上講,最低限量詞匯可以看作是日常元語言。而釋義元語言側重于闡釋功能,是用于詞典釋義最低詞匯量的依據,處于詞匯元語言的更高層級。目前國內大部分詞典,隨機釋義現象普遍存在,在釋義用詞數量上沒有明確的量的限制。釋義元語言作為釋義的限量詞匯,仍然具有可解讀性,可以用析義元語言進行界定。與詞匯及釋義元語言相比,析義元語言層級更高,是更加抽象化的元語言系統,具有人工語言性質。認知元語言是認知活動中的范疇系統,是對人類感知意象及其關聯結構的再抽象,是基于多種語言的元語言研究成果而形成的。沒有各種民族語言的元語言的充分研究,認知元語言就無法提取和建構。與詞匯、釋義、析義和認知元語言相對應,李葆嘉分別用詞元、基元、義元和知元來表示四種類型元語言的基本單位。
詞匯元語言系統是處于詞匯層面用來進行日常交際的限量詞匯集,也是人們進行日常交流和語言理解的憑借。個體詞匯習得時,首先掌握的就是詞匯元語言系統。
漢語詞匯數量很龐大,《現代漢語詞典》共收字、詞六萬多,在實際使用中詞匯遠遠超過這個數目。對外漢語教學詞匯通常分為四個界標:1000、3000、5000和8000(劉英林等,1992)。根據大多數研究者的共識,3000個詞是個基礎的界標,與外語教學基礎階段的詞匯量基本一致。到目前為止,漢語中已經出現了一些可供借鑒的定量詞表,仍沒有大家所公認的詞匯元語言詞表。如鄭林曦的《普通話三千常用詞表》收詞3996個。白麗芳(2006)經過與各類詞表的比較,提取了漢語的詞匯元語言,數量為3051個。該詞表所收錄的3051個詞匯,可以劃分為若干層級。安華林(2005)基于目前五個常用詞表,如《漢語詞匯的統計與分析》(1985)等,通過比對提出共現詞的方法,建構了《現代漢語受限通用詞表》,該詞表共包括1451個詞。該詞表采取交集選詞的方法,具有很大的代表性和分布性。
根據對目前詞表的比對分析,我們把現代漢語詞匯元語言詞表3051個詞匯分為三個等級。其中第一層級包括安華林(2005)《現代漢語受限通用詞表》和白麗芳(2006)的《詞匯元語言詞表》經過交集后的部分,共有806個。這部分詞匯屬于內核結構,處于詞匯元語言系統的底層,具有基層性。第一層級的詞匯是目前常見詞表的共核部分。除第一層級外,其他屬于第二層級,有2245個,這些詞匯與第一層級的內核系統具有密切關聯。第一層級的詞往往是單音節詞,第二層級大多是復合詞。
20世紀80年代以后,國內漢語學界開始重視詞匯的計量研究,出版了一些詞表和頻率詞典,但詞典編纂中仍未采用限量釋義元語言的方法?!冬F代漢語詞典》是公認的權威語文性詞典,但釋義用詞數量尚未控制,共收字、詞6萬余條,而釋義用詞總數達36000多個,占詞目總數的一半以上。張津、黃昌寧1996年提交了國家自然科學基金項目研究報告 《從單語詞典中獲取定義原語方法的研究及現代漢語定義原語的獲取》,提取的釋義基元詞集共包括3856個詞目。但該詞表存在若干不足,提取出的釋義詞可信度不高,存在大量不可能承擔釋義功能的詞語(蘇新春,2003)。安華林(2005)依靠嚴格步驟和統計方法初步提取了現代漢語釋義元語言,考慮到常用性、周遍性、適度性等因素進行了驗證和優化,構建了包含2878個基元的釋義元語言符號集。這是國內目前所構建的最權威的限量釋義元語言詞表。
安華林(2005)所建構的釋義元語言詞表所包含的2878個詞匯,從使用頻度和日常語感的感知來看,也具有層級性。根據使用率和分布率,把釋義元語言符號集區分為甲乙丙三個等級,其中甲級詞761個,乙級詞1040個,丙級詞1077個。其中甲級詞處于核心層,具有很高的使用頻度和分布率;乙級詞處于中間層,具有較高交際常用性和解釋常用性;丙級詞處于外圍層,不同時兼備交際常用性和釋義常用性,但為系統、釋義所必須。其中甲、乙級詞是釋義元語言的基礎,丙級詞是為釋義的精密性、順暢性提供保證。
與詞匯元語言、釋義元語言相比,析義元語言層級更高,是更加抽象化的元語言系統,具有人工語言性質。提取限量義征(語義特征)和構建義征分析元句法模式是建立析義元語言系統的關鍵。根據李葆嘉(2002)提出的受限理論,孫道功等(2008)選取了1374個常用義位作為典型群案,進行義征分析提取,得到了義征標記初級集(1664個),然后對《現代漢語受限通用義位表》中實詞部分2105個義位進行驗證優化,最終得到《析義元語言標記優化集》(2836個)。在此之前,漢語學界尚未拿出一份語義特征的清單。在析義元語言系統中,頻度100次以上(含100)的共有20個,大都是義征分析中的類別義征。根據頻度,可以分為三個層級:頻度5次以上的為高頻義征,共761個;頻度為2到5次的為中頻義征,共955個;頻度為1次的為低頻義征,共973個。高頻義征和中頻義征是義征標記集的主體部分。其中第一層級是類別義征,第二層級是相同屬性義征,第三層級是區別屬性義征。
對于元語言系統中的認知元語言,目前研究得很少。認知元語言系統實際上去除了各種民族語言的個性部分,而提取了其最大公約項。認知元語言系統的構建,需要建立在對各種民族語言進行充分研究的基礎上。所以沒有各種民族語言的充分研究,認知元語言系統的構建只能是空中樓閣。故認知元語言系統的層級性及其表現形式暫不論述。
從研究現狀看,元語言系統的層級性是客觀存在的,這在語言學界也已經基本達成共識。層級性的表現是多樣的,不僅表現在詞匯、釋義、析義,以及認知元語言的四個層級劃分上,而且表現在各層級下又包含了下位層級。但元語言系統是非常復雜的,目前層級劃分主要依據頻度高低,在進一步的研究中需要對所分出的各個層級進行分布率的驗證,以促使元語言下位層級的研究更加細化。
[1]安華林.現代漢語釋義基元詞研究[M].中國社會科學出版社,2005.
[2]白麗芳.英漢元語言比較研究[D].南師大2006語言學及應用語言學博士論文.
[3]李葆嘉.漢語元語言系統研究理論建構及應用價值[J].南京師大學報,2002,(4).
[4]李炯英.波蘭語義學派概述[J].外語教學與研究,2005,(4).
[5]劉英林等.漢語水平詞匯與漢字等級大綱[M].經濟科學出版社,1992.
[6]孫道功等.試論析義元語言標記集的建構[J].語言文字應用,2008,(3).
[7]于鑫.Ю.Апресян及其語義理論[J].解放軍外國語學院學報,2003,(2).
[8]張家驊等.俄羅斯當代語義學[M].商務印書館,2005.