房宇華 胡志紅
(中國地質大學(武漢)外國語學院,湖北 武漢 430074)
隨著全球化趨勢的推進發展,近年來涉外法務事件的頻率不斷上升,法律語言研究與法律英語ESP教學也逐漸進入人們的視野。語料庫語言學的興起與發展為語言研究提供了可計量化途徑,使得語言研究更為科學化,規范化,并與相關學科聯姻孕育了語料庫翻譯學、語料庫文體學等等新興學科。本文應用語料庫語言學的量化方法,以自建法律英語語料庫為觀察語料庫,LOB語料庫為參照語料庫,對法律英語語篇中詞匯應用的基本特征及主題詞應用類型進行實證探討。
法律英語(Legal English)是指普通法國家以普通英語為基礎,在立法和司法全過程中逐漸形成的,具有規約性的民族語言的社團分支,包括規范性法律文件以及法律工作者在執法過程中使用的一整套規范化的法律公務用語。[6]國內法律英語研究聚焦于法律翻譯與法律英語教學,[3]但了解法律英語本身的特質是其應用研究的基礎。相關研究對于法律英語的語法、詞匯、句法等基本要素而言已有一定程度的解析,如馬慶林(2003)認為法律英語具有準確性和正確性、正式拘謹性、晦澀難懂性、模糊性,[4]趙春義(2006)指出法律語言須簡潔、準確,文體須嚴肅、莊重,[4]但上述研究多為內省式探討并輔以少量語料進行佐證,這樣的研究結果難免缺乏一定信度,而語料庫技術的孕育和發展為法律語言研究提供了可計量化途徑。近年來應用語料庫方法的法律英語研究多為以平行語料庫開展的翻譯研究(參見徐珺,王清然,2017;蔣婷, 楊炳鈞,2013;王子穎,2013等)或教學研究(參見孟超,馬慶林,2019等),而情態動詞的應用又是其中研究重心所在,如朱英毅等(2017)以自建法律語料庫與CLOB語料庫進行對比,指出法律英語與一般用語的情態動詞使用頻率差距極大;[11]此外王子穎(2013)、胡丹(2011)等也對其進行了探索。
簡而言之,目前法律英語研究已取得一定成果,但較少應用量化方法,對其中詞匯進行的研究多集中于單個或單類詞的應用剖析,研究尚不夠深入、全面。
本文擬在已有研究基礎上,針對英語法律語篇中的詞匯應用情況,對以下問題進行探究:
英語法律詞匯的基本統計特征是怎樣的?
英語法律話語的主題詞有哪些? 它們反映出英語法律語篇詞匯應用的哪些特征?
本研究所用語料為自建法律英語語料庫(Corpus of English Legal Texts,以下簡稱為CELT語料庫),語料來源為123部大陸法律和香港法律英語版本,具體包括中華人民共和國公司法、保險法、標準法、著作權法、專利法、銀行法、招標投標法、中外合作經營企業法、職業教育法、信托法、刑法、消費者權益保護法等,收錄法規近10萬條,共計300萬詞。對比語料庫為LOB語料庫(Lancaster-Oslo/Bergen Corpus),LOB收錄100萬詞匯,涵蓋500個大約2000詞的文本內容,是涵蓋了多種文本類型的平衡語料庫。
本文采用WordSmith Tools 6.0對語料進行定量分析。第一,采用詞表分析,統計出自建CELT語料庫及LOB語料庫的基本信息進行比對,以對研究問題1進行回答。第二,使用主題詞分析,以自建CELT語料庫為觀察語料庫,以LOB語料庫為參照語料庫,自動提取CELT語料庫中的正向詞匯,對英語法律語篇具體詞匯應用進行剖析,以對研究問題2進行回答。
詞頻分析是語料庫計量化研究方法重要因素之一。詞頻涉及形符(tokens)和類符(types) 兩個概念,形符類似我們日常說的“詞”,而類符指語料庫文本中任何一個獨特的詞型。比如在The damage caused thereby shall be borne by the person who built 這句話中有12個詞,即12個形符;the雖出現2次,但屬于同一類符,因此這句話的類符數為10。WordSmith 在統計詞次時,把包含數字等符號在內的統計結果稱為語料庫中的所有詞次(tokens running words in text),將剔除上述符號的統計結果稱為用作詞表的詞次(tokens used for word list),故后者總是少于前者,如表1所示。

表1 CELT語料庫與LOB語料庫基本統計信息對比
形符/類符比 ( type/token ratio) 是衡量文本詞匯密度的常用方法,但由于文本中功能詞的重復出現,形符量將隨文本量增大而增大,類符量則不會隨之變化,因此可采取標準化形符/類符比(standardized type-token ratio)進一步計算詞匯密度。本文以1,000詞作為參考詞數,將兩語料庫中的形符/類符比進行均值處理,最終得出其標準形符/類符比。
統計數據顯示CELT語料庫的形符/類符比為34.48,低于LOB語料庫的37.40,這說明法律英語語篇是專用型文本,其有一定數量的專門集中性用詞,而LOB語料庫的內容覆蓋面較廣,因此涉及詞型較多。CELT語料庫的標準形符/類符比標準差為66.18,高于LOB語料庫的61.88,這說明法律語篇詞型差異性更大。CELT語料庫的平均詞長為4.84,略高于LOB語料庫的4.26,二者在詞長方面相差不大。
主題詞(Keyword)是一種文體標識詞,其頻率與其在標準語境中的頻率明顯不同。(Culpeper,2009)因此我們可以通過主題詞的使用規律來進一步探討法律英語語篇的文體特征。本文應用WordSmith 6.0的詞表功能 (WordList),生成兩個分別基于觀察語料庫CELT語料庫和參照語料庫LOB的詞表,然后啟動主題詞功能 (KeyWords),選擇對數似然率檢驗 (Loglikelihood statistics),將p值設為0.000001,并選取生成的前500個正向主題詞進行分析。表2列出了前10個主題詞的相關信息:

表2 英語CELT語料庫中主題詞(前10)
根據對主題詞表的統計及分析,我們將法律語篇中較之一般語料(LOB)頻率異常的主題詞分為以下幾類:古體詞、情態動詞、專業術語、連接詞,以下部分將對這幾類主題詞分別開展討論。
3.2.1 古體詞
根據統計結果顯示,法律英語語篇中有較多古體詞的使用。古舊詞匯在現代英語中已經很少使用,但在法律英語中,為了凸顯其正規、嚴肅的特點,現代法律語篇中仍常見古體詞。法律英語中常見古體詞多為there/here/where+介詞構成,如表3所示詞根為there的古體詞如thereof(由此),therein(在其中),thereto(另外),thereon(關于那),therefrom(從中)在CELT語料庫中都有一定的使用量,但在LOB語料庫中的使用寥寥無幾。

表3 詞根為THERE的古體詞在兩語料庫中的主題詞對比
例1.Provided further that this policy shall be subject to the Conditions herein contained and to any Memoranda endorsed hereon and such Conditions and part of the Policy and the observance and performance by the Insured of the times and terms therein contained so far as they relate to anything to be done by the Insured are of the essence of this contract and shall be conditions precedent to any liability on the part of the Insured under this Policy.
如在例1中,herein,hereon,therein都是典型的古體詞,它們對一方面以舊詞沿用的形式增強了法律語篇的權威性,另一方面以簡寫形式增強了法律語篇的簡潔性,如herein即相當于here in,意為于此。
3.2.2 情態動詞
情態動詞的應用是法律英語研究中的熱點之一,在法律英語語篇中,“當事人”是一個避不開的概念,其享有的權利及應履行的法律義務都是法律語言著重表達的部分,shall是表示義務職責的強制詞,may是表示權利許可的授權詞,[7]因此這兩個情態動詞與法律語言有著較高契合度,表4所示數據顯示shall和may在CELT語料庫中出現頻率遠遠超過LOB語料庫,因為在其他文體中較少涉及“義務”和“授權”的概念,而法律語篇正需要應用此種表達來提升其文體正式性。

表4 情態動詞在兩語料庫中的主題詞對比舉例
例2.An authorized institution shall not provide to any one of its employees any facility specified in subsection (2) to an aggregate amount of such facilities in excess of one year's salary for the employee.
例3.If the hawker on whom a notice is served under sub-paragraph (a) fails to comply with any of the requirements thereof,the Council may remove the stall, or cause it to be removed, to the place specified in the notice and may recover any expenses thereby incurred from the hawker.
如例2中法律限定了經授權機構提供給雇員的融通總額,是對其義務職責的說明,因此用shall來強化其強制義務意味。
例3中法律條款表明若攤販有違反條例行為,市政人員可將其擺攤物品移走,這是法律的一種授權行為,以明確市政工作人員的管理權力,因此用may來強化其授權意味。
3.2.3 專業術語
英語法律語篇使用了很多法務范疇的專業術語,限于篇幅,本文僅在表5列出統計結果中的部分專業術語主題詞:

表5 法律術語在兩語料庫中的主題詞對比(部分)
法務專業術語在整個主題詞表中占據主導地位,以表5中列舉詞匯為例,其中便包括形容法律法規的article(條款)、subsection(附屬條款),表示法務活動中各主體的person(行為人)、court(法庭)、company(公司),表示承擔法律責任的liable(責任承擔),imprisonment(監禁)等等。此外,這些法務術語多為實義詞,主導著句子和語篇的語義走向,如例4所示:
例4.Any person who contravenes regulation 3 or 3A commits an offence and is liable to a fine at level 5 and to imprisonment for 6 months.

表6 連接詞在兩語料庫中的關鍵詞對比
在例4中出現的法務術語有7個:person(行為人)、contravene(抵觸)、regulation(規章)、commit(犯罪)、offence(犯罪行為)、liable(責任承擔)及imprisonment(監禁),約占句子總詞數的28%,構成了法律語篇中的主要枝干,表明法規的具體意義,而其余詞如any,who,or,a等等為非實義詞,語義鮮明度遠遠低于上述專業術語。
3.2.4 連接詞
統計數據顯示法律英語語篇中表并列關系的or,表條件假設的unless和if相較于平衡語料使用頻率更高,尤其是or的使用頻率排在生成關鍵詞表首位,在CELT語料庫中的使用頻率約是LOB中使用頻率的11倍,這與法律語篇需要保證準確無歧義的要務是密不可分的,使用or來對多個名詞或條件進行并列可有效起到加強解釋的作用,以此規避可能產生的歧義和模糊,而unless和if在法律語篇中的大量使用與or的目的相同,即補充限定條件,使法律更加嚴謹,如例5所示:
例5.The Council may refuse to grant or renew a licence, or may revoke a licence granted,to a person if he is under the age of 21 years or if,in the opinion of the Council,such refusal or revocation is in the public interest.
例5中以多個or和if對市政局撤銷或拒絕未滿21歲居民申請牌照的條件進行了詳盡描述,列出了所有可能條件和處理方式,盡管多次并列和條件引出會造成一定的閱讀曲折,但法律語篇需保證其文字的準確性,消除可能產生的歧義,因此較之平衡文本,法律語篇中高頻的并列連接詞or及條件連接詞是難以規避的。
法律英語是專門用途英語(ESP)的一種,其誕生與演化與所在的語言生態環境密不可分,具有較強的交際功能。本文以自建法律英語語料庫為觀察語料庫,平衡語料庫LOB為參照語料庫,通過基本統計特征分析和主題詞分析索引探索英語法律語篇的文體特征。基于兩語料庫的對比統計和分析與平衡語料表明,法律英語語篇中的詞匯應用較為集中化,體現了法律英語語篇的保守性,從主題詞特征上看,法律英語語篇中應用的大量古體詞增強了其權威性和簡潔性;情態動詞shall和may的使用增強了其正式性;專業性詞匯引導了法律英語語篇語義走向;并列和條件假設連接詞消除了可能產生的歧義和模糊。